転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
部署・役職名 | DevOpsエンジニア(分散データベース) |
---|---|
職種 | |
業種 | |
勤務地 | |
仕事内容 |
ポジション概要 大量のデータと高いトラフィックのもとでの分散データベースの管理、運用、そしてトラブルシューティングを通して高い信頼性目標を達成するStorageの DevOpsを担当 業務詳細 サービスアプリのMessaging PlatformやDeveloper Product Platformの専任のStorage Operations Engineerとして大量のデータと高いトラフィックのもとでの分散データベースの管理、運用、そしてトラブルシューティングを通じて高い信頼性目標の達成に貢献する業務を担当いただきます また、ツール、自動化、ワークフローの開発を通じて、運用プロセス、コストおよびパフォーマンスの最適化も担っていただきます。 ミッション・展望 ・開発チームにDevOps memberと参加し、日常的な運用業務や運用支援ツールの開発やQAとして業務に貢献する ・将来的には 独立したStorage運用チームとして動作できるように seed memberとして memberの育成やガイドを整備する 主な業務内容 ・データベースインスタンスのデプロイ、再起動、更新などの運用や管理 ・ツール、自動化、infrastructure as a codeの開発により、運用プロセス、コスト、パフォーマンスを最適化 ・オンコール業務、監視、トラブルシューティング、インシデントや障害を支援 ・SRE/DBREチームと一緒に高可用性目標の達成に貢献 ・必要に応じて、CSやQA、その他の開発チームと協力して問題を解決 |
応募資格 |
【必須(MUST)】 求める人物像・業務の流れを改善し、コストと性能を最適化することが得意な方 ・現在の問題に対処するだけでなく、組織全体の運用効率を向上させるソリューションを提供することで、発生しうる問題を積極的に予防するソリューション設計ができる方。 ・大規模インフラや多くのトラフィックを扱うサービスにおける、ハードウェアおよびソフトウェアの問題を運用し、解決し、改善するための深い知識と経験を持つ方 ・問題の根本原因を適切に評価し、効果的な解決に取り組める方 ・自身の提案、観察、結果を正確に説明し、チームが手順を理解し、フォロー可能な状態にできる方 ・システムの監視、問題の検出、即時の対応を通じて、高い信頼性基準を確保し、定義されたSLOを調整するために、SRE/DBREと共に貢献できる方 必要な経験/スキル ・DevOpsの経験 ・インフラとネットワークの基礎知識 ・分散システムまたは分散データベースの基礎知識 Shell、Python、Rubyなどのスクリプト言語や、AnsibleやChefなどのオーケストレーションツールを使用したサーバーインスタンスの構築自動化および保守作楽の経験 ・Experience with observability (monitoring) tools and best practices. トラブルシューティング、根本原因の評価スキル、クリティカルインシデント対応および事後分析の経験 ・システムオンコールの経験 言語: ・日本語でのビジネス会話スキル(中級または上級程度必須) ・英語力(社内外の開発者に対する文書コミュニケーションや報告のスキル) あると望ましい経験/スキル ・大規模インフラや高トラフィックを扱うサービスに発生するハードウェアおよびソフトウェアの問題を操作し、解決し、改善する経験 ・SRE(Site Reliability Engineering)の概念とベストプラクティス ・システムのパフォーマンス最適化に関する経験 ・BCP/DR対策に関する経験 |
受動喫煙対策 | その他 「就業場所が屋外である」、「就業場所によって対策内容が異なる」、「対策内容は採用時までに通知する」 などの場合がその他となります。面接時に詳しい内容をご確認ください |
更新日 | 2024/12/10 |
求人番号 | 4146031 |
採用企業情報
この求人の取り扱い担当者
転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です