40サービス、会員3000万人超の日本トップクラスのサービス群のSREのベストプラクティスを定義する

40サービス、会員3000万人超の日本トップクラスのサービス群のSREのベストプラクティスを定義する

Company
DMM.com
Tags
EngineerSRE

このissueを掲げている背景・理由

これまでオンプレミスで運用していたDMMの多種多様なサービスのクラウド移行を促進していき、事業を更なる飛躍へと繋げたい

40以上のサービス、3,000万人のユーザーを抱え更に成長を続けるDMM.com。そのシステムは多種多様、トラフィックも日本トップクラスです。

DMM.comのSREはDMM.com内すべての事業に対して、Infrastructure as Code、CI/CD等の導入を通してサービスの安定性を担保した上で様々な観点で効率を改善していくことをミッションとしています。

ステークホルダーが多岐にわたることもあり、エンジニアリング観点だけではなく、 ビジネス的な観点も持った上でプロジェクトを導くことが求められる非常にチャレンジングなポジションですが、その事業の数にSRE部のメンバーがまだまだ足りておらず、チームを積極的に拡大をしてます。

このissueの魅力

DMMのSREはスピード感をもってチャレンジすることが重要であり、各エンジニアの裁量が大きいのが特徴です。 また様々なフェーズの事業を担当し、サービス規模や選定している技術も異なるため短期間に多くの経験ができます。

また、多岐にわたるシステムに関するプロジェクトに設計から実装まで関わることができ、具体的には下記の業務をお任せします。

  • 各事業に対してモダン化に向けたサービス全般のアーキテクト
  • 各サービスの可用性・信頼性向上
  • 信頼性向上、効率向上の実現につながる技術の評価・検証
  • キャパシティプランニング
  • モニタリング
  • DevOps
  • クラウド化・マイグレーション

<インフラ関連使用技術一例>

AWS、GCP PHP、Python、Ruby、Go GitHub、CircleCI、Terraform、Datadog

担ってほしい役割・責任

事業・プロダクトの課題を理解した上で解決に向けて 事業推進をさせる。

・チームメンバーのリード

・品質と開発効率のバランスを取った各種施策の実施 ・主にクラウド環境におけるサーバーやネットワークなどの構築、運用 ・CI/CD 環境の改善ならびにDeveloper eXperience 改善施策の実施 ・監視のためのモニタリング環境の構築、運用 ・システム改変やサービス立ち上げのためのインフラ設計及び維持管理 ・運用課題の可視化および解決(リファクタリング・チューニング・自動化など) ・レガシー基盤のモダン化 ・障害調査 ・サービスレベル指標・目標(SLI/SLO)の設計、視覚化及び分析 ・SLOに基づいたモニタリング、インシデント対応、ポストモーテムによる根本原因分析

求人詳細/エントリーはこちら

🙋‍♀️ このissueのスカウトを欲しい人は↓からキャリア情報を登録するだけ

issue clubについて詳しくはこちら 👈