深層学習などの技術を活用し、数百ペタバイトの多様な行動データのパターン化や強化学習に挑戦する

深層学習などの技術を活用し、数百ペタバイトの多様な行動データのパターン化や強化学習に挑戦する

Company
プレイド
Tags
EngineerML

このissueで取り組むこと

複雑な行動データを最新の機械学習技術で複雑なままパターン化する

  • 既存の機械学習技術を、ナイーブに行動情報に適用しモデル化するのは簡単ではありません。
  • そもそも人間の行動は複雑だからです。
  • その複雑な特徴を捉えたままモデル化することは、一見矛盾を孕んでいますが、ユーザーの行動を本質的に理解するために重要です。
  • 適切に行動をモデル化することができれば、ユーザーにとって無駄のないアクションが可能になり、ユーザーにとっても利益があります。
  • 介入アクションを実行することが可能な環境であるため、アクションを実行しながら理解を深めていく強化学習的アプローチをとることができます。
  • また機械学習プロジェクトが失敗しやすい原因である技術と実問題とのギャップを小さくし、価値の高い機械学習モデルが創出される基盤作りを重要視しています。

これまでやってきたこと

  • 現状の基盤では、数十ペタバイトのデータを蓄積し、月間数百ペタバイトのデータを解析しています。
  • 多様なクライアントのデータに基づいて主にオンライン上の行動データのモデリングをしています。
  • GCPのサービスを活用しながら、モデリングだけではなく機械学習基盤の構築にも取り組んでいます。
  • 大量のリアルタイムデータからパターンを発見する機械学習システムと、人にしかできない思考や発想とを継続的に統合するEnd-to-Endの機械学習パイプラインを実現しています。

このissueの魅力

大量の実データに基づいてWeb上の行動データのパターン化に挑戦できる

  1. Sequence to Sequenceモデルなどの最新技術やアイデアを駆使し、画像データや言語データではなく行動データのパターン化という実データがないと取り組めない課題に取り組める
  2. リアルタイムに介入可能な環境化での強化学習問題に取り組むことができ新しい問題の見方ができる

担ってほしい役割・責任(最低限の条件)

現実の問題に適用可能なモデル作り

  1. 最新技術やアイデアを生かして試行錯誤しながらモデルを作ること
  2. モデルを実際にサービスに組み込むことで、ユーザー行動を理解することなどの現実問題に適用して評価すること

役割は決めない

  1. 課題を解くための手段を自由に選択可能にするため、個々人の役割は決めていません。
  2. プロダクト全体を俯瞰し、課題だと思う部分は、主体的に取り組むことができます。

本issueへの社内メンバーからのオススメ

無限大の可能性のあるデータから新たな価値を生み出す

image

Engineer 春日 瑛

KARTEでは多岐の業界に渡るデータが膨大に蓄積されています。そのため取り組める問題は、シンプルな行動分類、コンバージョン予測、異常行動検知、配信最適化、行動要因探索など非常に幅広く存在します。これらの問題を自身で提案する手法で主体的に解きにいくことができ、問題×手法のパターンは無限大に存在します。様々な方法論を駆使して、このチャレンジングな課題に取り組む仲間を募集しています。

🙋‍♀️ このissueのスカウトを欲しい人は↓からキャリア情報を登録するだけ

issue clubについて詳しくはこちら 👈