11 分で読了
6 views

DV365:Instagramにおける極めて長いユーザ履歴モデリング

(DV365: Extremely Long User History Modeling at Instagram)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近社内で「ユーザの長い行動履歴が効く」と聞くのですが、具体的にどういう話なのか分かりません。これって要するに何が変わるんでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!簡単に言うと、過去の行動を長く拾えると「好みの本質」が分かりやすくなり、推薦精度が上がるんですよ。大丈夫、一緒に見ていけば必ずできますよ。

田中専務

長く拾うと言っても、実運用ではデータセンターの電気代やGPUコストが心配です。本当に会社の投資に見合う効果が出るんですか。

AIメンター拓海

そこが今回の肝なんですよ。DV365は「オフラインで作る埋め込み(user embedding、UE、ユーザ埋め込み)」に着目して、現場のコストを抑えつつ長期履歴を反映できる設計です。要点は三つ、コスト削減、長期興味の捕捉、既存モデルへの組込みです。

田中専務

オフラインで作る埋め込みというのは、要するに現場で毎回学習させずに事前にユーザの特徴をまとめておくということですか。

AIメンター拓海

まさにその通りですよ。端的に言えば、図書館で蔵書リストを作るように、ユーザの長期履歴を凝縮した“ユーザカード”を先に作っておいて、推薦時にそのカードを参照するイメージです。これによりオンラインの計算負荷を大きく下げられますよ。

田中専務

ただ、履歴が長いほどノイズも増えますよね。全部を詰め込めば逆に性能が落ちるのではないかと心配です。

AIメンター拓海

鋭いですね。DV365はその点を「マルチスライシングと要約(multi-slicing and summarization)」で解決しています。長い履歴を時間や行動ごとに切って要点だけを抽出するため、安定した長期興味を捉えつつノイズを減らすことができるんです。

田中専務

実際の履歴は数万件とか聞きました。運用面でどれくらい現実的ですか。導入に手間がかかるのではないですか。

AIメンター拓海

実運用で彼らは平均約40,000件、最大70,000件の履歴をエンコードしていますが、肝は基礎となる単一の上流モデルで埋め込みを一括生成している点です。これにより、複数のプロダクトへ低追加コストで展開でき、費用対効果が出やすいんですよ。

田中専務

それなら現場負担は大きくなさそうですね。ところで、プライバシーやデータ保持の観点はどう考えればよいですか。

AIメンター拓海

重要な視点です。実務では履歴そのものを渡すのではなく要約した埋め込みを使うため、個々の行動が直接露出しにくい構成にできます。さらに保持期間や更新頻度を管理すれば、法令や社内ルールにも整合しやすいですよ。

田中専務

導入後の効果はどう評価すればよいでしょうか。投資対効果の評価指標が欲しいのですが。

AIメンター拓海

実務ではクリック率やコンバージョン、ユーザ滞在時間といったKPIの変化を見ますが、導入コストを年間運用費と比較することが重要です。小さなパイロットで段階的に改善を示せれば、経営判断がしやすくなりますよ。

田中専務

要点を整理すると、これって要するに長い履歴を賢く要約して現場コストを下げつつ精度を上げる仕組み、という理解で合っていますか。

AIメンター拓海

その通りですよ。端的に言えば、長期履歴の“要約埋め込み”を作っておき、必要なときに参照することでコストを抑えつつ推薦精度を高める手法です。導入は段階的に進め、効果を数値で示すのが現実的です。

田中専務

わかりました。自分の言葉で整理すると、「長い履歴をまとめたカードを作って、必要な時だけ使うことでコストを抑え、顧客の深い好みを拾えるようにする」ということですね。ありがとうございます、拓海先生。


1.概要と位置づけ

結論から述べる。DV365は、極めて長いユーザ行動履歴を実用的かつ低コストでモデルに反映するために、オンラインでの重い計算を避けつつ長期的な嗜好を保持する「オフライン生成のユーザ埋め込み(user embedding、UE、ユーザ埋め込み)」を提案した点で大きく変えた。従来の直列的な長期シーケンス処理アプローチが抱えるデータセンター負荷とGPUコストの問題を、先に埋め込みを作成して配布する設計により回避できる点が特徴である。

基礎的な差分は明確である。従来法はオンラインで長い履歴全体を逐次的に処理しがちで、履歴が伸びるほど計算負荷と遅延が増大する。一方でDV365は、長大な履歴を時間的・行動的なスライスで切り分け要約し、上流で一括して埋め込みを算出して各モデルで再利用するアーキテクチャを採用する。

この設計は、企業の視点で重要な点を満たす。第一に、運用コストの抑制が見込める。第二に、長期の安定した嗜好を捉えられることで推薦の品質向上に直結する。第三に、単一の基盤モデルから複数の下流モデルへ埋め込みを供給できるため、導入と運用の効率性が高い。

実運用の規模感も示されている。研究では平均約40,000件、最大で70,000件といった極めて長い履歴長を埋め込みに取り込んでおり、InstagramやThreadsの複数モデルへ展開して実運用で有意な改善が確認されている点が説得力を高める。これにより、研究は単なる学術検証にとどまらず実務的価値を備える。

本節は端的に位置づけを示した。次節以降で先行研究との差分、技術的要点、評価結果と議論を段階的に整理する。

2.先行研究との差別化ポイント

従来研究の主流は、長期行動を扱う際にシーケンス全体をモデル内部で逐次処理する設計であった。こうした手法は理論上は情報を失わない利点があるが、履歴長が増すにつれて計算コストと記憶帯域が急増するため、実運用ではスケールに限界が生じる。特にレイテンシーや電力消費の制約があるサービス環境では運用負荷が問題となる。

これに対してDV365が差別化した点は二つある。第一に、埋め込みをオフラインで生成することでオンライン処理を軽くし、運用コストを抑える設計である。第二に、マルチスライシングと要約という戦略により、非常に長い履歴から冗長な情報を取り除き、長期的に安定した興味のみを抽出することで汎化性を高めている。

既往手法の中にはサンプリングや圧縮を行うものもあるが、DV365は一貫した上流モデルで埋め込みを生成し、複数の下流モデルで同じ表現を共有できる点で実運用への適合性が高い。つまり、単独の改善に留まらず組織横断的な再利用が見込める。

この差分は、我々が投資を判断する際の重要な観点と直結する。スケールしない改善策は短期的には効果があっても全社導入時にコストが跳ね上がる可能性がある。DV365の設計はまさにその耐性を高めることを狙っている。

以上の差別化により、DV365は学術的な新規性と実務的な可搬性を両立させている点で先行研究と一線を画す。

3.中核となる技術的要素

中核技術は三つに整理できる。第一に、オフラインでのユーザ埋め込み(user embedding、UE、ユーザ埋め込み)生成。これは長いシーケンスを一度にモデルへ流すのではなく、まとめた表現を先に作り配布する手法である。第二に、マルチスライシング(multi-slicing、多分割)である。時間軸や行動種類で履歴を分割し、それぞれを局所的に要約することで全体の情報を失わずにノイズを抑える。

第三に、要約(summarization、要約化)手法の工夫である。単純な平均や最新値だけでなく、各スライスの代表的な特徴を抽出するための重み付けやアテンション的な仕組みを活用しており、この点が長期的安定性に寄与している。こうした処理は上流の基盤モデルで一括して行われ、下流の推薦モデルはその埋め込みを受け取る。

技術的な優位性は、実装と運用の両面にある。上流モデルは一度のバッチ処理で多数ユーザの埋め込みを生成でき、これを複数モデルが共有するため新たな推論コストは小さい。結果としてデータセンターでのGPU利用やキャッシュ設計が効率化される。

さらに、埋め込みは長期的興味の表現を狙っているため、短期の流行ノイズに揺らされにくい。企業が顧客理解やパーソナライゼーションの基盤として採用する場合、この安定性は事業判断のブレを減らす利点をもたらす。

以上を踏まえ、技術の本質は「長い履歴を計算可能な形で安定的に要約し、現場の運用負荷を下げる」ことにある。

4.有効性の検証方法と成果

検証は大規模なA/Bテストとオフライン評価の併用で行われている。オフラインでは精度指標や埋め込みの汎化性を評価し、オンラインでは実際のクリック率やエンゲージメント、コンバージョンといったビジネス指標で効果を確認した。研究報告では複数のInstagram内モデルで有意なトップライン改善が報告されている。

具体的には、DV365由来の埋め込みを既存の注意機構ベースのユーザシーケンスモデルに付加する形で評価しており、追加の計算コストを抑えつつ精度向上が得られている。これは単一の上流モデルから生成した埋め込みが下流モデルで有効に機能することを示している。

また運用の観点では、実装後一年以上の本番運用実績がある点が強みである。研究チームは15以上のモデルで同一の埋め込みを利用し、それぞれにおいて改善が確認されたとしている。実運用での持続性は、学術的検証だけでなく事業価値の持続性を示す重要なエビデンスである。

ただし効果の大きさや費用対効果はプロダクトやユーザ層によって異なる可能性がある。したがって、企業が導入を検討する際は小規模パイロットでの評価を経て段階的に拡大する運用設計が望ましい。

結論として、DV365はスケールする環境下で有効性を示しており、実務的な導入の可能性が高いと判断できる。

5.研究を巡る議論と課題

本研究には明確な利点がある一方で、議論すべき課題も残る。第一に、埋め込みの鮮度と更新頻度のバランスである。オフライン生成はコスト面で有利だが、ユーザ嗜好の急激な変化に対して遅延が発生しやすい。この点をどう補償するかは設計上の重要な判断である。

第二に、プライバシーとガバナンスの問題である。長期履歴を要約して埋め込み化する手法は個別行動を直接露出しにくくするが、埋め込み自体が機密情報を含む可能性は否定できない。アクセス権管理や保持方針の設計が不可欠である。

第三に、汎用性と公平性の検証である。埋め込みを複数モデルで共有するメリットは大きいが、それが一部のユーザ群に対してバイアスを生み出さないか、特定の下流タスクで過剰適合しないかの評価が必要である。これらは追加の実験と監査を通じて検証されるべきである。

さらに、企業内の導入障壁としては既存インフラとの統合や運用組織の整備がある。上流モデルの運用や埋め込み配布の仕組みを整えるための初期投資と運用体制の設計を怠ると期待した効果を得にくい。

総じて、DV365は有望だが現場での実装とガバナンス設計を慎重に行うことが成功の鍵である。

6.今後の調査・学習の方向性

次の実務的課題は三点ある。第一に、埋め込みの更新戦略の最適化である。どの頻度で再計算するか、増分更新をどのように扱うかはコストと鮮度のトレードオフになるため、プロダクトごとの最適解を探る必要がある。第二に、プライバシー保護手法との併合である。匿名化や差分プライバシーなどの技術を組み合わせて埋め込みの安全性を高めることが重要だ。

第三に、評価フレームワークの整備である。複数モデルにまたがる埋め込みの効果を一元的に評価する指標や監査手法を整備すれば、導入判断がより迅速かつ確実になる。研究の次段階では、これらの実装指針とベストプラクティスを提示することが期待される。

実務者への助言としては、まず小規模の試験導入を行い、効果と運用コストを可視化することだ。次に、プライバシーとアクセス管理の方針を先に決め、最後にスケール展開の設計を固める。こうした段階的な進め方が成功の確率を高める。

検索に使える英語キーワードとしては、”extremely long user history”, “user embedding”, “multi-slicing”, “summarization”, “recommendation systems” を挙げる。これらで調査すれば本稿の出典や類似研究へアクセスできる。

以上が、経営層が短時間で理解し現場と議論できるための主要な示唆である。


会議で使えるフレーズ集

「DV365は長期履歴を要約した埋め込みを先に作って配布する設計で、オンラインの計算負荷を下げながら推薦精度を高める点が特徴です。」

「まずは小さなパイロットで効果とコストを可視化し、プライバシーと更新頻度の方針を決めてからスケール展開することを提案します。」

「優先すべきは運用コストと鮮度のトレードオフをどう管理するかであり、それにより投資対効果を判断できます。」


W. Lyu et al., “DV365: Extremely Long User History Modeling at Instagram,” arXiv preprint arXiv:2506.00450v1, 2025.

論文研究シリーズ
前の記事
浮体資産の運動応答予測における機械学習の適用
(An application of machine learning to the motion response prediction of floating assets)
次の記事
Bangla手書き文字認識のためのFew-Shot Learningの性能解析
(Performance Analysis of Few-Shot Learning Approaches for Bangla Handwritten Character and Digit Recognition)
関連記事
マルチモーダルヘルスケアAI:放射線科向けの臨床的に関連するビジョン・ランゲージ応用の特定と設計
(Multimodal Healthcare AI: Identifying and Designing Clinically Relevant Vision-Language Applications for Radiology)
潜在拡散による転送可能で頑健な敵対的画像
(TRAIL: Transferable Robust Adversarial Images via Latent Diffusion)
KL誤差の完全分解と高次相互作用選択
(A Complete Decomposition of KL Error using Refined Information and Mode Interaction Selection)
木構造はいつ必要になるか
(When Are Tree Structures Necessary for Deep Learning of Representations?)
多様な表形式データタスクに関する統一的なシーケンス・ツー・シーケンスLLM事前学習の限界検証
(Testing the Limits of Unified Sequence to Sequence LLM Pretraining on Diverse Table Data Tasks)
ワイヤレスに優しい窓位置最適化
(Wireless-Friendly Window Position Optimization for RIS-Aided Outdoor-to-Indoor Networks based on Multi-Modal Large Language Model)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む