4 分で読了
0 views

語彙外サンプリングは投機的デコーディングを強化する

(Out-of-Vocabulary Sampling Boosts Speculative Decoding)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近「語彙外サンプリング」とやらが話題だと聞きましたが、正直私にはちんぷんかんぷんでして、簡単に教えていただけますか。

AIメンター拓海

素晴らしい着眼点ですね!大丈夫、一緒に整理しますよ。端的に言えば、ある小さなモデルが提案できない語彙(単語)を賢く補って、本命モデルの確認回数を増やせる手法なんです。

田中専務

なるほど。でも実務で言うと、何が困っているんでしょうか。小さいモデルを使えば速くなるのは分かるのですが、その代わり品質が落ちるのではないですか。

AIメンター拓海

素晴らしい着眼点ですね!要点は三つあります。第一に、小さいモデル(drafter)は速いが語彙が限られるため本命(target)に受理されない提案が増えること、第二に、それが受理率(acceptance rate)を下げて効率を損なうこと、第三に今回の手法はその穴を埋めて効率を回復できることです。

田中専務

受理率という言葉が出ましたが、それは「どれだけ下流のモデルが上流の提案を受け入れるか」という意味で合っていますか。具体的には現場で何が改善されると考えれば良いですか。

AIメンター拓海

素晴らしい着眼点ですね!現場では応答速度、サーバーコスト、ユーザー待ち時間が変わります。受理率が上がれば本命モデルの確認回数が減り、総合的な遅延と計算コストが下がるのでトータルで得するのです。

田中専務

それなら安心できますが、従来の方法では語彙が交差する部分だけ使うんですよね。Token-Level Intersection(TLI)というやつですか。これだと受理率が低いと聞きましたが、なぜそうなるのですか。

AIメンター拓海

素晴らしい着眼点ですね!Token-Level Intersection(TLI)とは、上流と下流の語彙の共有部分だけ提案するやり方です。これだと上流が提案しない多くの候補をそもそも作れないため、特に語彙の重なりが小さければ受理率が下がるのです。

田中専務

なるほど。ここで聞きたいのですが、これって要するに、語彙が小さいドラフターでも実用上の受理率を回復できるということ?

AIメンター拓海

その通りです!要点は三つに整理できます。第一に、Redistributing Drafter Kernels(RDK)という手法は語彙外(out-of-vocabulary, OOV)トークンを仮想的に復元すること、第二に、トークン間の親和性を使って確率を再配分すること、第三に、この処理は追加の推論遅延をほとんど生まない点です。

田中専務

親和性というのは学習データ上で一緒に出やすい単語のつながりという理解で良いですか。実装に手間はかかりますか、前処理が必要だと聞きましたが。

AIメンター拓海

素晴らしい着眼点ですね!親和性(token-affinity)とはトークン同士のつながりを数値化した行列です。これを一度代表的なデータで作る前処理が必要ですが、そのコストは一回限りで、以降のデコードで何度でも使える点が実務的です。

田中専務

なるほど、では最後に要点を私の言葉でまとめます。語彙の小さい高速ドラフターでも、このRDKを使えば重要な候補を仮想的に復元できて、全体の効率が改善するという理解でよろしいですか。ありがとうございました、拓海先生。

論文研究シリーズ
前の記事
順序型推薦における人間らしい嗜好プロファイリング
(Towards Human-like Preference Profiling in Sequential Recommendation)
次の記事
多モーダル交差マスク自己符号化器
(MoCA: Multi-modal Cross-masked Autoencoder for Digital Health Measurements)
関連記事
マルチロボット自律探索のための階層的計画フレームワークの拡張
(An Enhanced Hierarchical Planning Framework for Multi-Robot Autonomous Exploration)
非有向グラフィカルモデルに対するニューラル変分推論と学習
(Neural Variational Inference and Learning in Undirected Graphical Models)
歩行者軌跡予測のためのマルチオーダー意図融合
(SocialMOIF: Multi-Order Intention Fusion for Pedestrian Trajectory Prediction)
Adaptive, Doubly Optimal No-Regret Learning in Strongly Monotone and Exp-Concave Games with Gradient Feedback
(強単調・指標凹凸ゲームにおける勾配フィードバック下での適応的二重最適無後悔学習)
プロトン内部のパートン分布、αs、重クォーク質量の同時決定
(Parton Distribution Functions, αs and Heavy-Quark Masses for LHC Run II)
NutrifyAI:リアルタイム食品検出と栄養解析による個別化食事推薦
(NutrifyAI: An AI-Powered System for Real-Time Food Detection, Nutritional Analysis, and Personalized Meal Recommendations)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む