4 分で読了
0 views

Vision TransformerにおけるSoftmaxをReLUに置き換える手法

(Replacing softmax with ReLU in Vision Transformers)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近うちの若い連中が「AttentionのsoftmaxをReLUに変えるといいらしい」と騒いでまして。正直、何がどう良くなるのか見当もつきません。これって本当に実務で役立つ話ですか。

AIメンター拓海

素晴らしい着眼点ですね!大丈夫、一緒に整理しましょう。要点は三つで、性能の維持、計算の簡素化、実装上の並列化です。まずは前提から順に説明しますよ。

田中専務

まず、そもそもsoftmaxって何ですか。Excelでいう合計を出して割合にするようなものだと聞きましたが、それとReLUはどう違うんでしょう。

AIメンター拓海

素晴らしい着眼点ですね!簡単に言うと、softmaxは複数の値を足して1にする”割合変換”で、注目の重み付けを確率の形にします。一方のReLUは負をゼロにする単純な関数で、確率にはなりません。普通は確率にすることで安定するためsoftmaxが多用されます。

田中専務

なるほど。で、ReLUにしたら計算が楽になると。うちの現場で言えば、人手一人分の仕事が自動化できる、みたいな期待を持っていいですか。

AIメンター拓海

いい質問です!要するに計算コストと並列化の観点で利点があります。softmaxは指数計算とシーケンス長に沿った合算が必要で、並列処理の頭打ちが生じやすいのです。ReLUは単純なので並列化しやすく、特に長い入力列を扱う場面で効率が出ますよ。

田中専務

でも先生、論文の話ではそのままだと精度が落ちると聞きました。どうやって精度を保つのですか。

AIメンター拓海

素晴らしい着眼点ですね!論文は重要な工夫を一つ入れています。それはReLUの出力を”シーケンス長で割る”ことです。これによりスケールが調整され、softmaxと似た振る舞いを示すことができ、学習での安定性が回復します。

田中専務

これって要するに、ReLUで単純化しても”全体の割り算(シーケンス長で割る)”でバランスを取れば、昔のやり方と同じくらい効く、ということですか。

AIメンター拓海

その通りです!非常に良い理解ですね。まとめると一、ReLUに置き換えると計算が単純になる。二、シーケンス長で割る工夫で精度が保てる。三、並列化がしやすく実装上の効率が向上する。これだけで議論を始められますよ。

田中専務

なるほど、結構現実的な改善案に聞こえます。実際の効果はどれくらいの規模のモデルで確認しているんですか。

AIメンター拓海

素晴らしい着眼点ですね!論文では小型から大型のVision Transformerで実験しており、ImageNet-21kという大規模データでの学習で、ReLU/シーケンス長の組合せがsoftmaxに匹敵するか追随することを示しています。特に計算量を増やした際の

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
階層的計画のための合成基盤モデル
(Compositional Foundation Models for Hierarchical Planning)
次の記事
視点統合と位置合わせを用いた視覚言語基盤モデルによる画像変化理解
(Viewpoint Integration and Registration with Vision Language Foundation Model for Image Change Understanding)
関連記事
有害なファインチューニング攻撃と防御 — Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey
異質な治療効果の蒸留:因果推論における安定したサブグループ推定
(Distilling heterogeneous treatment effects: Stable subgroup estimation in causal inference)
ハードウェア劣化下でのマルチターゲット統合センシングと通信のモデルベースエンドツーエンド学習
(Model-Based End-to-End Learning for Multi-Target Integrated Sensing and Communication under Hardware Impairments)
Understanding the effects of language-specific class imbalance in multilingual fine-tuning
(多言語ファインチューニングにおける言語別クラス不均衡の影響)
科学図のキャプションを強化するクロスモーダル学習
(ENHANCING SCIENTIFIC FIGURE CAPTIONING THROUGH CROSS-MODAL LEARNING)
協調距離学習を用いた映画向け推薦システム
(Collaborative Metric Learning Recommendation System: Application to Theatrical Movie Releases)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む