大規模マルチモーダル事前学習モデルの総合調査(Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey)

田中専務

拓海先生、最近社内で「マルチモーダル」って言葉が出てきましてね。部下からはAIを入れれば何でもできると聞かされてますが、費用対効果がよく見えません。要するに我が社の現場で何が変わるんでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!大丈夫、一緒に整理しましょう。まず結論だけを先に言うと、マルチモーダルは「画像や音声、文章といった複数種類の情報を一つにまとめて学習する仕組み」です。これにより現場の判断支援や作業自動化がより現実的にできますよ。

田中専務

ほう、それは分かりやすい。ただ、具体的にはどの程度のデータや計算資源が必要なんですか。うちの設備で回せますかね。

AIメンター拓海

いい質問です。要点を3つに分けて説明しますね。1つ目、学習には大量データと計算を要するが、我々が使うのは既に学習済みの大規模モデルの

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む