2025.10.17

論文研究

4 分で読了

0 views

テキストなし動画でスケールするテキスト→動画生成のレシピ

（A Recipe for Scaling up Text-to-Video Generation with Text-free Videos）

- メールで送る
- リンクをコピーする

AI戦略の専門知識を身につけ、競争優位性を構築しませんか？

AIBR プレミアム

年間たったの9,800円で

“AIに詳しい人”として
一目置かれる存在に！

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか？

詳細を見る

【実践型】
生成AI活用キャンプ

【文部科学省認可】
満足度100%の生成AI講座

3ヶ月後には、
あなたも生成AIマスター！

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題！誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近”テキスト→動画”って話を聞くんですが、我が社にとって何が変わるんでしょうか。映像制作のコストや現場導入の見通しが気になります。

AIメンター拓海

素晴らしい着眼点ですね！大丈夫、難しく聞こえても本質は単純です。今回の研究は“テキスト付きの動画データが少ない”という壁を、テキストのない動画（text-free videos）を使って越える方法を示していますよ。

田中専務

テキストがない動画を使うって、要するに正解ラベルがなくても学習できるということですか？ただ、そうすると品質が下がらないか心配です。

AIメンター拓海

いい質問です。要点を三つにまとめますよ。第一に、テキストの情報を別の経路で扱うことで”文脈理解”と”時間変化”を分離できます。第二に、ラベル無しの動画を大量に集めることでスケールの利点が出ます。第三に、一部のテキスト付きデータをあとから加えることで品質を回復・向上できます。

田中専務

それは現場的に言うと、まず安い素材をたくさん集めて基礎を作り、後から少し投資して精度を上げるということですね。導入コストの分散ができるのは助かります。

AIメンター拓海

まさにその通りです。専門用語を一つ使うなら、モデルは”content branch”と”motion branch”の二本立てで学ぶ設計になっていて、内容（何が映っているか）と動き（時間的変化）を分けて捉えられるようにしているんですよ。

田中専務

これって要するに、映像の”中身”と”動き”を別々の工程で学ばせるから、犬の走る映像でも風景の変化でも両方扱えるようになる、ということですか？

AIメンター拓海

その通りですよ。例えるなら、料理で具材を整えるチームと、火加減を管理するチームを別にして訓練するようなものです。両方が揃えば、少ないレシピ情報でも安定して良い料理が作れるようになります。

田中専務

なるほど。具体的な効果はどう測ったんでしょうか。品質の指標や、テキストを再導入した際の変化を数字で見せてもらえると経営判断がしやすいのですが。

AIメンター拓海

良い点です。研究ではFID (Fréchet Inception Distance) とFVD (Fréchet Video Distance) といった客観指標で評価し、無ラベル動画を増やすとFIDが9.67から8.19に、FVDが484から441に改善したと報告しています。さらに一部のテキストを再導入するとFIDが8.19から7.64、FVDが441から366に改善しました。

田中専務

つまり最初は大量の安い素材で基盤を作って、あとから要所だけラベル付けして投資すれば効率よく品質が上がると。導入シナリオがイメージできました。自分で言うと、基礎投資と集中投資の組合せということですね。

AIメンター拓海

素晴らしいまとめです。導入の第一歩としては、まず小さなパイロットでtext-free動画を集め、コンテンツとモーションの分離が効いているか確かめることをおすすめします。大丈夫、一緒にやれば必ずできますよ。

田中専務

分かりました、まずは試すことが重要という点を経営会議で提案します。今日はありがとうございました。今回の要点は私の言葉で、基礎は無ラベル動画の大量収集、次に分離学習で基盤構築、最後に部分的なラベル投入で品質向上、という理解で合っていますか。

監修者

阪上雅昭（SAKAGAMI Masa-aki）
京都大学　人間・環境学研究科　名誉教授

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に！

論文研究

テキストなし動画でスケールするテキスト→動画生成のレシピ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

監修者

論文研究シリーズ

AI技術革新 - 人気記事

“AIに詳しい人“
として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

テキストなし動画でスケールするテキスト→動画生成のレシピ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

監修者

論文研究シリーズ

関連記事

この記事をシェア

AI技術革新 - 人気記事

“AIに詳しい人“として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

AI Benchmark Researchをもっと見る

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

“AIに詳しい人“
として一目置かれる存在に！

【実践型】
生成AI活用キャンプ