4 分で読了
0 views

損失関数が深層学習画像符号化性能にもたらす知覚的影響

(Perceptual impact of the loss function on deep-learning image coding performance)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近部下から「画像圧縮にAIを使えば画質が良くなる」と言われまして、正直何を基準に良いと言っているのかが分からんのです。要するに画質の評価は何を見ているのでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!画像圧縮で「良さ」を決めるのは単純な数字だけではなく、人間の見た目に近いかどうかが肝心ですよ。今日はその中でも『損失関数(Loss Function)』がどれだけ結果に効くかを、噛み砕いて説明しますよ。

田中専務

損失関数という言葉は聞いたことがありますが、経営でいうところの評価基準やKPIと同じようなものですか。現場に導入するときは投資対効果が気になります。

AIメンター拓海

大丈夫、一緒にやれば必ずできますよ。要点を3つにまとめると、1) 損失関数はモデルが何を「良い」とするかを決める評価軸、2) 人間の視覚に合う指標を使うと見た目が良くなるが万能ではない、3) 画像内容によって最適な指標が変わる、です。

田中専務

これって要するに『どの評価軸を使うかで圧縮後の見た目が大きく変わる』ということですか。それなら現場で一つに決めるのは難しそうですね。

AIメンター拓海

その通りですよ。さらに具体的に言うと、この研究ではいくつかの「画像品質指標(image quality metrics)」を損失関数に組み込み、クラウドソーシングで人に見てもらってどれが人間の評価に近いかを調べています。結果、画像の種類によって最適指標が分かれることが示されました。

田中専務

なるほど。では、例えば監視カメラと製品写真では別の指標を使った方が良いということでしょうか。投資に見合う効果があるかどうかが知りたいのです。

AIメンター拓海

大丈夫、実務目線で言えばまずは現場の代表的な画像群を抽出して、少数の指標で比較するのが現実的です。ここでの重要点は3つ。まずは画像カテゴリごとに評価を測る、次に人的評価と自動指標の差を確認する、最後にコスト(学習時間やラベル付け)を見積もることです。

田中専務

実際の導入手順もイメージできました。ところで、論文が採用している符号化構造というのは特殊なものですか。うちのIT部が対応できるかが心配です。

AIメンター拓海

この研究が使っているのはVariational Autoencoder with Hyperprior (VAE-Hyper)(変分オートエンコーダ(ハイパープライオリ))という比較的標準的な構造です。エンジニアがライブラリに慣れていれば実装は抑えられますし、まずは既存のモデルを使って損失関数だけ変えて試すのが現実的です。

田中専務

要するに、まずはリスク小さくプロトタイプを作って効果を確かめる、ということですね。分かりました、部長に説明して進め方を決めます。

AIメンター拓海

素晴らしい着眼点ですね!その通りです。自分で評価して比較する一連の流れを標準化すれば、投資判断も数値で出せますよ。大丈夫、一緒にやれば必ずできますよ。

田中専務

では最後に私の言葉で整理します。損失関数は評価軸であり、画像の種類ごとに最適な軸が変わるため、まず代表画像で検証してから現場導入する、これが本論文の要点だと理解しました。

論文研究シリーズ
前の記事
量子ニューラルネットワークの回帰性能と最大表現力
(Regressions on quantum neural networks at maximal expressivity)
次の記事
チップレットアーキテクチャの迅速な設計空間探索のためのツールチェーン
(RapidChiplet: A Toolchain for Rapid Design Space Exploration of Chiplet Architectures)
関連記事
アライメント不変な顔画像品質評価のための知識蒸留
(AI-KD: Towards Alignment Invariant Face Image Quality Assessment Using Knowledge Distillation)
地球の軌道を星に見る:年周視差と光行差
(Seeing Earth’s Orbit in the Stars: Parallax and Aberration)
ニューロモルフィックハードウェアのオンライントレーニングを加速するネオヘッビアンシナプス
(NeoHebbian Synapses to Accelerate Online Training of Neuromorphic Hardware)
メタバース向けネットワーク内計算における動的冗長性認識型ブロックチェーンベース部分計算オフローディング
(Dynamic Redundancy-aware Blockchain-based Partial Computation Offloading for the Metaverse in In-network Computing)
オープンソースのAIベースソフトウェア工学ツール:共同ソフトウェア学習の機会と課題
(Open-Source AI-based SE Tools: Opportunities and Challenges of Collaborative Software Learning)
不規則多変量時系列予測におけるSTRGCNの提案
(STRGCN: Capturing Asynchronous Spatio-Temporal Dependencies for Irregular Multivariate Time Series Forecasting)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む