4 分で読了
0 views

境界に敏感なポートレートセグメンテーション

(Boundary-sensitive Network for Portrait Segmentation)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近、部下が「人の輪郭をもっと正確に切り抜く技術がある」と言ってきまして、どういう意味か掴めていません。うちの製品画像やカタログ写真の編集に関係するのでしょうか。

AIメンター拓海

素晴らしい着眼点ですね! ポートレートセグメンテーションとは、人物(ポートレート)を画像から正確に切り抜く技術のことで、特に輪郭の部分をいかに精密に扱うかが課題なんです。大丈夫、一緒に要点を整理していけるんですよ。

田中専務

これまでの自動切り抜きはうまく行くこともあるが、髪の毛や袖のフチで妙なノイズが出る印象です。これをどう改善するんですか。

AIメンター拓海

端的に言うと、輪郭付近のピクセルを特別扱いするための工夫が入っています。従来は境界のピクセルを単純に前景か背景かで扱っていたため、フィルタが混ざった情報を学習してしまうのです。今回の手法は境界を”第三のクラス”としてソフトにラベル付けすることで、その混乱を避けようとしているんですよ。

田中専務

なるほど。要するに輪郭だけ特別扱いして学習させれば、切り抜きが綺麗になるということですか? それなら投資対効果も見えやすい気がします。

AIメンター拓海

その理解で正しいですよ。ポイントは三つです。第一に個別の画像ごとに境界に柔らかい(ソフト)ラベルを割り当てること、第二に全体的な位置情報としてのグローバルな境界カーネルを使うこと、第三に属性分類器を同時に学習して形状を補助することです。忙しい経営者のために要点を三つにまとめると、精度改善、位置の事前情報、補助学習の三点です。

田中専務

技術的にはCNNというものを使っていると聞きましたが、我々が扱う写真枚数や処理時間はどうなるのですか。現場に入れるときの負荷が気になります。

AIメンター拓海

CNNは畳み込みニューラルネットワーク(Convolutional Neural Network)の略で、画像の特徴を効率良く学習する仕組みです。導入負荷に関しては学習(トレーニング)と推論(実運用)で異なります。学習は高性能なGPUが必要だが一度学習させれば、推論は比較的軽くできるのでクラウドやオンプレの選択で運用コストを最適化できますよ。

田中専務

これって要するに、初期投資で学習基盤を整えれば、現場での運用コストは下がるということですか。どれくらい精度が上がるものなんでしょう。

AIメンター拓海

概ねその理解でいいです。論文ではベースとなるDeepLabv2 ResNet101を用い、境界をソフトラベル化することで境界付近の誤りを大幅に減らしていると報告しています。数値はデータセットや評価条件で変わるが、視覚的な改善は明瞭であり、製品写真など高品質を求める用途では価値があるはずです。

田中専務

現場では色々な背景や服装が混ざりますが、どの程度一般化できるものですか。特定条件でないとダメだと困ります。

AIメンター拓海

その点も考慮されています。個別画像用の境界カーネルと全体の位置情報カーネルを組み合わせることで、ある程度の背景や構図の変化に強くなる工夫がされているのです。現場導入では代表的な画像をいくつか追加で学習させることで、業務特化のモデルにチューニングするのが現実的な運用パターンです。

田中専務

分かりました。要点を私の言葉で言うと、「輪郭の周りを普通とは違う第三の扱いにして学習させる、全体の位置の傾向も使う、そして属性で補助する。だから写真の切り抜きが現状より綺麗になり、運用は学習段階に投資して推論は軽く回せる」ということですね。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
トリプルの関連度を序数ロジスティック回帰で測る
(Relevance Scoring of Triples Using Ordinal Logistic Classification)
次の記事
RelSifterによるタイプ関係のトリプル評価
(RelSifter: Scoring Triples from Type-like Relations)
関連記事
ローカルスケール不変性が示す動的スケーリングの新地平
(Local scale invariance, conformal invariance and dynamical scaling)
ランダムデザインによるリッジ回帰の解析
(Random Design Analysis of Ridge Regression)
分散TensorFlowをMPIで動かす
(Distributed TensorFlow with MPI)
ゲーム開発概念を教える教育用ゲーム「GameDevDojo」
(GameDevDojo — An Educational Game for Teaching Game Development Concepts)
スケーラブルなグラフ自己教師あり学習
(Scalable Graph Self-Supervised Learning)
局所的メンバーシップクエリによる学習
(Learning using Local Membership Queries)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む