Computer Vision

283

論文研究
2025.10.20

史料写字者識別のクロスコデックス学習（Cross-codex Learning for Reliable Scribe Identification in Medieval Manuscripts）

田中専務拓海先生、お忙しいところすみません。先日、若手が『中世写本の筆者識別にAIを使える』と言ってきて、なんだか現場の判定より正確だという話で驚きました。これって要するに機械が誰が書いたか当てられるということですか？AIメンター拓海素晴らしい着眼点ですね！一言で言えば、機械（ニューラル

Computer Vision

論文研究
2025.10.20

CSSTの科学的準備：深層学習による銀河および星雲/星団の分類（Scientific Preparation for CSST: Classification of Galaxy and Nebula/Star Cluster Based on Deep Learning）

田中専務拓海先生、お忙しいところ失礼します。最近、部下から「宇宙データにAIを入れると業務効率が上がる」と言われまして、正直ピンとこないのです。これって要するに何が変わるんでしょうか？投資対効果の観点で教えていただけますか。AIメンター拓海素晴らしい着眼点ですね！大丈夫、一緒に整理すれば

Continual Learning
, Computer Vision

論文研究
2025.10.19

手術用コンピュータビジョンの早期起動（Jumpstarting Surgical Computer Vision）

田中専務拓海先生、最近部署で『自己教師あり学習』とか『ドメインシフト』って言葉が飛び交ってましてね。うちの現場でもAIを使えないかと相談されて困ってます。要するにこれって現場データが少なくてもAIを育てられるって話ですか？投資対効果をまず教えていただけますか。AIメンター拓海素晴らしい着

Computer Vision

論文研究
2025.10.19

医療ビジョン言語事前学習のサーベイ（Medical Vision Language Pretraining: A survey）

田中専務拓海先生、最近現場で「VLPをやればなんとかなる」と聞くのですが、正直何がそんなに変わるのか掴めません。うちの製造現場にも関係ありますか。AIメンター拓海素晴らしい着眼点ですね！Medical Vision Language Pretraining、略してVLPは医療画像と文章を

Computer Vision
, Fairness

論文研究
2025.10.19

ロボットの汎用化に向けたファウンデーションモデルによる調査とメタ解析（Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis）

田中専務拓海先生、お時間ありがとうございます。最近社内で“ファウンデーションモデル”という言葉が出てきまして、正直何をどう始めればいいのか見当がつきません。まず、この論文は何を狙っているのですか？AIメンター拓海素晴らしい着眼点ですね！この論文は、視覚と言語で発達した大規模モデルをロボ

Continual Learning
, Computer Vision

論文研究
2025.10.18

音声フィードバックによる物体検出で視覚障害者を支援する（Assisting Blind People Using Object Detection with Vocal Feedback）

田中専務拓海先生、最近部下から「物体検出で視覚障害者支援できる」と聞きましたが、要するにどんな仕組みなんですか。私、AIは名前だけ知っているレベルでして。AIメンター拓海素晴らしい着眼点ですね！大丈夫、田中専務。簡単に言うと、カメラ映像から物を見つけて、その名前と場所を音で伝える仕組みで

Computer Vision

論文研究
2025.10.18

SO(3)における拡散生成モデルの統一フレームワーク：コンピュータビジョンと天体物理学への応用（Unified framework for diffusion generative models in SO(3): applications in computer vision and astrophysics）

田中専務拓海先生、最近うちの部下から「回転をそのまま学習できる新しい生成モデルがある」と聞きまして、正直ピンと来ないのですが、本当に現場で使える技術なんでしょうか。AIメンター拓海素晴らしい着眼点ですね！大丈夫、端的に言うと今回は3次元の向き（回転）を直接扱える拡散型生成モデルの話です。

Diffusion Model
, Computer Vision

論文研究
2025.10.18

低品質な図面の修復と認識の包括的エンドツーエンド視覚フレームワーク（A Comprehensive End-to-End Computer Vision Framework for Restoration and Recognition of Low-Quality Engineering Drawings）

田中専務拓海先生、最近部下から古い図面をデジタル化して業務効率を上げようと言われまして。ただスキャンしたら文字がボケたり線が歪んだりして、そのままだと使い物にならないと。こういうのを直す技術って本当に実用になるんですか。AIメンター拓海素晴らしい着眼点ですね！大丈夫、一緒に見ていけば必ず

Computer Vision

論文研究
2025.10.17

地理・環境・農業・都市計画向けマルチモーダル基盤モデルの可能性と課題（On the Promises and Challenges of Multimodal Foundation Models for Geographical, Environmental, Agricultural, and Urban Planning Applications）

田中専務拓海先生、最近「マルチモーダル基盤モデル」って話を聞きましてね。うちの現場でも使えるのか悩んでおります。要するに何が変わるんでしょうか。AIメンター拓海素晴らしい着眼点ですね！大丈夫、簡単に説明しますよ。ここで言うマルチモーダル基盤モデルは、文字だけでなく画像や地図など複数のデー

LLM
, Computer Vision

論文研究
2025.10.16

カカオ莢の病害識別のための深層学習ベース計算モデル（Deep Learning-Based Computational Model for Disease Identification in Cocoa Pods）

田中専務拓海先生、最近うちの若手が「畑でスマホで病気探せます」と言い出しましてね。正直、何がそんなにすごいのかピンと来ないんですが、本当に現場で役立ちますか。AIメンター拓海素晴らしい着眼点ですね！大丈夫、田中専務、これは単に写真を見て判断するのではなく、画像の特徴を学習したモデルが病変

Computer Vision

CATEGORY