Computer Vision

537
  • 論文研究

マルチモーダル大規模言語モデルの推論限界:ボンガード問題の事例研究(REASONING LIMITATIONS OF MULTIMODAL LARGE LANGUAGE MODELS. A CASE STUDY OF BONGARD PROBLEMS)

田中専務拓海さん、最近またAIの話が社内で出てましてね。うちの現場でも画像と説明を組み合わせて判断させたいと。で、この論文って要するに何を示しているんでしょうか?AIメンター拓海素晴らしい着眼点ですね!簡潔に言うと、画像と文章を同時に扱うMultimodal Large Language

  • 論文研究

創傷分類におけるデータ不足を克服するためのデータ拡張手法の研究(A Study of Data Augmentation Techniques to Overcome Data Scarcity in Wound Classification using Deep Learning)

田中専務拓海先生、最近部下から「医療画像にAIを入れたい」と言われて焦っておるのです。特に『創傷(きず)の分類』でAIが使えると聞いたのですが、データが少ないと聞きます。これ、本当に現場で使えるのですか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理すれば見通しが立つんですよ

  • 論文研究

地球観測とコンピュータビジョンを用いた効果異質性検出のためのマルチスケール表現最適化 (Optimizing Multi-Scale Representations to Detect Effect Heterogeneity Using Earth Observation and Computer Vision)

田中専務拓海先生、衛星画像を使って効果の違いを見つける論文があると聞きましたが、我々のような中小の製造業にも関係がありますか。AIメンター拓海素晴らしい着眼点ですね!ありますよ。要点を先に言うと、衛星画像を複数の「拡大縮小」レベルで組み合わせることで、地域ごとの施策効果の違いをより正確に

  • 論文研究

高高度ドローン映像からの地理参照車両軌跡抽出の進展(Advanced computer vision for extracting georeferenced vehicle trajectories from drone imagery)

田中専務拓海先生、最近うちの若手から「ドローンで道の車を追跡して交通を見直そう」と言われて焦っています。正直、空撮から「どの車がどこへ行ったか」までわかるなんて、本当に役に立つんですか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に見れば必ずわかりますよ。要点を先に3つにまとめる

  • 論文研究

MediaPipe Holisticを用いた連続手話認識システム(Continuous Sign Language Recognition System using Deep Learning with MediaPipe Holistic)

田中専務拓海さん、最近部署で手話対応の話が出てまして、何か手軽に使える技術がないかと聞かれました。スクリーンに文字を出すようなシンプルな実装で十分なのですが、どの論文を読めば実務に近いイメージが掴めますか。AIメンター拓海素晴らしい着眼点ですね!今日はMediaPipe Holistic

  • 論文研究

異常検出による外れ値耐性画像分類(Outliers resistant image classification by anomaly detection)

田中専務拓海先生、お忙しいところ失礼します。うちの現場でカメラを使った異常検知を検討しているのですが、そもそも画像を学習させたモデルが見たことのない物をどう扱うのか不安です。投資したのに誤検出が多くて現場が混乱したら困ります。AIメンター拓海素晴らしい着眼点ですね!その不安は正当です。今

  • 論文研究

バックドアMBTI:バックドア学習のマルチモーダルベンチマークと防御評価ツールキット (BackdoorMBTI: A Backdoor Learning Multimodal Benchmark Tool Kit for Backdoor Defense Evaluation)

田中専務拓海先生、お忙しいところ恐縮です。最近、部下から“バックドア攻撃”がヤバいと聞いて焦っております。うちのような製造業にも関係ある話でしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、丁寧に整理しますよ。まず端的に言うと、バックドア攻撃はモデルが特定の“合図(トリガー)”で

  • 論文研究

農村インフラ開発のための深層学習による水路マッピング(Deep learning waterways for rural infrastructure development)

田中専務拓海先生、最近若手から「衛星画像で川が見つかるんです」と聞きまして、正直ピンと来ないのです。うちの地方拠点の橋の計画に関係しますか?投資対効果が見えないと怖いのですが。AIメンター拓海素晴らしい着眼点ですね!大丈夫、田中専務。今回の研究は、衛星画像と標高データを組み合わせて、これ

  • 論文研究

暗号化された画像はニューラルネットワークを訓練できるか?(Can Encrypted Images Still Train Neural Networks?)

田中専務拓海先生、最近うちの現場でも「画像データを使って品質検査を自動化しよう」という話が出ています。ただ顧客情報や社内データをそのまま外部に出すのは抵抗がありまして、暗号化したまま解析できるという論文があると聞きました。要するに、見えないデータでもAIは学習できるという話ですか?AIメン

  • 論文研究

FPGA上のランタイム適応型トランスフォーマニューラルネットワークアクセラレータ(A Runtime-Adaptive Transformer Neural Network Accelerator on FPGAs)

田中専務拓海先生、お時間をいただきありがとうございます。最近、うちの若手が『FPGAにAIを乗せて高速化すべきだ』と言うのですが、FPGAとかトランスフォーマーとか聞くと頭が痛くなりまして。本件の論文、簡単に教えていただけますか。AIメンター拓海素晴らしい着眼点ですね!大丈夫です、順を追