5 分で読了
1 views

Handwritten Text Recognition of Historical Manuscripts Using Transformer-Based Models

(歴史写本の手書き文字認識に対するトランスフォーマーベース手法)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海さん、最近AIの話がまた出てきましてね。特に古い手書き文書をデジタル化する話が重要だと聞きましたが、実際にうちの資料にも使えるのでしょうか。現場からは「ラテン語や古い字形が多くて無理だ」とも言われております。

AIメンター拓海

素晴らしい着眼点ですね!大丈夫、一緒に整理しましょう。要点は三つです。古文書は記録が少ない、言語が現代と違う、手書き様式が多様である、という三つの障害が問題なんです。

田中専務

なるほど、記録が少ないというのは教師データが足りないという話ですか。うちの倉庫にも写本がいくつかあって、全部を人手で打ち起こすと時間がかかりすぎます。これって要するに人手を減らして効率化できるということですか?

AIメンター拓海

その通りです!ただし一歩進めて考える必要がありますよ。モデルは人間の代替というよりも下ごしらえと校正を劇的に減らす補助者だと捉えると現実的です。まずは部分的に使って時間とコストを比べましょう。

田中専務

部分的に導入するのは現実的ですね。導入するとしたら何を準備すれば良いのですか。現場は紙焼きしかなくて、スキャンは業者に頼むしかないと言っています。

AIメンター拓海

大丈夫、進め方はシンプルですよ。まず読み取り精度に影響する画像前処理、次にデータ拡張(augmentation)で少ないデータを増やすこと、最後に複数モデルの投票(ensemble)で安定化を図る、という順序で進められます。これなら現場負担を小さくできますよ。

田中専務

投票というのは複数のAIを走らせるという意味ですか。コストが掛かるのではないかと心配です。投資対効果の観点で見て、どれほどのメリットが期待できるのでしょうか。

AIメンター拓海

良い質問ですね。投資対効果は三つの切り口で説明できます。初期はクラウドや既存モデルを活用して試験導入し、人手での転記時間を削減することで回収期間を短くできる。二つ目に精度向上は校正工数の削減に直結する。三つ目にデジタル化された情報は検索や利活用が速く、業務改善に波及しますよ。

田中専務

なるほど、まずは小さく始めて効果を測るわけですね。ところで専門用語が多すぎて現場に説明しづらい。これって要するに「古い文字も読み取れるよう訓練したAIを現場で使える形にする」ということですか?

AIメンター拓海

その表現で問題ありませんよ。現場向けにはそう説明して構いません。補足すると、単に訓練するだけでなく画像処理、データ増強、複数モデルの調整という運用側の工夫が成功の鍵になるんです。

田中専務

運用の部分が重要なのはわかりました。では最初の実験規模はどれくらいで十分でしょうか。社内の優先順位付けも必要ですので、経営会議で提案できる目安が欲しいです。

AIメンター拓海

賢明な判断ですね。目安は百行単位のラベル付きデータで試験を始めるのが現実的です。それで読み取り誤差(Character Error Rate)を確認し、校正工数がどれだけ減るかを定量化しましょう。結果にもとづき投資拡大を判断できますよ。

田中専務

よくわかりました。最後に、社内で説明するときに要点を三つで言えるように助けてくださいませんか。短く端的だと伝わりやすいので。

AIメンター拓海

もちろんです。三点にまとめますよ。第一に試験導入で人手を大幅削減できること、第二に画像前処理とデータ増強で精度が向上すること、第三に小さく始めて効果が確認できれば段階的にスケールできることです。これを会議で使ってくださいね。

田中専務

分かりました。要するに、まず小さく試して効果を見て、画像処理や拡張で精度を高め、うまくいけば段階的に広げる、という方針ですね。自分の言葉で言うとそういうことです。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
固有の解釈可能性を修正する自己教師ありマスキング
(AIM: Amending Inherent Interpretability via Self-Supervised Masking)
次の記事
相関するキー・バリュー推定のためのローカル差分プライバシー監査
(KV-Auditor: Auditing Local Differential Privacy for Correlated Key–Value Estimation)
関連記事
LLMの公平性改善:テスト時敵対事例による手法
(Improving Fairness in LLMs Through Testing-Time Adversaries)
混合現実ヘッドセットHoloLensを用いた栄養ワークショップのコミュニケーション実装
(IMPLEMENTATION OF COMMUNICATION MEDIA AROUND A MIXED REALITY EXPERIENCE WITH HOLOLENS HEADSET, AS PART OF A DIGITALIZATION OF A NUTRITION WORKSHOP)
ユニバーサル音声トークン学習:低ビットレートニューラルコーデックと事前学習表現による
(Universal Speech Token Learning via Low-Bitrate Neural Codec and Pretrained Representations)
画像からの質問生成を問い答えの双対タスクとして
(Visual Question Generation as Dual Task of Visual Question Answering)
スマート慣性粒子と強化学習による流体ターゲティング
(Smart Inertial Particles)
自己持続的反復学習
(Self-Sustaining Iterated Learning)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む