AI、細川家文書を解読 「崩し字」5万枚、熊本大など

共同通信 2024年9月4日 16:33

 熊本大とTOPPANが、人工知能(AI)を使ったシステムで、専門家でも解読が困難な「崩し字」で記載された約5万枚の未解読の古文書を読み解いた。約950万字の漢字や片仮名をテキスト化した。キーワード検索もできる。一般公開も検討中で、国内に数十億点残るとされる古文書の解明に活用したいとしている。

 同大と同社は2023年4月、古文書の電子データ化に着手。熊本大は公益財団法人「永青文庫」から寄託された細川家関連の古文書のうち、江戸時代前期の細川藩の業務日誌の一種「奉行所日帳」など約90年分を約1カ月かけて解読した。成果をまとめ、7月下旬に公表した。

 作成したデータを使い「大雨」「地震」など災害に関する言葉を検索すると、300を超える記述があり、これまで知られていなかった洪水や飢饉などの記録も見つかった。防災研究の発展に資する可能性があるといい、同大は今後、古文書から当時の災害対応を読み解く研究を進める。

 研究プロジェクトを指揮する稲葉継陽教授は「崩し字は古文書活用の大きな障壁になっている」と期待した。

RECOMMEND

あなたにおすすめ
Recommend by Aritsugi Lab.

KUMANICHI レコメンドについて

「KUMANICHI レコメンド」は、熊本大学大学院の有次正義教授の研究室(以下、熊大有次研)が研究・開発中の記事推薦システムです。単語の類似性だけでなく、文脈の言葉の使われ方などから、より人間の思考に近いメカニズムのシステムを目指しています。

熊本日日新聞社はシステムの検証の場として熊日電子版を提供しています。本システムは研究中のため、関係のない記事が掲出されこともあります。あらかじめご了承ください。リンク先はすべて熊日電子版内のコンテンツです。

本システムは「匿名加工情報」を活用して開発されており、あなたの興味・関心を推測してコンテンツを提示しています。匿名加工情報は、氏名や住所などを削除し、ご本人が特定されないよう法令で定める基準に従い加工した情報です。詳しくは 「匿名加工情報の公表について」のページ をご覧ください。

閉じる
注目コンテンツ
全国のニュース 「暮らし・話題」記事一覧