古文書を文字データ化 熊本大とTOPPAN、専用ソフトで「くずし字」解読

熊本日日新聞 2024年7月26日 20:37
専用のソフトウエアを使って文字データ化した「奉行所日帳」(熊本大永青文庫研究センター提供)
専用のソフトウエアを使って文字データ化した「奉行所日帳」(熊本大永青文庫研究センター提供)

 熊本大永青文庫研究センター(熊本市中央区)は26日、画像の文字を読み取るソフトウエアを使い、江戸時代初期の古文書約5万枚に書かれた「くずし字」を解読し、約950万字を漢字や片仮名などにデータ化できたと明らかにした。キーワード検索も可能で、一般公開も検討する。

 TOPPAN(東京)と共同で、未解読の古文書を文字データ化する研究に2023年度から取り組んだ。TOPPANのグループ会社が開発した専用ソフトを使い、熊本大が公益財団法人「永青文庫」から寄託されている「細川家文書」のうち、奉行所の執務記録「奉行所日帳」や細川忠利の命令を記録した「奉書」などを解読した。

 作成したデータで「地震」「大雨」「飢」など災害に関するキーワードを検索すると、300件を超える記述が発見された。これまで知られていない災害や疫病の流行など、歴史学と防災研究に役立つ資料もあるという。センターは、江戸時代初期の災害発生状況や細川藩の対応について研究を進める。

 くずし字の解読は知識と経験が必要で、研究者でも時間がかかる作業とされる。稲葉継陽センター長は「難易度が高く、膨大な量の古文書をテキストにできたことに大きな意味がある。研究の可能性を広げる成果だ」と話した。(上野史央里)

RECOMMEND

あなたにおすすめ
Recommend by Aritsugi Lab.

KUMANICHI レコメンドについて

「KUMANICHI レコメンド」は、熊本大学大学院の有次正義教授の研究室(以下、熊大有次研)が研究・開発中の記事推薦システムです。単語の類似性だけでなく、文脈の言葉の使われ方などから、より人間の思考に近いメカニズムのシステムを目指しています。

熊本日日新聞社はシステムの検証の場として熊日電子版を提供しています。本システムは研究中のため、関係のない記事が掲出されこともあります。あらかじめご了承ください。リンク先はすべて熊日電子版内のコンテンツです。

本システムは「匿名加工情報」を活用して開発されており、あなたの興味・関心を推測してコンテンツを提示しています。匿名加工情報は、氏名や住所などを削除し、ご本人が特定されないよう法令で定める基準に従い加工した情報です。詳しくは 「匿名加工情報の公表について」のページ をご覧ください。

閉じる
注目コンテンツ
熊本の文化・芸能