ニュース

凸版印刷が古文書解読アプリを開発、2023年1月にベータ版公開へ

 凸版印刷は、スマートフォンで撮影したくずし字資料を、その場で解読できるアプリを開発した。同社は、2021年に古文書解読支援システム「ふみのはゼミ」の提供を開始したが、パソコン・タブレット上での利用かつ法人向けに限られていた。今回開発されたアプリは、個人でも利用できるものになる。

 2023年1月にベータ版が公開され、3月に正式版の一般販売が行われる予定。価格は未定で、2023年3月までに決定される。

 本アプリは、木版印刷のくずし字資料に対応したAI-OCRに加えて、手書きの古文書に対応したAI-OCRを新たに搭載した。

 OCR(光学文字認識)は、文書画像に含まれる文字を読み取り、テキストデータに変換することができるソフトウェアの総称。

 研究機関や資料館などにおいては、事前調査・目録作りの際に本アプリを使用することで、作業の効率化を図ることができる。また、個人が所有する古文書の解読を支援することで、貴重な資料の破棄・散逸を防ぐといったユースケースも想定される。さらにAI-OCRの活用によって、くずし字未修者の「手元にある古文書の概要を知りたい」「くずし字を読めるようになりたい」というニーズに対応できるという。

開発の背景

 国内に数十億点以上残存するとされている古文書には、生活の様子や災害の記録のような、現代の社会課題にも直結する情報、観光資源の創出や地域活性化に活用可能な情報が残されている。

 しかし、「くずし字」が障壁となり、記録や文献を活用することが困難になっているという。また、個人が所有している古文書は、内容がわからないために破棄されるケースや、災害などによる損傷や紛失、焼失などのリスクにさらされている。

 そこで同社は、2015年に国文学研究資料館との共同研究を開始して以来、多数の研究機関などとくずし字OCR技術の開発・実証を実施してきた。2017年リリースの原本画像と解読テキストを重ねて表示できる「ふみのはビューア」、2021年リリースのオンラインくずし字解読支援システム「ふみのはゼミ」は、研究機関や大学で利用されている。

「ふみのは」サービス全体像

本アプリの特長

 くずし字で書かれた資料について、手書きの資料と木版印刷された資料では、文字の形や使われている字種が異なる。今回凸版印刷が開発したアプリは、2種類のAI-OCRを搭載し、両方に対応できる。

 AIが自動で文字領域を検出・解読する「フルオートモード」と、AIが候補文字を提示することでより高精度な解読ができる「1文字モード」が選択できる。