てっぱんアプリ!

国会図書館の文字認識ツールをスマホからでも快適に使える「NDLOCR-Lite Web」

 スマホを、もっと楽しく快適に使うには、アプリを活用しよう。本コーナーでは、続々登場する旬なアプリの中から編集部が厳選した、スマホユーザー必携の“てっぱん”アプリをご紹介します!

◇   ◇   ◇
アプリ名: NDLOCR-Lite Web
開発者: 橋本雄太(国立歴史民俗博物館、国立国会図書館 非常勤調査員)
価格: 無料
対応OS: iOS、Android
カテゴリ: ツール

 2026年2月に国立国会図書館が公開した「NDLOCR-Lite」は、画像内の文字を高精度にテキストデータ化できるOCRツール。これをスマホからでも使える「NDLOCR-Lite Web」が登場したので、さっそくチェックしてみよう。

パソコンやスマホで画像内文字認識できる「NDLOCR-Lite Web」

パソコンはもちろんスマホでもブラウザから利用可能

 「NDLOCR-Lite Web」は、国会図書館が開発したOCRツール「NDLOCR-Lite」をWebブラウザ上で利用できるようにしたもの。大元のNDLOCR-Liteは、AI技術を活用しながらも特別なハードウェアを必要とせず、画像内の日本語を含む文字を高精度に認識・抽出してテキスト化できるのが特徴だ。

 オープンソースソフトウェアとして公開され、当初はコマンドラインツールやパソコン用のデスクトップアプリが利用できた。その後、プラットフォームを問わないWeb版のNDLOCR-Lite Webが登場した、という流れ。こちらも最初の頃はパソコンでの使用が前提となっていたようだが、現在はスマホでも快適に使えるようだ。

元となっている「NDLOCR-Lite」の配布ページ
NDLOCR-Liteのコマンドラインツール、またはパソコン用デスクトップアプリが公開中

処理はスマホ内で完結、カメラ撮影だけですぐにテキスト化

 使い方も簡単だ。スマホでNDLOCR-Lite Webにアクセスし、「タップしてファイルを選択」を押したら、カメラを起動するか保存済みの画像を選ぶ。たとえば手元の紙書類をテキストにしたいならそれをカメラ撮影し、「認識を開始」すれば数十秒程度でテキスト抽出され、プレビュー表示できる。

 抽出されたテキストはクリップボードへのコピーとテキストファイルへの保存が可能。かなり正確に文字認識され、しかも読み取った画像や抽出したテキストなどのデータはサーバーに送信されず、すべて端末側で処理するとのことなので、業務などでも安全性高く利用できるのもメリットだ。

 写真から文字を抽出するOCRアプリは他にも存在するが、日本語の認識精度が高くないものもある。NDLOCR-Lite Webは国産の日本語に強いOCRツールということで、活躍の場面は多いのではないだろうか。

「NDLOCR-Lite Web」。中央の「タップしてファイルを選択」を押す
カメラを起動するか、既存の画像ファイルを選ぶ
紙書類を写真撮影
撮影が完了したら「認識を開始」をタップ
認識処理が開始。数十秒待つと……
テキストの抽出が完了
抽出テキストのプレビュー表示
クリップボードにコピーしたり、ファイルに保存したりできる