ドコモ、写真の中の文字が認識できるAPIを無償提供


 NTTドコモは、写真や画像から文字を認識できる技術を開発した。携帯電話のアプリやWebサービスで活用できるようAPI化し、2011年12月1日~2012年5月末までトライアル提供する。10月5日より利用申し込みが開始された。

 このAPIは、携帯電話で撮影した写真などに含まれる文字や言葉を認識できるというもの。単語データベースと認識した文字の並びを照合し、文字以外の不要な部分を除去しつつ誤り結果を訂正していくため、制度の高い文字認識が実現するとしている。風景写真のような複雑な画像の文字も認識できるという。登録単語は100万語以上あり、さらに拡大していく。文字認識技術によって、ナビゲーションや地図、辞書、翻訳、旅行、物品管理などのサービスを構築できる。

 ドコモでは、トライアル期間に得た意見をもとにAPIを改善し、商用提供に向けて開発を進めていく方針だ。

(津田 啓夢)

2011/10/5 17:24