|
「モバイルプロジェクト・アワード2008」受賞者に聞く
|
|
ザウルス時代からの積み重ねが活きた「名刺リーダー」
|
|
|
名刺をカメラで撮影するだけのお手軽操作で、読み取りのスピードも速い。こうした性能や実績が評価され、「モバイルプロジェクト・アワード2008」のモバイルソリューション部門で最優秀賞を受賞したのが、シャープの名刺リーダーだ。「W-ZERO3[es] Premium version」に初搭載され、ドコモのSH904iを皮切りに、いわゆるスマートフォン以外のケータイにも導入が進んでいる。今では各キャリアのシャープ端末では標準的な機能となっているほどだ。そんな名刺リーダーの開発秘話をシャープに聞いた。
■ 20世紀から検討されていた「名刺リーダー」
|
シャープ 研究開発本部 基盤技術研究所 第四研究室 主席研究員 斗谷充宏氏
|
「W-ZERO3[es] Premium version」に搭載されてから、一気にケータイへの導入が進んだ名刺リーダー(※W-ZERO3[es]版は名刺リーダ)だが、ベースとなる研究は、1999年ごろから始まっている。シャープ、研究開発本部、基盤技術研究所、第四研究室、主席研究員の斗谷充宏氏は「元々、10年以上前になるがザウルス用の名刺読み取り専用機があり、高い評価を得ていた。1999年には、オプションで85万画素のカメラが付き、これで名刺を読み取れないかと検討したのが、開発のきっかけになっている」と話す。
1999年3月に発表されたザウルスシリーズの「ザウルス アイクルーズ」には、オプションでカメラユニットを装着できる。このカメラを利用して、名刺を読み取ろうと考えたのだ。だが、スペック的な問題から、斗谷氏の思惑どおりにはいかず、画像のなかから文字を上手く読み取れなかった。原因は2つ。1つが処理速度で、もう1つがカメラの画素数だ。
「ワードプロセッサーにスキャンして名刺を読み取れるソフトがあり、それを応用したが処理速度が遅かった。また、名刺の文字を読み取るには、カメラの画素数も足りず、そこで一度話が止まってしまった」(斗谷氏)
|
名刺リーダーの発想の原点「ザウルス アイクルーズ」
|
いったん中断してしまった名刺読み取り機能の開発だが、カメラ付きケータイの登場で、転機が訪れた。2000年11月には、シャープが初のカメラ付きケータイ「J-SH04」を開発。J-フォン(現・ソフトバンクモバイル)から発売され、「写メール」として瞬く間にブームとなったことは記憶に新しい。この端末の登場を受け、名刺リーダーの研究開発を再検討することになった。ただし、「J-SH04」に搭載されたカメラの画素数はわずか有効11万で、文字を認識するには力不足。ROMの容量もネックになったため、「まずはメールアドレスやURLなどの、アルファベットの読み取りから検討を始めた」(斗谷氏)という。
研究成果が実を結んだのが、2003年6月にドコモから発売されたシャープ製端末の「SH505i」だ。SH505iは、有効100万画素のカメラを搭載した、シャープ初の50Xiシリーズ。マクロ切り替えスイッチを備え、メールアドレスやURL、電話番号などの英数字をカメラで認識できる。「1行で、間違いを1つか2つ程度に収めることを目指した」(斗谷氏)というように、読み取りの精度も高かった。この機能は、翌年には欧州向けのシャープ製端末に対応し、「今の端末にも残っている」(斗谷氏)というほどの“定番”になっている。
SH505iで実現したOCR機能だが、名刺リーダーの完成に向け、その後も研究は一歩一歩進められていった。3年後の2006年には、「ケータイの上で動くものができていた」(斗谷氏)そうだ。そして、ちょうど同じタイミングで開発中だった「W-ZERO3[es] Premium version」に搭載が決まり、ついに、名刺リーダーは世に送り出されることとなる。
■ 名字の読み取りに対応しスピードも改善
|
「W-ZERO3[es] Premium version」に初搭載された名刺リーダー
|
名刺リーダーを一度でも使ったことがある人は、その認識率の高さに驚くはずだ。筆者も手持ちの名刺をいくつか読み取ってみたが、特殊なレイアウトや書体でない限り、失敗は少ない。端末や撮影者の影が、多少名刺にかかっていても大丈夫で、名刺を取り出してサッと撮影できる。この“手軽さ”も、名刺リーダーの売りの1つ。同時に、斗谷氏が苦労した点の1つでもある。
「名刺リーダーでは画像をモノクロのパターンにしている。単純にしきい値を取るだけだと『影らしい』『文字らしい』というのが判断できず、影の部分が黒くなって文字を読み取れなくなってしまう。そこで『適応二値化』と呼ばれる処理を行い、文字だけを認識できるようにした」(斗谷氏)
また、SH904i搭載の名刺リーダーから、メールアドレスで判断して、名字の仮名を表示するようになった。例えば「渡部」という名字の場合、「ワタナベ」や「ワタベ」など複数の読み方が存在する。こうした判断を、メールアドレスで行うというわけだ。「junyaishino」のように、姓名を組み合わせたメールアドレスでも、「名字の読み方の辞書とメールアドレスの一部とを比較しているので対応が可能」(斗谷氏)という。「W-ZERO3[es] Premium version」版では頻度に応じて読み仮名を表示していたが、「5~6%の間違いがある」(斗谷氏)ため、この方式を採用したそうだ。
|
SH906iの名刺リーダーで名刺を読み取ったところ
|
読み取りの速度は「プログラム自体をチューニングしたのと、マッチングにかかる時間を減らした」(斗谷氏)という2つの方法で向上させた。斗谷氏は、その仕組みを「速度が遅かった点を改善するのに苦労した。4000文字以上の文字パターン辞書を持っていて、全てに当たっていくのが基本だが、大まかな文字の特徴を使ってどれとどれと照合するかを早めに決めるように工夫している」と解説する。
「W-ZERO3[es] Premium version」に初搭載されてから、「フィードバックがかかってアルゴリズムを改善していった」(斗谷氏)成果が出ているといえるだろう。こうした細かな積み重ねが功を奏し、今では「ほとんどフィードバックがないほど」(斗谷氏)になったという。
「名刺だけだとビジネスユーザーに限られるので、対応範囲を広げた」(斗谷氏)というように、名刺リーダーを応用した機能も登場している。WILLCOM 03のコラムリーダがそれだ。コラムリーダとは、雑誌のコラムなどを認識し、テキストとして保存することができる機能のこと。購入した雑誌の一部をテキストで残せるので、あとで容易に参照できる上、ブログなどで引用するのも簡単だ。「読み取った文字を単純にテキストとして残すだけでなく、もっと有効に活用できる機能にも展開したい」(斗谷氏)とのことであり、将来的には、雑誌の文章を一瞬で要約するような機能などが実現されるかもしれない。
■ 地道な研究の積み重ねはまだまだ続く
完成度の高い名刺リーダーだが、課題も残されている。例えば、背景が複雑な柄だと、どれが文字でどれが模様かといった判断がつきにくく、読み取り精度が極端に下がってしまう。
「人間だったら、黒い部分だけを文字と認識できるが、ソフトだと、模様と文字の違い判別できない。対応させると普通の名刺の読み取りが遅くなったり、認識率が下がったりする課題はあるが、そのような名刺を読み取れるものも今後開発していきたい」(斗谷氏)
同様に、現状では、縦横が混在する名刺も、読み取ることができない。「利用頻度が少なく、対応すると認識率が下がる恐れがある」(斗谷氏)という難点があるそうだ。
とはいえ、名刺リーダーは商用化されてまだ2年。インターフェイスや、読み取ったデータの活用方法などに、まだまだ進化の余地が残されているように感じる。課題を1つ1つ潰していくのはもちろん、ベースの技術を活かし、コラムリーダのような応用例をどんどん生み出してほしい。
■ URL
シャープ
http://www.sharp.co.jp/
■ 関連記事
・ モバイルプロジェクト・アワード 2008の受賞プロジェクト発表
・ モバイルプロジェクト・アワード2008表彰式
・ ウィルコム、「W-ZERO3[es]」Premium versionを16日発売
(石野純也)
2008/10/02 11:40
|
ケータイWatch編集部 k-tai@impress.co.jp
Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.
|
|
|
|
|
|