みんなのケータイ

「Evernote」の文字起こし機能がイイ! 折りたたみスマホと最強の取材スタイルを確立

【ZTE Libero Flip】

 自分にとって初めてのスマートフォンであるiPhone 3GSを購入したのは2009年のこと。それから毎晩のようにApp Storeを眺めては、それまで使っていたPDA(シャープ製ザウルスMI-P10)の代わりになりそうなアプリを探してはインストールしていた。

 そんな中で見つけたのがEvernoteだ。無料プランでも毎月40MBのデータをアップロードできるとのことで、「ということは、一生無料で、データため放題では!?」とワクワクしつつ、あっさりと同年8月に有料のプレミアムプラン(現パーソナルプラン)を契約していた。

 それから15年以上が経った。有料プランの価格がじわじわ値上がりしたり、無料プランの作成ノート数上限がグッと下がったりと、あまり良くないニュースを耳にするたびに「もう解約しちゃおうかな」などと考えるのだが、そもそもプレミアムプランで月間アップロードデータ容量が500MBだったものが10GBへと瀑上がりしていることなど改良されていることなど良い点もある。

 しかも、これを解約してしまったら、これまで貯めてきたデータが消失してしまうし、これとって移行先候補もない。

 放置して、すっかりEvernoteから遠ざかっていたある日、スマートフォンで録音したデータをPCへ移動するのにEvernoteを使ってみた。Evernoteでは、付与された専用メールアドレスにデータをメールするとEvernoteのノートとして保存するという機能がある。その他、iOSであれAndroidであれ、OSレベルで「共有先」としてEvernoteを選択肢の1つとしてリストに入れている場合が多い。格納されたばかりのデータは、最新ノートとしてノートリストの先頭に表示されるので、探す必要がない。

 「サクッとEvernoteから仕事用フォルダに移し替えるか~」と、PCのEvernoteアプリを開いたところ、「文字起こし」ボタンが表示されている。

「文字起こし」ボタンだと……?

 「まさかねぇ」と疑いつつ、ポチッとクリックしたら、数分もかからず文字起こしされるではないか。すごいぞ、Evernote。

しかも、精度が高い。こちらは以前の記事を音読したものであるが、比べてみると「獣医師」を「注意」に、「カッコ閉じで」を「閉じて、」にしてしまっている程度の違いである

 写真内の文字をOCR認識するようになり、写真を検索できるようになったときもかなり「できるぞEvernote」と感動したが、音声すら検索対象になったというわけだ。これに感動せず、何に感動しようというのか。

 これまで、iPhoneとGalaxyなど、スペックの高いスマートフォンにしかインストールしていなかったEvernoteを、Libero Flipに入れることにした。理由は、まだ容量に余裕があること、購入したスマートフォンなので手元に残るものであること、そして首からぶら下げておくのにちょうどいいサイズであることなどだ。

 取材開始時に、首から下げたLibero Flipを、折りたたんだ状態でサブモニターで操作して録音を開始する。首から下げたままにしておくことの利点は、キーボードをたたく音が入りにくいこと、移動中の説明ももれなく録音できることが挙げられる。聞いたはずなのに、音声が残っていない、というミスを防げるのだ。

 取材終了後に録音データを保存し、Evernoteへアップする。もしくはEvernoteで新規ノートを立ち上げて、「添付ファイル」から録音データを探して添付しても良い。添付が完了すると、「文字起こし」のボタンが現れて、その場で文字起こしを行える。

Evernoteを開いて「新規ノート」を作成。「+」をタップするとさまざまなデータを添付できる。なお、録音済み音声データは「添付ファイル」に分類される。ファイルリストでは「音声」タグを選べばすぐに目当ての録音データを見つけることができる

 試しに、1分51秒の録音データを文字起こししたところ、かかった時間は17秒52であった。21分程度の録音データでも、46秒28であった。移動中どころか、カフェなどでオーダーしている間に文字起こしが終わっているレベルのスピードだ。

 ただし、万能というわけではない。Evernoteでは25MBを超えるファイルの文字起こしに対応していないのだ。

25MBを超えると文字起こしできない。これはスマホアプリだけでなく、PCアプリでも同様だ

 これには回避方法があり、Libero Flipのレコーダーアプリで音声のトリミングをして、それぞれ保存し直しておけば良い。トリミングすると、デフォルトで「Trim_日付_00x」という具合に、このデータがトリミングしたものであることを示すテキストと連番がファイル名に付与される。あとは、番号通りにEvernoteに取り込んで、文字起こしするだけだ。

レコーダーアプリでトリミングして別名で保存しておく。iOSのボイスレコーダーアプリでも同様にトリミング可能だ

 別の問題は、まだまだ開発途上であるということだ。同時通訳付きのイベントで、他国語と日本語をそれぞれ正しく認識して話された言語で文字起こしすることや、起こせているところの精度が高いこと、なんとなく話者別に、または適当な長さで段落分けしてくれることなど、頑張っている印象ではあるが、20分程度の長さの音声を文字起こしすると、謎の“繰り返し”が生じる。例えば、下の画像のように。

ちょっとしたホラーである

 ファイルをもっと細かく分ければ回避できそうであるが、そのような手間はできれば省きたい。日本法人はもうなくなってしまったが、米Evernoteにはぜひとも頑張って改善してもらいたいなぁと切に願うのであった。