みんなのケータイ

オンライン発表会を「音声文字変換」で文字起こししようとしたら大苦戦

 新型コロナウイルスの影響が多くの人の生活にさまざまな影響を及ぼしている昨今ですが、メディアの仕事をしている立場からすると、最も大きな影響は発表会やイベントがオンラインでのライブ配信のみになっていることです。

 実際、2020年3月3日に楽天モバイルが実施した正式サービス提供開始に向けた発表会や、3月5日に実施されたソフトバンクの5Gサービス発表会、そして3月18日に実施されたNTTドコモの5Gサービス発表会も、全てオンラインのみでの開催となっていました。いずれも非常に大きな内容の発表だったのですが、やはり多くのメディア関係者を呼ぶことが、新型コロナウイルスの感染リスクを高めるという判断ゆえなのでしょう。

 それゆえ筆者は最近、オンラインの発表会を見て記事を書く生活を繰り返しているのですが、作業しているうちにふと思ったのが、「オンライン発表会ならアプリを使って音声をテキストに自動変換しやすいのでは?」ということです。

 最近は英語であれば「Otter」、日本語などあればグーグルの「音声文字変換」のように、音声をテキストに自動変換してくれるスマートフォンアプリがいくつか出てきています。通常の発表会で利用すると、スマートフォンのマイクで拾った声が小さくてテキストに変換してくれないこともあるのですが、自宅のパソコンやタブレットなどでオンライン発表会を視聴する分には、音量調節が自在にできることから確実にテキスト変換してくれるのでは? と考えた訳です。

 「HUAWEI P30」にはイヤホン端子が備わっており、イヤホンだけでなくマイクも接続できることから、確実に音声入力をするためにもここを経由して音声入力するという方法を取ってみることにしました。

 まずはパソコンやタブレットのイヤホン端子に音声分岐ケーブルを接続し、一方はイヤホン、もう一方はスマートフォンにヘッドセットを接続するアダプタを経由してHUAWEI P30に接続。後は音声をテキストに変換するアプリを立ち上げ、パソコンで動画を再生すれば、HUAWEI P30に音声が入力されてアプリでテキスト化してくれる……という段取りです。国内の発表会は日本語となるので、アプリは音声文字変換を使用します。

▲パソコンのイヤホン端子から分岐ケーブルで音声を分岐し、さらにスマートフォン用の3極-4極変換アダプタを接続してHUAWEI P30に音声を入力することで、音声をテキスト変換する

 ですが結論から言いますと、この組み合わせではトラブルが頻発して実用に耐えませんでした。理由の1つは、マイクを接続しても反応しないことがあり、何度か端子を抜き差しすれば反応はするものの、その際なぜかGoogleアシスタントが立ち上がってしまうこと。スマートフォン用のマイクを接続した時にこうした現象が起きることはないのでアダプタとの相性と思われるのですが、いくつかのアダプタを試してみても同じ現象が発生するので原因ははっきりしていません。

アダプタにマイクを挿入するとなぜかGoogleアシスタントが立ち上がってしまう。例えオフにしたとしても、オンにするよう促すメッセージが現れてしまうのだ

 そしてもう1つは、うまく音声入力ができたとしても、音声文字変換を使うとなぜか数秒から数十秒程度で、音声入力がイヤホン端子から本体のマイクへと勝手に切り替わってしまうという謎の現象が起きることです。再度イヤホン端子から入力するにはマイクを接続し直さなければならず、その都度Googleアシスタントが立ち上がるのでとても面倒です。

 この現象は、Otterや音声レコーダーアプリなどでは発生せず、スムーズに利用できたことから、音声文字変換固有の現象と言えそうです。音声文字変換は元々聴覚障がい者の補助を目的に作られたものなので内蔵マイクを優先する仕様なのかな? とも思ったりしたのですが、やはりはっきりした原因は分かっていません。

 では結局どうしたのかといいますと、音声文字変換を使う時はパソコンのスピーカーにスマートフォンのマイクをくっつけて音声入力するという、一層アナログな方法を取るのが確実という結論に至りました。この方法であれば音声入力が勝手に切り替わることもなく、確実に変換してはくれるのですが、どう見てもスマートではないのでもっといい方法を考えてみたい所です。

結局、音声文字変換を使う時にはパソコンのスピーカーに内蔵マイクをくっつけるというアナログな方法を取るのが確実という結論に。時々端末が倒れるのが難点