みんなのケータイ

「Pixel 6 Pro」1台だけでイベントを取材してみた

【Pixel 6 Pro】

米国で無事サルベージしたPixel 6 Pro

 前回、米国で購入して日本に持ち帰ってきたPixel 6 Proだが、これ以上ないくらい取材にフル活用している。コロナ禍ではオンライン中心だった取材活動も徐々に現場でのリアル取材が増えてきており、写真撮影やメモを取る機会が増えている。筆者は日本国内ではデジタル一眼やミラーレスなどのカメラ専用機は持ち歩かず、スマートフォンのみで済ませていることが多い。

 以前までは、4台運用しているスマートフォンのうち、iPhone 8(回線はソフトバンク)が音声メモ、iPhone 7 Plus(回線はAT&T)がスライド撮影用、Pixel 3(回線はGoogle Fi)が人物を含む全体の撮影用、「Galaxy S20+」(回線はNTTドコモ)が海外滞在時の携帯電話をインターネット接続するためのモバイルルーター代わり(そしておサイフケータイ)という役割をそれぞれ与えていた。

 撮影を2つのスマートフォンに分けているのは、スライドと人物撮影ではズーム倍率が異なるため、いちいち切り替えるよりは固定設定にしてしまった方が便利だという理由による。ところがPixel 3をPixel 6 Proに乗り換えたことで、モバイルルーター代わりのGalaxy S20+を除くすべてのデバイスはPixel 6 Proで置き換えが可能になってしまった。

 理由としては、Pixel 6 Proのカメラ性能があまりにも高く、倍率の切り替えがスムーズでオートフォーカスが高速であり、2台運用する意味があまりなくなったことにある。加えて、Pixel 6やPixel 6 Proで導入された音声メモのトランスクリプト機能が優秀なうえ、カメラ撮影をしながらでも問題なく録音やテキスト起こしをバックエンドで実行してくれるため、iPhone 8のような別デバイスで音声記録を行う意味がなくなったことにある。

 下記はサンプルだが、東京駅で行われたイベントの様子を撮影したものだ。1枚目が倍率が1倍の標準状態で撮影したもの、2枚目が中央部の垂れ幕前でスピーチを行っている人物を4倍ズームで撮影したもの、3枚目が会場奥にあるスクリーンに表示されるスライドを8倍ズームで撮影したものになる。

イベント会場で倍率1倍で撮影を行った状態
4倍ズームでスピーチ中の人物撮影を行った状態
8倍ズームで奥にあるスクリーンのスライドを撮影した状態

 Pixel 6 Proは3種類のレンズを背面に採用しているが、1枚目の映像は主に標準の広角レンズが用いられ、2枚目の人物は“4倍ズームのボタン”を押した瞬間に光学4倍のテレフォトが撮影可能な望遠レンズに切り替わるようになっている。

 3枚目のスライドは、望遠レンズの画像を中心に複数のレンズの映像を組み合わせてデジタルズームをAIで補完した映像となるが、8倍ズームでもノイズやにじみなしで文字がくっきりと判別できている。画質は落ちるが、最大20倍ズームも可能なため、これより広い会場での撮影にも充分対応できると考えていいだろう。

 そして一部での話題のPixel 6シリーズのトランスクリプト(文字起こし)機能はどうか。

 ところどころおかしい部分はあるものの、登壇者の渾身の駄洒落である「駅だけにエキサイティングでエキ(ク)セレント」もなんとなく認識できる。

Recoderアプリでトランスクリプト抽出中の様子。録音とトランスクリプトを続行したままカメラも利用可能

 もっとも、ここで得られたトランスクリプトはそのまま原稿では使用しないため、あくまで全体の内容を素早く把握したり、キーワードで会話“ブロック”の頭出しを行うのに活用する程度なので問題ない。グーグルのRecoderアプリでは、設定でクラウドへの自動アップロードを行う機能がある。これを使うと、Webブラウザ上でトランスクリプトを表示させたまま録音の再生が可能だ。再生タイミングに合わせてキーワードをなぞっていくため、聞き漏らしのチェックに有効だ。このWebインターフェイスではキーワード入力で録音からキーワードのある箇所を抽出できるため、頭出しが非常に楽になる。特に1~2時間の長時間の録音では効果を発揮する。

録音した音声データはクラウドにアップロードが可能。トランスクリプトごと転送されるので、あとでキーワード検索をかけながら頭出しが可能

 ただトランスクリプトにも弱点がある。たとえば別の言語が混じった瞬間にテキスト変換が崩壊する。

 先に紹介したイベントでは、シンガポールからの来賓が英語でスピーチを行っていたため、逐次通訳を挟んで英語と日本語が交互に聞こえてくるのだが、トランスクリプトの言語を日本語にしたままの状態で英語が入ってくると、画像のように意味不明の文字が並ぶようになる。

英語のスピーチと日本語の逐次通訳が混在した状態のトランスクリプト。意味不明の文字の羅列になっている

 「supercalifragilisticexpialidocious」より長い単語を見かける機会はそうそうないが、いちいち逐次通訳が入る状態で言語モードを日本語と英語で切り替えるのも苦痛なので、とりあえず英語のトランスクリプト化はこの場面では諦めた。

 なお、Google Recoderアプリは最新のアップデートでPixel 3以降の機種までトランスクリプト機能が対応するようになっている。そのため、前回ピックアップして使い道のなかったPixel 5を引っ張り出して、2台体制で英語と日本語のトランスクリプトを実行してみるのも手かと思う。