みんなのケータイ

発展途上のGalaxy AI、日本語の精度向上にも期待

 4月のアップデートで、筆者の使用している「Galaxy Z Fold5」が「Galaxy AI」に対応した。機能的には、生成AIを使った壁紙作成などには非対応だが、その他のほとんどは発売されたばかりの「Galaxy S24」「Galaxy S24 Ultra」と共通している。文字起こし対応のレコーダーも利用可能だ。

Galaxy Z Fold5でも、Galaxy AIを利用できるようになった

 アップデート当初は、文字起こしをしてもかなりグダグダで何を言っているかがさっぱり分からない状況だが、日本語の言語パックにアップデートをかけてからは、それなりに内容が分かるようになった。

 こうなると、その文字をベースにした要約機能もある程度使えるようになってくる。試しに、連休の中日である5月2日に開催された(!)楽天モバイルの発表会を文字起こししたあと要約してみたが、「最強こどもプログラム」が発表されたことや、3GB以下で449ポイント還元があること、それを適用した際の実質価格など、必要な部分は抽出されていた。

楽天モバイルの発表会を録音して要約してみた。最強こどもプログラムが発表されたことや、その中身の一部が分かる

 さすがにこれをそのままうのみにして記事に使うわけにはいかないレベルだが、後から発表内容を振り返るぐらいのときには悪くない。ただ、並行して使用しているPixelのレコーダーに搭載された文字起こしと比べると精度は低く、まだまだ改善の余地が大きいものの、それなりに使えそうという感触だ。個人的には、後からまとめて文字起こしするのではなく、リアルタイムな表示にも期待したいところだ。

ただし、ベースとなる文字起こしはまだまだ粗が多い。逆に言えば、要約としてしか使えないという印象だ

 ちょっと期待外れだったのが、Samsung Notesの手書き認識。これまでも、テキスト化できる機能はあったが、Galaxy AIへの対応でまとまった範囲を指定し、それを一気にテキスト化できるようになった……のだが、これがなかなか厳しい。

 筆者は囲み取材など、立ちながら話を聞く際にSペンでGalaxy Z Fold5にメモを取ることが多く、走り書きのようにかなり崩れた文字が多い。決して字が汚いわけではないことは強調しておきたいが(笑)、急いで書くとどうしても判別が難しい文字が増えてしまう。これはAIも同じようだが、やはり筆者自身が後から見返してテキストを入力し直すよりも、精度は低い。

Samsung Notesの文字起こしは、認識精度がまだまだ

 日本に研究所もあるだけに、日本語対応の部分は期待していたが、残念ながら実用的な仕事のツールとして使うには、まだまだこれからといったところ。今後の継続的なアップデートに期待したい。

 一方で、画像の編集に関してはそれなりに実用的だった。例えば、以下のように手前に写り込んだ柵を大胆に消しても、それなりにその他の背景と整合性の取れた画像が生成される。生成にはやや時間がかかるものの、実用性は高い。ちょっとした人物の写り込みなら、最初からどこにいたかが分からなかったような写真に仕上がる。

画像編集は得意分野の1つ。大胆に写り込みを消すことも可能だ

 撮った動画のフレームを補完して、自動的にスローモーション動画を作れる「インスタントスローモーション」もおもしろい。日々の生活の中で、わざわざスローモーションに設定して動画撮影することはあまりないが、これがあれば、普通に動画を撮っておくだけで済む。

インスタントスローモーションは、動画を長押しするだけと操作性もシンプル

 AIのようにざっくりまとめると、音声認識やテキスト化を含む部分はまだまだ発展途上だが、画像や動画に関するAI活用はまずまずの優秀さ。とは言え、Galaxy Z Fold5は大画面ゆえに、Sペンを使って文字を書くことも多い。Galaxy Sシリーズ以上に仕事に活用できる端末のため、日本語の精度向上には期待したいところ。