てっぱんアプリ!

グーグルの新実験アプリ「Google AI Edge Gallery」は通信も料金も不要! スマホ単体で画像・音声認識、AIチャットができる

 スマホを、もっと楽しく快適に使うには、アプリを活用しよう。本コーナーでは、続々登場する旬なアプリの中から編集部が厳選した、スマホユーザー必携の“てっぱん”アプリをご紹介します!

◇   ◇   ◇
アプリ名: Google AI Edge Gallery
開発者: Research at Google
価格: 無料
対応OS: Android 12 以上
カテゴリ: その他

 世の中のAI関連のサービス、特にAIチャットのようなものは、多くがクラウドで提供されている。ただ、機密情報を扱いにくかったり、通信できる環境でしか使えなかったり、というのが人によっては難点だ。

 これを解決したいなら、「オンデバイスAI」を実現するツール「Google AI Edge Gallery」を試してみよう。

通信不要でAI画像・音声認識などが可能な「Google AI Edge Gallery」

通信不要でお金もかけずに使えるAIツール

 「Google AI Edge Gallery」は、スマホのみでAI処理を行なえるようにするアプリ。いわゆる「オンデバイスAI」を可能にするツールだ。

 たとえばAIチャットの多くはスマホからサーバーへデータを送り、クラウド上でAI処理を行なった後、結果をスマホに返すことで実現している。しかし、本アプリは通常サーバー側にあるAIモデルをスマホ側に持って処理する仕組みのため、通信できない環境でも利用可能。ネットワークを介さないことから機密情報を扱いやすいというメリットもある。

 機能は大きく分けて4種類、「Ask Image(画像認識)」「Audio Scribe(音声認識)」「Prompt Lab(テキスト処理)」「AI Chat」がある。これらを利用するにはあらかじめAIプラットフォーム「Hugging Face」へのユーザー登録と、AIモデルのダウンロードが必要になる。

 ユーザー登録やAIモデルのダウンロードは無料で、利用料金はかからない。ただ、AIモデルは小さいもので数百MB、大きいもので5GB近くあるので、スマホのストレージに余裕があるか確認してから使い始めよう。

最初にAIモデルのダウンロードへ
Hugging Faceにログインし、連携を承認
「Open user agreement」ボタンをタップ
「Agree and send request to access repo」ボタンをタップ
AIモデルの利用同意書を送信
AIモデルのダウンロードが開始し、完了後に各機能が使えるようになる

画像認識やテキスト要約などが使い放題、日本語でも指示・質問できる

 4つある機能のうち画像認識では、撮影した写真やスマホに保存している画像などを指定して、その画像が何であるかを尋ねたり、画像内の文字を読み取って何が書いてあるのかを教えてもらったり、といったことができる。

 音声認識では、スマホのマイクで録音した音声、または音声ファイルに対して、文字起こししたり、他の言語に翻訳したり、といったことが可能だ。ただし、音声データ1つあたり30秒までという制約があるので、実用性はあまり高くないかもしれない。

 テキスト処理では、入力したテキストに対するトーンの変更や要約、プログラミングコードの生成指示などが行なえる。そしてAIチャットでは、AIに繰り返し指示や質問をして対話するシンプルなテキストチャットができる。

 UIは英語だが、どの機能でも日本語を使用可能。試しにGoogle Pixel 10 Proで実行してみると、AIが回答し始めるまでに数秒~十数秒程度かかり、少し待つかな、といったイメージだ。クラウドベースのChatGPTやGeminiなどと比べればできることは少ないが、通信できない場所でも動作し、情報漏洩をあまり気にせず、いつでも好きなだけAIを活用できるのは大きな強みだろう。

画像内の文字認識
音声の文字起こしをして、英語にも翻訳させてみた
記事テキストを1段落分に要約
AIチャットで架空の物語について説明してもらった
スマホに保存している他のAIモデルもインポートして使えるようだ