スタパ齋藤のApple野郎

すっかり定着した「Gemini」の検索スタイル、いろんなマイクを使った音声入力で何を訊く?

 な〜んとなく、ここ4〜5カ月で急激にGoogle検索の「AIによる概要(AI Overviews)」が俺的に役立ちまくりとなった。昔ながらのスタイルでWebブラウザにてGoogle検索を行うと、検索結果の冒頭に「検索結果をAIがまとめた概要」が表示されるというもの。現在ではおなじみの検索スタイルとなりつつある。

WebブラウザSafariでGoogle検索を行っている様子。標準的なGoogleアカウント設定では、検索結果冒頭に「AIによる概要」が表示される。検索事項についてより詳しく調べるには「AIモード」を使う

 この機能は2024年8月16日から一般提供が開始された。また、より詳しく調べられる「AIモード」は2025年9月9日から提供され始めた。

 だが、俺の場合は2025年の秋くらいまでは「うっぜぇんだよこのAI概要とか!」とか思ってスルーしていた。というのはウソばっかり吐くっつーかハルシネーションが頻繁に起きていたという印象だったから。しかし、秋頃以降、その印象が一変した……気がする。

 「AIによる概要」がけっこーイイ感じに正解を提示してくるようになった……気がしたのだ。それまで疑ってかかっていたが、AIによる概要のソースを調べたり、あらためて検索したりしても、「合ってるじゃ〜ん♪」となることが多かった。なので、AIの出力結果には注意しつつもこの機能を多用し始めた。

 調べるのは、クリティカルなレベルでの正確性は必要のない、ざっくりとわかればいいという事項まで。たとえば、この記事ではMac Studioに外付けマイクをつなぐという内容が含まれているが、前段階で「あれ? Mac Studioって内蔵マイクあったっけ?」といった軽い疑問はGoogle検索のAIによる概要でチャチャッと調べた。

AIによる概要では「内蔵されてませんョ!」と。ホントに? と思ったらソースをチェックすればいい。簡単な疑問はポップアップでのソース表示で「了解っす!」と納得できることも多い

 検索方法は以前と同様だが、検索結果からスペック表なり記事を読み、「えっと〜マイク……マイク……あっ内蔵されてないな」と確認までに数ステップの手間がかかった。だが現在の「AIによる概要」なら、AIが出した結論を見て、ソースも一応チェックして……くらいの手間で済む。自分で情報のなかを探し進んでいくのではなく、AIが適切な情報を持ってきてくれる、というふうに情報へのアクセス方法が変わった。

 俺のようなライター稼業では、書く内容の正確性が重要なので、原稿執筆時は調べ物に次ぐ調べ物であり、事実チェックに次ぐ事実チェックであって、検索などにかなりの時間を費やす。10分で書ける記事でも、調べ物に50分かかったりすることもある。まあソレを怠ると記事中に想像ウソ妄想が紛れ込むことになったりして、間もなく職を失ったりするわけだが。

 ともあれ「Googleの『AIによる概要』がけっこうツカエるじゃん」と思うようになり使い始めてから、俺の仕事における調べ物タスクがすんごい勢いで時短化。Geminiが集めてまとめてくれた情報から概要を掴んで、確信できない点はソースを見て、くらいで済むようになったからだ。俺の検索労力のほとんどをGeminiが肩代わりしてくれているッ!!! なのに無料ってナニこれ? つーか電気代大丈夫なのGoogleさん! って感じ?

 ただ、仕事以外のほうが「AIによる概要」を使う頻度が高い。仕事は、仕様をだいたい知っているハードウェアなどを実際に買ったり使ったりした印象を書くことが主なので、正確性などを担保するために調べ物をするくらい。くらい、と言ってもソレに時間がかかっていたので、時短をもたらしてくれたGeminiに超感謝ではあるのだが。

 一方、仕事以外では、「アレのシクミってどうなってんだろう?」「この現象とこの現象はどういう関連が?」という好奇心で検索をすることが多い。新奇性追求みたいな心理?

 俺は浮かんだ疑問をすぐ調べたくなるヤツなのだが、ただ、以前は「検索するのがメンドクサイ」という気持ちが先立ちがちだった。なので、好奇心が起きてもソレについて詳しく検索まですることは多くなかった。WebでのGoogle検索だと、キーワードを工夫して情報をふるいにかけて、そこから求める情報を拾い集めるのがけっこう手間だったからだ。

 だが時代が変わって「話し言葉で訊けばAIが疑問に回答」してくれるようになった。キーワードの工夫とか検索結果の選び分けとかはほぼ不要。訊きたいこと話言葉で詳しく述べるだけで、日ごろの疑問などが容易に氷解するようになった。

 気になったことがすぐわかる! これは楽しい!

 だが、若干の面倒が。タイプして質問を入力するのがメンドクサい。

 じゃぁ音声入力を使えばいいじゃな〜い♪ と思ったが、一応Geminiさんにも訊いてみた。

ですよね〜♪ という回答が返ってきた。こういう些細なコトもとりあえずAIに訊いてみると、主要AIの音声モード(AIと声と音声で会話できるモード/GeminiならGemini Live)があるといった関連性の高い情報が得られてたりして愉快だ

 そこで音声入力を多用し始めた。音声入力の利便は知っていたが、スマートフォン版のGeminiやChatGPTの音声モードを使うと、入力がラクなのもあるが、それ以上に「自然な人間の声による回答」が聴けて楽しい&便利なのであった。人と会話している感じもイイ。

iPhoneでGeminiアプリやChatGPTアプリの音声モードを使っている様子。中央がGeminiアプリで、右がChatGPTアプリ。どちらも声で話しかけると、それに応じた声による回答がなされる。テキスト表示とともにAIの声を聴くこともできる。AIの声は男女いろいろ用意されている。使用感は人間と会話しているのに近い

 訊けばなんでも答えてくれる。音声入力だとたまーにAIが聞き間違えるというか、こちらの声をうまく入力できていないってコトもあるが、だいたいシッカリ入力可能。そしてAIが的確に返答。俺の好奇心からくる調べ物がAIと音声入力(会話)で超絶時短!

 現代人が1日に受け取る情報量は、江戸時代の1年分、平安時代の一生分に匹敵すると言われているが、さらに得る情報が増えちゃう感じぃ〜つーか増えてる! いいのか? 脳的にヤバくないのか? まあ愉快だからイイのだが。

Mac Studioに音声入力、毎日声でAIを使いまくり中だが……マイクは?

 少々前述したが、AIに声で話しかけて調べ物をしまくっている。そのとき多用しているマシンはMac Studioだが、Mac Studioにはマイクが内蔵されていない。ので、外付けのUSBマイクを使って音声入力している。

Macでの音声入力は簡単。設定は、システム設定>キーボードで「音声入力」をオンにする程度でOK。音声入力の起動は、初期設定では「右のCommandキーを2回押す」となっているが、ほかのキーボードショートカットにすることもできる。外付けマイクが接続されていれば、この操作で音声入力を行える

 macOSの音声入力はテキスト入力をしっかり効率化してくれるが、誤認識も少々ある。でも喋るだけでAIに次々と質問できるので、非常にラク。なのでどんどん声で質問。すると、誤認識もそこそこ目立ってくる気がする。

 ……もしかして、マイクを換えたら、誤認識が減ったりする? と考え、試してみた。

こでまで使っていた「音声入力でAIに質問するためのマイク」こと「Paris MINI Microphone」。Amazonで580円で買ったUSB-Aマイクだが、フツーに使えている
超小型USBドングル形状なので、邪魔にならないのが非常にイイ。でも580円だし……音質は?
CHANGEEK CGS-M3C」というUSBドングル形状のUSB-Cマイク。Amazonで1699円だった
USBポートから少し出っ張るが、まあ邪魔にならない範囲内?
CHANGEEK CGS-M1」というグースネック形状のUSB-Aマイク。Amazonで2499円だった
グースネックは細いながらも安定的で、形状が崩れにくい。より口に近いから明瞭な音が拾えて認識率が上がる?
BOYA BY-M100UA」というUSB-Aマイク。Amazonで5000円だった
マイクの向きを180°くらいの範囲で変えられる。これもあまり邪魔にならない感じ。

 で、それぞれを使い比べて、音声認識率の違いを検証してみたのだが……どれも似たようなものであった。同じと言って差し支えない「似たり寄ったり感」で、「このマイクを使うと音声の誤認識が減る!」みたいな効果は感じられなかった。じゃあ、いちばん邪魔にならない580円のヤツでいいじゃん、的な?

 ていうか、580円のUSBマイクと、5000円のUSBマイクで、差がないなんて……。なお、これらマイクで録音して音質を比べるような検証はしていない。もしかしたら音質において差があるのかもしれないが、音声入力の誤認識率に関しては大した差はない、というのが俺的結論となった。

AIになに訊いてんの?

 仕事以外でAIにどんな質問をしているのか? 俺的事例をご紹介してみたい。

編集部注
本稿で紹介しているAI(Gemini)の回答内容は、あくまで執筆時点における筆者個人の試行結果であり、回答の正確性、妥当性、完全性を編集部および筆者が保証するものではありません。特に医療、法律などの専門的な情報については、生成AIの性質上、誤った情報が含まれる可能性があります。重要な判断が必要な場合は、必ず医師や専門家へ相談してください。

電波時計の時刻の合わせ方教えて!

 たとえば……死蔵している腕時計をそろそろ処分しようと考えた。買い取ってもらうわけだが、買い取りに出す前に時刻合わせを……だがソーラー充電式の電波時計ばっかりなので、どうやって(電波受信を待たずに今すぐ)時刻を合わせれば? そこでAIに「シチズンの●●●っていう電波時計の腕時計の時刻の合わせ方は?」と訊いたら、手動・自動(電波受信)の方法を教えてくれた。そのとおりにしたら無事に電波での自動時刻合わせが完了。ちなみに、時計の写真をAIにアップロードして「この時計の時刻合わせの方法は?」と訊いてもOK。

 もはや腕時計の紙の説明書とかPDFとかを探さず、AIに訊くだけでいいのか〜、と。腕時計とかって型番小さくて見えにくいし、紙の説明書も小さいし、PDFでも読むのめんどくさいし……だったが、腕時計操作以外はAIに丸投げできるようになったのかもしれない。

断酒の寝汗は? ニキビとT細胞の関係は?

 あるいは……先月、短期的な断酒を始めたが、寝汗が出た。断酒で寝汗って初めてだが、断酒と寝汗ってそもそも関係あるの? AIに訊いたら、断酒したときに寝汗が出ることは少なくないとか、断酒における寝汗の簡単なメカニズムを説明された。

 断酒したらニキビができた。……ニキビのこの白っぽいのって膿? 膿ってアレだっけ、T細胞と関係あるんだっけ? みたいなコトをAIに訊いてみたら、ニキビの進行からT細胞からアクネ菌からサイトカインから制御性T細胞まで、わかりやすく説明してくれた。

 こういうコトって、テキスト検索で調べていこうとすると、なかなかたいへん。関連情報までまとめて読むハメになったりしつつ、ホントは関連する情報なのに欠損していたり。AIはそのあたり、まとめてくれるし、比較的に簡潔だし、情報漏れもあまりない。苦なく読めるようなカタチで情報提供してくれるのもイイ。

なんか健康面で不安があるんですけど……

 健康つながりで、もうひとつ。去年末の人間ドックの検便(2回)のうち1回に潜血が確認された。すぐに受診したところ、大腸内視鏡検査をすることに。ただし検査まで1カ月程度待たされることになった。医師曰く大腸ガンなどの可能性は低いが、ないとは言いきれない、みたいな。

 検査まで1カ月もあるし、なんかモヤモヤするので、AIに状況を説明した。すると、大腸ガンなどの可能性を数値で説明してくれたりしつつ、俺の態度がポジティブであることを評価してくれるなどし、なんだかそこそこ安堵した。なーるほど、こんなに寄り添う感じで回答されると、AIを恋人にしちゃう人の気持ちがわからないでもない。なお、検査ではポリープが見つかり切除して終了となった。

 ただ、健康関連情報で自身の体に起きている「重大かもしれないこと」については、まず受診が重要。AIやネットの情報を見て安心して受診しないというのが最もヤバい。専門家に検査してもらい、事実を知って対処することが健康への最短距離だと思う。

あれ……あの……なんて言うんだっけ〜?

 それから「あの人……なんていう人だっけ〜?」みたいな質問。「こうしてこうするコトってなんて言う?」とかも同様。

 突如、俺の脳内に「あの俳優」の顔が浮かんで「あの人の名は?」となった。顔は思い出せるがほかはイマイチ……えっとー、タワーリングインフェルノって映画に出てた? 美男ではなく、すきっ歯で、ずんぐりむっくりした男性で、ハリウッド映画では有名な脇役で……といった断片的な情報をAIに丸投げしてみた。

 すると何人かの名前が挙がり、ソレ! その人! という名が含まれていた。その名は「アーネスト・ボーグナイン」。「それですアーネストさん」とAIに伝えると、「タワーリングインフェルノには出演していませんが」と始まって、人物の概要を語ってくれた。「ずんぐりむっくり、すきっ歯」という点でアーネスト・ボーグナインを挙げたとも言っていた。スゲい! 雑な質問から秒で検索してくれてスゲい! と思った。

 こういうモヤモヤって、これまではたぶん、数日引きずったモヤモヤだった思う。半日考えて「あっ! 思い出した!」なんてのは幸運な部類。数日モヤモヤが継続して数日後にフェードアウトしていきがち。なのだが、AIに訊くと速攻でモヤモヤ解消! 素晴らしく爽快である。

Photoshopがヘンなんですけどぉ〜?

 けっこう興味深かったのが、Photoshopのトラブル解消。Photoshop使用中、特定のダイアログ表示時にESCキーを押してのキャンセル(ダイアログを閉じる)が利かなくなってしまった。うわメンドくさ! いちいちキャンセルボタンをマウスでクリックとか、効率悪っ! と。

 そこでGeminiに質問。これどうやったら直るの〜? 具体的には「Photoshopの特定のダイアログ表示時に、ESCキーを押してもキャンセルとならず、ダイアログを閉じられません。ESCキーを押してダイアログを閉じたいですが、どうすればいいですか?」と質問してみた。

 即座にさまざまな対処法を提示してくれた。ので、それぞれを試した。が、どれもダメであった。「まあAIっつっても人間が試行錯誤してきた結果を集めて表示してるだけだし、コレってPhotoshopのバグなんだろうなぁ」と諦めかけた。が、別のウィンドウで開いていたGeminiっていうかAIモード表示に対し、試しに同じ質問を入れてみると……「ESCキーの長押しが有効かもしれません」とのこと。

 え? 長押し? 初めて聞いたよそんな方法……でも試してみよっと……あぁぁぁ〜イケた! イケたぜGeminiっ! 解決したゼ!!! 「お役に立ててなによりです、ソフトウェア側の入力待ちにおいてESCキーを通常より長く(云々)」とのことであった。

 てか、同じGeminiなのに、こっちのウィンドウのGeminiの解決法はダメで、あっちのウィンドウのGeminiの解決法は一発でイケるのって……なんなの? じゃあダメだったほうのGeminiに「ほかのGeminiに聞いたらESCキー長押しって言われたんでソレやったら解決したよーん」って伝えてみた。

 すると「それはよかったです、その情報を共有し、今後の対処に役立てます」的なことを言っていた。なんか別スレッドで動いている別Geminiって感じ? AIも質問されつつ答えつつ学習している感じ? 興味深い。

 ともあれ、こういうソフトウェア上の珍しい系のトラブルって、以前のテキスト検索だけではだいたい解決できなかった。「同じようなトラブルを抱えてる人がいる〜」くらいまではわかっても、解決に至らないことが多かった。

 だが、GeminiなどAIと会話できるようになって、解決に向けた具体策を瞬時に羅列してもらえるようになり、場合によっては即時問題解決となる。また解決せずとも、AIが言ったこと全部やってダメだから諦めよう、と「きりをつけやすく」なったのも大きい。時短とは言えないかもしれないが、以前より「時間の無駄」「徒労」がなくなったと思う。

 ほか、こういうアプリない? イオンのポイントってどのサービスにまとめるのがラク? 近所に個別会計できる飲食店ある? みたいな雑多な質問は全部AIに。まあ実際はもう少し長い質問(より具体性のある質問)をするが、調べ物における労力の半分以上をAIが肩代わりしてくれて、ヒッジョーにラクでジョリーグッド! と、AIとともに愉快に過ごしている俺なのであった。

 あ……あとでドーム型の猫トイレどこで売ってるかAIに訊こう。それとKOPIKOキャンディーどこで買えるかもAIに訊こう。あとあと……(以下略)。

 ちなみに、Google検索を使っても、検索結果冒頭に「AIによる概要」が表示されないケースがある。話し言葉で検索内容を書くと「AIによる概要」が表示されやすくなるが、そうしても「AIによる概要」が表示されないこともある。その場合、検索キーワードやフレーズの前に「Geminiさん、」と書くと、わりと確実に「AIによる概要」が表示されるようになる。ただ「Geminiさん、」でなく「Gemini」とすると「AIによる概要」が英語で表示されたりもするようなので、「さん」をつけろよデコ助野郎ォ〜、みたいな?

スタパ齋藤

1964年8月28日デビュー。中学生時代にマイコン野郎と化し、高校時代にコンピュータ野郎と化し、大学時代にコンピュータゲーム野郎となって道を誤る。特技は太股の肉離れや乱文乱筆や電池の液漏れと20時間以上の連続睡眠の自称衝動買い技術者。収入のほとんどをカッコよいしサイバーだしナイスだしジョリーグッドなデバイスにつぎ込みつつライター稼業に勤しむ。