ケータイ用語の基礎知識

【第1011回】「生成AI」どうやって使うの? 思った通りの答えを導き出すのに必要な「プロンプト」のコツを紹介

 昨今、話題の生成AI。ジェネレーティブ(Generative)AIとも呼ばれます。その名前の通り、さまざまなコンテンツを生成できる、あるいは生成するための学習ができるAI(人工知能)のことです。

 パソコンやスマートフォンで気軽に使えるため、すでに試してみたという人も多いはず。しかし、どういうわけかうまく動いてくれない、予想もしていない斜め上の回答が提示された、という経験をしたことはないでしょうか。今回は、どうしたら生成AIが思ったように動いてくれるのか、コツを紹介します。

NTTの「tsuzumi」も生成AIの一種

生成AIって?

 ユーザーが入力した指示・条件などに従って、文章、画像、音声、音楽などを生成することができます。また、与えられた指示・条件や生成したデータを学習することができ、さらに生成する出力の精度を高めることができるのも生成AIの大きな特徴のひとつです。

 2023年に生成AIのひとつとして有名なOpenAIの「ChatGPT 3.5」が公開されました。指示に対する回答の精度や出力される文章表現の自然さがこれまでのAIのそれとは一線を画するものであったことから、この生成AIというジャンルが一部のコンピュータの専門家だけでなく、世間一般も注目されるようになりました。

生成AIを賢く使うコツは「プロンプト」に

 AIを上手に使うには「プロンプト」と呼ばれる指示文がポイントです。プロンプトとは、AIに何をしてほしいかを伝える指示です。文章や画像の生成、翻訳、音声アシスタントなど、さまざまなタスクに対して、AIにどのような処理を実行してほしいかを記述します。

 具体的なプロンプトの書き方ですが、大切なのは前提として「場面と役割を設定する」こと、AIへの指示の「目的を明確にする」こと、そして制約条件と言いますが「回答の表現や出力方法をAIに伝える」こと、そしてAIに理解できるようにプロンプトを「簡潔でわかりやすい文にする」ことです。

 最も大事なのは、AIに何をさせたいのか、指示として具体的に「目的を明確にする」ことです。たとえば「文章を翻訳して」「このデータの特徴的な点をまとめて」「ビジネス文書を作って」などです。そうでないと、AIは曖昧で当たり障りのない、データの平均的な傾向を並べ立てる……といったことしかしてくれません。

 AIに前提情報として「あなたにこういう観点で仕事をしてほしいよ」という情報を与えることも重要です。「来週、〇〇に旅行に行きます。1日で回れるおすすめの観光名所と所要時間を教えてください」「新しい本のアイデアを考えている編集者です。AIのトレンドを3つ教えて下さい」といった風に前提情報を与えます。

 そして、制約条件である「回答の表現や出力方法を伝える」ことも大切です。「定型的なビジネス文書として作成してください」「箇条書きにしてまとめて」「Webニュース記事の原稿を作成して」など、具体的に指示します。

 生成AIによっては、図での出力や、表出力に対応しているものもあります。ですので、たとえば「表にしてまとめてください」といえば、スッキリとわかりやすい表にしてまとめることもできるのです。

 プロンプト自体を「簡潔でわかりやすい文にする」ことも忘れてはいけません。専門用語や複雑な文章は避け、簡潔でわかりやすい文を心がけましょう。5W1H(What、When、Where、Who、Why、How)を意識して書くことや冗長な表現を避けること、句読点や改行を活用して読みやすくしたり複雑な指示は各ステップに分割して伝えたりすることで、求める答えを得やすくなります。

少々、悪ふざけな例だが意外と答えてくれた。さらに自身の使い方のアドバイスまで説明している

生成AIの、スマートフォンアプリだからできること

 かつては専用アプリ、あるいはパソコン上のブラウザなどからしか利用できなかった生成AIですが、現在はスマートフォンからも利用できます。

Pixel 9 Pro XL上で動くGemini

 2024年9月現在では、OpenAIのChatGPT、マイクロソフトのCopilot、グーグルのGeminiなどのスマホ用アプリが提供されており、iPhoneの場合は今後「Apple Intelligence」の提供も始まる見通しです。

 ChatGPT、Copilot、Geminiのスマートフォン用アプリは、それぞれ少しずつ違いがありますが、いずれもパソコンのブラウザから使用する場合と違い、スマホに合わせて最適化されています。スマホ適合部分のひとつとして挙げられるのが、ユーザーインターフェースです。スマホアプリは、スマホに最適化されたインターフェースを提供します。タッチ操作に適しており、モバイルデバイスの画面サイズに合わせてデザインされています。

 第二に挙げられるのは、カメラへのアクセスなど、スマホのハードウェアを活用できることです。たとえば、AIにその場でスマホのカメラで撮った写真を見せて、そこから何が読み取れるかを質問することができます。

 第三に挙げられるのは、スマホのアクセシビリティを利用した入出力です。たとえば、音声入力の利用が手軽にできることが挙げられます。実際、ChatGPT、CoPilot、Geminiともにスマートフォンの音声入力を利用することができます。GeminiはもともとChromeブラウザでも音声入力ができましたが、ChatGPTでも手軽に音声入力ができるのは、スマホアプリの魅力です。

 ちなみに、Geminiなどはオフラインでもその一部機能を利用することができます。たとえば、Androidスマートフォンでは、音声メモの要約やメールでの返信候補を提案する機能がその例です。

大和 哲

1968年生まれ東京都出身。88年8月、Oh!X(日本ソフトバンク)にて「我ら電脳遊戯民」を執筆。以来、パソコン誌にて初歩のプログラミング、HTML、CGI、インターネットプロトコルなどの解説記事、インターネット関連のQ&A、ゲーム分析記事などを書く。兼業テクニカルライター。ホームページはこちら
(イラスト : 高橋哲史)