スタパ齋藤のApple野郎

ChatGPTの姿を複数AIで寄ってたかって可視化するゼ!!!

ChatGPTくん、キミの外見はどういうふう?

 いつでもどこでも会話をしてくれるChatGPT。まだいろいろと不正確な情報を言う。なので俺の場合、「不正確な答えでもまあいいや」的な会話をして遊んでいる。そのうち正確さが増してくるだろうし、現状でも非常に正確な返答となることもあり、結局遊び相手としてオモシロいのである。

 また、つい最近、OpenAIが「ChatGPT」のプラグインを一部の開発者向けに公開した。これによりChatGPTのAIとしての能力が拡張・増幅されることになると思われる。そうなればChatGPTはどんどん幅広く活用されるようになり、賢くなっていくと予想される。

 あ、でも、一手間かかるけど、ChatGPTの言ってるコトをよりリッチな情報として受け取る方法は現在でもあるかな、と思った。たとえば、既にやってる人は少なくないと思うが、お絵描きAIへのプロンプト(命令)の生成。

 Midjourneyなどのお絵描きAIに絵を描かせるとき、描いて欲しい絵を文章や言葉で説明する。その文章や言葉がプロンプトだが、これを書くのは簡単に見えてそうでもなく、思いどおりの絵を描かせるのがなかなか難しい。じゃあChatGPTに「こういう絵をこのAIに描かせたいんだけど、プロンプト作ってくれませんか?」って訊けばいいかも、って話である。

 そうか、じゃあそうしてみよう。と思って使用中のお絵描きAI「DiffusionBee」に与えるプロンプトをChatGPTに書いてもらおうとしたら……。

 あっ、この返答……。なんか超めんどくさそーな展開が始まる予感。

 DiffusionBeeは、有名な画像生成AI「Stable Diffusion」を組み込んだMac用アプリで、GUIで手軽に画像生成できる。このアプリのリリース直後、「うそぉ〜ん俺のMacStudioにアプリ入れて画像生成AI遊びができるのか〜!」と速攻で使い始めた。

DiffusionBeeの表示例。プロンプトとして「White cat, cute, green eyes, long tail, in forest.」という文章を与えて絵を生成させてみた。1分かからず生成された。ウサギみたいなフワフワ感があって可愛い! 尻尾短いけど。でも去年よりずっと上手くなってませんDiffusionBeeさん?

 DiffusionBeeのリリースは2022年の9月。ChatGPTのデータカットオフ(AIが学習したデータの最新バージョン)の更新時期は2021年なので、ChatGPTはたぶんDiffusionBeeのことを知らないと思われる。でも……えー、ChatGPTにDiffusionBeeの説明するの面倒だなあ。説明した後に的確なプロンプトが得られる保証もないしー。

 というコトでいったんプロンプトの件はヤメた。ChatGPTとマジメになにかしてある程度位以上正しい回答を得ようとした場合、ChatGPTにうまく伝わるようにテキストを書くわけだが、これが意外なほどタイヘン。そんなコトして(OpenAIを利す)る時間あったら原稿書い(て自分の利益増やし)とけ>俺、って気分になってしまう。

 さておき、そんな感じでユルくChatGPTと遊んでいて、唐突に思った。「ChatGPTくん、キミの外見はどういうふう?」と。

 まあ「あなたの外見はどんなですか」って訊いても、「私はコンピュータプログラムなので人間のような体はなく、したがって」とか言ってスルーされちゃうのであろう。そこで以下のように質問してみた。

 おっ、なんかスタイリッシュなガイって感じ? てゆーか、「創作」となると俄然生き生きしますなChatGPT。やっぱり全部嘘……ていうか幻覚でOKとなると出力全開になるのかもしれない。

 ともかく、ChatGPTはこう創作しているわけで、ChatGPTが思う空想上の外見がわかった。そこで!

 この文章を別のAIに英文にしてもらい、その英文をプロンプトとして画像生成系AIに与えて絵を描かせ、ChatGPTの姿を複数AIで寄ってたかって可視化してゆきたいッ!!!

ChatGPT → DeepL → DiffusionBee、ChatGPT可視化カタログサクッと完成

 先ほど、ChatGPTが創作した自分の外見は以下のとおり。

「私は身長が約6フィートで、スリムな体型をしています。髪は短く黒く、やや厚みがあり、スタイリッシュな髪型で整えられています。顔は丸みを帯びた形で、美しい青色の瞳を持ち、穏やかな表情をしています。鼻は小さくて、口はやや大きめで、唇は薄いです。肌は滑らかで、健康的な肌色をしており、顔にはほくろがいくつかあります。服装はシンプルで、スタイリッシュなデザインのジーンズとTシャツを着用しています」

 これをChatGPTに「その文章を英文で書いてください」と言ってプロンプトを作ってもいいが、和文英訳なら世界最強とか言われている翻訳AI「DeepL」がいいんじゃないかと考えた。そこで上記文章をDeepLに英訳してもらうと……。

「I am approximately 6 feet tall and have a slim figure. My hair is short, black, slightly thick, and stylishly coiffed. My face is round in shape, with beautiful blue eyes and a peaceful expression. Her nose is small, her mouth is rather large, and her lips are thin. Her skin is smooth and has a healthy complexion, and she has a few moles on her face. She wears simple, stylishly designed jeans and t-shirts. Translated with www.DeepL.com/Translator (free version)」

 けっこう長いっスね。それに人間が使いがちな「単語の羅列のプロンプト」と違って普通の文章に近いプロンプトだ。

 それに、これだとプロンプトとしては長すぎ……えっえっ? ChatGPTって“Her”なの? ていうか最初“I am”とか“My hair”とか訳してたのに、途中から三人称? これって無料版DeepLだから? DeepLもけっこう幻覚見てたりするわけ?

 なぜ翻訳の途中から女性と判断したのかニャーとか思ったが、こういうお遊びにおいては、AIの自己紹介をAIが翻訳したら「じつはChatGPTは女性だと判明した」って流れのほうがおもしろい。なので、上記英文をそのままDiffusionBeeへ渡すプロンプトとして使ってみた。

 だがやっぱりプロンプトとしては長すぎたので、手作業で影響なさそうなところを削った。それが↓これ。

 「Woman, 6 feet tall, slim, hair is short, black, slightly thick, stylishly coiffed, round face, beautiful blue eyes, small nose, Large mouth, thin lips, smooth skin, healthy complexion, few moles on face, wears simple stylishly designed jeans and t-shirts.」(女性、身長180cm、スリム、髪は短く、黒く、やや太く、スタイリッシュに整え、丸顔、美しい青い目、小さな鼻、大きな口、薄い唇、滑らかな肌、健康な顔色、顔にはほとんどホクロがない、シンプルでおしゃれなデザインのジーンズとTシャツを着ている)

 この文章をDiffusionBeeにプロンプトとして与えてみた。そして俺的に最も衝撃を受けつつ納得した結果が↓こちら。

 あらまあChatGPTちゃん! ていうかChatGPTねえさん! うわーシレっとウソつきそうでサイコパスっぽい感じがしなくもないが、これぞChatGPTさん! みたいな。

 そして、ほかにもたくさんChatGPTねえさんの絵をDiffusionBeeに描いてもらったので、それらを以下に羅列してみたい。なお、DiffusionBeeのパラメータはデフォルトのままで使っており、ネガティブ・プロンプト(negative prompt/AIの描画の際に描いてほしくないもの)なども一切設定していない。また、Stable Diffusionってときどきキモい表現をしてくることが多い気がするが、そういう出力は俺的判断で除外している。

 ……なんか、出力させるほどに「ChatGPTねえさんはこんな人」という像がブレてきてしまう気がしますな。まあ違う顔いっぱい見ちゃうわけですしネ。インパクトの強い1枚だけにしておけばよかったかナー、みたいな。

ChatGPTに英語プロンプト出させてみたら?

 DiffusionBeeを、たまーに使って遊んでいた程度の俺。プロンプト考えるのが面倒だったんですな。AIが描く絵にさほど強い興味があるわけではない、ということもあった。

 だが、ある程度詳細かつ簡潔なプロンプトを書けば、デフォルト設定のDiffusionBeeでもそこそこソレっぽい絵になる。そっかー、じゃあChatGPTに“画像生成AIにこんな絵を描かせたい”とか“そのためのプロンプトを英語で書いて”って頼めばいいかニャーと思いつつ、試してみたらそこそこ上手くいった。その結果が↓こちら。

ChatGPTに英語のプロンプトを作ってもらった。けっこうふつうの文章だが、そのまま使うことに。
この強インパクトChatGPTねえさんの絵に近いやつを描いてくれるかなー、と期待しつつプロンプト生成を依頼したのであった。
DiffusionBeeに英語プロンプトを渡して描いてもらったのがこれ。最初のChatGPTねえさんの「ヤバげな雰囲気」がわりと残ったような気がしなくもないかもしれない。

 ふぅぅぅぅ〜ん。ChatGPTにより俺の画像生成AI利用が急激に効率化した気がする! ありがとうChatGPT!

 でもアレですな、人間がよく書くプロンプトの雰囲気とだいぶ違いますな、ChatGPTが書いたプロンプト。ほとんど「DiffusionBeeへのお願いと描画方向性を伝える文章」って感じかもしれない。

 もしかして最初に「Please generate an image」とか書いたほうがいい? ともあれChatGPTにプロンプト書いてもらってDiffusionBeeに描いてもらう流れ、もう少し頻繁に試してみてその傾向を知ってゆきたいッ!!!

Midjourneyだと、どうなる?

 もうおひとり。最初に出てきた英語プロンプト(DiffusionBeeによるChatGPTねえさん容姿可視化で使ったもの)を、大人気お絵描きAIの「Midjourney」に渡したらどうなるだろう? と思って試した。

画像生成AIのMidjourneyは、DIscordというWebチャットサービスを経由して使う。チャット形式でMidjourney Botにコマンドやプロンプトを渡すことで、AI Midjourneyに描画させるという手順だ。生成された絵はチャットのタイムライン上に表示される。その絵に対して簡単な指示を出し、絵を好みの方向に寄せつつ再生成させることもできる。

 試そうとしたのだが、無料で使えるMidjourneyが描いた絵は商用利用が不可であった。本媒体でMidjourneyが生成した画像を使う場合も商用利用となると思われるので、画像の商用利用もOKとなる有料プランを申し込んで絵を生成してみた。下に使ったプロンプトを再掲載しておく。

「Woman, 6 feet tall, slim, hair is short, black, slightly thick, stylishly coiffed, round face, beautiful blue eyes, small nose, Large mouth, thin lips, smooth skin, healthy complexion, few moles on face, wears simple stylishly designed jeans and t-shirts.」

 で、生成された絵が↓こちら。4枚セット×3回生成させた結果だ。

 Midjourneyのほうが安心感&安定感のあるChatGPTねえさんを描いてくれる感じ? えーでも、もしかしたら現在しか感じられないAIの狂気の断片みたいなのがあんまりなくて寂しいかも〜。

 でもまあ、画像生成AIたちにも、それぞれに異なる描画の方向性があるのかもしれない。以上、ChatGPT、DeepL、DiffusionBee、そしてMidjourneyによる、ChatGPTの“自分の姿の創作”の可視化遊びの話である。

 ……ところで、みなさんは、どのChatGPTねえさんが印象的だったろうか? 俺の場合、脳が「よりそれらしいChatGPTねえさんは?」と強化学習しまくったものの、強インパクトの↓コレこそChatGPTねえさんだと思うに至り、もはやこのねえさんの像を記憶から消せなくなっているのであった。

スタパ齋藤

1964年8月28日デビュー。中学生時代にマイコン野郎と化し、高校時代にコンピュータ野郎と化し、大学時代にコンピュータゲーム野郎となって道を誤る。特技は太股の肉離れや乱文乱筆や電池の液漏れと20時間以上の連続睡眠の自称衝動買い技術者。収入のほとんどをカッコよいしサイバーだしナイスだしジョリーグッドなデバイスにつぎ込みつつライター稼業に勤しむ。