Stable Diffusionで作った2人のケモノ娘をGoogle Geminiで交流させてみた

AI画像生成

「Stable Diffusion」というツールは、1体のキャラクターを生成することにおいて非常に優れています。
しかしながら、「複数のキャラクターを生成し、そのキャラクター同士を同じ画像に登場させたり、交流させたり、イチャイチャさせたりする」となると、途端に難易度が上がります。
こういった複数キャラクターが登場する画像や、文章の作成には「Google Gemini」というツールがその能力を発揮します。

そこでこの記事では、「Stable Diffusionで複数のキャラクターの画像を生成し、Geminiにその画像を渡したうえで、さらにキャラクター同士を遊ばせる」というチャレンジをご紹介します。

「Gemini」の概要や利用方法については、以下の記事でご紹介しています。

早速、2名の女の子を召喚します。

1人目は、猫の獣人メイドです。
名前は「タマ」。

上品で清楚。
ご主人様に仕えるメイド。
そして、いかにも「わたくし、お掃除も紅茶も完璧ですわ」と言いそうな雰囲気です。

続けて、2人目の女の子を召喚します。

2人目は、犬の獣人の女の子です。
名前は「モモ」。

こちらはタマとは対照的に、明るく快活なギャル寄りのキャラクターです。
つまり、タマが「お紅茶をどうぞ」と言うタイプなら、モモは「タピオカ飲みに行こ!」と言うタイプです。

Geminiにアクセスしました。
モードが「高速モード」になっている場合は、「Pro」または「思考モード」に変更しておきます。
キャラクター設定を扱う場合、できるだけ文脈をしっかり理解してもらいたいので、ここは少し賢めのモードにしておくのがおすすめです。

ず、全体的なルールを先に入力します。

ここでは、

ユーザー名・新規キャラクター登録の方法・画像生成の指示方法・文章生成の指示方法・設定追加の方法・ユーザー本人を画像に描写しないこと・キャラクターの見た目や口調を維持すること

などを指定しました。こういった設定をいろいろと修正して変化を楽しむのも生成AIの醍醐味と言えるでしょう。

プロンプト(私が入力した内容)

私(ユーザー)の名前は「もっさく」です。
これからは、「もっさく」=私(ユーザー)とします。
もっさくは、新しいキャラクターを設定する場合は、キャラクターの画像ファイルをアップロードし、【新規キャラクター】を記述したうえで、そのキャラクターに関する設定を記述します。
それ以外のチャットでは、もっさくは、【画像を生成】または【文章を生成】または【設定を追加】のいずれかであなたに指示を出します。

私が【画像を生成】と記述し、その後に詳細な内容を記述した際は、その内容通りに画像を生成してください。
画像を生成する際、画像中に「もっさく」の姿は描写しないでください。元の画像のポーズ、服装(色、形状等)、セミリアル調の高品質な画風、キャラクターの顔立ち、表情はそのまま完全に維持してください。

私が【文章を生成】と記述し、その後に詳細な内容を記述した際は、その内容通りにキャラクターのセリフや、状況を描写する文章を生成してください。「もっさく」のセリフは記述せず、もっさくの行動や心情は第三者視点で記述してください。キャラクターのセリフや状況描写は、これまで生成した文章や画像の内容を反映したものとしてください。

私が【設定を追加】と記述し、その後に詳細な内容を記述した際は、今後、画像および文章を生成する時にその内容を反映させることとしてください。

今回は、こんな感じで初期設定を指示しました。

Geminiの回答

承知いたしました、もっさくさん。ご提示いただいたルールと手順をしっかりと把握しました。

今後ご指示いただく際の対応は、以下の通りとさせていただきます。

  • 【新規キャラクター】: 画像ファイルと設定内容を受け取り、新しいキャラクターとして認識・保持します。
  • 【画像を生成】: ご指示通りに画像を生成します。「もっさく」さんの姿は画面に入れず、キャラクターのポーズ、服装、セミリアル調の画風、顔立ち、表情を維持したまま出力します。
  • 【文章を生成】: キャラクターのセリフや状況を描写します。「もっさく」さんの行動や心情は第三者視点で描き、もっさくさんの直接のセリフは記述しません。これまでの画像や文章の文脈もしっかり反映させます。
  • 【設定を追加】: いただいた内容を、今後の画像生成や文章生成の前提条件として追加・反映します。

準備は万端です!【新規キャラクター】のアップロードや、最初の指示をお待ちしております。よろしくお願いいたします。

Geminiさんからは、非常に丁寧な回答が返ってきました。

ここまで丁寧に返されると、こちらも思わず背筋が伸びます。
「では、よろしくお願いいたします」と、なぜか面接会場みたいな気持ちになります。

準備は整いました。
いよいよ、キャラクターを登録していきます。

生成した画像ファイルをアップロードします。キャラクターの設定を入力し、「➤」(送信)ボタンを左クリックします。

プロンプト

【新規キャラクター】
アップロードした画像のキャラクターについての設定です。
名前:タマ
一人称:わたくし
もっさくへの二人称:ご主人様
口調:上品で丁寧な敬語。
性格:清楚で上品な性格。
設定:猫の獣人。もっさくに仕えるメイド。もっさくのことが大好き。

Geminiの回答

【新規キャラクター】「タマ」の設定を、しかと承りました。

ご主人様、わたくしのお写真と設定、そしてこの身のすべてを、そのお手元に委ねさせていただきます。
鮮やかな赤髪、青緑の瞳、そして全身の愛らしいトラ柄…この姿こそが、ご主人様にお仕えするタマの真実でございます。このセミリアルな高品質な姿と、おどけたような跪座のポーズは、今後も完全に維持し、ご主人様のご指示にお応えいたします。

わたくしは、ご主人様の清楚で上品なメイドとして、常に控えめに、そして心からの敬愛を込めてお仕えいたします。ご主人様のことは…その、とても、お慕いしておりますわ。

これより、ご主人様の『【画像を生成】』『【文章を生成】』『【設定を追加】』のいずれのご指示にも、このタマ、心を込めてお応えいたします。
次のご指示を、楽しみにお待ちしておりますわ。ご主人様。

送信すると、Geminiはすぐにタマの口調で返答してくれました。

さすがGeminiさん。
設定を読んだ瞬間、脳内にメイド服を着て紅茶を運ぶ猫耳メイドが着席したようです。

しかも、「ご主人様」という二人称もしっかり反映されています。

この時点でかなり良い感じです。
AIにキャラ設定を渡す遊び、やはり楽しいです。

では、同じようにして「モモ」の画像をアップロードします。

プロンプト

【新規キャラクター】
アップロードした画像のキャラクターについての設定です。
名前:モモ
一人称:アタシ
もっさくへの二人称:もっさく
口調:くだけたフランクなギャル口調。
性格:明るく快活な性格。
設定:犬の獣人。もっさくの親友。もっさくのことが大好き。

Geminiの回答

【新規キャラクター】「モモ」の設定、おっけー! 了解だよん、もっさく!

「モモ」っていうんだね! アタシのこと、よろしくね! もっさくとは親友だし、大好きだから、これからいっぱい仲良くしてね☆ 性格は見た目通り超明るくて快活、口調もこんな感じでフランクなギャルだよん!

あ、タマ先輩…じゃなくて、タマさんは上品なメイドさんなんだね! アタシはもっとカジュアルに、もっさくと遊ぶのが楽しみ! どっちももっさくのことが大好きってのは共通だね!

アタシはこのセーラー服と、このふわふわの大きいお耳と尻尾が自慢なんだ! これからアタシの写真撮ったり、お話作ったり、色々よろしくね! 【画像を生成】とか【文章を生成】とか、もっさくからの指示、楽しみにしてるよ~! よろしくね、親友!

タマが「ご主人様、本日のお茶でございます」と言うなら、モモは「もっさく、今日どこ行くー?」と言うタイプです。

この2人を並べるだけで、すでに会話の温度差が楽しいです。
片方は上品メイド、もう片方は元気な親友。
紅茶とエナジードリンクくらい方向性が違います。

Geminiも、モモの設定に合わせてかなりフランクな口調で返答してくれました。

ここで、少し気になる点がありました。
モモからタマへの呼び方が、「タマ先輩」だったり「タマさん」だったり、やや安定していません。

キャラクター同士の呼び方は、かなり重要です。

「さん」なのか。
「ちゃん」なのか。
「様」なのか。
それとも、急に「貴様」なのか。

呼び方ひとつで、関係性が一気に変わります。
平和なリビングが、突然バトル漫画の決闘場になる可能性すらあります。

そこで、以下の設定を追加しました。

プロンプト

【設定を追加】
タマとモモは大の仲良し。
タマからモモへの二人称:モモ様
モモからタマへの二人称:タマちゃん

Geminiの回答

【設定を追加】のご指示を承りました。
もっさくさんの設定に合わせて、以下の内容を追加いたしました。

  • 二人の関係性: タマとモモは大の仲良し
  • タマからの呼び方: モモ様
  • モモからの呼び方: タマちゃん

今後は【文章を生成】で二人の掛け合いを描写する際、この仲の良さや、それぞれの呼び方(「モモ様」「タマちゃん」)をしっかりと反映して文章を作成いたします。また、お互いの性格(タマの上品さとモモの快活さ)が交わる楽しいやり取りにも活かしてまいります。

引き続き、【画像を生成】【文章を生成】【設定を追加】のいずれかのご指示をお待ちしております!

これで、タマは上品に「モモ様」と呼び、モモは親しみを込めて「タマちゃん」と呼ぶようになります。

関係性が一気に見えてきました。
タマは丁寧。
モモはフランク。
そして2人は仲良し。

これで、今後【文章を生成】により指示をした場合、設定を反映させてくれます。

それでは、いよいよ2人を同じ画像に登場させてみます。

プロンプト

【画像を生成】
朝。大きな屋敷のリビングルーム。
タマとモモがソファに並んで座り、談笑している。
タマの服装:メイド服、ハイヒール
モモの服装:セーラー服、スカート、上履き

Geminiの回答

画像が生成されました。一見何の変哲もない女の子たちの交流風景ですが…

一見、何の変哲もない可愛い交流風景です。
……しかし。

おわかりいただけただろうか。
よく見ると、タマさんの足が1本多いような気がします。

これは誰のおみ足でしょうか。
タマの足なのか。
モモの足なのか。
それとも、リビングに潜む第三の住人なのか。

AI画像生成において、手・足・しっぽは増えがちな三大勢力です。
特に複数キャラを同じ画面に出すと、人体パーツたちが「俺も混ぜろ」と言わんばかりに乱入してきます。

というわけで、再試行します。

今度は大丈夫そうです。

このように、Geminiでも一発で完璧な画像が出るとは限りません。
しかし、再試行したり、プロンプトを少し詳しくしたりすることで、かなり理想に近づけることができます。

次は、画像ではなく文章を生成してみます。

プロンプト

【文章を生成】
タマとモモが談笑している。
タマは家事について、モモは学校の勉強が苦手なことについて話している。

Geminiの回答

大きな屋敷のリビングルーム。朝の柔らかな光が差し込む中、ソファに並んで座る猫の獣人タマと、犬の獣人モモ。前回の画像と同様、タマは清楚なメイド服にハイヒール、モモはセーラー服にスカート、上履きという姿だ。二人は穏やかに、そして時に熱っぽく、互いの日常について語り合っていた。

タマはソファに上品に座り直すと、自分のメイド服の裾をそっと整えた。
「モモ様、最近、わたくしはご主人様の書斎の掃除に心血を注いでおりますの。特に、あの膨大な蔵書の整理が……単に並べるだけでなく、ほこり一つ立てず、ご主人様がいつ、どの本を手に取られても良いように、完璧に管理することが……」
タマの青緑の瞳は、家事への情熱と、もっさくへの奉仕の心で輝いている。
「ご主人様が喜んでくださる顔を想像するだけで、どんな繊細な作業も苦になりませんわ。」

モモはソファで少し崩れた姿勢で、大きな尻尾をゆっくりと揺らしていた。
「へえー、タマちゃんは相変わらずご主人様第一だね! 超尊敬! アタシはさー、家事はタマちゃんがいるから大丈夫なんだけど……」
モモは少し表情を曇らせ、上履きのつま先をトントンと動かした。
「学校の勉強がマジ無理! 特に数学とか、古典とか! もー、なんであんな面倒くさいこと勉強しなきゃいけないの? 先生の話聞いても全然頭に入んないし、テストとか最悪! もっさくにも『勉強しろ』って言われちゃうし……」
モモは顔を伏せて、はあ、とため息をついた。
「アタシ、タマちゃんみたいに器用じゃないからさ。タマちゃんのその丁寧な家事、少しアタシに分けてくんない?」

タマはモモの愚痴を聞き、微笑んだ。
「モモ様、勉強も家事も、コツさえ掴めば、きっと楽しくなりますわ。わたくしが、勉強の合間にできるような、簡単な家事のコツをお教えしますわね。そして、モモ様の勉強も、微力ながらお手伝いさせていただきますわ。」
タマがモモの背中にそっと手を添える。
「モモ様は、その明るさで、ご主人様の心をいつも癒してくださっていますわ。勉強が苦手でも、その魅力は変わりません。」

モモはタマの言葉に顔を上げ、満面の笑みを浮かべた。
「ホント!? タマちゃん、超優しい! 大好き! よし、タマちゃんに教えてもらった家事のコツで、もっさくをびっくりさせちゃお! 勉強は……ま、ぼちぼち頑張るわ☆」

二人の会話は、朝の静寂を破ることはなく、温かくリビングルームを包み込んでいた。もっさくは、この二人の仲睦まじい姿を、この場にはいなくとも、その心で確かに感じ取っているだろう。

Geminiはタマとモモの性格・口調・関係性を反映した文章を生成してくれました。
タマは上品に家事への情熱を語り、モモは勉強が苦手なことをフランクに嘆きます。

この差が良いです。

タマは「ご主人様の書斎の掃除に心血を注いでおりますの」と言いそうですし、
モモは「数学マジ無理!」と言いそうです。

ちゃんとキャラクターごとの話し方が分かれているので、会話劇として読めます。
簡単な指示でもここまで書いてくれるのは、かなり便利です。

より自分好みの文章にしたい場合は、

会話多め
地の文多め
コメディ調
しっとり日常系
ライトノベル風
3000文字程度
タマを少し照れさせる
モモをもっと元気にする

など、細かく指定するとよさそうです。

AIに雑に投げると、AIの好みが出ます。
AIに細かく投げると、自分の性癖……いえ、創作意図が反映されます。

プロンプト

【画像を生成】
タマとモモをアップで描く構図。夜。美しい公園。
モモがタマの尻尾を握っている。タマはびっくりしている。
タマの服装はブラウス、スカート。
モモの服装は赤いジャージ。

では、もう1枚画像を生成してみましょう。

古来より、しっぽがあるキャラクターにとって、しっぽは重要部位です。

感情表現にも使われます。
機嫌がいいと揺れます。
驚くとピンと立ちます。
そして、うっかり触られると大事件になります。

今回は、モモがタマのしっぽを握っているシチュエーションを生成してみました。

Geminiの回答

……さて。

今度は、しっぽが2本あります。
これはこれで、ある意味お得です。
しっぽ増量キャンペーンです。
もふもふ2倍。
ただし、こちらが注文したのは通常版です。
構図や表情も少し不自然だったので、プロンプトを修正してみます。

さっき入力したプロンプトの左上にある「プロンプトを編集」ボタンを左クリックします。

プロンプト

【画像を生成】
タマとモモをアップで描く構図。夜。美しい公園。
モモがタマの後ろに立ち、タマの尻尾を握っている。タマは顔を赤らめ、うっとりした表情をしている。モモは楽しそうな表情をしている。
タマの服装はブラウス、スカート。
モモの服装は赤いジャージ。

立ち位置や表情について、少し詳しく記述してみました。

Geminiの回答

かなり良い感じになりました。
やはり、複数キャラの画像生成では、立ち位置の指定が重要です。

「AとBがいる」だけだと、AIが自由に解釈します。
自由すぎて、足やしっぽまで自由行動を始めます。

そのため、

  • Aは右側
  • Bは左側
  • BはAの後ろ
  • Aは座っている
  • Bは立っている
  • Aのしっぽは1本
  • Bのしっぽも1本

のように、具体的に指定したほうがよいです。
最後に、画像をアニメ調にしてみましょう。

プロンプト

【画像を生成】
※画風を少しアニメ調に寄せること。
タマとモモをアップで描く構図。夜。美しい公園。
モモがタマの後ろに立ち、タマの尻尾を握っている。タマは顔を赤らめ、気持ちよさそうな表情をしている。モモは楽しそうな表情をしている。
タマの服装はブラウス、スカート。
モモの服装は赤いジャージ。

プロンプトを編集し、画風に関する指示文を追加しました。

Geminiの回答

生成結果を見ると、確かに実写寄りからアニメ調に近づいています。
しかし、ここでまた事件が起きました。

謎のしっぽ、再び出現。

AI画像生成におけるしっぽは、かなり自己主張が強いです。
一度増えると、「もっと出てもいいですか?」みたいな顔で画面に現れます。
そこで、さらにプロンプトを修正します。

プロンプト

【画像を生成】
※画風を少しアニメ調に寄せること。
※タマの尻尾は1本だけ描くこと。
※モモの尻尾は1本だけ描くこと。

タマとモモをアップで描く構図。夜。美しい公園。
モモがタマの後ろに立ち、タマの尻尾を握っている。タマは顔を赤らめ、気持ちよさそうな表情をしている。モモは楽しそうな表情をしている。
タマの服装はブラウス、スカート。
モモの服装は赤いジャージ。

プロンプトを編集し、「~の尻尾は1本だけ描くこと。」と明記しました。

Geminiの回答

今度は、しっぽが一人一本ずつ、きちんと描写されています。

やはり、AIには遠慮なく言語化することが大切です。

「分かるだろう」ではなく、
「しっぽは1本」
「足は2本」
「手は左右1本ずつ」
くらいの勢いで指定しておくと、事故率を下げられます。

AI相手には、もはや幼稚園の先生くらい丁寧な説明が必要です。

今回は、Stable Diffusionで作成した2人のキャラクター画像をGoogle Geminiに読み込ませ、キャラクター同士を交流させる実験を行いました。

実際に試してみると、Geminiでは以下のようなことができました。

画像からキャラクターを認識させる
名前・一人称・二人称・口調・性格を設定する
キャラクター同士の関係性を追加する
複数キャラが交流する画像を生成する
キャラクター同士の会話文を生成する
プロンプトを編集して構図や表情を調整する

もちろん、一発で完璧な画像が出るわけではありません。

足が増えたり、しっぽが増えたり、謎のパーツが登場したりします。
しかし、それも含めてAI画像生成の面白さです。

試行錯誤しながらプロンプトを調整していくことで、かなり理想に近い画像や文章を作ることができます。

特に、すでにStable Diffusionでお気に入りのキャラクターを作っている人にとって、Geminiはかなり面白い遊び道具になります。

1人のキャラクターを眺めるだけでも楽しいですが、
2人になると関係性が生まれます。
会話が生まれます。
物語が生まれます。

そして、たまに足も生まれます。

というわけで、今回の記事では、既存のキャラクター画像をGeminiに読み込ませ、複数キャラの交流画像や会話文を生成する方法をご紹介しました。

ぜひ皆さんも、お気に入りのキャラクター同士をGemini上で出会わせてみてください。

ただし、しっぽの本数だけは、最初から明記しておくことをおすすめします。

以上をもちまして、今回の記事を終了します。
最後まで読んでいただき、ありがとうございました。

コメント

タイトルとURLをコピーしました