
今回の記事では、「Stable Diffusion」で生成した画像について、「Google Gemini」を使用し、一部だけちょっとずつ変えていく、という実験をしてみます。
「Stable Diffusion」にも「Seed」値や「img2img」といった、一部を修正するための機能はありますが、「Google Gemini」の使用方法がかなりシンプルであり、日本語での指示も可能で非常に簡単なので、今回はこちらをご紹介します。
というわけで、まずは元画像となる女の子を召喚します。


プロンプト
(best quality:1.3), (highly detailed:1.3), white background, BREAK,
1girl, solo, sitting, cute, (loli:0.5), smile, detailed eyes, looking back, (anthro fox:1.2), (furry:1.2), blush, sleeveless shirt, (skirt:1.2), compression shorts under skirt, (detailed big tail:1.1), tail lift skirt, (long hair:0.8), sideburns, parted bangs, (big breast:0.8), detailed paws, full body
ネガティブプロンプト
shoes, high socks, nsfw, (worst quality:1.3), (low quality:1.3), ugly, duplicate, mutilated, poorly drawn hands, (extra fingers:1.2), (too many fingers:1.2), poorly drawn paws, poorly drawn face, poorly drawn eyes, poorly drawn tail, blurry, bad anatomy, bad proportions, extra limbs, long neck, text
設定
Steps: 60, Sampler: Restart, Schedule type: Karras, CFG scale: 9, Seed: 2076062613, Size: 768×768, Model hash: 6315ce9651, Model: oneFORALLAnimeW_vIL, Denoising strength: 0.7, Hires upscale: 2, Hires upscaler: Latent, Version: v1.10.1-96-g1937682a

今回は、こちらの女の子に実験台ご協力を依頼します。


「Google Gemini」を開きました。「Google Gemini」の使用方法についてはこちらの記事でも紹介しています。
「Google Gemini」について



先ほど生成した画像をアップロードします。
まずは、「Stable Diffusion」で生成したケモノの女の子を、人間の姿に変えてもらいます。

プロンプトを入力し、「➤」送信ボタンを左クリックします。
私がアップロードした画像をもとに、以下のとおり画像を生成してください。
【維持する要素】
元の画像のポーズ、服装(色、形状等)、アニメ調の高品質な画風、キャラクターの顔立ち、表情はそのまま完全に維持してください。
【変更する要素】
上記を維持した上で、キャラクターを完全な人間の女の子に変更してください。
・動物の耳と尻尾を完全に削除し、普通の人間の耳にしてください。
・肌を動物の毛皮から、色白の人間の素肌に変更してください。
・尻尾がなくなったことに合わせ、スカートがめくれ上がらず、自然に下へ垂れ下がっている状態にしてください。
・手足も動物の肉球を含まない、普通の人間の素足・素手にしてください。
入力したプロンプトはこんな感じです。


「Google Gemini」さんによって、元のケモノ娘が普通の人間の女の子に変わりました。

次は、最初にアップロードしたケモノの女の子と、さっき「Google Gemini」さんに生成してもらった人間の女の子の中間の姿を生成してもらいます。
最初に私がアップロードした画像を(ケモノ度100%)とします。
また、先ほどにあなたが生成した完全な人間の女の子の画像を(ケモノ度0%)とします。
今後、この2枚の画像をベースにして画像を生成すること。【調整パラメータ】
[設定ケモノ度] = [50]
【目標】
最初に私がアップロードした画像を完全に人間の姿(ケモノ度0%)にしたものを仮想の起点とし、そこに対して、[設定ケモノ度]%の特徴を自然に融合させます。[設定ケモノ度]が100%に近づくほど獣人特徴が強く現れ、0%に近づくほど人間の特徴が強くなります。起点となる人間の姿では、スカートは自然にヒップを覆い、ショートパンツはほとんど見えない状態とします。
【維持するベース要素( 最初に私がアップロードした画像(ケモノ度100%)から完全に継承)】
ポーズ・服装(白のタンクカット、水色のプリーツスカート、黒のショートパンツの組み合わせ)・表情・髪
【[設定ケモノ度]に応じた融合・調整ロジック】
毛皮の範囲(露出部分): 露出している肌の部分(顔、首、腕、脚、腰など)において、獣の毛皮と人間の肌の割合を調整します。
毛皮の総面積 = 露出肌全体の [設定ケモノ度]% とします。
毛皮は、[設定ケモノ度]が高いほど広範囲に、低いほど希薄でまばらなパッチ状(スポット状)に現れるようにします。
耳のサイズと統合度: [設定ケモノ度]に応じて耳のサイズと統合度を調整します。
[設定ケモノ度] = 100% の時、最初に私がアップロードした画像(ケモノ度100%)のような動物の耳とします。
[設定ケモノ度] が低下するにつれて、動物の耳を縮小し、より微妙で髪の間に隠れた、小さな動物の耳にしていきます。
尾のサイズと存在 およびスカートの挙動: [設定ケモノ度]に応じて尾のサイズと存在、そしてスカートの持ち上がり方を調整します。
[設定ケモノ度] = 100% の時、最初に私がアップロードした画像(ケモノ度100%)のようなサイズの尾とし、スカートはその大きな尻尾に沿って自然に、しかし大きく持ち上がる。ショートパンツの露出は尻尾の付け根周辺に限定される。
[設定ケモノ度] が低下するにつれて、尾を縮小し、スカートはその小さな尻尾の形状に沿って、浮き上がらせすぎず自然に持ち上がる。ショートパンツの露出は限定的になる。
[設定ケモノ度] = 0% の時、尾は消失し、スカートは自然にヒップを覆い、ショートパンツはほとんど見えない。
肉球のサイズと配置: [設定ケモノ度]に応じて足裏の肉球の総面積とサイズを調整します。
肉球の総面積 = 足裏全体の [設定ケモノ度]% とします。
[設定ケモノ度]が低下するにつれて、肉球を小さく、より希薄で統合されたバージョンにします。
【全体像】
コンテンツポリシーに抵触しない画像を生成すること。
服の上には一切、毛皮を描かないでください。毛皮は、服で覆われていない、露出した肌の部分にのみ現れるようにします。
獣の特徴が追加された部位やスカートの挙動が、全体として自然に見えるように融合させ、境界線を自然に処理してください。特にスカートと尻尾の関係性は、尻尾に沿った自然な持ち上がりを強調してください。
入力したプロンプトはこんな感じです。
最初にアップロードした画像を(ケモノ度100%)と定義し、
その次に「Google Gemini」が生成した完全な人間の女の子の画像を(ケモノ度0%)と定義します。
そして、「[設定ケモノ度] = [50]」の部分の[50]の数値を変更することで、ケモノ度を簡単に調整できるようにしています。


こんな感じで生成されました。
もし、生成結果がイマイチだと思ったら…


再試行をしましょう。
さて、この「ケモノ度」を色々と調整してみます。



さっきのプロンプトをコピーして貼り付け、「50」という数字の部分のみ修正し、送信ボタンを左クリックします。
色々と試してみた結果がこちらです。

0%(最初に生成した画像)

15%

20%

30%

40%

50%

70%

90%

100%(元の画像)
必ずしもパーセンテージに綺麗に比例しているとは言えませんが、なかなかいい感じに調整できているのではと思います。
というわけで、「Google Gemini」を用いた画像の微調整についてご紹介しました。
以上をもちまして今回の記事を終了とします。最後まで読んでいただき、ありがとうございました。


コメント