メインコンテンツへスキップ
二人のキャラクター生成大冒険!テキストだけで何が可能か?
  1. ブログ/

二人のキャラクター生成大冒険!テキストだけで何が可能か?

· loading · loading ·

こんにちは、Einarです。

今回の投稿は、先週行った楽しい実験についてです。SD.NextとSDXLを使い始めてから、私は以前よく使っていた便利な拡張機能のいくつかを諦めなければならなくなりました。その一つがsd-webui-regional-prompterで、これは画像の異なる領域に異なるものを描かせることができる機能です。これは、複数キャラクターのセットアップを作成する際に非常に便利でした(ControlNetを使用して結果の品質を向上させます)。

hako-mikan/sd-webui-regional-prompter

set prompt to divided region

Python
1589
132

残念ながら、最近の改善もSD専用で、SDXLモデルではまだ使用できないので、しばらくはこの方法を使えそうにありません。

albarji/mixture-of-diffusers

Mixture of Diffusers for scene composition and high resolution image generation

Python
418
37

「本当にダメなの?」

全然、ゆかちゃん!SDXLモデルがSDに比べて優れている点の一つは、テキストの扱い方です。書かれたことを解釈して完成した画像に変換する能力が、ずっと優れています。だから、まやちゃんとゆかちゃんの「特別な」(えへん!)シーンを考えている時に、試してみることにしました。

そして、結果は… 予想以上に良かったんです。

SDXLに指示を出す:あなたが何を欲しいか伝える
#

「これは命令だ!従え!」

通常、AnimagineXLはDanbooruスタイルのタグを使うと最も効果的ですが、根本的にはSDXLであり、SDXLはフリーフォームのテキスト入力に対応しています。だから、その「特別な」(えへん!)イラストを作成している間、こんな感じで書いてみることにしました:

the girl on the left has very long pink hair in two high long twintails
and violet eyes, the girl on the right has short dark brown
hair in a bob cut and blue eyes

(左側の女の子は、非常に長いピンクの髪を高い位置で二つに分けたロングツインテールにしていて、紫色の目をしています。右側の女の子は、ダークブラウンの短いボブカットの髪と青い目をしています。)

これはうまくいくように見えました(「左」と「右」は実際にはあまり重要ではなく、単に二人のキャラクターを区別するためだけですが)、しかし…シーンの性質上、もっと複雑なものよりは簡単にできたかもしれません。そこで、実験をさらに進めて、もっと複雑なシーンを生成することにしました:ゆかちゃんとまやちゃんが、学校の制服を着て手をつないで歩いているシーンです(はい、わかっています。SDと手。時々自分のアイデアを呪います)。このプロンプトを考えました(サンプラーはEuler a、28ステップ、2倍のハイレスフィックス):

2girls, cowboy shot, medium breasts, walking, holding hands, the girl
on the left has very long pink hair in (two high long twintails)
and violet eyes, the girl on the right has blue eyes and short
dark brown hair in a bob cut with blunt ends and wears a
futuristic black bracelet on the right wrist , smile,
serafuku, white sailor shirt, dark blue pleated skirt,
dark blue sailor collar, aqua neckerchief, short sleeves,
loafers, white socks,  detailed ultra photorealistic school yard,
school, building, road, tree, fence, morning, summer, outdoors,
cinematic lighting, cinematic angle, anime artwork,
anime style, key visual, vibrant, studio anime,
highly detailed, anime coloring, newest, masterpiece,
best quality, modern <lora:style-enhancer-xl:0.6>

そしてネガティブ用には:

FastNegative, lowres, worst quality, low quality, bad anatomy,
bad hands, text, error, missing fingers, extra digit, fewer digits,
cropped, worst quality, low quality, normal quality, jpeg artifacts,
signature, watermark, username, blurry, artist name, photo, deformed,
black and white, realism, disfigured, low contrast, lipgloss,
curly hair, parted bangs, sketch, bangle, sweatband, buttons, braid,
expressionless, low twintails, short twintails

そして、こちらがいくつかの結果です:

見てのとおり、SDと同じで完璧ではないこともありますね。一方のキャラクターのディテールがもう一方に少し「滲む」こともありますが、SDXLではコントロールがしやすくなっています。目の色のような細かい部分は正確に描くのが難しいので、そういうところはインペイントで修正が必要です。でも、2023年初めにDefmix 1.1を使っていた時と比べると、随分と楽になりましたよ!

最後に
#

次のステップは何かって?もっと複雑なプロンプトのテストをする予定です。特に、キャラごとに異なる服装を含めたりすることですね(かなり難しくなりそうですが…)。そして、それで今日の投稿はおしまいです。楽しんでいただけたら嬉しいですし、将来的にもっと多くのコンテンツをお届けする予定ですので、楽しみにしていてください!

Einarでした。