これまで Stable Diffusion 2.1 を使ってきたが、これでは、ちょっと無理だ。
デフォルト環境だと、到底 DALL-E 3 の品質には及ばない。
世の中では、この3つは必須のようだ。今のところ VAE しか使っていないワケだが…
- VAE
- Lora
- Controlnet
そもそも、ネガティブ・プロンプト指定するのも面倒だし…
lowres blurred, blurry, bad hands, fewer digits, bad anatomy, mutated limbs, extra limbs, retro style, flat color, limited color
ということで、最近流行りのFooocus で、SDXLを使うことにした。
同じプロンプトなのだが、各段に違う写実的な画像が一発で出力された。