Stable Diffusion の img2img 使い方白書～パラメーターによる違い比較～

※ご利用前にお読みください。
ここで使用する画像はイラスト生成ＡＩである「stable diffusion」で当ブログ作成者である私が作成したものであり、実在する人物やキャラクターとは一切関係ありません。また画像の無断転載や無断利用、プロンプトの丸パクリや無断転載はご遠慮ください。

プロンプトは参考までに使用してください。

プロンプトはコピペしてご自由に画像作成にお使いください。

パラメーター紹介

モデル：animepunk_v10
chilled_remix_v1
サンプリングメソッド：DPM++ 3M SDE Karras
ステップ：60
CFG：14
シード：-1

モデルはアニメ系とリアル系の2種を使って比較

基本プロンプト

ポジティブプロンプト
beautiful Japanese woman,

「　　　　　　　　　　　　」
upper body,
「　　　　　　　　　　　　」
high detail, vibrant colors,
realistic image quality photo, 8k,

ネガティブプロンプト
low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

基本的には「」の部分にプロンプトを入れて比較

元になる画像はこちらを使用

25-year-old Japanese woman,
wearing a summer blouse,
smiling warmly at the camera,
front-facing bust-up shot,
street,
bright sunny day, vivid summer atmosphere,

high detail, vibrant colors,
realistic image quality photo, 8k

Negative prompt: kimono, sea,
low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

はじめに

多くの人は基本的にプロンプトをもとに画像を生成する「txt2img」を使用しているかと思いますが、ここでは画像をもとに新たな画像を生成する「img2img」の使い方を紹介します。

画像の青丸の部分のタブを開きましょう。

そこから更に下のタブで項目を選択。

タブごとに説明していきます。

画像生成ＡＩ「stable diffusion」のリアル系日本人作成向けモデル（checkpoint）比較

Resize mode

ほぼ共通項目であるサイズ変更に関する項目。

Just resize

この機能は風船に描いた絵のような感じで画像をそのまま縮めたり引き伸ばすように変更できる。

元画像　W800×H800

W800×H1000

W1000×H800

Crop and resize

この機能はトリミングのような機能です。

縦横の比率に応じて切り取る感じ。

元画像　W800×H800

W800×H1000

W1000×H800

Resize and fill

Crop and resizeが画像内だったのに対して、この機能は画像からはみ出てしまう部分も新たに生成してくれる機能です。

元画像　W800×H800

W800×H1000

W1000×H800

W1000×H800の右側はきれいに生成されています。

使いこなせたらなかなか面白そう。

Just resize (latent upscale)

Just resizeとほぼ同じなのですが、高画質化する機能？であるUpscalerが異なるとの噂。

Latent Upscaleという種類のものが使用されるようで、鮮やかになりやすいようです。

元画像　W800×H800

W800×H1000

W1000×H800

Denoising strengthが低すぎると全体的にぼやけた画像になってしまう。

リサイズしつつ画質やら色味やらを変える感じなのかな。

上記の画像はDenoising strength0.5。

0.4辺りからぼやぼや感がなくなってきている感じ。

img2img

まずは見本の元となる画像をアップロードする。

（ここに画像をドロップまたはクリックしてアップロード）と書いてある場所。

Denoising strength

この数値は小さいほど元画像に近いものができ、大きくするほど元画像から遠ざかっていく。

シード値は固定して生成する。

使用するプロンプト

beautiful Japanese woman,
long hair,
upper body,
winter,
high detail, vibrant colors,
realistic image quality photo, 8k,
Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

0.1

0.2

0.3

0.1　0.2　は変わらない気がする。

0.3では口の辺りが微妙に変化している。

0.4

0.5

0.6

0.4と0.5はわずかな変化。

0.6はパット見てわかるくらい変化している。

でもプロンプトの内容は上手く反映されなかった。

他の数値を調整する必要があるかもしれない。

0.7

0.8

0.9

ここからは変化がかなり大きい。プロンプトの「long hair」「winter」も反映されている。

0.7と0.8は顔の雰囲気が残っている気がするが、0.9は別物かな。

CFGやステップ数の数値を調整すれば上手く生成されることもある。

次はcheckpointモデルを変更して生成。

プロンプトはリアル画向けの「chilled_remix_v1」を使用

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

元画像を生成した際とほぼ同じ
プロンプトを入れて生成。

プロンプト

25-year-old Japanese woman,
wearing a summer blouse,
smiling warmly at the camera,
front-facing bust-up shot,
street,
bright sunny day, vivid summer atmosphere,

high detail, vibrant colors,
realistic image quality photo, 8k

Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

リンク

プロンプトを単純にしてみた場合

モデルは元画像と同じ「animepunk_v10」

african,
high detail, vibrant colors,
realistic image quality photo, 8k

Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

closed eyes,
high detail, vibrant colors,
realistic image quality photo, 8k

Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

T-shirts,
high detail, vibrant colors,
realistic image quality photo, 8k

Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

long hair,
high detail, vibrant colors,
realistic image quality photo, 8k

Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

office,
high detail, vibrant colors,
realistic image quality photo, 8k

Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

devil woman,
high detail, vibrant colors,
realistic image quality photo, 8k
Negative prompt: low quality, worst quality, weird face, text, watermark, logo,
nudity, naked, cleavage, lingerie,
missing fingers, extra fingers, malformed hands,
mutated limbs, extra limbs, fused fingers,
overexposed, blurry

Sketch

まずは見本の元となる画像をアップロードする。

（ここに画像をドロップまたはクリックしてアップロード）と書いてある場所。

アップロードした画像の右上にこのようなアイコンがあるので、そこから色とペンの太さを選んで変えたいところを塗る。

まずは髪を塗ってみる。

元画像　色塗り後

0.5

0.5　プロンプト入り

複数個所を複数の色で塗ってみる。

元画像　色塗り後

0.5

0.56　プロンプト入り

プロンプトを入れないとベタ塗りっぽい感じになりやすい。

checkpointモデルを変えてみる。chilled_remix_v1

元画像　色塗り後

0.56

0.56　プロンプト入り

autumn,
realistic image quality photo, 8k

Negative prompt: low quality

髪の長さを変えてみる。

元画像　色塗り後

0.56

0.56　chilled_remix_v1

shiba*2さんという方がこちらで面白い検証をしていました。https://note.com/gentle_murre488/n/nae7d131b3c9c?sub_rt=share_pw

Inpaint

まずは見本の元となる画像をアップロードする。

（ここに画像をドロップまたはクリックしてアップロード）と書いてある場所。

アップロードした画像の右上にこのようなアイコンがあるので、そこからペンの太さを選んで変えたいところを塗る。

リンク

パラメーター解説

Inpaintではこのようなパラメーターがある。

Mask blur

元画像と修正部分の境界線のぼかし具合の数値。高い方がぼかしが効いて元画像に馴染ませやすい。

でも高すぎるとぼかしの範囲が広がりすぎる。

Mask mode

Inpaint masked　塗りつぶした部分を変える。

Inpaint not masked　塗りつぶした部分以外を変える。

Masked content

fill　塗りつぶした箇所をその周囲の色に合わせて変える。

original　塗りつぶした部分の元の画像を保持する。

latent noise　塗りつぶした部分をランダムなノイズで変える。

latent nothing　塗りつぶした部分を空白として扱う。

Inpaint area

生成し直す対象範囲の設定

Whole picture　画像全体

Only masked　マスク（塗りつぶし）部分のみ

Only masked padding, pixels
Only maskedを選んだ際にマスク部分の周囲に追加される余白の数値。

数値がある程度高い方が自然な仕上がりになるらしい。

Mask blur　数値比較

数値は0～64まで。

パラメーターは
Inpaint masked
fill
Whole picture
Denoising strength　0.6
プロンプトなし

元画像　色塗り後

Mask blur　0

Mask blur　16

Mask blur　32

Mask blur　48

Mask blur　64

プロンプトがない場合はこんな感じ。

マスク部分に代わるものを生成するための機能だからほとんど変化ない。

次はプロンプト入り

red tie

元画像　色塗り後

Mask blur　0

Mask blur　16

Mask blur　32

Mask blur　48

Mask blur　64

０の値が一番いい感じに生成された。

Whole pictureって画像全体が変わるんだよね。

なんかマスク部分以外は変わっていない気がするけど。

Mask mode比較

パラメーターは

Mask blur　7
Inpaint masked
fill
Whole picture
Denoising strength　0.6
プロンプト
red tie

Inpaint masked

Inpaint not masked

ちょっと不気味な感じの画像になってしまったが、プロンプトは反映されているようだ。

Masked content

パラメーターは

Mask blur　7
Inpaint masked
Whole picture
Denoising strength　0.6
プロンプト
red tie

fill

original

latent noise

latent nothing

Inpaint area　Only masked　数値比較

元画像　色塗り後

Only masked padding, pixels　32

Only masked padding, pixels 100

Only masked padding, pixels　200

Only masked padding, pixels　256

Inpaint sketch

「sketch」と「inpaint」を組み合わせた機能。

sketchはマスク部分以外の画像全体も書き換えられてしまうがInpaint sketchの場合は変更範囲をマスク部分やマスク部分以外に限定できる。（Inpaint の Mask mode比較参照）

パラメーター

Mask blur 7

Mask transparency 10
Inpaint masked

fill
Whole picture
Denoising strength 0.6
プロンプト
apple

元画像　色塗り後

sketch

Inpaint sketch

sketchの場合は全体的に変化しているが、Inpaint sketchはマスク部分のみ。

Mask transparency　数値比較

マスク部分の透明度の数値

0～100

数値が大きいほど透明度が高くなる。

パラメーター

Mask blur 7

Inpaint masked

fill
Whole picture
Denoising strength 0.6
プロンプト
apple

元画像　色塗り後

数値　0

数値　25　

数値　50

数値　75

数値　100　

100だと完全に消えてしまっています。

途中からリンゴではなくただの赤丸になっている。透明度を高くするのであれば他の数値の調整も必要。

Inpaint upload

基本的にはInpaintと同様ですが、マスク部分を塗りつぶすのではなく、別にマスク用のデータを用意してそのデータを使って画像を生成する機能。

使い方はInpaintとほとんど変わらず。

AdobeのPhotoshopなどのような他ツールで、マスク部分を自動で作ったりすると効率良いかも。

Stable Diffusion上でやると細かな部分は時間掛かってしまうし、より細部まで調整したい場合ならいいかも。

Batch

複数枚の画像を一気に処理できる機能。

ただ、本格的に使うには高スペックパーツだったり拡張機能の追加が必要そう。

こちらはまた機会があれば試してみます。

Stable Diffusion の img2img 使い方白書～パラメーターによる違い比較～

パラメーター紹介

はじめに

Resize mode

Just resize

Crop and resize

Resize and fill

Just resize (latent upscale)

img2img

Denoising strength

使用するプロンプト

次はcheckpointモデルを変更して生成。

プロンプトを単純にしてみた場合

おすすめの使い方

Sketch

まずは髪を塗ってみる。

複数個所を複数の色で塗ってみる。

checkpointモデルを変えてみる。chilled_remix_v1

髪の長さを変えてみる。

おすすめの使い方

Inpaint

パラメーター解説

Mask blur　数値比較

Mask mode比較

Inpaint masked

Inpaint not masked

Masked content

Inpaint area　Only masked　数値比較

おすすめの使い方

Inpaint sketch

Mask transparency　数値比較

おすすめの使い方

Inpaint upload

おすすめの使い方

Batch

コメント

パラメーター紹介

はじめに

Resize mode

Just resize

Crop and resize

Resize and fill

Just resize (latent upscale)

img2img

Denoising strength

使用するプロンプト

次はcheckpointモデルを変更して生成。

プロンプトを単純にしてみた場合

おすすめの使い方

Sketch

まずは髪を塗ってみる。

複数個所を複数の色で塗ってみる。

checkpointモデルを変えてみる。chilled_remix_v1

髪の長さを変えてみる。

おすすめの使い方

Inpaint

パラメーター解説

Mask blur 数値比較

Mask mode比較

Inpaint masked

Inpaint not masked

Masked content

Inpaint area Only masked 数値比較

おすすめの使い方

Inpaint sketch

Mask transparency 数値比較

おすすめの使い方

Inpaint upload

おすすめの使い方

Batch

コメント

Mask blur　数値比較

Inpaint area　Only masked　数値比較

Mask transparency　数値比較