AUTOMATIC1111の更新は長らく止まっており、新しいツールを探していてComfyUIを試したりしていたのだが、Hire fixに相当する機能に当たることが出来ず、どうにもイマイチだった。
そこでかつてAUTOMATIC1111からフォークされ、AUTOMATIC1111にマージされたForgeからreForgeが新たに派生していることを知ったので試してみたが、これがかなり良かった。生成速度は爆速になったし、複数キャラの絡みも自然にできるようになった。
reForgeは既に開発が停止しているようだが、逆に言えば安定していると言う事でもある。
というわけで試した結果をつづっていく。
導入
git pull
したらwebui.bat
叩いて終わりなので特筆することはない。AUTOMATIC1111とディレクトリ構造が同じなので、extentionやmodel, loraなどの環境はそのまま引っ越せる。
爆速化したベンチマーク
前回のベンチマークでは平均生成速度2.911it/s、生成時間120秒だったが、今回は平均生成速度4.352it/s、生成速度81秒まで短縮された。
これは前回最速を記録したUltra 7 265F + 4070Tiを12秒も凌ぐ速度で、極めて速い。正直コスパでNovelAIと勝負できるレベルだ。
ベンチマーク構成
ソフトウェア
reForegeにxformersは不要とのことで、xformersを入れていない。
Env | Ver |
---|---|
version | f1.0.0v2-v1.10.1RC-latest-2446-ge1dcf9b4 |
python | 3.11.9 |
torch | 2.7.1+cu128 |
xformers | N/A |
gradio | 3.41.2 |
ハードウェア
前回とマザボが変わっているが、これによる差はないだろう。
デバイス | 製品 |
---|---|
CPU | Intel Core Ultra 7 265F |
GPU | GeForce RTX 5070 Ti |
MEM | Crucial CT2K16G56C46U5 * 4 |
M/B | ASRock Z890 Pro RS |
りこベンチ
ベンチマーク用の設定
コマンドライン引数なしでwebui.bat
を実行
設定 | 値 |
---|---|
Model | ntrMIXIllustriousXL_xiii.safetensors [1207404b17] |
Clip skip | 2 |
ENSD | 31337 |
Propmpt | (illustration:1.0), masterpiece, best quality, 1girl, solo, happy, smile, theater, (perspective:1.3), from below, (looking away:1.2), (from side:1.0), {{shot_hair}}, smile, bangs, shaggy, (brown hair:1.1), swept_bangs, thick_eyebrows, skin_fang, closed mouth, {{purple eyes}}, gray {{jacket}}, white shirt, glasses, {{small breasts}}, |
Negative Prompt | nsfw, (worst quality, low quality:1.4), (depth of field, blurry, bokeh:1.5), (greyscale, monochrome:1.0), multiple views, text, title, logo, signature, (tooth, lip, nose, 3d, realistic:1.0), dutch angle,(cropped:1.4), text, title, signature, logo, (loli:1.2), school satchel, pink, school bag, school uniform, from behind |
VAE | Automatic |
Sampleing method | DPM++ 2M |
Hires. fix | True |
Upscaler | Latent |
Hires steps | 0 |
Denoising strength | 0.8 |
Upscale by | 2 |
Sampleing steps | 20 |
Width | 768px |
Height | 768px |
Batch count | 5 |
Batch size | 1 |
CFG Scale | 7 |
Seed | -1 |
生成ログ
20/20 [00:02<00:00, 6.90it/s]
20/20 [00:11<00:00, 1.70it/s]
20/20 [00:02<00:00, 6.96it/s]
20/20 [00:11<00:00, 1.71it/s]
20/20 [00:02<00:00, 7.06it/s]
20/20 [00:11<00:00, 1.70it/s]
20/20 [00:02<00:00, 7.14it/s]
20/20 [00:11<00:00, 1.70it/s]
20/20 [00:02<00:00, 6.98it/s]
20/20 [00:11<00:00, 1.67it/s]
200/200 [01:21<00:00, 2.46it/s]
200/200 [01:21<00:00, 1.66it/s]
前回のベンチマークでは平均生成速度2.911it/s、生成時間120秒だったが、今回は平均生成速度4.352it/s、生成速度81秒まで短縮された。
平均生成速度
4.352it/s (前回比 +1.441it/s)
生成時間
81秒 (前回比 -39秒)
まとめ
明らかに爆速になった。これだけ早ければ何の文句もない。総合点でNovelAIと勝負できるレベルといっても過言ではないだろう。
複数キャラを配置できるForge Coupleの力
Forge CoupleというExtentionsが出ており、これを使うと複数キャラをNovelAI並みの自然さで配置できる。安定性ではNovelAIには敵わないのだが、無料で勝負できるところに価値がある。これがあればもうRegional Prompterは窓から投げ捨てていい。
Forge Coupleを使えばこのレベルは朝飯前だ。因みにこれはサンプルプロンプトそのままに近いが、キャラ同士の絡みも実現できる。
キャラ同士の絡ませ方の例(NSFW)
例えば、以下の条件であれば、ふたなりアスナと直葉の断面図あり挿入シーンという難題さえこなして見せる。かなりドギツイのが出てくるので試したい人はプロンプトをよく確認してほしい。かなり地獄のようなワードが入りすぎている。
nsfw, hentai illust, {num: 2girls}, 1dickgirls and 1girls, wet hair, drool,wet and messy, {cup: asuna to suguha}, very aesthetic, masterpiece, no text, from side, female sex, female sex from behind, female only
{num}, {cup}, couple, girl, kirigaya suguha, sao, large breast, large areola, white skin, (bob cut), armpit hair, pubic hair, doggy style, x-ray, creampie, ahegao, full body
{num}, {cup}, couple, dick girl, asuna (sao), A adult tall beauty crossdresser,shemale, little breasts, sagging breats, (dark nipple), little long nipples,wetty hair, hentai anime , long gloves and high socks, enjoying,smile,heart eyes, erection foreskin dick,smegma, armpit hair, pubic hair, hairy, tatoo,normal dick, sex, cum in cevio, ahegao, full body,
Negative prompt: lowres, artistic error, film grain, scan artifacts, worst quality, bad quality, jpeg artifacts, very displeasing, chromatic aberration, dithering, halftone, screentone, multiple views, logo, too many watermarks, negative space, blank page, low quality, child, text, speaking, censored. male, boy, male sex, 1boy
Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 6, Seed: 1605499267, Size: 768x512, Model hash: c3688ee04c, Model: waiNSFWIllustrious_v110, Denoising strength: 0.85, Clip skip: 2, Hires CFG Scale: 6, Hires upscale: 2, Hires upscaler: Latent, forge_couple: True, forge_couple_compatibility: False, forge_couple_mode: Advanced, forge_couple_separator: \n, forge_couple_mapping: "[[0, 1, 0, 1, 1], [0, 0.5, 0, 1, 1], [0.5, 1, 0, 1, 1]]", forge_couple_common_parser: { }, Pad conds: True, Version: f1.0.0v2-v1.10.1RC-latest-2446-ge1dcf9b4
ポイントは一行目のfrom side, female sex, female sex from behind, female only
と、2~3行目のキャラクター設定行にある{num}, {cup}, couple,
だ。
まずfrom side
のように構図を指定していないと破綻しやすい。NovelAIのようにいい感じにはしてくれない。
次にふたなり百合をする場合、female sex, female sex from behind, female only
辺りがあると良い。男が出てくる確率が目に見えて減る。
キャラクター設定についても{num}, {cup}
で一行目の変数を参照し、プレイスタイルや人物属性の設定を強めることで出現率が大幅に向上する。またcouple
を付けることで、二人が出てくる確率が上がる。これがないと一人しか出てこなかったり、男が出てくる確率が増える。
トラブルシューティング
ノイズ画像が生成される
この様なノイズ画像が生成される時に「Number of Couples and Masks mismatched」というエラーが出ている場合、余計な空行が入っているのが原因なので、それを消すと直る。
Empty lines are still counted; ensure you do not leave an empty line at the end;
久々にPC構成を大刷新してみたのでベンチマークをしてみたが、かなり複雑な結果になった。
大まかにはCore Ultra 7 265FはCore i7 13700に、RTX 5070 TiはRTX 4070 Tiに劣るケースがありそうなことが判明したが、結果が複雑すぎて断言しづらい。
ベンチマーク構成
ソフトウェア
Env | Ver |
---|---|
version | v1.10.1-89-g2174ce5a |
python | 3.10.6 |
torch | 2.7.0+cu128 |
xformers | 0.0.30 |
gradio | 3.41.2 |
ハードウェア
スペックアップ前後で単純に計測したところ、結果に疑問を持ったのでCPUとGPUを新旧それぞれで組み合わせて全数網羅で見ている。
デバイス | 構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|---|
CPU | Intel Core i7 13700 | Intel Core i7 13700 | Intel Core Ultra 7 265F | Intel Core Ultra 7 265F |
GPU | GeForce RTX 4070 Ti | GeForce RTX 5070 Ti | GeForce RTX 4070 Ti | GeForce RTX 5070 Ti |
MEM | Crucial Ballistix BL2K16G32C16U4B * 4 | Crucial Ballistix BL2K16G32C16U4B * 4 | Crucial CT2K16G56C46U5 * 4 | Crucial CT2K16G56C46U5 * 4 |
M/B | ASUS TUF GAMING Z790-PLUS D4 | ASUS TUF GAMING Z790-PLUS D4 | ASUS TUF GAMING Z890-PLUS WIFI | ASUS TUF GAMING Z890-PLUS WIFI |
FF14 黄金のレガシー ベンチマーク
4070Tiより5070Tiの方がベンチスコアが若干高く出るが、Core i7 13700よりCore Ultra 7 265Fの方が顕著にスコアが低い。
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
27,439 | 29,138 | 22,393 | 23,479 |
おまけ:ローディングタイム
構成1-2は記録し忘れたので書いていない。
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
6.5秒 | - | 7.9秒 | 8.6秒 |
ローディングタイムはストレージ依存のはずなのでCPUやGPUの性能が大きく影響することはないはずだが、かなり差が出ていたので参考程度にとどめておく。結果は小数第二位で四捨五入している。
CPUのキャッシュメモリサイズやDDR5の4枚差しによる速度低下が影響している可能性もあるが、2-1と2-2はGPUのみの差なのでよくわかっていない。ひょっとしたらグラフィック自体の読み込み速度が低下しているのかもしれない。
この差はMMORPGをする上ではかなりのハンデになるため、私が現役プレイヤーであれば、このスペックダウンは受け入れられなかっただろう。特にFF14をしていた時は誰よりも早くローディングを終えるのが自慢の一つだった。
SDベンチ
トキベンチ
ベンチマーク用のSD設定
COMMANDLINE_ARGSは--xformers --opt-channelslast --medvram
を使用。
設定 | 値 |
---|---|
Model | animagine-xl-3.1.safetensors [e3c47aedb0] |
Clip skip | 2 |
ENSD | 31337 |
Prompt | 1girl, toki \(blue archive\), blue archive, toki sits cross-legged in her chair. looking at viewer, cowboy shot, masterpiece, best quality, newest, |
Negative Prompt | nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name, |
VAE | Automatic |
Sampleing method | Euler a |
Sampleing steps | 15 |
Width | 1024px |
Height | 1024px |
Batch count | 5 |
Batch size | 1 |
CFG Scale | 7 |
Seed | 50 |
生成ログ
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
15/15 [00:04<00:00, 3.12it/s] | 15/15 [00:05<00:00, 2.67it/s] | 15/15 [00:05<00:00, 2.92it/s] | 15/15 [00:05<00:00, 2.78it/s] |
15/15 [00:04<00:00, 3.34it/s] | 15/15 [00:05<00:00, 2.92it/s] | 15/15 [00:04<00:00, 3.35it/s] | 15/15 [00:05<00:00, 2.95it/s] |
15/15 [00:04<00:00, 3.34it/s] | 15/15 [00:05<00:00, 2.91it/s] | 15/15 [00:04<00:00, 3.44it/s] | 15/15 [00:05<00:00, 2.96it/s] |
15/15 [00:04<00:00, 3.36it/s] | 15/15 [00:05<00:00, 2.95it/s] | 15/15 [00:04<00:00, 3.46it/s] | 15/15 [00:05<00:00, 2.93it/s] |
15/15 [00:04<00:00, 3.32it/s] | 15/15 [00:05<00:00, 2.97it/s] | 15/15 [00:04<00:00, 3.46it/s] | 15/15 [00:04<00:00, 3.01it/s] |
75/75 [00:33<00:00, 2.24it/s] | 75/75 [00:35<00:00, 2.08it/s] | 75/75 [00:31<00:00, 2.40it/s] | 75/75 [00:34<00:00, 2.20it/s] |
75/75 [00:33<00:00, 3.96it/s] | 75/75 [00:35<00:00, 3.30it/s] | 75/75 [00:31<00:00, 3.96it/s] | 75/75 [00:34<00:00, 3.32it/s] |
平均生成速度
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
3.296it/s | 2.884it/s | 3.326it/s | 2.926it/s |
生成時間
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
33秒 | 35秒 | 31秒 | 34秒 |
まとめ
この結果からは4070Tiより5070Tiの方が生成速度が遅いことが読み取れる。またCPUがCore Ultra 7 265Fの時に僅かに高速化しているが、これはPCIe4から5への変化が効いている可能性がある。
またUltra 7 265F+4070Tiの組み合わせが最速を叩き出している点も見逃せない。つまりこれはStableDiffusionにおいてはi7 13700よりUltra 7 265Fが優位であることを示しており、FF14のベンチとは結果が逆転することを意味している。
りこベンチ
りこベンチとは個人的によく使う設定をベースにしたベンチだ。トキベンチの設定は個人的に使わず、実用性がないので今後はこちらを主にしていくと思う。
COMMANDLINE_ARGSは--xformers
を使用。
ベンチマーク用のSD設定
設定 | 値 |
---|---|
Model | ntrMIXIllustriousXL_xiii.safetensors [1207404b17] |
Clip skip | 2 |
ENSD | 31337 |
Propmpt | (illustration:1.0), masterpiece, best quality, 1girl, solo, happy, smile, theater, (perspective:1.3), from below, (looking away:1.2), (from side:1.0), {{shot_hair}}, smile, bangs, shaggy, (brown hair:1.1), swept_bangs, thick_eyebrows, skin_fang, closed mouth, {{purple eyes}}, gray {{jacket}}, white shirt, glasses, {{small breasts}}, |
Negative Prompt | nsfw, (worst quality, low quality:1.4), (depth of field, blurry, bokeh:1.5), (greyscale, monochrome:1.0), multiple views, text, title, logo, signature, (tooth, lip, nose, 3d, realistic:1.0), dutch angle,(cropped:1.4), text, title, signature, logo, (loli:1.2), school satchel, pink, school bag, school uniform, from behind |
VAE | Automatic |
Sampleing method | DPM++ 2M |
Hires. fix | True |
Upscaler | Latent |
Hires steps | 0 |
Denoising strength | 0.8 |
Upscale by | 2 |
Sampleing steps | 20 |
Width | 768px |
Height | 768px |
Batch count | 5 |
Batch size | 1 |
CFG Scale | 7 |
Seed | -1 |
生成ログ
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
20/20 [00:05<00:00, 3.43it/s] | 20/20 [00:06<00:00, 2.94it/s] | 20/20 [00:03<00:00, 5.92it/s] | 20/20 [00:04<00:00, 4.51it/s] |
20/20 [00:11<00:00, 1.68it/s] | 20/20 [00:17<00:00, 1.13it/s] | 20/20 [00:11<00:00, 1.73it/s] | 20/20 [00:17<00:00, 1.13it/s] |
20/20 [00:05<00:00, 3.49it/s] | 20/20 [00:06<00:00, 3.06it/s] | 20/20 [00:03<00:00, 6.26it/s] | 20/20 [00:04<00:00, 4.79it/s] |
20/20 [00:11<00:00, 1.67it/s] | 20/20 [00:17<00:00, 1.14it/s] | 20/20 [00:11<00:00, 1.72it/s] | 20/20 [00:17<00:00, 1.13it/s] |
20/20 [00:05<00:00, 3.53it/s] | 20/20 [00:06<00:00, 3.03it/s] | 20/20 [00:03<00:00, 6.28it/s] | 20/20 [00:04<00:00, 4.81it/s] |
20/20 [00:11<00:00, 1.68it/s] | 20/20 [00:17<00:00, 1.14it/s] | 20/20 [00:11<00:00, 1.71it/s] | 20/20 [00:17<00:00, 1.13it/s] |
20/20 [00:05<00:00, 3.36it/s] | 20/20 [00:06<00:00, 3.06it/s] | 20/20 [00:03<00:00, 6.15it/s] | 20/20 [00:04<00:00, 4.78it/s] |
20/20 [00:12<00:00, 1.62it/s] | 20/20 [00:17<00:00, 1.13it/s] | 20/20 [00:11<00:00, 1.71it/s] | 20/20 [00:17<00:00, 1.13it/s] |
20/20 [00:05<00:00, 3.53it/s] | 20/20 [00:06<00:00, 3.08it/s] | 20/20 [00:03<00:00, 6.13it/s] | 20/20 [00:04<00:00, 4.57it/s] |
20/20 [00:11<00:00, 1.68it/s] | 20/20 [00:17<00:00, 1.14it/s] | 20/20 [00:11<00:00, 1.71it/s] | 20/20 [00:17<00:00, 1.13it/s] |
200/200 [01:49<00:00, 1.82it/s] | 200/200 [02:11<00:00, 1.53it/s] | 200/200 [01:33<00:00, 2.13it/s] | 200/200 [02:00<00:00, 1.65it/s] |
200/200 [01:49<00:00, 1.66it/s] | 200/200 [02:11<00:00, 1.12it/s] | 200/200 [01:33<00:00, 1.68it/s] | 200/200 [02:00<00:00, 1.11it/s] |
平均生成速度
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
2.567it/s | 2.085it/s | 3.932it/s | 2.911it/s |
生成時間
構成1-1 | 構成1-2 | 構成2-1 | 構成2-2 |
---|---|---|---|
109秒 | 131秒 | 93秒 | 120秒 |
まとめ
結果としてはトキベンチと変わらず、Ultra 7 265F+4070Tiの組み合わせが最速でi7 13700+5070Tiの組み合わせが最も遅い。
総括
結果しては複雑で、個人的にはどの道を選ぶか未だに悩んでいる。
まず、今回新規導入したデバイスについての評価は以下の感じだ。
Core Ultra 7 265F
- FF14ベンチではi7 13700に劣る
- StableDiffusionの生成速度ではi7 13700を上回る
RTX 5070 Ti
- FF14ベンチでは4070 Tiを僅かに上回る
- StableDiffusionの生成速度では4070 Tiより1.1~1.3倍遅い
この結果は非常に悩ましい。FF14ベンチの結果からみるとゲーミング性能だけで言えばi7 13700+5070Tiが最適解だが、StableDiffusionの生成速度ではUltra 7 265F+4070Tiが最適解となった。
ただ私はもうFF14をしておらず、あまりゲームもしていないため、FF14ベンチの結果はある程度無視できる。そうなるとStableDiffusionだ。生成速度は重要な要素だ。とはいえ、4070Tiではメモリ不足でControlNetが使えないケースもあった。
また最近話題になっているFramePackのkisekaeichiではVRAM16GB必須という話もあり、今回は生成速度よりメモリを取る判断をしたいと思う。少なくとも旧環境である構成1-1と現環境である構成2-2を比べた時の差は一割程度であり、十分許容できる。
正直、私にはベンチマークのためにハードウェアを組み替える環境がないので、ある程度の情報でジャッジせざるを得ない。ちもろぐの人みたいに組み換え環境がある人はこの辺りがやりやすいと思うが、私の場合はPCケースからマザボを引っ張り出してそう取り返して、もう一度ケースに戻す手間がかかる。一連の作業には1時間ほど掛かり非常に手間だ。
今回はあまりにも結果が結果だったので、やむを得ず、新環境に組み替えてから、一度元に戻してベンチを取り直す検証を行ったが、組み換えの手間に加え、高価なCPUグリスが無くなり結構キツイ思いをしている。ちなみに今は新環境に完全に復帰している。
5070Tiが良さそうだったのでついでに今までDDR5にするのを渋ってたメモリをアップグレードするかぁ!と総入れ替えした結果の記録。
グレードアップ現新比較表
デバイス | 変更前 | 変更後 |
---|---|---|
CPU | Intel Core i7 13700 | Intel Core Ultra 7 265F |
GPU | GeForce RTX 4070 Ti | GeForce RTX 5070 Ti |
MEM | Crucial Ballistix BL2K16G32C16U4B * 4 | Crucial CT2K16G56C46U5 * 4 |
M/B | ASUS TUF GAMING Z790-PLUS D4 | ASUS TUF GAMING Z890-PLUS WIFI |
今回はなんと、これだけのパーツを神戸市内、それも中央区だけで揃えてきた。通販は箱が増えて邪魔だし日本橋に行くのは大変なので、神戸で揃えられたのは非常に良かった。
組み換えシーン
机の下から薄汚れたケースを取り出すことから始まる。いい加減掃除した方がいいかなと思った。
まずは現環境をご開帳。1~2年に一度は簡単に掃除しているのもあり、中はそこまで汚れていない。
分解を進めていくときの部品入れに、いつか役に立つだろうと取っていた揖保乃糸の箱が役に立った。
グラボをメモリを外し、コネクタをいくらか外したところ。
CPUクーラーのヒートシンクもぼちぼち埃にまみれていた。これも掃除した方がいい。
CPUグリスは意外と乾いてなかった。このCPUを付けたのは2年半ほど前で、恐らくその時からそのままである。
オンボードLAN(Intel(R) Ethernet Controller I226-V)が腐っていたので取り付けた蟹のNICともお別れだ。新しいマザボのNICは蟹なので恐らく大丈夫という期待がある。
2025年7月2日追記
よく見たらNICはIntelで、相変わらず不安定だったため、結局蟹のNICをまた挿す羽目になった。Intel NICの不安定さについては別で記事にしようと思う。
ケースのフロントUSB用の拡張ボード。これも埃が積もっている。年期が入っているため、少しさびている気もする。
ケースからマザボを抜き取ったところ。まだNVMeSSDの抜去が残っている。マザボ交換は大変だ。
空っぽになったケース。よく見ると埃が積もっているので、やはり掃除が必要だ。
というわけで徹底的に掃除を始める。この後、全ての外装をはがし、ファンも外してクイックルワイパーとエアダスターでファンのフィンの一枚一枚や、わっか部分の内側など、掃除できる場所は掃除していった。
200mmファンの清掃ビフォーアフター。
裏配線の部分は比較的奇麗だったが、ここもクイックルワイパーやエアダスターを使って掃除していく。
一見そこまで汚れてなさそうな天面ファンも掃除する。
比較するとちゃんと奇麗になっている。こういうのは細かい積み重ねが大切なので、少しの埃であれ除去してゆく。
フロントパネルもはがして掃除する。
掃除している中でケースの前方下部にフィルターがあることに初めて気が付いた。電源ファン向けのフィルターだろうか?
今まで動かすときに何も考えずにつかんでいた気がするのでやや曲がっている。
完全に裸にして徹底的に掃除する。
戻していくところ。電源(PSU)を開けるのは地味に面倒なのだ。
新しいマザボには謎のパーツがたくさんついていたが、ほとんど使わなかった。ゴムだけ使った。
新しいマザボをケースにセットしたところ。ケーブルが多すぎて入れるのが大変だった。なお、この後のベンチマークの結果がイマイチで、元のマザボに戻し、またこのマザボに戻すという非常に面倒な工程を踏むハメになる…。
最近はNVMeが主流だからかSATAの数が少なかった。昔はもっとたくさんあったし、コネクタは一箇所に集中していて、こんな分散してなかったと思う。
細かいセッティングには、このようにケースの中に張り付いてくれる懐中電灯があると便利だ。ちなみにこれはヨドバシで売っている。
電源やリセットスイッチのケーブルを刺していて気が付いたが、このマザボにはブザーコネクタがなかった。LEDはあるものの、起動エラーを音で知れないのは少々不便である。
CPUを付けようとしたときにバックプレートが見当たらず探していたら、なんと前のマザボにセロテープでくっついていた。よく壊れなかったな…。
セロテープで固定していないと脱落してマウンタを付けづらいため、こうしていたのだと思うが、恐らくはがし忘れていたのだろう。
因みにこれはNoctuaのLGA1700用のバックプレートだが、LGA1851でもそのまま使うことができた。助かる。
マザボ現新比較。上側が今のマザボ、下が新しいマザボ。
新しい方がやや長く、薄くなっている。PCIeを複数使っている身としてはスリムになっているのは嬉しい。
PCIeスロット現新比較。左が今のマザボ、右が新しいマザボ。
今のマザボはボタンを押すとロックが外れる機構だが、ボタンが遠く、抜くとき斜めになりやすく、それが原因でロックが詰まることがしばしばあった。それに対して新しい方は位置が近いうえに、単純な作りになっており、こちらの方が抜き差ししやすいと感じた。押す場所が広く指が痛くならないのもいいところだ。
組み付け後。前よりちょっと高級感があり、チープ度が減った気がする。おそらくグラボのプラスチック感が減ったのが大きいだろう。
筐体もピカピカになっていい感じだ。しかしグラボのファンが光らなくなってしまったため回っているのか確認するのが少し煩わしくなってしまった。
セットアップ時に見舞われたトラブルの解消ログ
inaccessible boot driveというブルスクが出る
BIOSからIntel Rapid Storage TechnologyをOFFにする(デフォルトはOFF)
コマンドプロンプトで起動して以下のコマンドを流す。
sfc /scannow
OS起動時にAi Suite 3がaccess violationとかいう
Ai Suite 3を消すことで解決する。
普通に消そうとしても「The model does not support this application.」とか言われるので、公式にある適当なマザボのユーティリティからAI Suite 3 Cleanerを落としてきてAi Suite 3を消す。
モニタが片方しか映らない、モニタの映りが悪い、グラボが未検出
ZOTAC公式からドライバを落として入れる。
Ai Suite上でFan Xpertを使いたい(ASUS TUF GAMING Z790-PLUS D4)
ROG STRIX Z370-F GAMINGのツールから落としてインスコすれば使える。
ASUS TUF GAMING Z890-PLUS WIFIだと多分この方法は無理。
ASUS TUF GAMING Z890-PLUS WIFIでFan Xpertを使いたい
ASUS TUF GAMING Z890-PLUS WIFIのツールからArmoury Crateを落とし、Armoury Crateをインストール後、Armoury Crateの機能ライブラリからアシスタントをインストールすると使えるようになる。
Armoury Crateには過去に結構苦い思い出があったので入れるのを避けたかったが、他に方法はなさそうだ。ファンの細かい調整が不要ならBIOSからやってもいいかもしれない。
関連記事
ベンチスコアは複雑な結果になったので別記事、5070Tiは4070Tiより性能が悪い…?に譲る。
前の記事でSDベンチを回したので、ついでにFF14ベンチも回してみた。
NVIDIA 電源管理モードの設定で「パフォーマンス最大化を優先」にしても誤差程度しか変わらないようだった。
ベンチ | スコア | CPU | グラボ | MEM | PSU | CASE | M/B | 備考 |
---|---|---|---|---|---|---|---|---|
FF14 黄金 | 28,702 | i7-13700 | ZT-D40710J-10P | DDR4-3200 64G | SSR-750FX | H500M | TUF GAMING Z790-PLUS D4 | NVIDIA 電源管理モード:パフォーマンス最大化を優先 |
FF14 暁月 | 33,892 | i7-13700 | ZT-D40710J-10P | DDR4-3200 64G | SSR-750FX | H500M | TUF GAMING Z790-PLUS D4 | NVIDIA 電源管理モード:パフォーマンス最大化を優先 |
FF14 暁月 | 33,532 | i7-13700 | ZT-D40710J-10P | DDR4-3200 64G | SSR-750FX | H500M | TUF GAMING Z790-PLUS D4 |
ついでに歴代のスコアも貼っておく。上三行は前述の内容と同じだ。
日付 | ベンチ | スコア | CPU | グラボ | MEM | PSU | CASE | M/B | 備考 |
---|---|---|---|---|---|---|---|---|---|
2024-05-28 | FF14 黄金 | 28,702 | i7-13700 | ZT-D40710J-10P | DDR4-3200 64G | SSR-750FX | H500M | TUF GAMING Z790-PLUS D4 | NVIDIA 電源管理モード:パフォーマンス最大化を優先 |
2024-05-28 | FF14 暁月 | 33,892 | i7-13700 | ZT-D40710J-10P | DDR4-3200 64G | SSR-750FX | H500M | TUF GAMING Z790-PLUS D4 | NVIDIA 電源管理モード:パフォーマンス最大化を優先 |
2023-05-07 | FF14 暁月 | 33,532 | i7-13700 | ZT-D40710J-10P | DDR4-3200 64G | SSR-750FX | H500M | TUF GAMING Z790-PLUS D4 | |
2023-04-14 | FF14 暁月 | 22,127 | i9-9900 | ZT-D40710J-10P | DDR4-3200 64G | SSR-750FX | H500M | ROG-STRIX-Z390-F-GAMING | |
2020-06-04 | FF14 漆黒 | 15,702 | i9-9900 | ROG-STRIX-RTX2060-O6G-GAMING | DDR4-2666 32G | SSR-750FX | H500M | ROG-STRIX-Z390-F-GAMING | |
2019-06-21 | FF14 漆黒 | 16,675 | i7-8700 | ROG-STRIX-RTX2060-O6G-GAMING | DDR4-2666 32G | SSR-750FX | H500M | ROG-STRIX-Z390-F-GAMING | |
2019-04-02 | FF14 漆黒 | 16,717 | i7-8700 | GB 2060 OC 6G | DDR4-2666 32G | SSR-750FX | CM690III | ROG-STRIX-Z390-F-GAMING | |
2019-02-24 | FF14 紅蓮 | 17,340 | i7-8700 | GB 2060 OC 6G | DDR4-2666 32G | SSR-650FM | 69JD | ROG-STRIX-Z390-F-GAMING | |
2019-02-16 | FF14 紅蓮 | 11,555 | i7-8700 | ZOTAC 1060 3G | DDR4-2133 16G | SSR-650FM | 69JD | ROG-STRIX-Z390-F-GAMING | |
2018-07-18 | FF14 紅蓮 | 10,974 | i5-7500 | ZOTAC 1060 3G | DDR4-2133 8G | SSR-650FM | 69JD | PRIME H270-PLUS |
ちもろぐの【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】のベンチマークを個人環境で試してみた。
設定は「1024×1024:トキ(ネイティブ高解像度イラスト)」がベース。
- 検証機
- 共通設定
- ベンチマーク結果
- Animagine XL 3.1 --xformers --opt-channelslast
- Animagine XL 3.1 --xformers
- Animagine XL 3.1 起動オプションなし
- Animagine XL 3.0 --xformers --opt-channelslast
- Animagine XL 3.0 --xformers --opt-channelslast --medvram-sdxl Windows Defender「リアルタイム保護」を無効化
- Animagine XL 3.0 --xformers --opt-channelslast --medvram-sdxl
- おまけ1 --xformers
- おまけ2
- まとめ
- 生成した画像
- おまけ
検証機
構成 | 製品 | 備考 |
---|---|---|
OS | Windows 11 Pro | Version 22621.3593 |
CPU | Intel Core i7 13700 | 16C24T, 2.1 GHz, TDP 65W |
GPU | GeForce RTX 4070 Ti | Driver: NVIDIA 555.85 |
MEM | Crucial Ballistix BL2K16G32C16U4B | DDR4-3200 16GB * 4 |
M/B | ASUS TUF GAMING Z790-PLUS D4 | ATX, Z790 |
CPU Cooler | Noctua NH-U12A | |
CPU Fan | Fractal Design Prisma AL-12 PWM | 120mm PWM |
SSD | Solidigm P44 Pro SSDPFKKW020X7X1 | NVMe SSD 2TB |
共通設定
Stable Diffusionの設定
全てのケースで以下の設定を利用(モデルは後述)
設定 | 値 |
---|---|
Clip skip | 2 |
ENSD | 31337 |
Propmpt | 1girl, toki \(blue archive\), blue archive, toki sits cross-legged in her chair. looking at viewer, cowboy shot, masterpiece, best quality, newest, |
Negative Prompt | nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name, |
VAE | Automatic |
Sampleing method | Euler a |
Sampleing steps | 15 |
Width | 1024px |
Height | 1024px |
Batch count | 5 |
Batch size | 1 |
CFG Scale | 7 |
Seed | 50 |
NVIDIA Control Panelの設定
設定項目 | 設定値 |
---|---|
CUDA - システムメモリフォールバックポリシー | システムメモリフォールバックなしを優先 |
電源管理モード | パフォーマンス最大化を優先 |
Windows Defenderのリアルタイム保護
特記がない限り有効化している。
ベンチマーク結果
Animagine XL 3.1 --xformers --opt-channelslast
起動オプション
set COMMANDLINE_ARGS=--xformers --opt-channelslast
使用モデル
animagine-xl-3.1.safetensors [e3c47aedb0]
スコア
処理時間 | 25sec |
---|---|
平均生成速度 | 3.64it/s |
15/15 [00:04<00:00, 3.65it/s]
15/15 [00:03<00:00, 3.78it/s]
15/15 [00:03<00:00, 3.77it/s]
15/15 [00:03<00:00, 3.77it/s]
15/15 [00:03<00:00, 3.77it/s]
75/75 [00:25<00:00, 2.98it/s]
75/75 [00:25<00:00, 3.75it/s]
Animagine XL 3.1 --xformers
起動オプション
set COMMANDLINE_ARGS=--xformers
使用モデル
animagine-xl-3.1.safetensors [e3c47aedb0]
スコア
処理時間 | 27sec |
---|---|
平均生成速度 | 3.29it/s |
15/15 [00:04<00:00, 3.64it/s]
15/15 [00:05<00:00, 2.60it/s]
15/15 [00:04<00:00, 3.44it/s]
15/15 [00:04<00:00, 3.42it/s]
15/15 [00:04<00:00, 3.40it/s]
75/75 [00:27<00:00, 2.73it/s]
75/75 [00:27<00:00, 3.78it/s]
Animagine XL 3.1 起動オプションなし
起動オプション
なし
使用モデル
animagine-xl-3.1.safetensors [e3c47aedb0]
スコア
処理時間 | 32sec |
---|---|
平均生成速度 | 2.64it/s |
15/15 [00:05<00:00, 2.60it/s]
15/15 [00:05<00:00, 2.73it/s]
15/15 [00:05<00:00, 2.73it/s]
15/15 [00:05<00:00, 2.70it/s]
15/15 [00:05<00:00, 2.66it/s]
75/75 [00:32<00:00, 2.32it/s]
75/75 [00:32<00:00, 2.74it/s]
Animagine XL 3.0 --xformers --opt-channelslast
起動オプション
set COMMANDLINE_ARGS=--xformers --opt-channelslast
使用モデル
animagineXLV3_v30.safetensors [e3c47aedb0]
スコア
処理時間 | 25sec |
---|---|
平均生成速度 | 3.61it/s |
15/15 [00:04<00:00, 3.59it/s]
15/15 [00:03<00:00, 3.75it/s]
15/15 [00:03<00:00, 3.77it/s]
15/15 [00:03<00:00, 3.76it/s]
15/15 [00:04<00:00, 3.74it/s]
75/75 [00:25<00:00, 2.95it/s]
75/75 [00:25<00:00, 3.70it/s]
Animagine XL 3.0 --xformers --opt-channelslast --medvram-sdxl Windows Defender「リアルタイム保護」を無効化
起動オプション
Windows Defender「リアルタイム保護」を無効化
set COMMANDLINE_ARGS=--xformers --opt-channelslast --medvram-sdxl
set PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.6, max_split_size_mb:128
使用モデル
animagineXLV3_v30.safetensors [e3c47aedb0]
スコア
処理時間 | 45sec |
---|---|
平均生成速度 | 2.99it/s |
15/15 [00:05<00:00, 2.60it/s]
15/15 [00:04<00:00, 3.27it/s]
15/15 [00:04<00:00, 3.25it/s]
15/15 [00:04<00:00, 3.27it/s]
15/15 [00:04<00:00, 3.24it/s]
75/75 [00:45<00:00, 1.67it/s]
75/75 [00:45<00:00, 3.66it/s]
Animagine XL 3.0 --xformers --opt-channelslast --medvram-sdxl
起動オプション
set COMMANDLINE_ARGS=--xformers --opt-channelslast --medvram-sdxl
使用モデル
animagineXLV3_v30.safetensors [e3c47aedb0]
スコア
処理時間 | 45sec |
---|---|
平均生成速度 | 2.92it/s |
15/15 [00:07<00:00, 2.11it/s]
15/15 [00:04<00:00, 3.25it/s]
15/15 [00:04<00:00, 3.24it/s]
15/15 [00:04<00:00, 3.26it/s]
15/15 [00:04<00:00, 3.27it/s]
75/75 [00:45<00:00, 1.64it/s]
75/75 [00:45<00:00, 3.68it/s]
おまけ1 --xformers
このベンチマークはグラフィックドライバのバージョンが異なる。バージョンは不明だが531.79以前と思われる。
NVIDIA Control Panelの設定
設定項目 | 設定値 |
---|---|
CUDA - システムメモリフォールバックポリシー | 設定項目がない |
電源管理モード | パフォーマンス最大化を優先 |
起動オプション
set COMMANDLINE_ARGS=--xformers
使用モデル
animagine-xl-3.1.safetensors [e3c47aedb0]
スコア
処理時間 | 73sec |
---|---|
平均生成速度 | 1.14it/s |
15/15 [00:12<00:00, 1.23it/s]
15/15 [00:12<00:00, 1.16it/s]
15/15 [00:13<00:00, 1.11it/s]
15/15 [00:13<00:00, 1.13it/s]
15/15 [00:13<00:00, 1.12it/s]
75/75 [01:13<00:00, 1.02it/s]
75/75 [01:13<00:00, 1.22it/s]
おまけ2
このベンチマークはグラフィックドライバのバージョンが異なる。バージョンは不明だが531.79以前と思われる。
NVIDIA Control Panelの設定
設定項目 | 設定値 |
---|---|
CUDA - システムメモリフォールバックポリシー | 設定項目がない |
電源管理モード | パフォーマンス最大化を優先 |
起動オプション
なし
使用モデル
animagine-xl-3.1.safetensors [e3c47aedb0]
スコア
処理時間 | 75sec |
---|---|
平均生成速度 | 1.08it/s |
15/15 [00:14<00:00, 1.04it/s]
15/15 [00:13<00:00, 1.10it/s]
15/15 [00:13<00:00, 1.09it/s]
15/15 [00:13<00:00, 1.11it/s]
15/15 [00:13<00:00, 1.12it/s]
75/75 [01:15<00:00, 1.00s/it]
75/75 [01:15<00:00, 1.12it/s]
まとめ
設定系のパフォーマンス影響など
- Windows Defenderのリアルタイム保護は生成速度に有意な影響がないと思われる
- Animagine XL 3.1とAnimagine XL 3.0での生成速度には特に差がないと思われる
--medvram-sdxl
を付けると遅くなるset PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.6, max_split_size_mb:128
では特に意味がなさそうに見えた--xformers
を付けると早くなる--opt-channelslast
を付けると少しだけ早くなる- NVIDIAのドライバのバージョンを上げると劇的に早くなる
- ちもろぐSDベンチでは4070Tiでの「1024×1024:トキ(ネイティブ高解像度イラスト)」の生成スコアは3.15it/sだったが、私の環境では平均3.64it/s、最高3.75it/s、最低2.98it/sであった
- ちもろぐベンチのスコアが何処をとっているのかは不明だが、ちもろぐ側はCore i9 13900Kを利用しており、こちらのCore i7 13700であるため、CPUの割には悪くないスコアが出たと思う
- 元記事を読む限り、ちもろぐ先生も結構ガッツリとNSFW生成をされていそうで安堵した(?
生成した画像
品質系プロンプトやHires. fixが入ってないので品質が微妙だが一応載せておく。
おまけ
品質系プロンプトやHires. fixを入れた版。ディティールや体の作りが、だいぶ良くなっている。
おまけ
ベンチとは一切関係なくなってしまうが、ついでにいつものキャラも出してみる。うちの子は元から可愛いのだが、SDXLの力で随分洗練され可愛くなった。
プロンプトなど
short hairではなくshot hairになっていることに、このプロンプトを生み出して一年半くらい経つ、今更気が付いた。
設定 | 値 |
---|---|
Clip skip | 2 |
ENSD | 31337 |
Propmpt | (illustration:1.0), masterpiece, best quality, 1girl, solo, happy, smile, theater, (perspective:1.3), from below, (looking away:1.2), (from side:1.0), {{shot_hair}}, smile, bangs, shaggy, (brown hair:1.1), swept_bangs, thick_eyebrows, skin_fang, closed mouth, {{purple eyes}}, gray {{jacket}}, white shirt, glasses, {{small breasts}}, |
Negative Prompt | nsfw, (worst quality, low quality:1.4), (depth of field, blurry, bokeh:1.5), (greyscale, monochrome:1.0), multiple views, text, title, logo, signature, (tooth, lip, nose, 3d, realistic:1.0), dutch angle,(cropped:1.4), text, title, signature, logo, (loli:1.2), school satchel, pink, school bag, school uniform, from behind |
Model | animagine-xl-3.1.safetensors [e3c47aedb0] |
VAE | Automatic |
Sampleing method | Euler a |
Hires. fix | Upscaler: Latent, Hires steps: 0, Denosing strength: 0.7, upscale by: 2 |
Sampleing steps | 20 |
Width | 768px |
Height | 768px |
Batch count | 6 |
Batch size | 1 |
CFG Scale | 7 |
Seed | -1 |
おまけのベンチスコア
参考までに上記設定でBatch countを6に変えた時の生成速度も貼っておく。なおpromptのshot hairはshort hairに直している。
処理時間 | 118sec |
---|---|
平均生成速度 | 3.09it/s |
20/20 [00:04<00:00, 4.45it/s]
20/20 [00:12<00:00, 1.55it/s]
20/20 [00:04<00:00, 4.94it/s]
20/20 [00:12<00:00, 1.58it/s]
20/20 [00:03<00:00, 5.41it/s]
20/20 [00:12<00:00, 1.59it/s]
20/20 [00:03<00:00, 5.01it/s]
20/20 [00:12<00:00, 1.59it/s]
20/20 [00:03<00:00, 5.08it/s]
20/20 [00:12<00:00, 1.59it/s]
20/20 [00:03<00:00, 5.21it/s]
20/20 [00:12<00:00, 1.59it/s]
240/240 [01:53<00:00, 2.11it/s]
240/240 [01:53<00:00, 1.59it/s]
そしてこれは計測用の走行で出た子