お知らせ

現在サイトのリニューアル作業中のため、全体的にページの表示が乱れています。

5070Tiは4070Tiより性能が悪い…?

久々にPC構成を大刷新してみたのでベンチマークをしてみたが、かなり複雑な結果になった。

大まかにはCore Ultra 7 265FはCore i7 13700に、RTX 5070 TiはRTX 4070 Tiに劣るケースがありそうなことが判明したが、結果が複雑すぎて断言しづらい。

ベンチマーク構成

スペックアップ前後で単純に計測したところ、結果に疑問を持ったのでCPUとGPUを新旧それぞれで組み合わせて全数網羅で見ている。

デバイス 構成1-1 構成1-2 構成2-1 構成2-2
CPU Intel Core i7 13700 Intel Core i7 13700 Intel Core Ultra 7 265F Intel Core Ultra 7 265F
GPU GeForce RTX 4070 Ti GeForce RTX 5070 Ti GeForce RTX 4070 Ti GeForce RTX 5070 Ti
MEM Crucial Ballistix BL2K16G32C16U4B * 4 Crucial Ballistix BL2K16G32C16U4B * 4 Crucial CT2K16G56C46U5 * 4 Crucial CT2K16G56C46U5 * 4
M/B ASUS TUF GAMING Z790-PLUS D4 ASUS TUF GAMING Z790-PLUS D4 ASUS TUF GAMING Z890-PLUS WIFI ASUS TUF GAMING Z890-PLUS WIFI

FF14 黄金のレガシー ベンチマーク

4070Tiより5070Tiの方がベンチスコアが若干高く出るが、Core i7 13700よりCore Ultra 7 265Fの方が顕著にスコアが低い。

構成1-1 構成1-2 構成2-1 構成2-2
27,439 29,138 22,393 23,479

おまけ:ローディングタイム

構成1-2は記録し忘れたので書いていない。

構成1-1 構成1-2 構成2-1 構成2-2
6.5秒 - 7.9秒 8.6秒

ローディングタイムはストレージ依存のはずなのでCPUやGPUの性能が大きく影響することはないはずだが、かなり差が出ていたので参考程度にとどめておく。結果は小数第二位で四捨五入している。

CPUのキャッシュメモリサイズやDDR5の4枚差しによる速度低下が影響している可能性もあるが、2-1と2-2はGPUのみの差なのでよくわかっていない。ひょっとしたらグラフィック自体の読み込み速度が低下しているのかもしれない。

この差はMMORPGをする上ではかなりのハンデになるため、私が現役プレイヤーであれば、このスペックダウンは受け入れられなかっただろう。特にFF14をしていた時は誰よりも早くローディングを終えるのが自慢の一つだった。

SDベンチ

トキベンチ

ベンチマーク用のSD設定

COMMANDLINE_ARGSは--xformers --opt-channelslast --medvramを使用。

設定
Modelanimagine-xl-3.1.safetensors [e3c47aedb0]
Clip skip2
ENSD31337
Prompt 1girl, toki \(blue archive\), blue archive, toki sits cross-legged in her chair. looking at viewer, cowboy shot, masterpiece, best quality, newest,
Negative Prompt nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name,
VAE Automatic
Sampleing method Euler a
Sampleing steps 15
Width 1024px
Height 1024px
Batch count 5
Batch size 1
CFG Scale 7
Seed 50

生成ログ

構成1-1 構成1-2 構成2-1 構成2-2
15/15 [00:04<00:00, 3.12it/s] 15/15 [00:05<00:00, 2.67it/s] 15/15 [00:05<00:00, 2.92it/s] 15/15 [00:05<00:00, 2.78it/s]
15/15 [00:04<00:00, 3.34it/s] 15/15 [00:05<00:00, 2.92it/s] 15/15 [00:04<00:00, 3.35it/s] 15/15 [00:05<00:00, 2.95it/s]
15/15 [00:04<00:00, 3.34it/s] 15/15 [00:05<00:00, 2.91it/s] 15/15 [00:04<00:00, 3.44it/s] 15/15 [00:05<00:00, 2.96it/s]
15/15 [00:04<00:00, 3.36it/s] 15/15 [00:05<00:00, 2.95it/s] 15/15 [00:04<00:00, 3.46it/s] 15/15 [00:05<00:00, 2.93it/s]
15/15 [00:04<00:00, 3.32it/s] 15/15 [00:05<00:00, 2.97it/s] 15/15 [00:04<00:00, 3.46it/s] 15/15 [00:04<00:00, 3.01it/s]
75/75 [00:33<00:00, 2.24it/s] 75/75 [00:35<00:00, 2.08it/s] 75/75 [00:31<00:00, 2.40it/s] 75/75 [00:34<00:00, 2.20it/s]
75/75 [00:33<00:00, 3.96it/s] 75/75 [00:35<00:00, 3.30it/s] 75/75 [00:31<00:00, 3.96it/s] 75/75 [00:34<00:00, 3.32it/s]

平均生成速度

構成1-1 構成1-2 構成2-1 構成2-2
3.296it/s 2.884it/s 3.326it/s 2.926it/s

生成時間

構成1-1 構成1-2 構成2-1 構成2-2
33秒 35秒 31秒 34秒

まとめ

この結果からは4070Tiより5070Tiの方が生成速度が遅いことが読み取れる。またCPUがCore Ultra 7 265Fの時に僅かに高速化しているが、これはPCIe4から5への変化が効いている可能性がある。

またUltra 7 265F+4070Tiの組み合わせが最速を叩き出している点も見逃せない。つまりこれはStableDiffusionにおいてはi7 13700よりUltra 7 265Fが優位であることを示しており、FF14のベンチとは結果が逆転することを意味している。

りこベンチ

りこベンチとは個人的によく使う設定をベースにしたベンチだ。トキベンチの設定は個人的に使わず、実用性がないので今後はこちらを主にしていくと思う。

COMMANDLINE_ARGSは--xformersを使用。

ベンチマーク用のSD設定

設定
ModelntrMIXIllustriousXL_xiii.safetensors [1207404b17]
Clip skip2
ENSD31337
Propmpt (illustration:1.0), masterpiece, best quality, 1girl, solo, happy, smile, theater, (perspective:1.3), from below, (looking away:1.2), (from side:1.0), {{shot_hair}}, smile, bangs, shaggy, (brown hair:1.1), swept_bangs, thick_eyebrows, skin_fang, closed mouth, {{purple eyes}}, gray {{jacket}}, white shirt, glasses, {{small breasts}},
Negative Prompt nsfw, (worst quality, low quality:1.4), (depth of field, blurry, bokeh:1.5), (greyscale, monochrome:1.0), multiple views, text, title, logo, signature, (tooth, lip, nose, 3d, realistic:1.0), dutch angle,(cropped:1.4), text, title, signature, logo, (loli:1.2), school satchel, pink, school bag, school uniform, from behind
VAE Automatic
Sampleing method DPM++ 2M
Hires. fix True
Upscaler Latent
Hires steps 0
Denoising strength 0.8
Upscale by 2
Sampleing steps 20
Width 768px
Height 768px
Batch count 5
Batch size 1
CFG Scale 7
Seed -1

生成ログ

構成1-1 構成1-2 構成2-1 構成2-2
20/20 [00:05<00:00, 3.43it/s] 20/20 [00:06<00:00, 2.94it/s] 20/20 [00:03<00:00, 5.92it/s] 20/20 [00:04<00:00, 4.51it/s]
20/20 [00:11<00:00, 1.68it/s] 20/20 [00:17<00:00, 1.13it/s] 20/20 [00:11<00:00, 1.73it/s] 20/20 [00:17<00:00, 1.13it/s]
20/20 [00:05<00:00, 3.49it/s] 20/20 [00:06<00:00, 3.06it/s] 20/20 [00:03<00:00, 6.26it/s] 20/20 [00:04<00:00, 4.79it/s]
20/20 [00:11<00:00, 1.67it/s] 20/20 [00:17<00:00, 1.14it/s] 20/20 [00:11<00:00, 1.72it/s] 20/20 [00:17<00:00, 1.13it/s]
20/20 [00:05<00:00, 3.53it/s] 20/20 [00:06<00:00, 3.03it/s] 20/20 [00:03<00:00, 6.28it/s] 20/20 [00:04<00:00, 4.81it/s]
20/20 [00:11<00:00, 1.68it/s] 20/20 [00:17<00:00, 1.14it/s] 20/20 [00:11<00:00, 1.71it/s] 20/20 [00:17<00:00, 1.13it/s]
20/20 [00:05<00:00, 3.36it/s] 20/20 [00:06<00:00, 3.06it/s] 20/20 [00:03<00:00, 6.15it/s] 20/20 [00:04<00:00, 4.78it/s]
20/20 [00:12<00:00, 1.62it/s] 20/20 [00:17<00:00, 1.13it/s] 20/20 [00:11<00:00, 1.71it/s] 20/20 [00:17<00:00, 1.13it/s]
20/20 [00:05<00:00, 3.53it/s] 20/20 [00:06<00:00, 3.08it/s] 20/20 [00:03<00:00, 6.13it/s] 20/20 [00:04<00:00, 4.57it/s]
20/20 [00:11<00:00, 1.68it/s] 20/20 [00:17<00:00, 1.14it/s] 20/20 [00:11<00:00, 1.71it/s] 20/20 [00:17<00:00, 1.13it/s]
200/200 [01:49<00:00, 1.82it/s] 200/200 [02:11<00:00, 1.53it/s] 200/200 [01:33<00:00, 2.13it/s] 200/200 [02:00<00:00, 1.65it/s]
200/200 [01:49<00:00, 1.66it/s] 200/200 [02:11<00:00, 1.12it/s] 200/200 [01:33<00:00, 1.68it/s] 200/200 [02:00<00:00, 1.11it/s]

平均生成速度

構成1-1 構成1-2 構成2-1 構成2-2
2.567it/s 2.085it/s 3.932it/s 2.911it/s

生成時間

構成1-1 構成1-2 構成2-1 構成2-2
109秒 131秒 93秒 120秒

まとめ

結果としてはトキベンチと変わらず、Ultra 7 265F+4070Tiの組み合わせが最速でi7 13700+5070Tiの組み合わせが最も遅い。

総括

結果しては複雑で、個人的にはどの道を選ぶか未だに悩んでいる。

まず、今回新規導入したデバイスについての評価は以下の感じだ。

Core Ultra 7 265F

  • FF14ベンチではi7 13700に劣る
  • StableDiffusionの生成速度ではi7 13700を上回る

RTX 5070 Ti

  • FF14ベンチでは4070 Tiを僅かに上回る
  • StableDiffusionの生成速度では4070 Tiより1.1~1.3倍遅い

この結果は非常に悩ましい。FF14ベンチの結果からみるとゲーミング性能だけで言えばi7 13700+5070Tiが最適解だが、StableDiffusionの生成速度ではUltra 7 265F+4070Tiが最適解となった。

ただ私はもうFF14をしておらず、あまりゲームもしていないため、FF14ベンチの結果はある程度無視できる。そうなるとStableDiffusionだ。生成速度は重要な要素だ。とはいえ、4070Tiではメモリ不足でControlNetが使えないケースもあった。

また最近話題になっているFramePackのkisekaeichiではVRAM16GB必須という話もあり、今回は生成速度よりメモリを取る判断をしたいと思う。少なくとも旧環境である構成1-1と現環境である構成2-2を比べた時の差は一割程度であり、十分許容できる。

正直、私にはベンチマークのためにハードウェアを組み替える環境がないので、ある程度の情報でジャッジせざるを得ない。ちもろぐの人みたいに組み換え環境がある人はこの辺りがやりやすいと思うが、私の場合はPCケースからマザボを引っ張り出してそう取り返して、もう一度ケースに戻す手間がかかる。一連の作業には1時間ほど掛かり非常に手間だ。

今回はあまりにも結果が結果だったので、やむを得ず、新環境に組み替えてから、一度元に戻してベンチを取り直す検証を行ったが、組み換えの手間に加え、高価なCPUグリスが無くなり結構キツイ思いをしている。ちなみに今は新環境に完全に復帰している。