然后是基础光栅性能测试。惯例选用DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal作为参考。
GeForce RTX 5070的表现略逊于RTX 4070 Ti SUPER,但相对RTX 4070,提升幅度可以达到30%到40%。
因此在2K游戏的实战环节。DLSS 3游戏中,GeForce RTX 5070表现与RTX 4070 Ti SUPER是持平的,部分场景相对RTX 4070 Ti SUPER略好一些,但在同一个水平。而如果相对RTX 4070,提升幅度还是非常明显的,可以做到30%到40%左右的提升。
在DLSS 2的游戏中,GeForce RTX 5070表现也与RTX 4070 Ti SUPER相当,并且相对RTX 4070提升大概在20%到40%左右。
AI依然带劲
在AI环节,这里先通过UL Procyon FLUX.1 AI Image Generation Demo for NVIDIA进行测试。FLUX.1是一个基于FP4模型,拥有120亿个图像生成模型参数,因此对显存要求也非常高,必须要在16GB显存以上才能完成。
Blackwell开始从硬件层面引入对FP4数据格式支持,则可以很好的解决这个问题。原因是FP4提供了一种较低的量化方式,类似于文件压缩,能够减少模型的大小。相对大多数模型默认使用的FP16精度相比,FP4所需的内存是FP16的不到一半,并且GeForce RTX 50系列可以提供相比上一代2倍以上的性能,FP4可以通过NVIDIA TensorRT模型优化器的量化方式,确保质量不会有太多损失。