游戏显卡的江湖上流传着这样的传说,凡是N卡豪门旗下披着6号战袍的产品都会拥有着异常火爆的市场表现。这一规律被称为“逢6必火”定律。自从NVIDIA推出6600GT以来,几乎每一代带“6”的显卡都大火特火了起来。但上一代GTX 960由于一些问题最终没有大火特火起来让N粉们有些失望,而最近发布的新一代帕斯卡中端显卡 GTX 1060是否能捡起旧日的荣光,重新续写“逢6必火”的传奇呢?
2016年5月,NVIDIA发布了最新一代的帕斯卡架构产品,并且使用了16nm FinFET工艺制造。同时发布的GTX 1080和GTX 1070都表现出了巨大的性能提升,而作为传统意义上的主流产品,GTX 1060直到两个月后的7月初才低调发布。
在NVIDIA发布GTX 1060之前老对手AMD已经祭出了自己的主流显卡RX 480,让这一价位的争夺成为了再一次的N/A大战的首次交火。作为这一代的NVIDIA中端主力型号,GTX 1060又有怎样的战斗力呢?
●GTX1060规格参数:
规格点评:GTX1060显存升级到6GB,已经比GTX980的4G都更高了,对于VR应用来说,大显存相当有必要。流处理器数方面,GTX1070比GTX1080少了640个,1/4也就是一组的量,而GTX1060也是比GTX1070少了640个,剩1280了,但也比同定位的GTX960要多了;显存位宽终于回归到192bit,位宽缩得太多一直是GTX960被喷的点,因此猜测应该就不会有GTX1060Ti了(但很可能会有1050Ti)。基础频率也是很高,1.5GHz比GTX960足足高了50%,加速频率也达到了1.7GHz,老黄帕斯卡这代的频率扯真心高。纹理单元和ROPs也是GTX1070略为缩减,但减的都不是太多,换来的是更低的功耗,仅120W,6PIN供电完全够用.
Pascal GP106核心解析
NVIDIA在经历了四年基于28nm FinFET制造工艺制造GPU的漫长历史以后,基于Pascal GP104的GeForce GTX 1080首次迎来了16nm FinFET制造工艺升级。更高精度的“光刻”工艺允许GPU在单位面积的芯片上集成更多数量的晶体管,在同样的核心架构中,更加庞大的核心规模就意味着更强大的处理性能。所以16nm FinFET制造工艺能够给NVIDIA新显卡带来的能效提升是可以预见的,但是一直在超越自己的NVIDIA并没有被动享受制程进步的红利,反而在新一代的显卡中使用了更为先进的技术。这其中就包括GTX 1060使用的GP106核心。
GTX 1060的GP106核心内建2组GPC和6个显存控制器,每个GPC包含5个SM,1个SM中集成了128个CUDA单元、8个纹理单元、256KB的二级缓存、96KB的共享储存空间以及48KB的一级缓存。从规格上来看,GP106更像是GTX 1080所使用的GP104核心在除显存控制器之外其它多数规格砍掉一半而成的。
SM流式多处理器能够高度协调其中的CUDA核心以及其他功能元件的工作,这20个SM会参与到几乎所有GPU执行的所有命令中。GeForce GTX 1080拥有8个位宽为32bit的显存控制器,每一个显存控制器配有八个ROP单元和256 KB二级缓存。所以,完整GTX 1080的GP104核心共有2560个CUDA单元、256bit显存位宽、64个ROP、160个TMU以及2MB二级缓存。
GP106的核心晶体管数量为44亿,核心面积为200 mm2,略小于麦克斯韦家族GM206的227mm2,得益于16nm FinFET工艺的应用,每平方毫米的晶体管数量达到了22.9m,远远高于GM200。这也是GP106以及其它Pascal架构显卡能耗比如此高效的主要原因之一。此外,CUDA数量1280个,ROPs数量48个,TMUs数量80个。
NVIDIA将GPU开发工作的重点放在了设计Pascal核心架构的每一个细节中。Pascal之所有能够成为有史以来能效最高的GPU,原因不仅仅是16nm FinFET带来的制造工艺精进,更得益于持续提高的核心效率。NVIDIA工程团队的一大精力投入重点是GPU核心运行频率,橡木桶定律那样,GPU核心运行频率是由数以百万计的设计电路中速度最慢的那一路径决定的,所以这一最慢路径的优化对于GPU核心运行频率的提高是至关重要的。经过NVIDIA工程团队在这一领域的不断钻研,Pascal架构GPU相比前代有着40% 的运行效率提升。单靠16nm FinFET的制造工艺,是不能够带来如此高比例的核心频率提升的。
SMP技术和Ansel工具介绍
多画面同步投射技术(SMP),可以让基于Pascal架构核心的GPU以16个角度渲染画面并分别呈现。为了实现多画面同步投射技术,NVIDIA在Pascal架构核心的GPU中集成了新的多画面同步投射引擎模块。
SMP单元负责在渲染一个画面之前,生成多个视角再分别交给CUDA及其他元件进行渲染。SMP可用于许多新的图形技术,列如环绕透视、镜头阴影的匹配、单通道虚拟现实VR,多分辨率渲染。
这些新的图形技术对于虚拟现实VR有着颇多的益处,能够带来多达1.5倍的像素输出量和2倍以上的几何图形输出量。
环绕透视
环绕透视可利用SMP在三个显示器中呈现出的更宽视野和具有正确透视关系的图像。
单通道虚拟现实VR
NVIDIA VRWorks可以利用SMP技术以减少在渲染虚拟现实VR画面时的几何运算量。GeForce GTX GPU1080凭借单通道虚拟现实VR图形技术,可通过一次运算就能将一个画面以双眼的视角呈现出来,这就相当于减少了GPU几何图形一半的运算量。
镜头阴影的匹配
镜头阴影的匹配通过计算,让VR头戴显示设备直接显示根据设备矫正过的画面。避免了渲染之前过多不需要的图形被浪费掉,以大幅提高VR图形渲染性能。
多分辨率渲染
在游戏时,玩家们往往是将最多的注意力集中在画面的中心,所以通过多分辨率渲染技术,GPU可以将更多的资源分配去渲染游戏中心位置的画面,以此来提高玩家在游戏时的视觉体验。
开创性的Ansel截图功能
在游戏产业高度发展的今天,玩家们对游戏的诉求已经不是简简单单的娱乐放松,他们要求游戏可以以艺术甚至自我表达的层次呈现在人们面前。为顺应这一要求,NVIDIA开发出了极具开创性的Ansel截图功能,可以让玩家以自己特有的方式,去发现游戏中的美。
玩家们在游戏中碰到精彩的瞬间多会截图保存,其中有些游戏提供的截图功能异常简单,就是截取一堆当前的游戏画面,退出游戏后再慢慢挑选自己理想的。开创性的Ansel则可以让玩家在游戏中使用Ansel截图功能后定格游戏世界,然后玩家可以以任何自己想要的方位和角度进行精彩瞬间的抓取。
你还可以为截图添加不同的Photoshop滤镜效果,并调整景深、色调、光照、纹理等画质细节.截图的分辨率也不是锁死在游戏分辨率上,而是可以大幅度提高,甚至能达到9600×5400这样的变态级别,相当于4K显示器的六倍以上!它甚至还可以截取VR全景照片,并能发送到手机APP上,然后借助一些手机VR设备就能欣赏的VR游戏场景。
Ansel工作原理
Ansel首先基于NVIDIA GPU,然后以数据库的方式无缝衔接到驱动程序和游戏之间。NVIDIA为Ansel设计了标准化的UI控件,将其作为开放的SDK供游戏开发人员使用,使游戏开发人员可以轻松地将Ansel集成到游戏程序当中去,这样游戏玩家不论在什么游戏当中都可以使用到界面标准统一的Ansel工具了。
Ansel中的三个界面:
1.setConfiguration - 游戏设置,例如被用于游戏中的坐标系统。
2.isSessionActive - 显示Ansel是否在控制游戏。
3.updateCamera - 遵从游戏中的使用限制
显卡外观解析&拆解
我们这次拿到的是Founders Edition版本 与以往不同,NVIDIA在这一代的公版6系列显卡上使用了与高端产品类似的“泰坦皮”散热器。可见NVIDIA对这款产品的自信和重视。
GTX 1060背面没有配备金属背板,整体长度在25cm左右PCB长度仅有17厘米,要比散热器短上不少,这样的设计在RX480上也同样存在。给后续推出超短尺寸的GTX 1060提供了可能。另外GTX 1060并没有配备SLI接口,双6秒旗舰的情况在这代并不会出现。
还是熟悉的配方,还是熟悉的味道,沿用多年的涡轮散热器的好处是可以将热量排出机箱之外,降低机箱内部温度。但由于结构限制,散热效能一直比较一般,另外风扇转速较高也会有一定的噪音问题。
接口方面一共拥有三个DP1.4接口和一个HDMI2.0b接口,以及一个DVI-D接口 。
GTX 1060拆解
打开散热器可以看到散热器与PCB之间有一条飞线连接,这其实是布置在显卡前端的6Pin电源接口的延长线,如此布置据说是为了显卡的整体美观。对此笔者持保留意见。
PCB长度为17cm,GPU周围布置了6枚单颗容量为1GB的GDDR5显存,GPU芯片左方是3+1相数字供电模块。120W的TDP显然并不需要过高的供电规格。
显示核心型号为GP106-400-A1,采用台积电16nm FinFET工艺制造,基于最新的Pascal架构。默认核心频率为1506MHz,Boost频率为1709MHz。
所使用的显存不出意料的来自三星,单颗容量1GB,等效频率高达8000MHz。
基准性能测试
本次测试使用的测试平台如下:
为了避免其它因素对测试结果造成影响,我们搭建了一套i7-5960X+X99组成的硬件平台,内存使用频率高达3000MHz的DDR4 8GBx4内存套装。驱动程序版本为GeForce 368.64和催化剂16.7.2。
测试中使用的GTX 1060显卡为Founders Edition版本,即过去我们所说的公版卡,默认核心频率为1506MHz,Boost频率为1709MHz。按照以往经验,第三方厂商推出的非公版GTX 1060多数在规格上会有一些提高,主要体现在核心频率和散热性能上,所以性能会略高于Founders Edition版本。经过我们的测试,非公版的GTX 1080和GTX 1070相比公版会有着至少10% 的性能提升。GTX 1060的情况应该也会比较相近。
3DMark性能测试'
3DMark是著名图形测试软件厂商Futuremark推出的图形性能测试程序,本次测试使用最新版本进行跑分。测试项目选择常规的Fire Strike Extreme和Fire Strike Ultra两个DX11测试项目以及近期推出的专门用于测试DX12性能的Time Spy模式。
3Dmark DX11基准性能测试中我们可以看到配备全新16nm帕斯卡核心的GTX 1060得分基本打平了上代次旗舰GTX 980。相比对手RX 480在两种模式下分别取得了9.5%和8.4%的领先优势。性能相当强悍。
在DX12测试Time Spy中,GTX 1060也表现不错,相比与GTX 980得分十分接近,领先RX 480约2% 左右,基本处于同一水平。以往同价产品DX12性能处于劣势的情况没有再度出现。
接下来是VR性能简易测试,使用常用的SteamVR Performance进行测试。
GTX 1060在SteamVR Performance测试中取得了8.1分的平均保真度成绩。得分在GTX 980与GTX 970之间。结合我们之前测试RX 480时遇到的情况,虽然显卡厂商已经就VR性能进行了相关优化,但SteamVR这类更新较慢的简易跑分软件所使用的引擎并不支持新的VR特性,造成了在跑分中新一代显卡表现不正常。所以这项测试的参考意义一般,要想完美展现新旧显卡的VR实际性能差距,出了等待Steam进行版本更新之外,只能等待权威测试程序VRMark早日上架。
游戏性能测试
游戏性能测试
游戏测试环节,我们选择1920x1080和2560x1440两种分辨率进行测试。特效水平开启最高。分别选择三款DX12和三款DX11游戏进行测试。
DX12游戏测试
DX12游戏测试
DX11游戏测试
DX11游戏测试
从以上游戏测试成绩可以看出,GTX 1060表现十分不错,与前代定位高两个档次的GTX 980处于同一基本打平,相比RX 480也表现出了可观的性能优势。即使在A卡擅长的DX12游戏中也没有显出任何劣势。
功耗散热测试&评测总结
功耗散热测试
得益于16nmFinFET工艺和全新架构,GTX 1060仅仅120W的TDP显然不能对如今越发大肚能容的电源构成威胁,顶级平台加持下的满载仅仅305W。散热测试中在满载状态下温度达到了82摄氏度,待机温度仅34摄氏度,表现正常。公版散热器的效能不高但也足够堪用,想要获得很好的散热表现可以期待一向以堆料而著称的一众显卡厂商的非公版产品。
评测总结
N卡“逢6必火”的定律延续多年之后,玩家们不免对NVIDIA今年的GTX 1060充满了期待,NVIDIA很明显也没有辜负玩家们。
在性能测试中GTX 1060表现出了战平上一代次旗舰GTX 980的性能水平,实际游戏测试更是印证了NVIDIA在这一代显卡中使用的16nm Pascal架构的优越性。DX11模式下相对于对手的同等级产品RX 480有着10%左右的性能优势,即使是在A卡传统的优势领域DX12测试中不落下风。另外得益于底层的大跨步前进更是带来了更高的每瓦性能表现,超频潜力值得期待。
NVIDIA官方给出的6GB版本建议零售价为1999元,部分非公版产品已经开启了预售。(本次评测使用的Founder Edition版本并没有出现在首批上市的产品中)结合其优良的性能表现,这样的价格显然具有着相当明显的性价比优势,市场表现十分光明。”逢6必火“的传奇非常有希望在这一代得到传承。