今年1月初,伴随着英特尔第七代酷睿平台的发布,名为Optane的内存以及固态硬盘也同期公布。此后在3月28日的发布会上,Optane正式定名为傲腾。自此,经过大约两年左右时间的陆续披露,英特尔傲腾内存终于正式上市售卖,从而开启了英特尔在存储领域的一段新篇章。
在英特尔公司创立之初,其最早推出的产品并非处理器,而是1.024比特动态Ram 1103。直到1971年推出第一个微处理器4004之后,英特尔才开始在半导体芯片领域逐渐成为家喻户晓的公司。
那么傲腾内存到底是什么?其底层技术的特性究竟如何?它适合哪些用户?相对于常见的NAND来说有何不同?今天,我们将围绕这些问题,为大家做一次深度解读。
·傲腾内存是什么?
简单来说,傲腾内存是基于3D Xpoint存储介质而打造的、帮助硬盘提升速度的缓存设备。Optane/傲腾是其品牌名称,3D Xpoint是这种存储设备的存储介质,而时下各类存储设备比较常见的存储介质为NAND,3D Xpoint可以说是一种全新的存储介质。
目前,傲腾分为固态硬盘以及内存。前者目前主要致力于企业级应用,消费市场还没有相应设备。而后者,也就是傲腾内存,则主要面向消费级市场推出,目前包括16GB和32GB两个版本,均可以在各大电商买到。
·傲腾内存的主要功能
那么傲腾内存的主要功能是什么呢?简而言之,它就是为硬盘加速用的,而相对于固态硬盘来说,对机械硬盘的加速更加明显。具体来说,它的主要作用表现在:
其一,提升开机速度;
其二,提升软件加载速度;
其三,提升软件素材、文件加载速度;
其四,提升游戏加载速度。
·使用傲腾内存应具备什么条件?
傲腾内存的使用是有一定限制的,并不是所有硬件平台都能够使用。目前需要同时具备两个要求:
其一,用户必须至少有一块英特尔200系主板,全新的300系主板也支持。如B250与Z270、Z370等。
其二,用户必须使用至少是英特尔第七代酷睿处理器,全新的第八代酷睿处理器也支持。即酷睿i3、i5、i7,同时不支持奔腾、赛扬等其它处理器平台。
因此,如果手上没有第七代或第八代酷睿处理器,亦或是没有200系或300系主板的朋友,想要使用傲腾内存的话就需要对硬件进行升级了。
·傲腾支持哪些操作系统?有无PCI-e版本?SATA总线的M.2接口有用吗?
英特尔傲腾内存目前只支持Windows10操作系统,中国用户量比较大的Windows 7等老系统无法支持。
同时,傲腾内存主要使用接口为M.2,使用PCI-e连接。NVMe才能发挥傲腾在随机读写时的超快响应和最佳的服务质量等特性。
了解傲腾内存基本信息之后,我们在接下来的三页篇幅中,来深入挖掘一下傲腾内存的底层技术,即3D Xpoint技术。
·打破NAND瓶颈 存储进入3D时代
其实早在2015年8月份的旧金山IDF 15上,英特尔就公布了Optane。但当时并未强调Optane,而是以Optane的核心技术3D Xpoint为主要切入点来向媒体以及用户做出展示的,因此要想搞懂Optane是什么,首先要明白Optane核心的3D Xpoint技术是什么?
我们都知道,以往PC体验主要受制于处理器性能,尤其在奔腾、赛扬时代最为明显。而到了酷睿时代,随着处理器性能不断飞跃,影响PC整体体验的瓶颈从处理器逐渐转向内存、硬盘这样的存储介质。这就是为什么老处理器平台机器加个内存条、换块固态硬盘就能再战五年的主要原因。
硬盘性能成为时下PC性能体验的主要瓶颈
因此,如今电脑性能的提升,已经从以往的“升级处理器”转向了“升级内存与硬盘”。
不过,即便是同等规格下的内存与硬盘也存在性能上的高低差异,想要进一步突破瓶颈,就需要推出更加先进的存储技术。Optane所使用的3D Xpoint技术,就是为此而生。
时下,内存与固态硬盘所使用的都是NAND闪存,想要在此基础上去不断提升性能变得越来越困难,所以需要全新的闪存技术来实现性能的突破,3D Xpoint就是针对NAND闪存瓶颈而打造的全新技术。总结为一句话就是:NAND闪存性能提升难以突破之后,3D Xpoint的出现为性能再次飞跃带来了可能。
NAND闪存性能突破已现瓶颈
那么3D Xpoint技术的原理是什么呢?为什么能够完成NAND闪存所不能完成的任务呢?
首先要明白的是,3D Xpoint是一种改变传统闪存架构的技术,本质上并不是一种单纯通过提升闪存存取速度来达到性能提升的技术。这就像处理器性能提升过程中,除了暴力拉升主频之外,对底层架构优化也能够达到性能提升一样,3D Xpoint技术就是一种全新的闪存架构技术。
那么有朋友就要问了,3D Xpoint架构与传统的NAND闪存架构有何不同呢?
这里我们不妨以比喻的方式来进行说明,这样会更好理解。
首先我们假设有一个占地20000平米土地的小镇,镇子里起先有2000个人。在3D Xpoint出现之前,镇子里的人都住在平房里,那么这时候每个人所摊的面积只有20000÷2000=10平米。大家可以想像一下10平米的空间得是有多挤。
面对这种状况,小镇领导班子经过研究请来了一位设计师和一个施工队,力求解决小镇居民们现在这种拥挤的状况。于是设计师设计出了一幢足够容纳2000人的大楼,而施工队则将原本的平房都推到,迅速盖起了设计师设计出的大楼。这幢大楼的占地面积必然要比原本的大片平房占地面积小很多,但却容纳了原有的2000人。
3D Xpoint技术就是一种先进的3D存储技术
说到这里相信大家已经明白了吧?没错!3D Xpoint就像它的名字“3D”一样,是一种立体化的闪存架构。3D Xpoint技术其实就是将原本平面化的NAND闪存结构变成了立体结构,在这样的立体结构里,存储容量不再单纯受芯片平面面积大小的影响,因此同样的芯片面积上可以容纳更大的数据吞吐量。
此外,领导班子请来的这位设计师和施工队,就是这项技术的设计者和开发者——英特尔与镁光。所以我们也就明白了,英特尔推出的基于3D Xpoint技术的Optane内存与Optane固态硬盘,实质上就是全新的3D存储介质。
·引入新架构 数据吞吐更高效
3D Xpoint是一种立体化的存储技术,它看起来与同为3D设计的TLC NAND技术相似,但其实本质却不同,3D Xpoint并不单纯是NAND,而是一种新的存储介质,并且是一种新的非易失性存储技术。从架构设计上看,它与FlashTec NVRAM加速卡有些近似,用RAM作为缓存,提高访问速度,同时用NAND作为存储介质。因此,3D Xpoint在速度上有优势,同时又具有非易失性存储的优点。
然而看到这里可能懂行的朋友就会说了,“这不就是之前各家都推过的3D内存吗?有啥可吹的?”
虽说3D Xpoint同样是一种3D闪存,但此3D并非彼3D,二者之间还是有较大差异的。我们还是以比喻的方式来说明。
普通3D闪存是一层地建一层平房,之后通过多层地面堆叠构成3D闪存,但本质上房子还是平房。而3D Xpoint是在一层地上就建了很多幢大楼,并且盖完大楼还能堆很多层地,然后再建大楼,与平房比起来,自然是楼房单位面积内的容量更大,孰优孰劣显而易见。
那么英特尔的3D Xpoint技术在架构方面有怎样的特性呢?为什么能够被称为革命性的架构转变呢?
其一,高效的交叉阵列结构。
3D Xpoint让存储变得立体化,那么在立体化的空间里排布存储单元就与在平面里排布有所不同。基于3D Xpoint技术的存储介质中,通过垂直导线连接着多达1280亿个密集排列存储单元,每个存储单元存储一位数据,立体化让结构变得更加紧凑,而借助这种紧凑的结构就可以获得高性能和高密度位。
这么说可能大家不太明白,我们还是以比喻的方式对上面一段文字做个解释:设计师英特尔先生在设计好小镇大楼之后,觉得如果还是按照传统的走廊式设计,那么住在这幢大楼里的2000人串门会很不方便。于是英特尔先生瞬间被哆啦A梦附体,给每个房间都装了无数个任意门,而这些任意门可以让大楼里的居民们直通楼里的任何一个房间,这样的话有人想串门时就会方便、高效的多了。
开了任意门之后,“串门”就方便多了
这就是3D Xpoint技术的交叉阵列结构。它可以让大楼里(存储介质)的每一个居民(存储单元里的一位数据)之间的联系变得更加紧密高效,数据的吞吐变得迅捷自由,交叉阵列结构的高效性就在这里。
其二,存储单元可堆叠。
交叉阵列结构让数据的吞吐变得迅捷、高效,然而如果数据容量无法得到保证的话,这种高效吞吐又会失去意义。在单个文件容量越来越大的今天,存储介质在提升速度之外,当然还要重视容量的提升。因此,3D Xpoint技术还允许存储单元被堆叠到多个层中,这样就可以有效提升存储介质的容量。
目前,现有的技术可以使集成两个存储层的单个芯片存储128Gb数据,而未来,通过改进光刻技术、增加存储层的数量,其系统容量可以获得进一步的提升。
那么“存储单元堆叠”是啥意思呢?接下来我们再以比喻的方式为大家进行解读:
允许存储单元堆叠,就可以在有限的面积内增大存储容量。所以我们回到英特尔先生设计的大楼所在的这个小镇子中来。
在当初英特尔先生设计大楼时,小镇常住居民只有2000人,于是设计一幢大楼就可以容纳下这些人,但小镇的实际面积有20000平米,一幢大楼占地面积显然不可能有20000平米这么多,这样如果只盖一幢大楼的话,那么其它“土地”就完全浪费了。因此英特尔先生开始考虑是不是要把剩余的土地利用起来,以求利益的最大化。
于是,英特尔先生与镁光施工队一合计!就又在这20000平米的土地上盖了更多的房子,然而土地都被用来盖房子了,小镇里的道路问题怎么解决呢?颇富想象力的英特尔先生并未采用传统的地面道路建设方案,而是把每一幢大楼通过任意门相互打通,使新加入的居民和老居民之间能够任意进出每一幢大楼的每一个房间。
给小镇建设更多的“楼房”来提升容量
这就是存储单元堆叠与交叉阵列结构同时存在于3D Xpoint技术里的原由,不仅每一幢楼里的住户们之间能够自由“串门”,楼与楼之间的住户们同样可以自由“串门”。技术呈现出来的效果就是:既能够扩大存储容量,又能够通过交叉阵列结构提升数据吞吐速度。
其实明眼人都能看得出来,之前我们所说的交叉阵列结构与存储单元堆叠都是为了小镇“住户”来考虑的,小镇住户的身份其实就是数据存储。但内存与硬盘不只是涉及到“存储”这个概念,访问与读取也是很重要的。存储快了,但是访问、读取慢了的话,内存、硬盘性能还是上不去,盖那么多大楼、开那么多任意门岂不是白白浪费了?
·引入选择器提升效率 延长寿命
所以英特尔在3D Xpoint技术中又引入了选择器。
我们知道,在NAND闪存中,数据是以位(bit)的方式保存在Memory Cell中,一个Cell存储一个bit,这些Cell或8个或16个为单位,连成bit line,而这些line组合起来会构成Page,NAND闪存就是以页为单位读写数据,以块为单位擦除数据,同时按照这样的组织方式形成三类地址:Block Address、Page Address以及Column Address。对于NAND闪存来讲,地址和命令只能在I/O上传递,数据宽度只有8位。
3D Xpoint中的选择器就是为了解决这些瓶颈而被“请”来的。我们先看看其原理:
存储单元通过改变发送至每个选择器的电压,来实现数据的访问、写入或读取,相对于NADN闪存通过寻址方式来实现数据访问、写入、读取或擦除的方式,3D Xpoint效率更高。此外这样做的好处不仅消除了对晶体管的需求,同时也在提高存储容量时能够降低成本。因此3D Xpoint是一项既能够提高存储介质速度、性能的技术,同时又是一项能够降低存储介质成本的技术。
合理分配延长存储单元使用寿命
说到这里可能大家明白了,选择器的主要作用就在于,它可以合理有效的调控数据存储位置,并且让数据不单单只呆在一个地方,通过这种动态、随机的分配机制,可以让存储单元有更高的有效利用率,同时也能够让访问、写入、读取、擦除变得更高效,此外整个存储介质的寿命也会变得更长。
如果说交叉阵列结构是为数据盖了一栋大房子,而存储单元堆叠让这栋大房子更具规模,那么选择器在其中所起的作用,就是合理有效的调动这片大规模房屋中的数据,让它们变得更易访问、更快速的读写。
·引入快速切换单元 提升效率
然而,面对超大量的数据吞吐,如果仅凭借选择器的话,效率还是有所掣肘,毕竟“一个人”的力量是有限的,一个选择器也无法解决所有问题。因此3D Xpoint中还引入了“快速切换单元”。通过快速切换单元,选择器就像开了挂一样,其高效性就会被彻底激发出来。
我们还是先来了解一下基本的原理:
基于3D Xpoint技术所打造的存储介质,会凭借更为小尺寸的存储单元,快速切换选择器、低延迟交叉点阵列以及快速写入算法,让每一个成员始终处于高效的工作状态中,而避免有的忙有的闲这样的情况发生。在这种情况下,存储单元能够以高于目前所有非易失性存储技术的速度切换其状态。这是3D Xpoint技术提升存储性能的秘诀所在。
对于海量数据吞吐而言,省略寻址过程是提升效率的重要手段
快速切换单元则充当管理员的角色,它们能够将数据合理、快速的分配到没有数据的区间,省略了排查寻址的过程,从而提升数据吞吐速度。
傲腾内存的技术了解之后,我们不妨看看傲腾内存能够给机械硬盘的读取速度带来怎样的提升。
·16GB傲腾内存性能测试
首先我们来看一些理论测试数据,这些数据是在16GB傲腾内存发布之后,我们做过的一些简单测试。
安装并激活傲腾内存之后,如果重启系统的话你首先会发现系统开机速度变得非常迅速。笔者由于手上只有一套平台,所以无法做两套平台的同时对比,因此采用了秒表计时的测试方法,数值虽然不够那么精确,但误差基本在1-2秒之间,下面我们来看看激活傲腾内存和不激活傲腾内存时的相关测试数据有何不同。
开机速度对比
首先笔者掐表对开机速度做了对比。在HDD中安装系统并且开机的速度相信不少朋友都深有体会,即便是Windows 10这样已经精简很多的系统,开机速度也非常的缓慢,笔者使用3TB西数蓝盘开机需要大概33秒左右的时间才能进入系统。
不过在激活傲腾内存之后,开机速度缩减到11秒左右,能够达到普通SSD的水准。
AS SSD Benchmark Seq读取速度测试(数字越大越好)
AS SSD Benchmark Seq写入速度测试(数字越大越好)
接下来笔者使用了AS SSD Benchmark软件对其进行了测试。从上面的两张测试结果图中可以看到,傲腾内存对于读取速度的提升非常明显,测试所使用的西数蓝盘HDD读取速度仅为145.4MB/s,激活傲腾内存之后,读取速度能够达到886.9MB/s,能够达到普通SSD的读取速度。
而对于写入速度的提升就没那么大了,测试HDD写入141.9MB/s,激活傲腾内存加速之后可以达到172.6MB/s,提升不大。
PCMark 8存储带宽测试(数字越大越好)
PCMark 8软件中有专门的存储设备测试选项。我们对激活和未激活傲腾内存时的Bandwidth进行了测试,可以看到这个项目的差异也是相当明显的。未激活傲腾内存时的速度仅为10MB/s,而激活傲腾内存之后飙升至435MB/s,这也解释了傲腾内存激活之后,为何HDD的速度提升如此明显。
Photoshop打开速度对比(单位为秒,数字越小越好)
另外我们在理论测试之后,还对其进行了实际应用的测试。首先可以看到,在Photoshop打开速度测试中,安装在HDD上的时间要9秒,而激活傲腾之后只需要4秒钟。
《英雄联盟》游戏加载速度对比
此外,对于游戏加载速度的提升也是傲腾内存所擅长的领域。以《英雄联盟》这款游戏为例,激活傲腾内存之后加载速度可以缩减为28秒左右,而单独使用HDD的话加载速度需要32秒。此外这还不是最为重要的提升,在笔者实际对战过程中发现,未激活傲腾内存而单独使用HDD玩的话,会间歇性出现瞬间的卡顿,对游戏体验造成非常不好的影响,而激活傲腾内存之后,这种现象会被彻底的杜绝。
·傲腾内存适合哪些用户?
那么傲腾内存到底适合哪些用户呢?
首先,英特尔提出了傲腾内存的金字塔型目标受众群体:可以用于OEM品牌机、笔记本电脑及游戏玩家DIY等场合,解决高速度、大容量和可靠性。
不过笔者总结出的用户群体为:同时对大容量存储以及高速读写有需求的用户。
如对存储容量有2TB甚至更高的用户,选择傲腾+大容量机械硬盘的解决方案,就远比直接选择大容量固态硬盘来的划算。如下图:
2TB固态硬盘售价最便宜4999元
从上图可以看到,2TB固态硬盘最便宜的是4999元,而2TB机械硬盘+32GB傲腾内存的价格不到1000元,如果配上3TB、4TB甚至更高容量的硬盘,那么用户从傲腾内存上所获得的收益无疑会更大。
虽然傲腾内存是黑科技般的解决方案,但目前也存在一些需要完善的地方。比如如果能够给多块机械硬盘加速的话,那么其实用价值就会更大了。
总体来说,傲腾内存除了是普通消费者的最佳存储解决方案之一,对于OEM厂商来说,自然也是降低存储成本、提高产品运行体验的最佳途径之一。与其为产品配备成本高昂的大容量固态硬盘,不妨选择成本更加划算的傲腾+机械硬盘,在保证机器运行体验的同时,也能够用户更加合理的成本控制,何乐而不为呢?