无论是浏览新闻,还是网络购物,网络上的应用均离不开数据的存取。可是数据有“冷”、“热”之分,常用的数据比较热门,需要快速的读取出来,尽快通过网络传递给用户。但内存资源毕竟有限,一些不常用数据自然就要受到“排挤”,只能存储到读取速度缓慢但容量巨大的硬盘之上。一旦内存不足,只能从硬盘上反复进行读取,延长了用户应用请求的响应时间,损害了用户的网络应用体验。怎样才能数据保持“热度”?英特尔傲腾可以解决这个问题。
2018年8月31日,在上海紫竹研发中心,英特尔进行了一场别开生面的傲腾技术分享暨傲腾产品评测活动。
首先英特尔公司中国区非易失性存储事业部总经理刘钢先生向我们介绍了,英特尔如何创新的对数据存储架构层级进行重塑。
英特尔公司中国区非易失性存储事业部总经理 刘钢
传统角色下,DRAM下面是硬盘,但无论是从容量还是从性能来讲,DRAM和硬盘之间的差距非常大,就算我们中间加入一个NAND SSD来改善,实际上两者之间的差距也是非常大的。举例来讲,今天NAND SSD的成本已经降了很多,但是真正大规模的代替7200转的硬盘,就存在一个成本的问题。
另外,从时延性能和存储容量上来讲这也是几个数量级的差距。通常我们讲DRAM就是讲多少GB,而我们讲SSD的时候讲的是TB,这两个之间直接差了三个数量级。时延的差距更大,可以达到五、六个数量级。在这中间需要一种新的产品来填补中间的差距。
所谓重塑电脑存储架构,据刘钢介绍,就是在原本电脑中的存储架构内存、硬盘之外,在硬盘之上,内存之下加入了SSD,但是一方面内存需要更大的存储容量,另一方面传统SSD性能远远不够,不足以支持当前飞速增长的热数据存储需求,因此需要一种更高效、性能更好,而且更经济的全新存储产品加入,让存储架构进行重塑。
于是英特尔推出了傲腾持久内存,定位在DRAM和SSD之间。它有很低的延时,但比DRAM延时时间会更长一点,但是比起SSD来讲,有几个数量级的延时提升。还有比普通的SSD快很多存储容量基本上相当于SSD的存储容量的傲腾SSD。最后是无论性能、容量还是成本均有显著降低的将有机会去更大规模的替换大部分硬盘的QLC的3D NAND SSD。通过这三种产品来填补硬盘与内存间的存储性能差距。
傲腾SSD的性能优势总结为三个部分:
第一,更低延时、更加稳定。在与P460的性能对比中,随着工作负载数量的提升,傲腾时延几乎贴在X轴上面,基本没有变化,而P4600的时延则随着工作负载数量上升而剧烈抖动上升。P4600与傲腾的时延最小相差8倍,在大工作负载时,相差可以达到63倍。
第二,耐用性。同样是和P4600进行对比,4600系列的每天全盘可擦写次数为3次,而傲腾是4600的20倍,每天全盘可擦写次数可以达到60次。
第二,效率更高。由于傲腾的低延时、高稳定、高耐用,可以在同样应用场景下,使用更少容量的傲腾来完成SSD的数据缓存工作。比如在某一应用场景中需要使用2T的SSD当作缓存,但仅使用375G傲腾就可以去替代,而且性能还会更好。
介绍完傲腾的高性能,刘钢接下来又让我们了解了英特尔SSD的“尺子”。
英特尔将QLC 3D NAND SSD设计成尺子的形状并不是为了标新立异,而是为了加大存储容量,减少存储空间。具体可以减少多少,用1TB传统HDD硬盘和1TBQLC 3D NAND SSD在机柜中的空间对比就可以看出来。
正如上图所示,以每块传统HDD硬盘存储4T容量计算,约需要占用22U的机柜空间。而英特尔QLC 3D NAND SSD的每把“尺子”可以提供32T的存储空间,也就是说只需要32把尺子占用1U的机柜空间,就同样可以提供1PB的存储容量。体积降低导致功耗降低64%,散热效率提升2.8倍。
最后英特尔工程师在服务器上向我们实地展示了傲腾SSD的测试成绩。
从屏幕显示可以看出,英特尔傲腾SSD在4K文件块大小情况下,测试带宽始终保持在2200Mbytes/s左右,IOPS在54万左右徘徊。测试结果十分稳定,测试性能优异。
由此可知,高性能大容量的英特尔傲腾SSD必然可以向用户提供更加理想的数据存取能力,让用户的应用数据“热度”得以有效保存。
好文章,需要你的鼓励
北京大学研究团队开发出基于RRAM芯片的高精度模拟矩阵计算系统,通过将低精度模拟运算与迭代优化结合,突破了模拟计算的精度瓶颈。该系统在大规模MIMO通信测试中仅需2-3次迭代就达到数字处理器性能,吞吐量和能效分别提升10倍和3-5倍,为后摩尔时代计算架构提供了新方向。
普拉大学研究团队开发的BPMN助手系统利用大语言模型技术,通过创新的JSON中间表示方法,实现了自然语言到标准BPMN流程图的自动转换。该系统不仅在生成速度上比传统XML方法快一倍,在流程编辑成功率上也有显著提升,为降低业务流程建模的技术门槛提供了有效解决方案。
谷歌宣布已将约3万个生产软件包移植到Arm架构,计划全面转换以便在自研Axion芯片和x86处理器上运行工作负载。YouTube、Gmail和BigQuery等服务已在x86和Axion Arm CPU上运行。谷歌开发了名为CogniPort的AI工具协助迁移,成功率约30%。公司声称Axion服务器相比x86实例具有65%的性价比优势和60%的能效提升。
北京大学联合团队发布开源统一视频模型UniVid,首次实现AI同时理解和生成视频。该模型采用创新的温度模态对齐技术和金字塔反思机制,在权威测试中超越现有最佳系统,视频生成质量提升2.2%,问答准确率分别提升1.0%和3.3%。这项突破为视频AI应用开辟新前景。