近日PMC更新存储产品组合推出一款PCIe 3.0内存卡——Flashtec,采用DRAM配以2013年收购IDT获得的NAND闪存控制器技术,最高容量为16GB,可以作为系统主存储扩展,或者作为块存储。大多数厂商采用PCIe闪存作为一种取代硬盘存储的高性能替代选择;也有少数厂商选择把闪存内存插入双带内内存模块插槽。就目前现有的固态内存卡来说,这款卡的定位独特,瞄准非常小众的市场。
当今市面上的存储系统存在一些具有普遍性的问题。通常情况下,数据从外部接口进入,存储引擎进行数据处理。每种存储引擎均有其各自的特性,可以进行数据应用,或压缩、加密及映射等。在存储引擎处理数据的同时,还要进行应答,并将应答发送给高层应用。为了实现这一点,所有的存储系统均采用某种写缓存来尽可能快地作出应答,使应用得以执行各自的任务。此外,数据处理部分还会产生许多元数据。对每一个进入系统的I/O,元数据处理均如影随形般进行着。显然,也需要元数据存储来辅助数据处理。因此,这两种负载成为了存储系统中的瓶颈:写缓存和元数据缓存,亟需解决。
这两种负载的主要特点是,都需要存储设备具有尽可能高的性能才能应对。理想的目标是这两种负载都能达到与上图中最上层的内存相当的性能。同时,也希望具备与图中底层所示的外存相当的非易失性来弥补内存在断电情况下数据容易丢失的问题。观察从内存到外存的存储层级,可以看出,这两种负载所需要的理想存储介乎外存与内存的层级之间——姑且称之为:关键型任务性能缺口。
如何应对这些挑战呢?自然而然的反应可能是:“用SSD来解决吧。”回头看看,这正是几年前多数存储系统采取的办法——将SSD用作写缓冲和元数据缓存。但随着技术的进步,闪存已然成为了占据主导地位的存储媒介,IOPS逐步提升,SSD而今已无法再满足这些性能需求。真正的挑战还在于SSD的耐写度。
几年前,50k IOPS的系统已是非常高端,而今却已连入门级水平都达不到。以100k IOPS的系统为例,如果打算采用400GB SSD,即如图3中蓝线所示,那么,400GB SSD所需的耐久度是每天写100次,这显然是闪存无法达到的。即便将容量增至2倍甚至2倍,耐写度需求降至每天写入10次的范围,SSD也只是勉强可以应付,而且这样的SSD也会很昂贵。
放眼未来,发展趋势是右上角的绿色圆块部分。显而易见,由于耐写度的问题,目前闪存无法胜任不断攀升的IOPS速度。既然闪存不行,多数人会回头求助于DRAM。那么,DRAM能否胜任呢?不言而喻,从性能的角度来看,DRAM非常理想,但DRAM的缺点在于其容易受到电源故障的影响。所以必须为DRAM提供保护。保护DRAM的办法通常是加入集成的UPS系统或电池备份单元。而电池本身就存在一系列问题如可靠性差、生命周期比系统短等等,从而产生了维护的巨大困难。此外,电池要占据大量空间。有电池备份的存储机架中,1/4的位置都被电池所占据。显然,这些为电池所霸占的空间完全可以更好地利用。
审视摆在面前的这些问题,PMC推出了这款NVRAM加速卡解决方案,填补内存层与SSD层之间的空白。PMC表示,Flashtec的性能要高于基于闪存的固态盘,同时不存在固态盘的耐用性问题,被用做附加系统内存的时候,它的性能可以达到10万IOPS。”
从硬件外观上来看,这是一款标准尺寸半高、半长的PCIe卡。它设计紧凑,基本上可以与市场中现有的服务器兼容。此外,PMC还在该方案之上与主机相连的接口层进行了一些创新:基于块的接口和内存映射接口,有了这两个接口,就为写缓存以及元数据的负载问题找到了解决方案。
与基于内存的解决方案相比,采用NVMe驱动的核心优势在于能够高效进行DMA处理,在这一方面NVMe协议有很高的效率。用NVMe将数据从内存移至NVRAM解决方案,效率比利用CPU周期要高出4倍。这一点至关重要,进行内存备份基本上就要消耗CPU周期,而这些时间本可以用于上层应用软件的处理,这才是CPU资源最需要的地方。
PMC给这款NVRAM加速卡了一个新定位:创造在DRAM和SSD之间的一个高性能存储层级。张冬表示:“就算将之前闪存控制器做的事情拿到主机中做,速度还是很慢。相比之下,NVRAM纯粹是为了性能,尤其是小块的更新,例如互联网中的用户登录日志,当业务压力非常大,闪存无法胜任的时候就要使用NVRAM。
但同时他也坦言,这款卡的应用场景并不很通用,潜在的需求市场包括像分布式存储和KV数据库等。此前Objective Analysis市场分析师Jim Hardy曾认为,这款卡很适合于高端市场,针对那些甚至动用大量DRAM和SSD都无法得到足够高速度的应用。如果向系统PCIe总线添加更多DRAM的话,这种系统的速度会提高,但这样做的成本相当高。据悉,这款卡将在年底供货,有4GB、8GB和16GB三个版本。
好文章,需要你的鼓励
YouTube开始推出肖像检测工具,帮助创作者识别和举报使用其面部特征的AI生成视频。该系统类似于版权检测机制,目前处于测试阶段,仅向部分创作者开放。用户需要提供政府身份证件照片和面部视频来验证身份。系统会标记疑似包含用户肖像的视频,但无法保证100%准确识别AI内容。YouTube将根据多项因素决定是否移除举报的视频。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
谷歌宣布在AI Studio平台中引入"氛围编程"体验,让编程和非编程用户都能更轻松地开发应用程序。用户可通过简单提示生成可运行的应用,新功能包括应用画廊、模型选择器、安全变量存储等。平台还添加了模块化"超能力"功能和"手气不错"按钮来激发创意。完成的原型应用可一键部署到谷歌云运行平台。此次更新正值业界期待谷歌即将发布Gemini 3.0大语言模型。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。