实现数据存储和加速一直是存储厂商追求的目标,为了给用户提供更多新技术和选择,英特尔从3D XPoint内存技术到落地,在2017年3月份正式发布新的固态盘傲腾固态盘DC P4800X。Optane傲腾是英特尔的新一代存储品牌,它的存储介质是3D XPoint技术,加上内存和存储控制器以及英特尔互联IP以及英特尔软件,综合起来的产品我们称之为Optane傲腾。
英特尔研发新的技术的目的不断缩小内存和存储间的界限。比如目前NAND SSD的时延与DRAM内存的时延是一万倍级别的差距。3D XPoint存储技术希望实现低的延时以及更大的容量。
英特尔公司高级副总裁、NSG总经理Robert B. Crooke表示DC P4800X是第一代第一款基于的3D XPoint的技术的固态盘,容量目前为375G,同时性能也能够很好地满足需求。
Optane是目前世界上响应最快的数据中心级固态盘。Optane SSD能够给大家可预测的快速服务,在任何工作负载都可以预测的快速服务,99%的情况下可以提升60倍。另外,NAND SSD最大的性能需要再队列在128队列之下才可以实现,但是很多应用是在8-16队列之间,而Optane由于采用了类似DRAM的存储介质,可以在很低的队列深度下达到极致性能。另外Optane在不同负载下的快速响应,在一些实际应用中,特别是语音应用这种有很多负载同时进行的情况下,读的同时还有很大比重的写入,如果读的性能能降下来,写的性能可以提升很多。但是Optane可以在不同情况下,即使是读写混合时,时延也非常低,负载下的快速响应降低40倍左右。因为响应更快了,所以Optane可以提供更高的寿命,比最高寿命的NAND PCIe的寿命高2-3倍。和英特尔最高寿命的PCIe相比,这个产品的寿命能够再提升2.8倍左右,因为它的写进速率更好,因此寿命更高。
Optane SSD和至强CPU结合能够给客户,特别是云计算客户提供很多优化,特别是延时敏感的工作负载,降低事务处理成本,以更低时延且可无预测的快速服务来做差异化特别是对云计算领域。
在发布会上,英特尔合作伙伴腾讯云分享了采用Optane SSD在提升SSD云硬盘性能和数据库性能的价值。从QQ相册的每天上传1千万张图片,到今天的微信、QQ 20亿张图片,当存储技术没有提升的时候,在做上层应用的时候是非常痛苦的。腾讯云副总裁王慧星表示,技术的前沿发展和应用的繁荣二者之间一定存在着一种跷跷板的关系,而且是互相推动和互相发展的,也就是技术的发展让应用能够更加爆发,应用的进一步爆发又给存储技术带来了很多新需求。其实需求和技术之间一直是互相演进、互相牵引的状态。采用新的存储介质能让企业业务构建不再受到存储技术和存储服务的困扰和挑战。让他们的行业创新能够变得更加有效率。
以上数据为fio(ioengine=libaio)测试采集。使用方式,将傲腾固态盘作为内存及基于NAND的NVMe SSD之间的缓存层,写磁盘是3副本落盘。
对比以前1.0时代的SSD盘和新的傲腾存储介质实现的数据对比,单盘的IOPS有非常大的提升、吞吐性能也有大的提升,访问延时也是降低了一毫秒。大家不要小看这一毫秒,因为越是底层的技术每一点的变化都能给上层应用带来非常大便利和效率的提升,包括研发效率的提升,这都是行业中做应用、做服务的研发团队、运维团队非常看重的。这样一个服务不纯粹是对着盘直接测试,里面有经过网络、经过应用层架构在外面的整体架构,所以腾讯云持续在探索,怎么把底下的硬件能力更好地和腾讯云服务做结合,把技术能力和优势更好地发挥出来。
以上数据为基于350GB容量数据库测试,基准性能测试SYSBENCH 0.5采集,以上数据库测试经过数据库内核缓存、sql解析、sql语句优化等,同时与表结构和事务相关。
在数据库性能测试上,腾讯云方面做了很多尝试。使用傲腾存储介质后,SQL服务的QPS取得了非常大的进展。其实做互联网业务来讲,数据库和数据是整个应用层构架的时候核心的难点和挑战。也就是说,当在应用层进行容灾、跨数据中心的灾备时,最大的挑战在于数据层是怎样架构的。所以不要小看QPS的演进,其实对于程序来讲势能架构能得到极大的简化和效率提升。
从真实客户的案例,SQL服务当QPS请求量从4万次提升了3倍以后,一方面非常有效率的能够跑在腾讯云上。这背后是数据库技术以及存储介质提供了非常大的支撑。当另外运营层方面用户也得到了极大的节减。在成本压缩要获得相应的性能和应用层的变低的时候,通过基础设施来优化来降低应用层的成本。
英特尔傲腾固态盘DC P4800X系列将驱动新解决方案的出现以满足人工智能与机器学习的应用需求、实现更快速的交易、让医学扫描获取更深入的洞察,并扩大云计算解决方案的适用范围。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。