StoreServ机架图
StoreServ阵列采用特殊硬件,即一套ASIC来加速存储阵列操作,而且其每代阵列都会在这方面进行重新设计。目前的设计为第五代。
作为惠普企业业务公司研究员兼StoreServ架构师,Siamak Nazari当下主要负责第六代ASIC的设计工作。
每代ASIC设计往往需要效力五年左右,这意味着Nazari必须要着眼于未来可能出现的需求,同时考虑存储阵列介质、存储阵列软件以及主机访问需求等实际条件,猜测从2018年到2023年间第六代ASIC会面临怎样的具体考验。
Nazari与硬件团队协同设计这款ASIC芯片。在惠普企业业务公司的存储业务运营工作中,它归属于由Vish Mulchand领导的系统定义存储业务,而这位上司则直接向惠普企业业务公司存储业务负责人Manish Goel报告。
Patrick Osbourne负责运营软件定义存储部门,同样向Goel报告。而Goel则向惠普企业业务公司企业级系统业务负责人Antonio Neri报告。
第五代ASIC已经由纯磁盘与混合闪存/磁盘设计向全闪存方向迈进,其能够极大降低存储介质的访问延迟。Nazari假定后NAND时代存储介质又会出现一轮变革,例如电阻式RAM(简称ReRAM)、忆阻器类存储方案、3D XPoint以及STT-RAM(即自旋转移力矩RAM)与PCM(即相变存储器)等等。ASIC需要涵盖这些技术成果,从而实现更低的延迟--而不再像NAND时代那样主要关注使用寿命。
Nazari指出,惠普企业业务公司目前比较看重XPoint以及ReRAM。他表示,惠普企业业务公司与SanDisk(目前已经归属于西部数据)间的合作关系仍在继续,相关产品应用于惠普的服务器方案当中。因此,他认为采用ReRAM以及XPoint介质的惠普服务器将能够在采用DIMM实现形式的情况下实现次微秒级访问延迟。他同时解释称,NVMe over Fabrics类型的网络能够实现更低网络延迟,同样能够有效提升该阵列的性能表现。
在他看来,StoreServ阵列拥有六大主要元素,具体包括服务器主机访问、主机-阵列通道(一般采用光纤通道)、配合ASIC的阵列控制器、控制器-介质通道以及阵列的介质驱动器。图一所示为各元素间的协作关系。
他认为,目前控制器与存储介质间的对接通过采用光纤通道与SAS,未来两到三年内NVMe形式将逐渐普及。Nazari能够在ASIC领域自由创新,他表示其已经拥有内置存储语义并能够假设单一系统域。XPoint SSD的访问延迟应该在10微秒左右,低于NVMe NAND的60到100微秒。SAS的引入将额外增加10到20微秒,但其拥有NVMe所不具备的、经过良好定义的错误处理协议。在他看来,SAS的延迟水平已经可以令人满意,而协议的可靠性也要高于NVMe。
图一:StoreServ阵列总体示意图
Nazari宣称,第六代ASIC将针对NVMe进行优化。他关注的是各类数据服务(包括快照以及复制等)需要具备与第六代ASIC相匹配的延迟水平。他着眼于CPU周期与IOPS,并指出3PAR阵列通常只需要占用相当于竞争对手阵列产品一半的CPU周期或计算核心数量,这主要是由于拥有每秒800 MB传输带宽的ASIC能够作为存储协处理器起效。
他表示,至强核心的传输带宽为每秒150 MB。
在第五代ASIC StoreServ阵列当中,各控制器会耗费大量时间等待锁定,而他希望在新一代方案中降低这方面时间。方法之一就是向硬件添加更多队列,其数量甚至超过核心数。另外,惠普企业业务公司还与各HBA供应商开展合作,包括QLogic、Emulex、LSI等等,希望立足于其适配器产品实现阵列队列添加。这项倡议独立于特定光纤通道标准之外,例如每秒16 Gbit与每秒32 Gbit。
服务器与介质驱动器间的整套数据访问路径必须实现进一步提速,同时支持NVMe驱动器与NVMe架构,其中ASIC帮助各控制器更好、更快地完成处理任务。被Nazari设定为关注目录的NVMe over Fabrics规范正在不断演进,而后NAND时代下的首款XPoint SSD预计将在今年年底推出,XPoint DIMM也将在2017年年内亮相。
如果Nazari和他的同事们能够顺利完成工作,那么第六代ASIC StoreServ阵列将完美支持后NAND时代下的各类存储介质与NVMe架构,同时继续在不具备硬件(与固件)加速机制的商用阵列上拥有良好表现。作为老牌阵列供应商,惠普企业业务公司并不打算放弃其对外部阵列业务的关注;事实上,他们希望推出更为强大的第六代ASIC并为其阵列产品提供有力推动。
好文章,需要你的鼓励
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
麻省理工学院研究发现过度依赖AI会导致认知债务,削弱基本思维能力。研究表明交替进行无辅助思考和AI支持工作的模式能保持认知敏锐度。这种认知高强度间歇训练模仿体能训练中的HIIT模式,通过短时间高强度思考与恢复期交替进行,可以强化大脑神经回路,防止认知衰退,提升独立思考能力。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。