StoreServ机架图
StoreServ阵列采用特殊硬件,即一套ASIC来加速存储阵列操作,而且其每代阵列都会在这方面进行重新设计。目前的设计为第五代。
作为惠普企业业务公司研究员兼StoreServ架构师,Siamak Nazari当下主要负责第六代ASIC的设计工作。
每代ASIC设计往往需要效力五年左右,这意味着Nazari必须要着眼于未来可能出现的需求,同时考虑存储阵列介质、存储阵列软件以及主机访问需求等实际条件,猜测从2018年到2023年间第六代ASIC会面临怎样的具体考验。
Nazari与硬件团队协同设计这款ASIC芯片。在惠普企业业务公司的存储业务运营工作中,它归属于由Vish Mulchand领导的系统定义存储业务,而这位上司则直接向惠普企业业务公司存储业务负责人Manish Goel报告。
Patrick Osbourne负责运营软件定义存储部门,同样向Goel报告。而Goel则向惠普企业业务公司企业级系统业务负责人Antonio Neri报告。
第五代ASIC已经由纯磁盘与混合闪存/磁盘设计向全闪存方向迈进,其能够极大降低存储介质的访问延迟。Nazari假定后NAND时代存储介质又会出现一轮变革,例如电阻式RAM(简称ReRAM)、忆阻器类存储方案、3D XPoint以及STT-RAM(即自旋转移力矩RAM)与PCM(即相变存储器)等等。ASIC需要涵盖这些技术成果,从而实现更低的延迟--而不再像NAND时代那样主要关注使用寿命。
Nazari指出,惠普企业业务公司目前比较看重XPoint以及ReRAM。他表示,惠普企业业务公司与SanDisk(目前已经归属于西部数据)间的合作关系仍在继续,相关产品应用于惠普的服务器方案当中。因此,他认为采用ReRAM以及XPoint介质的惠普服务器将能够在采用DIMM实现形式的情况下实现次微秒级访问延迟。他同时解释称,NVMe over Fabrics类型的网络能够实现更低网络延迟,同样能够有效提升该阵列的性能表现。
在他看来,StoreServ阵列拥有六大主要元素,具体包括服务器主机访问、主机-阵列通道(一般采用光纤通道)、配合ASIC的阵列控制器、控制器-介质通道以及阵列的介质驱动器。图一所示为各元素间的协作关系。
他认为,目前控制器与存储介质间的对接通过采用光纤通道与SAS,未来两到三年内NVMe形式将逐渐普及。Nazari能够在ASIC领域自由创新,他表示其已经拥有内置存储语义并能够假设单一系统域。XPoint SSD的访问延迟应该在10微秒左右,低于NVMe NAND的60到100微秒。SAS的引入将额外增加10到20微秒,但其拥有NVMe所不具备的、经过良好定义的错误处理协议。在他看来,SAS的延迟水平已经可以令人满意,而协议的可靠性也要高于NVMe。
图一:StoreServ阵列总体示意图
Nazari宣称,第六代ASIC将针对NVMe进行优化。他关注的是各类数据服务(包括快照以及复制等)需要具备与第六代ASIC相匹配的延迟水平。他着眼于CPU周期与IOPS,并指出3PAR阵列通常只需要占用相当于竞争对手阵列产品一半的CPU周期或计算核心数量,这主要是由于拥有每秒800 MB传输带宽的ASIC能够作为存储协处理器起效。
他表示,至强核心的传输带宽为每秒150 MB。
在第五代ASIC StoreServ阵列当中,各控制器会耗费大量时间等待锁定,而他希望在新一代方案中降低这方面时间。方法之一就是向硬件添加更多队列,其数量甚至超过核心数。另外,惠普企业业务公司还与各HBA供应商开展合作,包括QLogic、Emulex、LSI等等,希望立足于其适配器产品实现阵列队列添加。这项倡议独立于特定光纤通道标准之外,例如每秒16 Gbit与每秒32 Gbit。
服务器与介质驱动器间的整套数据访问路径必须实现进一步提速,同时支持NVMe驱动器与NVMe架构,其中ASIC帮助各控制器更好、更快地完成处理任务。被Nazari设定为关注目录的NVMe over Fabrics规范正在不断演进,而后NAND时代下的首款XPoint SSD预计将在今年年底推出,XPoint DIMM也将在2017年年内亮相。
如果Nazari和他的同事们能够顺利完成工作,那么第六代ASIC StoreServ阵列将完美支持后NAND时代下的各类存储介质与NVMe架构,同时继续在不具备硬件(与固件)加速机制的商用阵列上拥有良好表现。作为老牌阵列供应商,惠普企业业务公司并不打算放弃其对外部阵列业务的关注;事实上,他们希望推出更为强大的第六代ASIC并为其阵列产品提供有力推动。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。