NAS加速和云存储网关厂商Averec以自己内部部署的NAS系统对象存储作为核心,拥有一条通向公有云的路径。到目前为止,Avere一直专注于加速对本地文件系统的数据访问,近来又涉足到云或者对象存储。现在,又提供了以NAS封装形式的对象存储。
这款Cloud-Core NAS(C2N)系统提供了一个NAS接口,而不是对象存储,甚至不是S3。它有三个组成部分:
• FXT全闪存高性能层,带有自动缓存
• MX100管理节点,1U设备
• CX200核心系统/存储节点,1U设备,有12个10TB热插拔的磁盘驱动器
这里至少需要1个MX100,需要2个来实现高可用性。
对象存储系统了三重复制(TR)和擦除编码(EC),以及地理分散的数据恢复。最低配置的TR需要3个CX2000节点,120TB可用容量,以及1个MX100节点。这是入门级的,Avere特别强调了一些对象存储系统是以更大规模、更昂贵、更耗费成本的1PB容量为起点的。
最低的EC配置是需要6个CX200节点,450TB可用容量,外加MX100控制器。
该系统从120TB原始容量/750TB可用容量逐渐增加到超过5PB可用容量。(可用容量是基于4+3擦除代码的,其中5/8的容量可用,因此就是120TB x 0.625=75TB。)
FXT层从14TB扩展到480TB的SSD容量,最高配置的FXT5600集群。集群提供了性能扩展和高可用性。
C2N系统,上层是3个MX100,下面是8个CX200,NAS特性包括:
• NFSv3,SMB2,多协议支持
• 快照
• 跨内部部署(私有云)和公有云的全局命名空间
• NAS和私有云/公有云之间的数据迁移
• 镜像
• 压缩
• 加密,密钥是在本地管理的
• GUI和存储分析
有可选的FalshMove用于数据迁移,FlashMirror用于灾难恢复。
Avere表示,典型的用例就是将NAS用于保存Tier-1数据,CX200(私有对象存储)用于保存Tier-2二级数据,公有云用于保存Tire-3归档数据。
据Avere称,C2N提供了私有云设施,有一个通向公有云的明确路径。它"允许企业创建一个简单且灵活的混合云,将整个异构基础设施作为单一的、逻辑存储池进行管理。"
Avere C2N系统即将供货,CX200标价为99500美元。毫无疑问,如果取得成功的话,其他型号也将陆续公布。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。