随着5G、4K/8K、IoT、人工智能等技术的加速落地,全球数据量迎来了新一轮的快速增长。数据是企业最具价值的关键资产,如何保证海量数据的可靠存储、高效访问,并对规模不断增长的存储系统实现故障快速治理、高效运维,成为企业数字化的新难题。
在此形势下,神州数码以海量文件数据存储管理为核心,打造自有品牌软件定义存储产品——神州鲲泰DFStore 522文件系统。该产品搭载鲲鹏主板,支持块、文件、对象统一存储,适配国产操作系统,在专业的分布式存储技术基础上,融入了智能运维、安全强化等多种特性,致力成为 5G 时代海量数据的守护者与赋能者,向众多新兴应用场景不断拓展,为用户创造新价值。

神州鲲泰DFStore 522文件系统

DFStore 522文件系统登录界面
神州鲲泰DFStore 522文件系统产品特点:
海量数据,弹性扩展
数据的爆炸式增长和高频交互共享,对存储系统的容量规模、扩展能力、共享能力都提出了更高的需求。神州鲲泰DFStore 522文件系统结合技术团队多年的工程实践及系统优化经验,针对海量非结构化数据场景,遵循软件定义存储的设计理念,利用不同规格配置的神州鲲泰服务器组建大规模分布式集群,在线扩展实现1024个节点的集群规模、EB级别存储空间、192PB的单文件系统容量、百亿级文件管理规模。
可靠存储,保障数据安全
对于一款软件定义存储产品而言,保证数据安全,实现可靠存储是首要要求。神州鲲泰DFStore 522文件系统以“分散写入,冗余存放”为原则,配备了众多资源与功能。采用“弹性哈希分布”作为数据分布策略,无需元数据服务和专门的索引数据,即可实现文件在各个节点上的读写以及均衡分布,并实现全局统一命名空间;支持纠删码和多副本策略应对硬盘故障带来的安全风险,同时采用“快照”“远程复制”“回收站”等多种方式进行数据保护。另一方面,神州鲲泰DFStore 522文件系统提供WORM(Write Once Read Many)一写多读功能,数据一经写入就无法修改删除,是长久安全存储大量数据信息的理想解决方案,可以满足法规遵从要求,实现对真实原始数据的追溯。

多副本和纠删码选项

高级功能“WORM”、“回收站”

创建快照
高速访问、高效运维,提高存储效率
神州鲲泰DFStore 522文件系统开创性地采用xMeta机制加速检索性能,通过对局部元数据的独立扫描管理,自动识别访问类型,优化IO路径;支持 “POSIX、CIFS、NFS、FTP、HDFS、Manila、S3、iSCSI”等众多协议,帮助实现异构应用的透明共享;根据需求采用灵活的存储系统配额管理,支持根据用户及目录进行软配额(文字提醒)和硬配额(禁止写入),可同时设置文件和容量个数限制,加强访问权限管理;支持存储分层策略,实现冷热数据自动迁移,降低运维及存储成本,同时提高了读写效率。经过软硬件深度优化,当前存储功能核心代码为10万行左右 ,约为行业主流产品的七分之一,精简的核心代码能有效降低硬件要求,并且能够提高存储系统运行时的稳定性,从而减少客户的运维压力。

配额
故障透明、快速治理,提升业务稳定性
神州鲲泰DFStore 522文件系统在故障发生时,其访问IP自动漂移至其他正常节点,数据依然可用,不影响应用的正常读写。节点故障后数据自动修复,保障数据的完整性。由于后台集成本地RAID保护,在单块硬盘故障时,对前端应用几乎没有任何影响,也不会触发集群的副本或纠删码修复动作。本存储系统最高可支持当一半的节点发生故障的情况下保证业务的正常运行,能显著提升业务稳定性。

HA高可用
神州鲲泰DFStore 522文件系统提供了企业业务所需要的容量、可靠性和高扩展性,通过智能运维管理可以极大简化用户的管理,大幅提高其数据资产的使用效率;弹性的 Scale-Out 集群架构能够迅速响应用户不断增长的容量及性能需求。神州数码提供的标准一体机可以轻松满足大规模文件存储应用多方面的严苛要求,可广泛应用于安防、云计算、融媒体、人工智能、HPC大数据等场景,满足交通、广电、医疗、科研、政府等行业的需求。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。