3月30日,以“智存储 驭未来”为主题的2021智能存储论坛暨奥卡云存储产品发布会在西安西咸新区成功举办。大会上奥卡云数据科技有限公司隆重对外发布了采用高效SCM技术、全局重删压缩、面向云计算领域的高端分布式全闪存存储系统——UniIO。会后,奥卡云数据科技有限公司CEO张科、奥卡云数据科技有限公司研发副总裁陈鹏接受了记者采访。
首先,奥卡云研发副总裁陈鹏,向我们介绍了公有云环境下对存储的特殊需求:
在当前主流的云计算数据中心之中,不但算力可以按需提供,存储也同样是如此,可以通过软件定义的方式,自如的对存储容量进行扩展、对传输性能进行控制,从而满足用户业务、应用多样化的实际使用需求。此外,在云环境中对存储性能的可持续性,也会有很高要求,在传统存储上,当存储系统即将写满时,会产生大量后台进行、维护进程,导致存储大幅性能波动,极大影响用户的正常业务应用。
奥卡云正是看到了云计算对存储系统的特殊需要,正式对外推出UniIO这款面向云、面向下一代数据中心的全闪存存储系统,为企业打通了一条全新的国产云存储之路。
接下来,奥卡云CEO张科就UniIO分布式全闪存存储系统,向我们进行了更详尽的介绍。
传统SSD存储为了保障应用性能,会在使用的过程中,预留15%-20%的存储空间,而UniIO由于自身的重删粒度小,重删范围大,所以能够达到很高的重删率。另外,通过后端放置专利技术,UniIO无需预留15%~20%的空间用于存储系统本身运行使用,相对于传统架构的存储,这15%~20%的空间释放给用户使用,进一步也提高了空间利用率。UniIO还有对性能无感知的压缩技术,也进一步提高了空间利用率。还有更重要的一点,UniIO采用创新的架构,将元数据与用户数据一样对待,元数据也同样可以重删,元数据也做到最精简。这种架构在目前已有的存储产品中是比较少见的。这种架构在业界是独一无二的,是奥卡云特有的。
这一些列的关键技术及措施,使得UniIO可用空间利用率达到95%以上。对于价格高昂的的闪存硬件,如果有20%的损耗,对于用户而言是极大的浪费。使用UniIO,仅需预留5%的空间既可满足系统本省运行使用,剩余95%都是用户的可得空间,提高了空间利用率。
在奥卡云当天的Openstack演示云环境下,重删压缩率在非最优配置环境下,UniIO的空间利用率可高达21:1。例如,10TB的物理存储空间,对于用户而言可以使用210TB。简单来说,就是买1份存储,可以当成21份存储使用。非常显著的减低了用户的整体拥有成本。
除了高可用性之外,受益于分布式存储的高可靠性,UniIO在配置3副本的情况下,可靠性达到9个9,即每年存储数据的丢失量不会多于1个对象,或者说宕机时间不会超过1秒钟。在此基础上,UniIO对于可靠性还做了一些特有的优化。例如,UniIO后台拥有智能的运维机制,会自动判断当前数据是否处于危险状态,会按照智能的算法始终将用户数据保持在安全稳定的状态。例如,当UniIO三副本的集群中有节点故障时,副本数又2降到1,UniIO就会自动感知到该节点上的数据已经处于危险状态,UniIO会将故障节点上的数据原原本本的复制到其他节点,并进行均匀分布,同时保持数据副副本在用户所设置的2副本~6副本范围内。这些处理对于用户来说都是透明的,也就是说UniIO随时随地,进行尽心尽力地在保护用户数据的安全可靠。
目前国内软件定义存储行业,呈现出百花齐放、群雄逐鹿的态势。因为有很多开源软件可以依赖,降低了产品研发门槛。一些企业可以依托开源软件做改进和优化,最后形成自己特有的架构。但奥卡云并非如此,而是采用100%自动研发的方式,重新设计了一套全新架构来进行分布式存储的研发。
最后,奥卡云CEO张科对于奥卡云的国产化的规划进行了总结:
第一、100%坚持原创的IP,我们所写的每一行代码都是可控的,提供给用户的产品是可控的;
第二、奥卡云最早从前年开始就积极与国产生态合作,尤其像飞腾、申威,还有像最近加入的光合组织。这里给大家分享一个例子,今天演讲中提到的非易失性内存,在当前在国产平台上是不支持的。 我们联合飞腾、国防科大、上下游等企业,联合推进NVDIMM在国产平台的适配,不久的将来大家就会看到非易失性内存在国产平台上的应用落地。
第三、国产化是一个不可逆的过程。不管从国外的大环,还是国内新基建、促进双循环的过程来看,国产化替代是一个大的趋势,一个不可替代不可逆的过程。从我们去年做过的一些政府项目来看,政府有明确的需求,从中国的国情来看,国内的政府项目是国产化的先进试验点,他们对于国产化的需求比较靠前,这些都促进奥卡云在国产化的道路上前行,是奥卡云国产化战略的重要组成部分。
好文章,需要你的鼓励
亚马逊云服务宣布雷尼尔项目正式投入运营,该AI超级集群配备近50万块Trainium2芯片,分布在多个数据中心。AWS称这是全球最大的AI计算集群之一,从宣布到全面运营仅用不到一年时间。合作伙伴Anthropic计划年底前扩展到超过100万块芯片。该项目与OpenAI星门计划展开激烈竞争,AWS凭借自主硬件开发优势能够控制从芯片到数据中心的完整技术栈。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
谷歌开始推出Fitbit应用的重大更新,采用全新设计并集成由Gemini AI驱动的个人教练功能。该更新于10月28日首先面向美国地区的Fitbit Premium用户开放,后续将逐步扩大覆盖范围。新版本围绕今日、健身、睡眠和健康四个主要标签重新设计,强调周趋势数据分析。AI教练功能可根据用户的实时和历史数据提供个性化建议和训练计划,支持语音或文字交互。用户可选择是否使用AI功能,预览期间可在新旧界面间切换。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。