伴随着大数据分析、人工智能技术的兴起,企业对高性能存储的应用需求开始显现,既希望存储产品可以提供高性能的存取能力,又期望其具备经济实惠的价格,还希望存储在上面的数据能有安全可靠的保障。7月23日,既年轻又经验丰富的西安奥卡云发布了自主、安全、可靠的可应用于新一代的数据中心,有助于用户数字化转型应用的OrcaStor UniIO存储产品。
奥卡云成立于2017年,实际上是在2018年春节才开始运作。奥卡云从创立开始就是聚焦在IT、信息的主航道上,主要是帮助企业做数字化的转型,聚焦在存储系统、基于基础设施的视频云解决方案,还有新一代的数据中心的建设上面。
奥卡云核心的团队分为两大部分:
首先是国际团队。奥卡云有一位国家级A级专家,还有12位海外专家,刚才也讲了,CTO John是Veritas的创始成员,他最早开发的VxFS文件系统已部署在全球500强企业的数据中心里面。还有Alex,他原来是vSAN的创始人之一,他还曾是一家公司的CEO,他现在加入了奥卡云。在存储领域,存储技术方面,有艾杰(AJ),他是惠普已经收购的一家公司的架构师,他们都有30、40年存储方面的经验,非常丰富。
国内团队中,奥卡云有49位来自于知名企业,包括EMC、华为、中兴等等这些原来存储领域非常有经验的技术骨干,他们都加入了奥卡云。
奥卡云聚焦解决云计算和大数据的核心难题,也就是说这些数据是怎么存储,以及这个数据是怎么管理的,也受到了各界领导的关注,奥卡云同时也是申威联盟,还有存储产业技术创新战略联盟的核心成员。
这次奥卡云发布的产品叫OrcaStor UniIO,OrcaStor奥卡云整个存储系统的核心,UnilO代表的是融合,后续奥卡云也会把文件和对象这种存储协议融合进来。
UnilO面向的是什么应用场景呢?简单来说是面向多应用或者是多租户的场景,实际上就是面向云计算,它有四大特征:
第一,UnilO是一个Scale-out分布式架构,包含了全局的面向整个数据的重删和压缩功能。
第二,UnilO提供了最佳的数据服务,包括性能无损快照,打快照的时候不受任何冲击,还有数据去重后的精简远程复制功能,应用程序服务质量保证QoS等。
第三,UnilO采用的是标准的商用的硬件,就是它无需昂贵的SSD,用通用的SSD就可以满足应用需求。
第四个,UnilO具备简单性。这个简单其实内含的是全自动化,没有任何RAID配置,也没有磁盘RAID组的概念,而且没有复杂的性能参数的调节功能,它通过Restful API的接口,可以完全去对接云计算的平台,比如说OpenStack,可以实现自动化的云编排。
整体来说,OrcaStor UniIO是面向大型基础设施、高性能的存储系统设计的,测试发现平均数据缩减率为5:1,极大的降低了客户的总体拥有成本,而且整个存储占用的空间和功耗都得到了大幅度的缩减。
我国正在推进有中国特色的智慧城市的建设,包括5G商业的落地,会推快这个进程。在这个进程中实际上有大量的数据产生,这些数据并不是所有的数据都要上公有云,这就会产生大量的存储的需求在里面。同时,网络安全和自主可控是整个国防信息安全建设的基石,存储在其中应该是首当其冲、重中之重。而在中高端存储领域的供应商中,我国的核心竞争力还有待增强。很多存储厂商产品还是基于开源软件进行实现,同质化比较严重,这里就蕴藏了大量的机会点,这也为具备技术和产品优势的奥卡云提供了难得的发展机会。现在奥卡云正在通过加入自主可控的申威联盟、与中国通信服务集团、联想集团建立了战略合作关系的方式,积极打造合作的生态,并通过国内人才与国际人才并重的方式把这些顶尖的人才放置在这个企业里面最核心的业务上面去,来快速加快产品化进程。
由此可以相信,借助5G与大数据的天时、本土信息安全的地利与高端技术人才的人和,奥卡云的未来发展将会大有可为。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。