在近日举办的Hitachi Vantara 2019中国论坛上,Hitachi Vantara在活动现场为参会者们展示了在NEXT 2019大会上最新推出的全球最快的Hitachi虚拟存储平台(Hitachi Virtual Storage Platform)VSP 5000。该产品能够提供每秒2100万IOPS,低至70微秒的时延以及高达8个9可用性。8个9是什么概念?就是说平均每年停机时间仅为0.3秒。保证了核心业务的业务连续性。
IDC中国副总裁兼首席分析师武连峰根据IDC数据分享了最新的存储发展趋势。为用户和企业发展和利用存储提供一个重要的参考。
数据存储趋势一:市场维持高速增长。2018年,基于各个存储厂商的销售额来看,中国存储市场规模达到了34.2亿美元。其中传统企业级存储19.7亿美元,占比60.9%,软件定义存储市场规模为7.2亿美元,占比22.1%。超融合存储占比17.0%。
IDC预测中国存储市场2018-2023年复合增长率10.3,其中软件定义和超融合存储增长率在20%以上。金融、电信、大型制造等对可靠性要求非常高的企业仍然偏好传统企业存储。
数据存储趋势二:全闪存与NVMe。2019年,目前主流存储设备厂商都已经进入市场,2019年全球NAFA超过20亿美元,到2021年全球NAFA将驱动50%的外部存储市场。其中2018年中国存储市场规模来看全闪存占比是14.1%。但是增长率很高。IDC预测2020年相比2019年增长率为44.2%,2021-2023年的复合复合增长也超过20%。
目前在全闪存上的创新领先厂商包括Hitachi Vantara、华为、和戴尔易安信。Hitachi VSP 5000能够提供每秒2100万IOPS,低至70微秒的时延以及高达8个9可用性。华为新一代oceanstor Dorado,是首款内置AI芯片的全闪存,提供2000万IOPS性能和0.1ms的稳定时延。
数据存储趋势三:多云环境的适应。多云管理成为存储上云考虑的问题。到2024年,70%的中国500强组织将实现跨公有和私有云的多云管理策略。
数据存储趋势四:人工智能融合。IDC2019年预测,到2023年,40%的企业的数据中心IT设施将利用嵌入式AI功能,拥有自主运转和控制的能力,到2021年,人工智能或自动化的分析驱动将取得50%的运维业务,节省20%以上的运营成本。人工智能将驱动设备的配置和修复的自动化,消除人为错误的手动过程并提高生产率。同时AI还能够通过提供IT综合效率、减少停机等实现运营成本的降低。
数据存储趋势五:安全与隐私匹配。IDC预测,到2022年,50%的IT基础架构平台将对静态和运行中的所有数据应用加密,这种加密需要是量子安全等新技术。到2020年,全球超过50%的跨国公司将实现云、IT基础架构和数据治理设置的安全和自动化,符合GDPR等法规需求。
数据存储的安全和隐私核心是数字主权的问题。华为任正非认为,“数字主权和过去物理主权同样重要,过去物理主权牵涉到地缘政治,信息化没有地缘,信息在全球流动,还是要有数字主权。每个国家都要建立自己数字主权的概念”华为坚决支持数字主权战略和诉求,为全球基础设施做出贡献。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。