3月19日,EMC宣布新产品和解决方案,支持数据湖基础。数据湖基础是支撑业务数据湖解决方案的存储基础设施。业务数据湖将数据、应用和分析整合到一起,同时,在任何需要的地方提供分析能力。
当EMC和客户交谈时,持续听到的是前所未有的数据增长,以及管理存储孤岛的挑战。去年,EMC分享了数据湖基础策略,并且已经提供像EMC Isilon和EMC ECS(弹性云存储)这样的产品,帮助客户消除存储竖井,为存储和管理数据提供更简便的方式。这样,客户就可以将更多精力投入到从数据中获取洞察和价值这件事上。
以下是数据湖基础可以为企业带来的好处:
新平台
2014年,EMC发布Isilon S210平台,将世界纪录的性能数字加倍。现在,EMC发布全新的Isilon HD400平台,容量增加2.5倍,允许客户将其数据湖基础史无前例地扩展至单集群50PB容量。该平台对那些需要一个强大、可扩展、可存储2PB至50PB数据的高容量平台的客户而言,是理想的选择。这种容量能力适用于深度归档、灾难恢复,以及构建一个高容量的数据湖基础。而且,HD400极致的密度(3.2PB/rack)可有效减少包括电、制冷、数据中心空间等在内的运营费用达50%。
新软件和能力
除了全新的阵列,EMC还发布了帮助客户从数据湖的数据中获取丰富洞察的新功能。全新的OneFS7.2操作系统将支持较新的、更多当前的Hadoop协议,包括HDFS2.3和HDFS2.4,更快地提供洞察。
EMC还宣布提供面向OpenStack Swift的支持,同时支持文件和对象,后者是增长速度最快的非结构化数据类型。
新解决方案
从数据湖基础的数据中实现价值的关键是利用EMC ISV伙伴提供的丰富的分析工具,例如Cloudera和Pivotal。这些合作伙伴的应用是经验证的,可运行在Isilon数据湖基础上。今天,EMC宣布与业界另一个企业Hadoop领导厂商——Hortonworks达成认证。这一认证标志着EMC Isilon OneFS系统可在最复杂的Hadoop测试套件中运行,是Isilon面向Hadoop环境系列成就的顶点。EMC还将继续与其他几个分析生态系统的伙伴紧密合作,为客户提供丰富的数据湖解决方案。
“通过经Hortonworks数据平台认证的EMC Isilon,组织现在可以利用其共享存储能力,运行全新的分析负载,从现有数据中获得更多价值。通过与Apache Amabari的工程和集成,客户现在可以部署分层,加快获得洞察,同时在Isilon上使用最彻底的经验证的Hadoop分发版。”
——Hortonworks业务开发副总裁 Mitch Ferguson
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。