Google已经弃用其曾经的三大核心技术之一MapReduce,因为该系统已不能满足这家互联网巨头的数据分析需求。
于周三在旧金山举行的Google I/O大会上,Google宣布了这一消息。取而代之的,是一个新开发的称为Cloud Dataflow的云分析系统。
MapReduce一直是一个非常受欢迎的基础架构和编程模型,用于在服务器集群上做并行分布式计算。它也是Apache Hadoop大数据基础架构平台的一个基础,后者已经得到广泛的部署,并成为许多公司的商业产品的核心。
然而,该技术已无法处理Google当前希望分析的数据量。Google技术基础设施高级副总裁Urs Hölzle表示,当数据规模达到PB级别,MapReduce变得太麻烦。
“我们真的不再使用MapReduce了,”Hölzle在他的主题演讲中说,该公司“多年前”就停止使用该系统。
在旧金山举行的2014 Google I/O大会上,Google技术基础设施高级副总裁Urs Hölzle宣布了一项新的云分析系统Cloud Dataflow。
Cloud Dataflow还将作为一项服务提供给使用Google云计算平台的开发者,它没有MapReduce的规模限制。
“Cloud Dataflow是数十年数据分析经验的成果,”Hölzle说。“和任何其他的系统相比,它的运行速度更快,扩展性更好。”
他表示,Cloud Dataflow是一项自动优化、部署、管理和扩展的全面的管理服务。它允许开发人员使用统一的编程轻松地创建复杂的管道用于批处理和流媒体服务,并且可以迅速抓取任意大型数据集。
Google还表示,Cloud Dataflow可以通过动态图显示数据流,Google演示了在本届世界杯上巴西对阵克罗地亚时的Twitter社区讨论追踪,当裁判“误判点球”时,网友的反映变化一目了然。
Google认为,Cloud Dataflow所有的这些特性解决了MapReduce搞不定的工作:它很难迅速摄取数据,它需要很多不同的技术,批处理和流是无关的,还有,MapReduce集群的部署和操作始终是必需的。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。