Google已经弃用其曾经的三大核心技术之一MapReduce,因为该系统已不能满足这家互联网巨头的数据分析需求。
于周三在旧金山举行的Google I/O大会上,Google宣布了这一消息。取而代之的,是一个新开发的称为Cloud Dataflow的云分析系统。
MapReduce一直是一个非常受欢迎的基础架构和编程模型,用于在服务器集群上做并行分布式计算。它也是Apache Hadoop大数据基础架构平台的一个基础,后者已经得到广泛的部署,并成为许多公司的商业产品的核心。
然而,该技术已无法处理Google当前希望分析的数据量。Google技术基础设施高级副总裁Urs Hölzle表示,当数据规模达到PB级别,MapReduce变得太麻烦。
“我们真的不再使用MapReduce了,”Hölzle在他的主题演讲中说,该公司“多年前”就停止使用该系统。
在旧金山举行的2014 Google I/O大会上,Google技术基础设施高级副总裁Urs Hölzle宣布了一项新的云分析系统Cloud Dataflow。
Cloud Dataflow还将作为一项服务提供给使用Google云计算平台的开发者,它没有MapReduce的规模限制。
“Cloud Dataflow是数十年数据分析经验的成果,”Hölzle说。“和任何其他的系统相比,它的运行速度更快,扩展性更好。”
他表示,Cloud Dataflow是一项自动优化、部署、管理和扩展的全面的管理服务。它允许开发人员使用统一的编程轻松地创建复杂的管道用于批处理和流媒体服务,并且可以迅速抓取任意大型数据集。
Google还表示,Cloud Dataflow可以通过动态图显示数据流,Google演示了在本届世界杯上巴西对阵克罗地亚时的Twitter社区讨论追踪,当裁判“误判点球”时,网友的反映变化一目了然。
Google认为,Cloud Dataflow所有的这些特性解决了MapReduce搞不定的工作:它很难迅速摄取数据,它需要很多不同的技术,批处理和流是无关的,还有,MapReduce集群的部署和操作始终是必需的。
好文章,需要你的鼓励
Genspark推出超级智能体,将"氛围编程"概念扩展至企业工作流程,实现"氛围工作"模式。该系统采用9个大语言模型的专家混合架构,配备80多种工具和10多个数据集,通过规划-执行-观察-回溯循环运行。系统能自主处理复杂业务任务,甚至代替用户拨打电话。45天内实现3600万美元年收入,展现了自主智能体平台的商业可行性,挑战传统企业AI架构理念。
北京大学和百度VIS联合研发的MV-AR技术,首次让AI学会像人类一样逐步观察物体,通过自回归方式生成多视角一致图像。该技术解决了传统方法在处理大视角差异时的一致性问题,支持文字、图像、形状等多种输入,在3D内容创作、机器人视觉等领域具有广阔应用前景。
医疗保健已成为AI应用的热点领域,在疾病诊断、康复监测和新药开发方面证明了其价值。然而,行业仍面临临床人员短缺、人口老龄化等挑战。AI智能体作为下一波AI变革浪潮,相比现有AI工具,能够执行更复杂的任务并减少人工干预。它们不仅能被动提供信息,还能主动采取行动,如自动分诊调度、辅助临床决策、远程患者监护等,有望在十年内彻底改变医疗服务的提供、管理和体验方式。
Microsoft和Georgia Tech研究团队开发了SlimMoE技术,能将超大AI模型压缩到原来的10-20%大小而性能基本不变。该技术采用多阶段渐进式压缩,保留所有专家模块但精简内部结构,成功将419亿参数的模型压缩为76亿和38亿参数版本,让原本需要企业级硬件的AI能力可在普通电脑上运行,大大降低了AI技术使用门槛。