Google已经弃用其曾经的三大核心技术之一MapReduce,因为该系统已不能满足这家互联网巨头的数据分析需求。
于周三在旧金山举行的Google I/O大会上,Google宣布了这一消息。取而代之的,是一个新开发的称为Cloud Dataflow的云分析系统。
MapReduce一直是一个非常受欢迎的基础架构和编程模型,用于在服务器集群上做并行分布式计算。它也是Apache Hadoop大数据基础架构平台的一个基础,后者已经得到广泛的部署,并成为许多公司的商业产品的核心。
然而,该技术已无法处理Google当前希望分析的数据量。Google技术基础设施高级副总裁Urs Hölzle表示,当数据规模达到PB级别,MapReduce变得太麻烦。
“我们真的不再使用MapReduce了,”Hölzle在他的主题演讲中说,该公司“多年前”就停止使用该系统。
在旧金山举行的2014 Google I/O大会上,Google技术基础设施高级副总裁Urs Hölzle宣布了一项新的云分析系统Cloud Dataflow。
Cloud Dataflow还将作为一项服务提供给使用Google云计算平台的开发者,它没有MapReduce的规模限制。
“Cloud Dataflow是数十年数据分析经验的成果,”Hölzle说。“和任何其他的系统相比,它的运行速度更快,扩展性更好。”
他表示,Cloud Dataflow是一项自动优化、部署、管理和扩展的全面的管理服务。它允许开发人员使用统一的编程轻松地创建复杂的管道用于批处理和流媒体服务,并且可以迅速抓取任意大型数据集。
Google还表示,Cloud Dataflow可以通过动态图显示数据流,Google演示了在本届世界杯上巴西对阵克罗地亚时的Twitter社区讨论追踪,当裁判“误判点球”时,网友的反映变化一目了然。
Google认为,Cloud Dataflow所有的这些特性解决了MapReduce搞不定的工作:它很难迅速摄取数据,它需要很多不同的技术,批处理和流是无关的,还有,MapReduce集群的部署和操作始终是必需的。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。