Google已经弃用其曾经的三大核心技术之一MapReduce,因为该系统已不能满足这家互联网巨头的数据分析需求。
于周三在旧金山举行的Google I/O大会上,Google宣布了这一消息。取而代之的,是一个新开发的称为Cloud Dataflow的云分析系统。
MapReduce一直是一个非常受欢迎的基础架构和编程模型,用于在服务器集群上做并行分布式计算。它也是Apache Hadoop大数据基础架构平台的一个基础,后者已经得到广泛的部署,并成为许多公司的商业产品的核心。
然而,该技术已无法处理Google当前希望分析的数据量。Google技术基础设施高级副总裁Urs Hölzle表示,当数据规模达到PB级别,MapReduce变得太麻烦。
“我们真的不再使用MapReduce了,”Hölzle在他的主题演讲中说,该公司“多年前”就停止使用该系统。
在旧金山举行的2014 Google I/O大会上,Google技术基础设施高级副总裁Urs Hölzle宣布了一项新的云分析系统Cloud Dataflow。
Cloud Dataflow还将作为一项服务提供给使用Google云计算平台的开发者,它没有MapReduce的规模限制。
“Cloud Dataflow是数十年数据分析经验的成果,”Hölzle说。“和任何其他的系统相比,它的运行速度更快,扩展性更好。”
他表示,Cloud Dataflow是一项自动优化、部署、管理和扩展的全面的管理服务。它允许开发人员使用统一的编程轻松地创建复杂的管道用于批处理和流媒体服务,并且可以迅速抓取任意大型数据集。
Google还表示,Cloud Dataflow可以通过动态图显示数据流,Google演示了在本届世界杯上巴西对阵克罗地亚时的Twitter社区讨论追踪,当裁判“误判点球”时,网友的反映变化一目了然。
Google认为,Cloud Dataflow所有的这些特性解决了MapReduce搞不定的工作:它很难迅速摄取数据,它需要很多不同的技术,批处理和流是无关的,还有,MapReduce集群的部署和操作始终是必需的。
好文章,需要你的鼓励
科技专家Sungjoo Yoon在TED演讲中提出"偏好原理",认为了解用户喜好信息越多,就能创造更强大的技术。他将市场变化比作"地壳运动",从1969年命令行界面到80年代GUI,再到90年代网络界面,技术发展都遵循这一规律。自然语言处理能建立信任,而AI智能体时代的到来意味着非人类参与者将在人类主导的世界中发挥作用。
德国图宾根大学研究团队发现现代AI视觉模型具备强大的图像排序能力,能够理解年龄、美观程度等连续属性并进行准确排序。研究测试了7种AI模型在9个数据集上的表现,发现CLIP模型表现最佳,且仅需极少样本就能学会排序。这一突破为照片管理、电商展示、社交媒体等领域提供了新的技术方案。
微软推出了Copilot Vision AI新功能,该技术能够扫描和分析用户屏幕上的所有内容。这项AI视觉技术可以实时理解用户正在查看的信息,包括文本、图像和应用程序界面,为用户提供更加智能化的交互体验和个性化建议。此功能的推出标志着AI助手向更深层次的用户体验集成迈进。
KAUST团队开发UnMix-NeRF技术,首次实现3D场景重建与材料识别的同步。该系统利用光谱成像技术,能够识别物体的材料特性,不仅重建逼真3D场景,还可自动分离不同材料区域。技术在多个数据集上表现优异,为机器人、增强现实、工业检测等领域带来新突破。