随着OpenAI等AI实验室推出所谓的"推理"AI模型,这些模型能够逐步"思考"问题,在特定领域表现出更强的能力。然而,这些模型的基准测试成本也大幅上涨,使得独立验证变得困难。第三方测试机构Artificial Analysis的数据显示,评估OpenAI的o1推理模型在7个流行基准测试上的成本高达2767美元,而非推理模型GPT-4o仅需109美元。高昂的测试成本可能会影响学术界复现结果的能力。
Google 发布了新的智能代理开发工具包 (ADK) 和相关功能,简化了基于 Gemini 模型的多代理系统创建过程。ADK 支持 Model Context Protocol,可帮助企业快速构建、部署和管理 AI 代理。同时推出的还有 Agent Engine 和 Agent Garden,为企业提供了更全面的代理开发和管理解决方案。这些新工具旨在增强企业对 AI 代理的控制和安全性。
Google 推出 Gemini 2.5 Flash 模型,基于 Gemini 2.5 Pro 代码,但运行更快、成本更低。新模型引入动态思考技术,可根据查询复杂度调整推理深度,提高响应速度并降低成本。Google 还将 Gemini 2.5 Pro 应用于 Deep Research 工具,显著提升了其准确性和实用性。这些进展有望降低生成式 AI 的高昂成本,推动其更广泛应用。
随着人工智能的影响日益深远,未来领导力将面临重大变革。研究指出,我们需要应对多重自我、心理健康、道德自主、人际关系和学习方式的挑战。同时,AI 也为人类好奇心和学习能力的提升带来机遇。未来领导者需要在保持人性特质的同时,与 AI 协同发展,避免人类被完全重塑。
Google宣布第七代张量处理单元(TPU)芯片即将向云客户开放租用,可提供256或9216芯片的集群。新一代TPU在内存带宽、算力和能效方面都有显著提升,专为大语言模型推理设计,每个芯片具有192GB高带宽内存。Google称9216芯片集群的AI算力可达42.5 exaFLOPS,远超现有超级计算机。
xAI 公司推出了旗舰模型 Grok 3 的 API,提供 Grok 3 和 Grok 3 Mini 两个版本。Grok 3 定价较高,但具有图像分析和问答能力。尽管马斯克此前宣称 Grok 模型不受限制,但实际表现较为中立。xAI 承诺将 Grok 调整为政治中立,但长期影响尚不明确。
Dell 宣布更新其 PowerEdge、PowerStore、ObjectScale、PowerScale 和 PowerProtect 存储系统,以应对 IT 分解和 AI 趋势。新产品旨在支持传统工作负载和生成式 AI 任务,采用分解式架构,可单独扩展服务器、存储和网络组件。更新包括搭载英特尔至强处理器的新服务器,以及针对 AI 工作负载优化的全闪存存储系统。
Cassava Technologies计划投资7.2亿美元与Nvidia合作建设非洲首个AI工厂。该项目将在南非、埃及、尼日利亚、肯尼亚和摩洛哥部署加速计算和AI软件。Cassava旨在确保非洲不落后于AI发展,首批3000个GPU将于6月在南非部署。该项目将为非洲研究人员、初创企业和开发者提供AI基础设施支持。
Google 正在为其云端生产力套件 Workspace 添加新的 AI 功能。新增的 Workspace Flows 工具可自动化多步骤流程,支持与 Gems AI 聊天机器人和第三方应用集成。Google Docs 将支持将草稿转换为播客式概览,并提供内容优化建议。Google Sheets 将新增数据分析功能,Google Meet 可自动记录会议要点。这些升级旨在增强 Workspace 的 AI 能力,提高工作效率。
Google 在云计算大会上宣布,其 AI 编程助手 Gemini Code Assist 新增"智能代理"功能,可执行复杂编程任务。这些代理能根据文档规格创建应用,或进行跨语言代码转换。Code Assist 现已支持 Android Studio 等多种编程环境,旨在提高开发效率,应对竞争日益激烈的 AI 编程助手市场。
谷歌地图不仅仅是一款导航应用,它还是旅行者的得力助手。从机场导航到餐厅预订,从离线地图到实时位置共享,谷歌地图提供了多种功能来简化你的旅行体验。本文介绍了7个实用的隐藏功能,包括AI驱动的行程规划和沉浸式目的地预览,让你的旅行更加个性化和轻松自在。
互联网工程任务组 (IETF) 成立了一个工作组,旨在制定新标准,让内容创作者能够向 AI 开发者表明是否允许使用其作品。该工作组将开发统一词汇表来表达作者和出版商对 AI 训练使用其内容的偏好,并探索将这些偏好附加到互联网内容的方法。这一举措源于当前系统的ineffectiveness,以及内容创作者对 AI 公司未经许可抓取内容的不满。
Microsoft 正在测试 Windows 版 Copilot 应用的新更新,允许用户与 AI 助手共享屏幕或应用。Copilot Vision 原本仅限于 Edge 浏览器,现在扩展到 PC 上的所有应用。它可以指导用户使用 Photoshop 功能,分析照片和网页。新功能还包括文件搜索,支持多种文件格式。这些功能将在未来几周或几个月内向所有 Windows 11 用户推出。
OpenAI前联合创始人Ilya Sutskever的新AI公司Safe Superintelligence (SSI)与Google Cloud达成合作,使用其TPU芯片支持AI研究。这表明SSI将在Google Cloud上投入大量计算资源。Google Cloud此前也与其他由前谷歌AI研究人员创立的AI初创公司达成类似合作。SSI成立于2024年6月,专注于开发安全的超级智能AI系统。
人工智能在艺术创作中的应用引发争议。许多艺术家反对 AI 图像生成器,但也有人尝试创新性地利用 AI 进行艺术创作。本文探讨了艺术家如何通过"故意误用" AI 来进行创意工作,以及这种做法所面临的挑战和机遇。文章还讨论了 AI 艺术的版权问题,以及 AI 对艺术创作和欣赏的潜在影响。
IBM 发布新一代大型机 Z17,搭载 Telum II 处理器,专为生成式和代理式 AI 优化。Z17 支持实时交易分析,AI 推理能力较前代提升 50%。新增 Spyre 加速器支持多模型 AI 和大语言模型。IBM 还推出 Watson 代码助手和运维工具,提高 IT 运维效率。Z17 还支持量子安全加密技术,帮助客户应对未来量子计算威胁。
Deep Cogito公司推出了一系列开放可用的AI模型,这些模型可以在"推理"和非推理模式之间切换。这种混合架构结合了推理和标准非推理元素,能够快速回答简单问题,同时对复杂查询进行更深入的思考。公司声称其模型性能优于同等规模的开放模型,并计划在未来推出更大规模的版本。
一位AI创业者试图用人工生成的虚拟形象在法庭上为自己辩护,结果遭到法官严厉批评。这位创业者Jerome Dewald在一起雇佣纠纷案中使用AI生成的视频avatar代替自己出庭,但法官认为这是一种误导行为,并要求Dewald亲自进行口头辩论。这一事件引发了对AI在法律领域应用的争议和思考。
Google 推出的 Gemini Live 不仅能进行对话,还能通过摄像头识别物体。这项功能可以帮助用户在日常生活中获取更多信息,如识别艺术品、导航等。它比简单的图像识别更强大,能与用户进行自然对话。目前该功能已开始在部分手机上推出,有望改变我们与周围世界互动的方式。
Amazon 推出了名为 Nova Sonic 的新型语音 AI 基础模型,旨在让第三方应用开发者通过 Amazon Bedrock 平台构建实时、自然的对话式语音交互功能。Nova Sonic 整合了语音识别、语言处理和语音合成技术,提供更流畅的人机对话体验。该模型支持实时双向对话,可无缝集成其他系统,并在多语言和噪声环境下表现出色。