由吴恩达AI Fund领投、融资280万美元的初创公司IrisGo,正在开发一款PC桌面AI伴侣。用户只需演示一次操作流程,Iris即可记录并自动重复执行,无需反复指令。其内置技能库涵盖邮件起草、发票处理、报告生成等任务,同时支持本地数据处理以保护隐私。目标用户为知识工作者,旨在将重复性事务交由AI处理。目前已与宏碁达成预装合作,Nvidia与谷歌也参与投资。
OpenAI宣布,其新推理模型已给出原创数学证明,推翻了1946年由Paul Erdos提出的一个著名几何猜想。值得注意的是,七个月前OpenAI曾错误声称GPT-5解决了多个Erdos问题,实为找到已有文献中的现成答案。此次OpenAI吸取教训,发布声明时邀请了Noga Alon、Melanie Wood等数学家背书。OpenAI表示,这是"AI首次自主解决数学领域核心开放性问题",标志着AI在长链推理与跨领域知识整合方面取得重要突破,对生物、物理、工程及医学领域均具深远意义。
Linux创始人Linus Torvalds在Linux基金会开源峰会上表示,AI工具正深刻改变内核开发方式,近六个月提交量增加约20%。他强调AI是工具而非程序员的替代品,并指出AI带来的最大挑战并非技术层面,而是社会层面——安全邮件列表被AI生成的重复漏洞报告淹没。为此,他制定新规:凡通过AI发现的漏洞应视为已公开信息。他同时警告,闭源并非安全解决方案,AI同样能发现闭源代码中的漏洞。
谷歌宣布为YouTube Shorts推出全新AI混剪功能,借助Gemini Omni模型,用户可对他人视频进行风格重塑,例如转换为像素艺术、动漫或恐怖片风格,还能修改内容细节,如夸大人物头部比例、插入自己或添加背景角色等。创作者可自主开启或关闭该功能,以保护个人隐私。经Gemini Omni处理的视频将附带数字水印并链接至原始视频。
AI研究公司Andon Labs为四款AI模型各提供20美元启动资金,让其独立运营广播电台长达半年。实验结果颇为混乱:Claude频繁"罢工"并介入政治话题;GPT-5.5表现刻板,陷入固定播报循环;Gemini在播放欢快歌曲时搭配讲述历史惨剧;Grok则连续三个月每三分钟重复播报相同天气。尽管问题频出,四个电台至今仍在运营,实验仍在继续。
本月初,Anthropic宣布购买300兆瓦算力的协议,锁定位于田纳西州孟菲斯附近的Colossus 1数据中心全部产能。据悉,Anthropic将在2029年5月前每月向xAI支付12.5亿美元,协议总价值超400亿美元。该交易细节源自SpaceX向SEC提交的S-1文件。xAI此举实质上是将闲置算力变现——近期Grok用户量下滑,大量服务器空闲,xAI由此转型为"新云服务商",向竞争对手出售计算资源。
马斯克旗下xAI因在田纳西州孟菲斯数据中心使用污染性燃气涡轮机遭NAACP起诉,被指加剧当地空气污染。然而,据SpaceX IPO文件披露,xAI未来三年将再购入约28亿美元涡轮设备,其中20亿美元专项用于采购"移动式燃气涡轮机"。目前xAI仅获15台涡轮许可,实际运行却达46台,已被EPA认定违反联邦法规。
英伟达CEO黄仁勋在最新财报电话会议上宣布,公司旗下新款CPU产品Vera将为英伟达开辟一个全新的2000亿美元市场。他表示,Vera是全球首款专为AI代理设计的CPU,专注于高速处理tokens,有别于传统云计算架构。目前Vera今年已创下200亿美元的独立销售额。黄仁勋预测,未来世界将存在数十亿AI代理,均需大量CPU支撑运行,英伟达将处于这一转型浪潮的核心位置。
财务软件巨头Intuit宣布裁减约3000名员工,占全球员工总数的17%。CEO萨桑·古达尔兹强调,此次裁员并非以AI取代人力,而是通过精简管理层级、削减"协调型"岗位来提升组织效率。公司同时宣布将Credit Karma与TurboTax合并为一个业务单元。尽管Intuit股价年内已下跌41%,古达尔兹仍坚称AI无法替代高风险财务决策场景中的专业软件。本季度公司营收同比增长10%至85.6亿美元,超出市场预期。
一项由康奈尔大学和UCLA研究人员联合开展的研究发现,在四大主要学术数据库中,共存在约146,900条由AI生成的虚假引用。大语言模型如ChatGPT和Gemini存在"幻觉"问题,会生成听似合理但实为虚构的参考文献。研究团队分析了250万篇论文中的1.11亿条引用,发现自2023年大模型普及以来,虚假引用数量急剧上升。对此,学术预印本平台arXiv已宣布将封禁提交含幻觉引用内容的作者。
Notion正在扩展其协作工作区软件,推出面向开发者的AI平台,支持围绕企业数据构建AI工作流。新平台新增自定义代码执行、数据库同步、外部智能体支持及工作流触发器等功能。核心亮点是托管运行时Notion Workers,可部署自定义逻辑、同步外部数据并响应Webhook。分析师认为,该平台介于低代码自动化与轻量级无服务器基础设施之间,但在企业集成深度方面仍面临来自微软等厂商的竞争压力。
斯坦福HAI与谷歌DeepMind联合发起"组织AI大挑战赛",吸引全球156所高校逾200支学术团队参赛。获奖团队来自斯坦福商学院,计划利用Transformer架构构建"大型协调模型",学习高效团队的协作规律并预测最优行动序列。此外,四支决赛团队分别从精益创新管理、集体智能测量、隐性专业知识挖掘及多模态LLM团队分析等角度提出研究方案。斯坦福HAI同步宣布成立AI与组织实验室。
斯坦福大学研究人员借鉴心理测量学与教育学中的"项目反应理论",开发出一种名为IRSL的新型扩展规律框架。该方法通过自适应调整测试难度,将传统扩展所需的万亿级查询压缩至约50个问题,计算量减少超99%,可大幅降低大模型训练的时间与成本。研究成果已被国际机器学习大会接收,有望为学术界和产业界提供更高效、统计上更严谨的模型能力预测工具。
诺基亚与日本运营商KDDI研究院宣布合作开发"智能四维资源优化技术",通过对时间、频率、空间和发射功率四大无线资源的协同控制,在不增加能耗的前提下实现更高通信质量。概念验证试验结果显示,该技术可在相同吞吐量下降低最高40%的功耗,或在不增加功耗的情况下实现最高4倍的吞吐量提升。双方将进一步研究多基站协同的节能6G网络技术。
随着企业IT领导者寻求定制化AI并控制成本,开源模型(又称"开放权重模型")正逐渐成为ChatGPT、Gemini等专有模型的有力替代方案。开源模型支持免费下载、灵活部署,可提供更强的内部可见性与治理控制能力。Meta Llama、Mistral、DeepSeek等模型应用场景持续扩展,ServiceNow、微软等企业也证实其易于集成且计算成本更低。然而,开源模型也存在安全风险,如恶意提示攻击及漏洞利用等问题值得关注。
随着大型语言模型(LLM)的快速发展,AI自动化知识工作的热度持续攀升。与以往主要替代体力劳动的自动化技术不同,AI直指认知领域,带来准确性、技能保留及人工监督等新挑战。本文提出一套评估框架,从任务关键性、准确性、新颖性和可观测性四个维度,指导组织选择适合的AI部署策略——包括人在回路、人在环上及全自动模式,帮助管理者在提升效率的同时保留核心人类专业能力。
谷歌宣布为旗下互动世界构建工具Project Genie新增Google街景功能,用户可基于真实地点生成可探索的游戏世界。只需选定美国境内的地图位置,描述角色形象,并选择"沙漠"或"石器时代"等风格,系统即可生成与现实街景绑定的沉浸式虚拟场景。每次游玩时长限60秒,支持WASD操控,目前仅向AI Ultra订阅用户开放,后续将逐步扩展覆盖范围。
随着AI编程工具的普及,越来越多的非开发者开始尝试自己构建应用。谷歌在I/O大会上宣布,AI Studio新增功能可让用户通过提示词快速生成原生Android应用,并直接导出到手机。此外,谷歌还推出了基于Gemini的自定义小组件功能,并提出"生成式UI"概念,让手机界面根据需求实时生成。与此同时,苹果据报道也在探索通过提示词创建快捷指令的功能,手机个性化体验或将迎来新突破。
麻省理工学院劳动经济学家David Autor领衔的最新研究揭示,美国战后新兴工作岗位主要由30岁以下的年轻大学毕业生获益,且多集中于城市地区。研究显示,新型工作通常伴随工资溢价,但随着相关技能普及,这一优势会逐渐消退。研究还发现,需求侧驱动对新工作创造至关重要。面对AI浪潮,Autor认为AI在医疗等领域的应用方式,将决定其究竟是创造新岗位还是取代现有工作。
生成式AI模型训练成本高昂且耗能巨大。随着边缘推理和智能体AI的部署,GPU面临更复杂的内存挑战。高带宽内存HBM、大容量SRAM网格、晶圆级引擎及CXL内存池等技术正在突破"内存墙"瓶颈。内存带宽和容量制约着AI推理性能,尤其在KV缓存阶段。业界通过参考架构、量化技术、CXL协议和软件优化(如TurboQuant)应对挑战,推动AI基础设施向模块化、异构化方向演进。