YouTube在其直播活动中发布了多项面向Shorts创作者的生成式AI工具,包括定制版Veo 3 Fast视频生成模型、新的混音工具和AI编辑功能。Veo 3 Fast能以480p分辨率低延迟生成带声音的视频片段,支持图像动画化、视频风格转换等功能。新的语音转歌曲混音工具可将对话转为配乐,AI编辑功能则能将原始素材自动制作成初稿。这些工具将陆续在多个市场推出。
劳埃德银行集团首席数据分析官博特朱表示,金融机构正探索通过生成式AI直接为客户提供服务,以解决传统个人化金融咨询模式无法规模化的问题。由于大语言模型存在"幻觉"等问题,银行采用"智能体作为评判者"的方法,让不同AI模型评估和审查其他模型的输出结果。该银行与苏格兰初创公司Aveni合作开发了专门的金融服务大语言模型FinLLM,并建立多重防护机制确保AI输出符合监管要求,为更广泛人群提供高质量金融指导服务。
Gemini移动应用自8月推出Nano Banana图像编辑模型后用户激增,该模型因能轻松执行复杂编辑和创建逼真图像而广受好评。据应用情报公司Appfigures数据,9月份下载量环比增长45%,已达1260万次。应用在9月12日超越ChatGPT成为美国App Store第一名,并在全球108个国家跻身iPhone应用前五。在消费支出方面,8月份iOS收入达160万美元,同比1月增长1291%。
Meta Connect 2025大会将于周三开幕,预计AI智能眼镜将成为焦点。公司可能发布与Ray-Ban和Oakley合作的新款智能眼镜,包括配备抬头显示屏的Hypernova眼镜和专为运动员设计的Oakley Spheara款式。此次大会是Meta成立超级智能实验室后的首次Connect会议,扎克伯格将发表主题演讲,讨论元宇宙、Quest头显和AI发展计划。
英国Oxford Quantum Circuits公司在曼哈顿数据中心安装了纽约市首台量子计算机,旨在为客户提供更快速高效的AI程序运行服务。该公司计划未来3-5年投资数千万美元,部分用于采购英伟达芯片进行集成。这一"量子-AI数据中心"项目预计将显著提升数据生成效率,特别有利于金融领域应用。
人形机器人公司Figure AI宣布完成超过10亿美元的C轮融资,资金将用于扩大机器人生产、构建英伟达GPU基础设施以加速训练和仿真,并扩展人类工作生活数据收集。该公司目标是在未来四年内交付10万台人形机器人,其Figure 02机器人搭载Helix AI智能系统,能够理解未见过的物体并做出合理行动。英特尔、英伟达、LG等公司参与投资。
硅谷科技巨头多年来一直宣传AI智能体愿景,但现有技术仍然有限。强化学习环境被视为训练AI智能体的关键技术突破。这些环境模拟真实工作场景,让智能体学习复杂任务。顶级AI实验室正大量需求此类环境,催生了Mechanize、Prime Intellect等初创公司。数据标注巨头Scale AI、Surge也在转型。据报道,Anthropic考虑明年投资超10亿美元。尽管前景看好,但专家对强化学习环境的可扩展性存在分歧。
随着AI能力的爆发式增长,仿人机器人的灵活性进化备受关注。傅里叶推出的开源设计展现了机器人行走、奔跑和攀坡能力。尽管目前仿人机器人仅占商业制造销售的不足2%,但专家普遍认为仿人机器人时代即将到来。斯坦福专家讨论了零样本设计、运动复杂性和安全性等挑战。
Forrester发布2025年十大新兴技术报告,将生成式AI列为IT领导者近期需重点关注的技术。报告显示,短期技术在AI加速与安全需求间寻求平衡,生成式AI、TuringBots和物联网安全仍位列前十。代理AI和合成数据新入榜单,预计两年内可实现可观投资回报。中期技术包括代理AI、边缘智能和自动驾驶等,但面临现实复杂性挑战。量子计算虽不在短中期ROI展望中,但Forrester建议零风险容忍组织开始投资量子安全。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
英伟达与新兴云服务商CoreWeave签署协议,承诺在2032年前为其提供63亿美元GPU计算容量担保。作为CoreWeave 7%股东,英伟达此举旨在培养与AWS、微软和谷歌抗衡的合作伙伴。该协议平均每年担保9亿美元容量,相当于约9400个GPU的年租赁。这种合作模式反映了AI领域中云服务商、芯片厂商和AI模型开发商之间复杂的资本循环关系。
Luminary Cloud宣布完成7200万美元B轮融资,专注开发"物理AI"技术。该公司云原生平台可将仿真速度提升100倍,利用物理信息模型实时预测汽车、飞机等产品性能。公司推出针对特定行业的预训练模型,包括与本田合作的汽车设计模型和与Otto航空合作的飞机开发模型。融资由西门子风投领投,将用于扩大研发团队和市场销售。
谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。
OpenAI发布了面向AI编程助手Codex的GPT-5新版本。新模型GPT-5-Codex采用动态"思考"机制,可根据编程任务复杂度灵活调整处理时间,从几秒到七小时不等。该模型已向ChatGPT Plus等付费用户推出,在代码重构和审查基准测试中表现优异。相比传统路由器预设计算资源的方式,GPT-5-Codex能实时调整工作时长,这有助于OpenAI在竞争激烈的AI编程工具市场中提升竞争力。
HPE第三财季营收创纪录达到91亿美元,同比增长19%。AI服务器销售大幅增长,新收购的Juniper推动网络业务增长54%。Alletra存储销售实现三位数增长。服务器业务营收49亿美元,AI系统营收达到16亿美元创历史新高。该公司连续四个季度实现营收增长,GreenLake订阅客户增至4.4万,年化营收运行率达31亿美元。
爱立信宣布在其私有5G技术中集成代理式AI,计划2025年第四季度推出。该系统将NetCloud平台与私有5G网络结合,为企业客户提供AI功能、实时特性、简化的生命周期管理等优势。升级版NetCloud助手ANA可处理复杂工作流程、执行管理决策并实时学习,预计将故障停机时间和客户支持案例减少超过20%,助力企业数字化转型。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
谷歌推出全球最强差分私有大语言模型VaultGemma,这是一个10亿参数的模型,基于Gemma架构构建。该模型采用先进数学算法防止敏感数据泄露,通过在数据集中添加受控噪声实现隐私保护。VaultGemma在多项基准测试中表现卓越,性能可媲美同等参数的非私有模型,但完全不会暴露训练数据,为金融和医疗等监管行业的AI应用提供重要保障。