Databricks Inc. 已完成上个月宣布的巨额 100 亿美元融资轮。
该公司今天同时披露完成了 52.5 亿美元的新债务融资。摩根大通领投了这轮债务融资,巴克莱银行、花旗银行和其他金融机构参与其中。
Databricks 融资的消息最早在 11 月传出。当时预计公司将筹集"至少"50 亿美元。路透社在 12 月中旬报道称这个数字可能超过 95 亿美元,几天后,Databricks 确认正在进行 100 亿美元的 J 轮融资。
领投方 Thrive Capital 与超过半打其他机构投资者一起参与了这轮融资。Databricks 今天透露,卡塔尔投资局、淡马锡、麦格理资本和 Meta Platforms Inc. 也参与其中。Databricks 联合创始人兼首席执行官 Ali Ghodsi 告诉路透社,来自 Meta 的投资将加深两家公司在人工智能领域的合作,特别是在 Facebook 母公司的 Llama 系列大语言模型方面。
Databricks 提供一个广受欢迎的基于云的数据存储和分析平台。它采用数据湖仓架构,可以存储结构化、非结构化和半结构化数据。企业可以对存储在 Databricks 中的信息运行 SQL 查询,使用 AI 模型发现有用模式并执行其他分析任务。
该平台支持名为 ACID 的数据可靠性标准。它可以回滚未成功完成的数据修改,这意味着这些修改常常产生的错误信息会被删除。此外,ACID 可以防止同时进行的数据修改相互干扰。
2023 年,Databricks 以 13 亿美元收购了一家名为 MosaicML Inc. 的风投支持的 AI 初创公司。此后,该公司扩展了大量 AI 功能。Ghodsi 今天告诉路透社,数千名客户正在公司平台上运行 Llama 模型。
Databricks 提供的功能使企业能够使用存储在其平台中的数据对 AI 模型进行微调或定制。它还使用名为 DSPy 的开源工具来自动化提示词调优。这是一种机器学习技术,通过为 AI 模型提供如何处理用户提示的指令来提升其输出质量。
该公司已将 Meta 的一个 Llama 模型直接集成到其平台中。公司提供由 Llama 3.1 70B 驱动的预打包 SQL 函数或程序。客户可以使用这些功能来总结存储在 Databricks 中的信息、翻译信息并执行其他任务,而无需手动部署大语言模型。
Ghodsi 表示:"组织正在现代化其数据和 AI 基础设施,因为他们认识到生成式 AI 的巨大潜力。数据智能对于释放这种潜力和帮助企业实现业务目标至关重要。"
该公司将利用 100 亿美元融资轮的收益开发新的 AI 产品。此外,Databricks 计划进行收购并扩大其国际市场营销业务。部分资金将用于为现任和前任员工提供流动性。
新的融资使 Databricks 上市的紧迫性降低。在 11 月融资消息传出前不久,Ghodsi 表示公司最早将在 2025 年下半年上市。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。