近日数据存储和AI公司Databricks和云数据库公司Snowflake在上周举办了各自的峰会,双方发布了一系列新闻公告。Databricks公布了其新的人工智能增强Lakehouse IQ平台,而Snowflake证实,它正在与英伟达合作,帮助客户构建自己的人工智能模型。
基于AI光环效应,Snowflake的股票上半年表现不错。作为竞争对手,投资者目前更关注价值330亿美元的Databricks何时会决定进行IPO。该数据存储公司一系列针对AI的收购行动,或许暗示了还有一段路要走。
Databricks公司及其举办的Data+AI峰会
数据存储和人工智能公司Databricks在其最新的峰会上毫无保留的展示新的AI业务,借此希望成为企业人工智能领域的顶级公司之一。
在峰会上,Databricks公布了它正在基于新的AI,自然语言处理和数据治理功能来增强其现有的Lakehouse数据平台。Lakehouse IQ将允许用户开发自己的生成AI模型,其背后的逻辑是Lakehouse作为平台,实现处理数据、AI模型和治理,来实现流程更高效。
那实际上意味着什么呢?Databricks已经创建了一个生成式AI平台,它可以获取企业的所有信息,如任务声明和数据使用模式,然后为组织输出一个更准确和相关的AI聊天机器人。Databricks还计划将Lakehouse IQ作为API提供以便集成到开源库中。
Databricks首席执行官Ali Ghodsi在峰会的主题演讲中表示,人工智能驱动的Lakehouse平台“让你可以控制自己的知识产权”。他还预测,五年后,每家公司“都将成为一家人工智能和数据公司”,而控制自身数据和模型将是实现为用户提供服务的基础。
Databricks IPO背后的秘密
截至去年10月,Databricks的最高估值为330亿美元。这实际上比2021年科技市场高峰期的380亿美元估值略有下降,但Databricks仍然是世界上第八大最有价值的初创公司。
就公司业务相关的数字而言,Databricks看起来非常健康:在截至1月的年度财报,其销售额增长了60%,创造了10亿美元的收入,其数据仓库产品今年4月的年化经常性收入突破了1亿美元大关。
尽管如此,该公司CEO表示,目前还没有任何IPO计划。他在接受彭博的采访时说,“现在市场关闭了”。一个残酷的现实是:在2021年的黄金时期之后,IPO活动已经跌落悬崖,当时美国397家IPO的总价值为1420亿美元。到目前为止,2023年只有49次IPO,总价值83亿美元。
相反,该公司正专注于建设其AI能力——考虑到华尔街对这项时髦的新技术的喜爱,这是一个明智的举动。Databricks最近宣布了两项新收购:以未披露的金额收购人工智能存储和服务系统初创公司Rubicon,并以13亿美元收购生成型人工智能初创公司MosaicML。Rubicon专注于为人工智能构建存储系统,而MosaicML则构建高端大型语言模型。
暂时看,Databricks的竞争者布局更胜一筹
Databricks并不是本周唯一举办大型峰会的公司。
它的竞争对手Snowflake在2023年的Snowflake数据峰会上也发布了一系列关注AI的公告。在其成为领先的AI数据存储和分析公司的宏大计划中迈步前行,Snowflake透露它正在与计算机芯片巨头Nvidia合作;该合作将让Snowflake的客户使用自己的数据构建自己的AI模型。
每个Snowflake模型都将在Snowflake的数据云上构建和存储,而该公司将使用Nvidia的芯片和AI软件来支持模型的构建,训练和调整。
在这个消息之后,Snowflake的股票在盘前交易中上涨了3.9%,而股票在五天的时间里上涨了近7%,达到183.85美元。自年初以来,股价已经飙升了35.6%。
Nvidia的股价在今年早些时候达到了一个里程碑,因为它成为了第一个万亿美元的芯片制造商,公告发布后上涨了0.5%。Nvidia今年取得了惊人的成绩,过去十年来一直在建立其生成AI套件的基础,2023年其股价上涨了187%。Snowflake与芯片制造巨头的合作无疑会给Databricks带来压力。
这并不是Snowflake 的唯一合作伙伴, Snowflake还确认了它正在扩大与大型科技巨头微软的现有合作关系,微软在AI竞赛中一直处于领先地位,以将生成AI带入Snowflake的Data Cloud套件。此举将允许Snowflake和Microsoft Azure的数据科学家进一步整合两种产品。
AI只是IPO冰山下的一角
很明显,虽然公众通过ChatGPT和Bard等聊天机器人看到了人工智能的直接机会,但这只是企业用例的冰山一角。Databricks现在正寻求利用市场缺口,但它面临着来自Snowflake等公司的激烈竞争。
最终,这种竞争力意味着随着对生成人工智能需求的升温,而客户将会是最大的赢家。对Databricks未来首次公开募股抱有希望的投资者应该密切关注这项新技术的结果,看看这是一项膨胀的气球还是真正的交易,来改变Databrickss在数据行业的长期未来。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。