7月1日,开源大数据Hadoop社区内专注于可用性和数据安全优化的MapR周一宣布,该公司通过股权和债券融资的方式最新筹集了1.1亿美元资金。
Hadoop是一种开源大数据技术,这种由Apache基金会(ApacheFoundation)开发的技术可供用户在不了解分布式底层细节的情况下开发分布式程序。
MapR称,在最新筹集的这1.1亿美元资金中,有8000万美元是通过股权融资的方式筹得的,由谷歌(微博)旗下风投公司谷歌资本(GoogleCapital)领投,其他参与者则包括无线芯片公司高通旗下的投资部门QualcommVentures等。此外,光速创投(LightspeedVenturePartners)、梅菲尔德基金(MayfieldFund)、NEA和红点创投(RedpointVentures)等公司也参与了这个融资回合。
除了成长资本融资以外,MapR还通过债券融资的方式筹集到了3000万美元资金,由硅谷银行(SiliconValleyBank)领投。这两项融资交易令MapR成立至今的总筹资额达到了1.74亿美元。此前,MapR的上一个融资回合是在15个月以前开展的C轮融资,当时该公司筹集了3000万美元资金,由梅菲尔德基金领投。
MapR围绕Hadoop技术建立起了自身业务,这种开源技术旨在帮助其他公司对大数据进行分析,以便提高盈利或削减成本。MapR的主要竞争对手包括Cloudera和Hortonworks等,这家公司以其建立起了一个专注于可用性和数据保护的工业级版本Hadoop而闻名、
对于一家Hadoop公司来说,MapR的这个融资回合是今年第三项上亿美元的筹资交易,从而将今年截至目前为止Hadoop领域中的总投资额提高到了11亿美元。今年3月份,英特尔牵头对Cloudera进行了投资,这项投资的总额达到了9亿美元,其中单是英特尔的投资额就高达7.4亿美元。而在此以前,贝莱德和PassportCapital则牵头对Hortonworks进行了总额1亿美元的投资。
Hadoop本身是由Apache基金会开发的一个开源项目,其最初的根源则来自于雅虎。Hadoop技术的核心开发团队随后开创了Hortonworks。过去几年时间里,Hadoop技术基本上都被视为处于实验阶段中。随着越来越多的公司开始关注大数据业务,许多公司都已转向Hadoop技术来简化相关开发程序。所谓“大数据”(bigdata),指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
在经过数年的实验以后,今年Hadoop开始更多地进入运营阶段。据市场研究公司IDC最近公布的一份调查报告显示,在试用Hadoop技术的202家大型公司中,将近三分之一的公司已经将这种技术转入生产环境中去,此外还有大约三分之一的公司计划在一年以内完成这种转变。
MapR称,目前为止该公司的付费认证客户总数已达500家,今年第一季度中的订单量与去年同期相比增长了两倍。但跟其他创业公司一样,MapR也并未公布具体的业绩数据。MapR表示,该公司计划利用最新筹集到的这笔资金来提升其面向全球市场推广自身服务的能力。
好文章,需要你的鼓励
科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。
Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。
这项由ETH苏黎世等机构发表的突破性研究首次系统性揭示了优化器选择对AI模型量化性能的重大影响。研究团队发现传统的异常值理论完全失效,并开发了革命性的ABC分解框架来准确预测量化后性能。实验证明Shampoo优化器在量化场景下表现最优,该发现为AI模型的实际部署提供了重要指导,有望让AI技术在资源受限设备上发挥更大作用。