7月1日,开源大数据Hadoop社区内专注于可用性和数据安全优化的MapR周一宣布,该公司通过股权和债券融资的方式最新筹集了1.1亿美元资金。
Hadoop是一种开源大数据技术,这种由Apache基金会(ApacheFoundation)开发的技术可供用户在不了解分布式底层细节的情况下开发分布式程序。
MapR称,在最新筹集的这1.1亿美元资金中,有8000万美元是通过股权融资的方式筹得的,由谷歌(微博)旗下风投公司谷歌资本(GoogleCapital)领投,其他参与者则包括无线芯片公司高通旗下的投资部门QualcommVentures等。此外,光速创投(LightspeedVenturePartners)、梅菲尔德基金(MayfieldFund)、NEA和红点创投(RedpointVentures)等公司也参与了这个融资回合。
除了成长资本融资以外,MapR还通过债券融资的方式筹集到了3000万美元资金,由硅谷银行(SiliconValleyBank)领投。这两项融资交易令MapR成立至今的总筹资额达到了1.74亿美元。此前,MapR的上一个融资回合是在15个月以前开展的C轮融资,当时该公司筹集了3000万美元资金,由梅菲尔德基金领投。
MapR围绕Hadoop技术建立起了自身业务,这种开源技术旨在帮助其他公司对大数据进行分析,以便提高盈利或削减成本。MapR的主要竞争对手包括Cloudera和Hortonworks等,这家公司以其建立起了一个专注于可用性和数据保护的工业级版本Hadoop而闻名、
对于一家Hadoop公司来说,MapR的这个融资回合是今年第三项上亿美元的筹资交易,从而将今年截至目前为止Hadoop领域中的总投资额提高到了11亿美元。今年3月份,英特尔牵头对Cloudera进行了投资,这项投资的总额达到了9亿美元,其中单是英特尔的投资额就高达7.4亿美元。而在此以前,贝莱德和PassportCapital则牵头对Hortonworks进行了总额1亿美元的投资。
Hadoop本身是由Apache基金会开发的一个开源项目,其最初的根源则来自于雅虎。Hadoop技术的核心开发团队随后开创了Hortonworks。过去几年时间里,Hadoop技术基本上都被视为处于实验阶段中。随着越来越多的公司开始关注大数据业务,许多公司都已转向Hadoop技术来简化相关开发程序。所谓“大数据”(bigdata),指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
在经过数年的实验以后,今年Hadoop开始更多地进入运营阶段。据市场研究公司IDC最近公布的一份调查报告显示,在试用Hadoop技术的202家大型公司中,将近三分之一的公司已经将这种技术转入生产环境中去,此外还有大约三分之一的公司计划在一年以内完成这种转变。
MapR称,目前为止该公司的付费认证客户总数已达500家,今年第一季度中的订单量与去年同期相比增长了两倍。但跟其他创业公司一样,MapR也并未公布具体的业绩数据。MapR表示,该公司计划利用最新筹集到的这笔资金来提升其面向全球市场推广自身服务的能力。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。