大数据初创企业Concurrent刚刚获得了 1000 万美元的新一轮融资。
大数据方兴未艾,Hadoop 则是大数据最流行的基础平台。围绕着 Hadoop 进行创新的初创企业有很多。如 Trifacta 做的是 Hadoop 的数据清理,Platfora 做的是基于 Hadoop 数据的商业智能, Splice Machine 瞄准实时负载处理,而 Hadoop 的分销商 Cloudera 和 Hortonworks 则致力于该数据库的进一步普及。
而 Concurrent 则是企业大数据应用平台公司,成立于 2008 年。该公司是流行的大数据应用开发工具 Cascading 的母公司。Cascading 可简化基于 Apache Hadoop 的大数据应用的开发、部署和管理,其月下载量超过 75000。
迄今为止,目前使用 Cascading 的公司超过 7000 家,其中有近 10 家付费客户,包括 Twitter、eBay、The Climate Corporation 及 Esty 等。4 个月前 Concurrent 推出了第一款商业产品 Driven,用于 Cascading 应用的管理和监控。
此轮融资由 Bain Capital Ventures 领投,Rembrandt Ventures 和 True Ventures 参投。融资所得将用于继续研发及客户拓展。此轮融资过后,其总融资已达 1495 万美元。
好文章,需要你的鼓励
据报道,OpenAI正与亚马逊洽谈至少100亿美元的融资。亚马逊此前已是Anthropic的最大投资者,并为其建设了110亿美元的数据中心园区。若融资达成,OpenAI将采用AWS的Trainium系列AI芯片。Trainium3采用三纳米工艺,配备八核心和32MB SRAM内存。AWS可将数千台服务器连接成拥有百万芯片的集群。报道未透露具体估值,但OpenAI最近一次二次出售估值已达5000亿美元。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。
各行业企业存储的数据量持续攀升,5PB以上已成常态,10PB以上也日益普遍。2026年非结构化数据管理的主题是全面增长:更多数据、更多投资、更多痛点以及更多AI安全风险。AI应用加速普及、数字化信息激增以及富媒体和传感器数据大幅增加推动了数据增长。随着AI推理应用的发展,企业将意识到非结构化数据管理对AI投资回报率的关键作用。
这项由伊利诺伊大学香槟分校等四所院校联合完成的研究,提出了名为DaSH的层次化数据选择方法。该方法突破了传统数据选择只关注单个样本的局限,通过建模数据的天然层次结构,实现了更智能高效的数据集选择。在两个公开基准测试中,DaSH相比现有方法提升了高达26.2%的准确率,同时大幅减少了所需的探索步数。