多孤岛大数据访问加速初创公司Alluxio去年与华为达成合作关系,最近又与Dell EMC就ECS产品签订了类似的协议。
Alluxio解决的问题是,很多单独的存储机制是针对需要被多个分析型应用访问的大规模非结构化数据。每种应用(Hadoop、Spark、Storm、samza等)需要自己安排访问每个数据源(AWS S3、HDFS、Ceph、Isilon、Gluster等)。
Alluxio提供了一个中央软件层,能够通过他们选择的接口让上述任何一种应用访问任何一种数据源。这样能够不费力地做到像NVMe驱动器为PCI协议闪存数据存储所做的那样,为上层系统软件提供标准接口。
除了提供统一访问的Alluxio之外,开源代码提供了内存缓存来加速数据访问,包括读和写。

Alluxio graphic
Dell EMC与Alluxio的合作涉及到Alluxio企业版(AEE)和Dell EMC的Elastic Cloud Storage(ECS)对象存储服务器用于大数据工作负载。ECS曾经的代号是Nile。Dell EMC和Alluxio宣称,他们给"客户提供了DAS存储的替代选择,提供ECS的优点同时还有Alluxio AEE软件的性能改进"。
Alluxio首席执行官李浩源表示,Alluxio能够让ECS用作网关或者存储组件:"Alluxio为Dell EMC ECS客户提供了能够使用任何计算框架在本地或者云中以内存速度访问单独存储系统的灵活性。"
对于潜在客户来说,将Dell EMC与Alluxio这个组合与Dell EMC的DSSD D5相对比是有道理的,后者也提供了对大数据的高速访问。两者之间在速度和成本上的对比是很有意思的。
对于Alluxio来说,就在几个月前刚刚与华为签约之后又和Dell EMC签约,这是个好消息,其他存储提供商可能也会接踵而至,比如HDS、HPE和NetApp。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。