近日,Apache软件基金会宣布,华为贡献给Apache社区的开源项目CarbonData从Apache孵化器毕业,正式成为Apache顶级项目(TLP),这意味着华为从大数据开源社区的参与者变成了社区和生态的引领者之一。
CarbonData是一种大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以一份数据同时支持多种大数据应用场景,并与Apache社区的Hadoop、Spark等组件实现无缝集成。
华为从2013年开始研究CarbonData解决方案,并在2015年将该方案开源贡献给Apache社区。2016年6月,CarbonData全票通过进入Apache孵化器;2017年4月,经过来自华为、英特尔、Talend、交通银行、上汽、携程等众多公司资深架构师和开发人员的努力,CarbonData经过不到一年的时间,毕业成为Apache社区顶级项目。这标志着CarbonData成为大数据生态的标准数据格式之一,也标志着华为不仅能够参与Apache大数据开源代码贡献,且能够主导一个顶级开源项目。同时,这也是华为"源于开源、强于开源、回馈开源"战略的又一次成功实践。
基于华为公司对Apache开源社区核心技术的掌握,华为FusionInsight大数据平台成为了众多客户的优选合作伙伴。截止目前,华为FusionInsight大数据平台已经服务于全球40多个国家和地区的700多家客户,广泛应用于金融、政府、公共安全、运营商、教育、能源、交通、医疗等多个行业。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。