当收到百分点集团发布中国首个行业AI决策系统产品Deep Matrix 的邀请函的时候。瞬间脑洞大开。哇,AI决策?是不是人工智能能够开始自己判断自己做决策了?有一天是不是会认为“人”这个生物太差了,以后不需要 “人”来做出决策了? 带着这种兴奋,参加了新产品发布会。
仔细聆听之后,发现未来还真有可能。
至顶网记者首先分享一下百分点集团董事长兼CEO苏萌博士、包括百分点集团技术副总裁及首席架构师刘译璟传达了几层信息。
首先,大数据、人工智能让企业在进化,从劳动密集型、资本密集型向数据密集型、智能密集型新物种企业进化。企业在进化,同样人类所有的决策将会不可避免的依赖机器智能。
其次,搜索现实世界成为可能。百分点有个愿景就是打造一个可以分析现实世界的系统。以前通过搜索引擎只能搜索文字、图片等,今后通过采集器,可以直接搜索到现实中实物投影。
第三,人工智能开始了从执行到决策的转变。就是以前你让他干什么它干什么。现在它会自己决定干什么。
那么未来AI的进化是什么方向?今天我们谈的AI主要是提高对数据的感知和认知能力。通过物联网技术、机器视觉以及语音识别等可以实现对信息的感知。之后Google发表了关于知识图谱的论文,通过自然语音处理技术、知识图谱技术以及逻辑推理等技术,实现了对信息的认知。那么AI如果一直停留在感知和认知层面,是不是还欠缺点什么?那么“智”这个字在人工智能里面的含义是什么?当AI能意识到自己可以解决问题的时候,是不是就是“智”的体现?百分点认为,让AI实现解决问题的核心是首先让AI具备决策的能力。
就是“智能决策”。因为目前还没有对“智能决策”有一个定义,因此,百分点整个科学团队对此作了定义“智能决策”就是“在动态和多维信息收集的基础上,对复杂问题自主识别、判断、推理,并做出前瞻性和实时性的决策过程,同时具备自优化和自适应的能力。”
对于这个定义,我怎么看都觉得比“人”厉害。如果我没有记错,在演讲中,百分点集团董事长兼CEO苏萌博士说了一句话,AI决策系统的发布是公司迈出的一小步。如果为了AI能够自己做决策,那么这一小步可是意义非凡的。
那么AI决策到底到哪一步了?AI决策了,人做什么?当我把最开始的疑问抛给了百分点集团技术副总裁及首席架构师刘译璟的时候,他的回答是这样的。
首先是人机共生时代带来,目前人类做的事情是对一件事情进行评估,并确定一个目标。进行目标设立,进行假设等。AI做的事情是信息采集、方案生成、问题识别以及结果预测。
如果把决策分为三大类,战略级别的,战术级别的,运营级别的,人类做的是典型的战略级别的事情。比如中国是汽车拥有量最多的国家,国家有一个国家质监总局有一个汽车缺陷产品管理中心,它负责的事情就是决定哪款汽车是否该销毁,这是非常难做的决定。这个思考过程是人类考虑的战略问题。AI决策就是在战术级别、运营级别完全实现自动的,比如智能决策,通过大量的数据采集,通过机器和智能的知识图谱体系,来学习过去几十年里专家如何来决定一款汽车产品的缺陷严重不严重,国家是否应该启动对它的召回调查,而且在不停地学习,把人脑里的知识和更广泛的计算机获取的数据进行结合,以及结合这些专家的知识和决策的经验。
优势就是以前需要每个季度把过去的这些专家们会商的制度召在一起,用两到三天的时间用人脑评比所有的信息,它的效力很低,今天通过AI决策可以随时来做一个智能的召回判断,时间仅用两个小时,从两百个小时缩短到两个小时。而且从之前的15个人到现在1个人+机器就能做。这就是AI决策。
好文章,需要你的鼓励
日立公司在CES 2026技术展上宣布了重新定义人工智能未来的"里程碑式"战略,将AI直接应用于关键物理基础设施。该公司与英伟达、谷歌云建立重要合作伙伴关系,并扩展其数字资产管理平台HMAX,旨在将AI引入社会基础设施,变革能源、交通和工业基础设施领域。日立强调其独特地位,能够将AI集成到直接影响社会的系统中,解决可持续发展、安全和效率方面的紧迫挑战。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
科技行业女性从业者比例从2015年的16%增至2025年的22%,进步缓慢。尽管各种倡议不断推进,但多元化员工仍面临离职率高、薪酬差距和发展机会不足等问题。2025年经济不确定性导致企业削减多元化项目,美国政策变化也产生连锁反应。随着AI技术快速发展,缺乏多元化团队将导致技术偏见,影响产品质量和市场表现。2026年将成为科技行业多元化发展的关键节点。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。