主数据也许是企业所拥有的最重要的资产之一。随着数字化的不断发展以及第四次工业革命的到来,主数据的价值和主数据管理的重要性日益突显。在我们探讨主数据管理的重要性之前,让我们先来了解一下什么是主数据。
Gartner将主数据定义为“...具有一致且统一的标识符集和扩展属性,描述了企业的核心实体包括客户、潜在客户、公民、供应商、网站、人员架构以及财务报表”。
实质上,主数据是指用于识别业务关键要素的所有静态信息,其中包括产品名称、人员(客户、供应商、员工、潜在客户等)、特殊设备和工具、设施等。主数据与交易数据(例如发票金额、日期、流程参数等)是不同的,主数据的目的更多地是关于识别,而不是测量。
然而,这并不是说主数据和交易数据是完全相互独立的。实际上,主数据对于描述和理解交易和流程至关重要,主数据为交易信息提供了更大的背景,主数据的差异可能会比交易数据的差异造成更大的损失,例如在计费时错误识别客户可能要比错误计算金额的损失更严重。为了避免这种情况,就必须足够重视主数据管理的重要性。
主数据管理与业务几乎每个关键方面都密切相关。最重要的是,主数据可以帮助企业及企业的信息系统识别出日常运营中所涉及的不同组成部分。主数据可能涉及个人客户、供应商、部件名称、资本资产、产品等等,这些都必须记录下来并进行处理以保持所有业务关键流程的真实性。主数据管理可以帮助企业组织成员和企业决策支持系统根据客观准确的信息来做出快速的决策。要做到这一点,每个元素所使用的每个标识符必须是在整个企业组织内达成一致的,这就确保了在正常操作过程中识别这些关键元素的一致,并将可能出现的混乱和错误减至最低。有效的主数据管理对于优化和加速企业组织流程来说是很有用的,因为使用具有一致性的数据可以确保彼此之前通信的快速接收、解释和响应。
主数据管理很必要——特别是在大型企业内——的另一个重要原因是为了确保法规遵从。监管机构对管理企业组织处理财务和客户数据的方式有着严格的法律规定。建立和遵循标准化的主数据管理实践,可以帮助企业组织使其流程与这些法律法规保持一致。例如,通用数据保护条例(GDPR)要求企业要具有成型的实践和协议,以防止与特定流程无关的人读取客户的个人数据。通常,客户信息是客户关系管理(CRM)等流程主数据的一个组成部分,有时候销售和客户支持主管需要访问客户信息,例如联系人详细信息,甚至是银行信息。
因此,管理主数据而不降低效率,同时也不会影响合规性,这就需要自动化和安全性。从某种意义上来说,自动化和安全性正是人工智能和区块链等技术为主数据管理带来的好处。
企业主要是将人工智能引入系统和流程中,利用增强的计算能力让这些系统和流程变得更加自主化。人工智能可以自动执行常规计算和数据输入任务,因此十分适合用于ERP和其他信息管理系统。人工智能通过确保在适当的时间始终将适当的信息传递给适当的人,从而让信息系统变得更加智能化,确保使用信息系统的企业组织是高效且灵活的。同样地,人工智能可以将自主性和灵活性带入主数据管理中,例如数据质量管理、数据管理、甚至是数据治理中。
在初期阶段,人工智能可以用于清理数据并确保必要的数据是准确和完整的。此外人工智能还可以用于利用自然语言处理(NLP)从文本中收集与主数据相关的附加信息,最大限度减少手动数据输入的工作量,从而最大限度降低低效率和不准确性的可能性。人工智能还可以用于遵循既定的主数据管理标准和实践,最大限度地减少手动执行数据治理活动的需要,并确保主数据的治理。因此,人工智能可以实现数据管理(即管理和维护数据)的自动化,以便在需要时可以轻松访问数据。通过进一步开发,人工智能还可以自动制定数据治理策略,处理更复杂的数据治理任务,例如规划等。
确保数据安全至关重要,不仅是出于道德目的,也是为了遵守监管机构的法规。在这个时代,如果没有区块链的话,任何关于安全和隐私的讨论都是不完整的。区块链通常被认为是隐私的同义词,这种技术可以用于保护构成主数据的敏感信息,包括任何个人信息,例如客户和员工有关信息,以及采购和销售等流程可能需要的财务和银行相关信息,所有这些信息都可以使用区块链技术通过加密散列施加保护。
企业可以在内部构建企业区块链网络,以使用这种去中心化的模型来保护和管理主数据。区块链不仅可以保护信息免受非法篡改,还可以防止因集中化服务器的物理损坏所导致的意外数据丢失。此外,区块链还以易于证明的方式帮助企业遵守隐私法规,这是因为区块链上的数据除了不可变之外,还是透明的,对所有参与者可见,从而确保审计和检查更加顺畅。
人工智能和区块链在不同的企业组织中所发挥的作用可能会因为主数据的分类而不同。但是,企业组织对主数据管理的需求仍将存在。由于人工智能的多元化和不断扩大的功能,使其成为现代企业架构的一个标准组成部分。率先在主数据管理中采用人工智能的企业不仅能看到立竿见影的效果,相比那些不这么做的企业来说更具优势,因为毫无疑问未来人工智能将继续发展壮大下去。
好文章,需要你的鼓励
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的准确率从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的准确率,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。
华中科技大学和香港中文大学研究团队提出SATORI-R1,一种通过空间定位和可验证奖励增强多模态推理的新方法。该方法将视觉问答任务分解为图像描述、区域定位和答案预测三个可验证阶段,解决了自由形式推理中注意力分散和训练收敛慢的问题。实验证明,SATORI-R1在七个视觉问答基准上一致提升性能,最高达15.7%,并展示出更聚焦的视觉注意力和更低的训练方差。