第三届HUAWEI CONNECT 2018(华为全联接大会)2018年10月12日继续,就像任正非说的,鼓励科学家,专家与工程师交流,思想碰撞。今天全联接大会上世界知名计算机专家,唯一华人图灵奖获得者、清华大学交叉信息研究院院长,中科院院士,美国科学院外籍院士姚期智教授将阐述人工智能理论新方向。为下一代人工智能突破提供理论基础。
姚期智首先分享了清华大学交叉信息研究院目前人工智能的应用,包括精准医疗、蛋白质三维结构重构、基于深度学习的医学影像诊断等。
姚期智谈到人工智能理论新方向:
人工智能及深度学,在未来三五年能产生非常出色的结果。这方面计算机科学、信息论以及统计物理学为基础。
姚期智认为目前理论上人类在科学上啊还不了解科和解释深度学习的运行原理。目前不能够解释算法做了什么事情,完全是一个黑盒子。目前深度学习最大的问题是“是不是做了不公平的事情,我们也不知道。”也困扰着人工智能的发展,全球出色的科学家都在探讨这个问题。
还有一个历史问题,图灵提出的人工智能的计算能不能模仿人的行为。这个问题困扰了世界很多年。最近人工智能的成功给了我们希望。人工智能和神经科学有一个互动。
第三个方向,人类的知识能够到达一个什么程度,这就让与量子人工智能产生关系。人工智能和量子计算机是两个很重要的发展。人工智能和量子计算机合并起来?是否是未来的终极学习机器?
姚期智主要分享了深度学习和量子计算的理论方向:
介绍了深度学习的起源,从理论基础到表达能力到学习能力再到收敛理论。

从计算机科学的角度看深度学习,目前传统的计算机算法是先证明正确性,在实施。
从信息论的角度看深度学习,怎么能够把信息中的信息提取出来。
从统计物理学的角度看深度学习,把你信息论的方法用数学展示出来。提出重整化群方法。物理学的理论用到计算机算法里面?
姚期智认为发现一个新的算法,远远超过对现有算法的升级。需要计算机科学跳出纯粹计算机方法的范畴。
量子数据如何传播通过并行传输量子路由器来解决。利用人工神经网络解决量子多体物理学问题。
最后姚期智憧憬未来,向了解自然世界一样了解算法世界进军。
(此文是作者个人理解,不作为专业解读。)
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。