今年5月以来,全球科技巨头们不约而同地开始展示在AI领域的最新成果和战略部署,一系列引人瞩目的发布和合作活动相继展开,预示着AI技术的快速发展和广泛应用。
谷歌推出了Gemini 1.5 Pro和Gemini 1.5 Flash两款新的大型语言模型,并发布了声称效果超过GPT-3的生成视频模型Veo。微软在Build 2024开发者大会上发布了50多项与AI相关的更新,包括Team Copilot、Microsoft Fabric、Azure AI和Cobalt芯片等。英伟达发布了“最强AI芯片”Blackwell,并宣布将继续坚持数据中心规模、一年一更新、技术限制和一个架构的发展路线。苹果与OpenAI达成合作,推出了系列生成式人工智能产品和服务,并发布了个人化智能系统“苹果智能”。
AI技术是全人类的共同财富,没有哪一个国家或地区能够独自引领AI发展,但是美国确实走在了AI发展的前列。面对美国科技巨头在AI领域的强势竞争,中国AI如何才能走出自己的路?特别是在高端GPU芯片出口限制层层加码、国际环境不确定性增加的背景下,中国的AI产业更需要在多个方面加强自主创新。
AI技术的发展离不开强大的计算能力,而中国目前在高端芯片领域仍面临着进口依赖的问题。因此,中国AI企业必须加快自主研发高性能芯片,以打破国外技术垄断,实现算力自给自足。
AI应用的推广需要依托完善的基础设施建设,包括数据中心、云计算平台等。中国在这方面具有一定优势,但仍需持续投入和优化,提升整体基础设施的智能化和高效化。
在大模型研发方面,AI技术的核心在于算法和模型的创新。中国拥有丰富的应用场景和海量数据,这为大模型的训练和优化提供了得天独厚的条件。因此,中国AI企业应加大对大模型的研发投入,探索更多元的应用领域,提升模型的实际应用效果和商业价值。
在全球科技巨头纷纷亮出AI“大招”死磕的时候,华为也将于6月21日至23日在华为开发者大会(HDC 2024)上展现其在AI行业应用上的广泛探索。届时,华为云盘古大模型5.0将重磅亮相,并呈现在行业落地方面的最新成果。
自2023年7月7日发布盘古大模型3.0以来,华为在AI领域已经取得了显著的进展。这一模型在矿山、药物分子、气象、铁路、政务、金融、制造等多个领域均取得了应用成果,为业界贡献了先进的算法和解决方案。
如今,华为云盘古大模型即将迎来一次重大升级。在HDC 2024上,我们将见证盘古大模型5.0的首秀。这一全新版本的大模型有望在多模态能力、自然语言处理、图像识别等方面取得显著进步,并为更多行业带来突破性的应用。这无疑将进一步巩固华为在AI领域的领先地位,并推动全球AI技术的发展和应用。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
大模型时代,玛丽·米克尔(Mary Meeker)的名字可能大家不一定熟悉,但是在互联网时代,这位被可被誉为“互联网女皇”的。她是美国风险投资家和前华尔街证券分析师,专注于互联网及新兴技术领域。玛丽·米克尔(Mary Meeker)发了一份340页的《人工智能趋势报告》,粗粗看了一下,并没有非常轰动的观点,但是数据比较全面
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。