美光公司是新近加入OpenMP架构审查委员会(简称ARB)的又一家企业成员,该委员会由多家供应商及研究机构共同组成,旨在推动这一高人气共享式内存并行编程模式的相关标准得以尽快出台。
作为一家内存厂商人,美光公司已经成为OpenMP ARB 14家软件与硬件厂商成员中的一员,希望通过长期努力为OpenMP构建起多个相关项目。目前有9位辅助成员正致力于参与标准制定,但却并未创建或者销售任何OpenMP产品,其中包括美国宇航局、德克萨斯高级计算中心、桑迪亚国家实验室以及休士顿大学。
美光公司实际上是通过收购Convey Computers公司成为OpenMP ARB俱乐部成员的,美光软件开发编译器经理John Leidel指出。继续参与该倡议并在标准的开发与推进工作当中扮演积极角色,代表着美光公司正在逐步走向自身固有的内存厂商局限,转而以内存技术参与者的身份涉足软件业务领域,他在今年于德克萨斯州奥斯汀市参加Supercomputing 2015大会时在采访当中指出。
"越来越多的用户开始要求各类配套性质的软件、工具以及编程模型,"他表示。"OpenMP在支持共享式内存编程模型方面则拥有强大的传统优势。"随着美光方面一步步建立其非易失性DIMM(简称NVDIMM),Leidel解释称,并考虑到其在DRAM与混合式内存立方(简称HMC)领域的开发尝试,美光已经意识到自身需要在不同平台之间解决软件可移植性这一重要难题,而OpenMP正是支持各类异构式内存架构的绝佳选项。
Leidel指出,美光公司希望将OpenMP标准作为该公司系统集成方案当中的固有组成部分,并让自身工作成果以规范形式为其它成员所广泛采纳,包括IBM、惠普以及德州仪器(简称TI)等等。
德州仪器提出的面向异构式系统芯片的OpenMP 4.0加速器模型。
OpenMP ARB营销协调员兼富士通公司代表Matthijs van Waveren指出,共享式内存已经开始作为一大应用层面而快速发展。OpenMP API是一套可移植且可扩展的实现模式,允许并行程序员们利用一套简单而灵活的接口实现面向多种平台的并行应用程序开发工作,其中包括各类嵌入式系统、加速器设备、多核心系统以及共享内存系统。而OpenMP本身最初于1997年以未正式标准的姿态开始为计算机科学家们所采用。
目前已经有一系列厂商在自家产品当中为OpenMP提供支持,van Waveren表示。举例来说,德州仪器公司就在其KeyStone多核心架构中支持OpenMP API,其负责支持异构式编程以及将德州仪器的定点与浮点TMS320C66x数字信号处理器(简称DSP)核心与ARM Cortex-A15 MPcore处理器加以结合。另外,德州仪器旗下的C66x DSP也是第一款能够支持OpenMP API的多核心DSP设备。
在这一领域,OpenMP标准将迎来极为广阔的适用空间,van Waveren补充称,而未来其具体用例还将进一步增长,其中包括车辆制造商进行的车体碰撞模拟与分析乃至航空公司进行的机翼模拟与降阻实验等等。
OpenMP API 4.0规范发布于2013年7月,其支持加速器编程、SIMD编程并利用线程亲和性实现了良好的优化效果。该版本还加入了一套新机制,旨在描述数据与/或计算在向其它计算设备迁移时所对应的代码区域。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。