今年是半导体产业最为流行的现象之一——摩尔定律——的50周年。考虑到摩尔定律是人们在解释和预测芯片产业走势时最常引用也是遭误用最多的词汇,因此称其为一种现象并不为过。高登•摩尔 (Gordon E. Moore) 观察到集成电路的晶体管数量每 18 个月就会增加一倍,并由此提出了摩尔定律。
这个定律出现过几个新版本,因为晶体管数量翻番的时间在不断变化。从 1965 年到 1975 年,芯片上的晶体管数量每年都会翻番。在 1975 年,这个周期变为了两年,而到上世纪 90 年代末,存储器产业再次使翻番的速度加快。但 2008 年以来,翻番的节奏开始延缓,使人们开始怀疑该定律是否仍能保持重要地位。
摩尔定律预测准确是多种因素独特组合的结果。变小的晶体管通过减少信号间距可以提高性能。与早期速度慢的大型芯片相比,更高性能的小型芯片可以放入有限尺寸的晶圆中,这意味着相同的固定资本费用可以带来更多收入。
摩尔定律推动着创新的发展,我们平时认为理所当然的智能手机、互联网和大数据等莫不如此。即使是已经过了 50 年,该“定律”对 CPU 和内存性能的准确预言依然准确地令人惊异,使 CPU 和内存性能得以持续增长,满足现在对数据的迫切需求。业界用该定律来控制尺寸和性能的发展已经有很多年。
人们每年都在尽情地享受着设备更小、性能更高所带来的便利,但并没有认识到摩尔定律幕后作用的意义。半导体对外部世界保持着如同其所取代的真空电子管一般的冷静。如果没有摩尔定律的指导,苹果手机会跟行李箱一样大,手机中继站的规模能够匹敌华盛顿纪念碑,谷歌数据中心消耗的能量将与整个曼哈顿相同。而这正是这个理念的美妙之处,它是简单性和复杂性结合的缩影。
摩尔定律最大的成就同时也是最被低估的成就是,它给产业带来了普遍的乐观情绪。它使技术世界具有可预测性,突出表现为在不考虑高成本和众多挑战的情况下,相比几乎所有其他行业而言,科技始终是一项更好、更安全的投资。事实是,虽然向新的芯片工厂或节能型数据中心投资数十亿美元存在风险,但这远低于在北极开采石油。该定律也带来了良性竞争,推动着半导体产业的进步,因为如果有厂商速度慢了,就会被其他厂商取代。
我们来看一下摩尔定律在存储器产业中的表现。多年来,CPU 和内存进步与传统存储器进步的差距被成倍拉大。
因为 CPU、内存和网络全部按照摩尔定律发展,性能每两年增加一倍,而硬盘性能却被落在后面,硬盘密度和性能当中只有前者受益于摩尔定律。而实际上,有时性能会随着容量增大而有所降低。15K RPM 硬盘第一次问市还是在十多年前,但到现在我们还没有看到 30K 甚至只是 20K RPM 的硬盘。原因是机械限制阻碍着硬盘实现更快的转速。硬盘信息的读取和写入需要通过机械零件实现,而这需要花费一定时间,从而带来延迟。
应对机械延迟的策略有几种。服务器和存储器供应商向使用处理器、DRAM(动态随机存储器)和其他技术的控制器投入巨资,以对硬盘瓶颈进行变通,但这样做的作用有限。随着时间推移,这种性能差异造成严重的效率低下,要求重新设计或编写应用程序,以平衡系统的利用。但如果使用闪存,解决方法更容易也更可靠,而且成本效率更高!
固态硬盘 (SSD) 使存储器回归到摩尔定律。例如,仅仅是四年前,一般的 SSD 可实现约 250 MB/s 的吞吐量,容量最高才约 512 GB。而现在,类似闪迪的企业级 PCIe 应用程序加速器可以实现 2.7 GB/s 的数据传输,容量高达 6.4 TB,尺寸也更小,可轻松一手掌握。
因此,未来会是怎样?研究人员说,我们可能最终在 2021 年之前达到半导体体积缩小的物理极限。但 3D 内存仍将继续这种良性循环。通过堆积而不是更紧密地挤压晶体管,可以获得(或提高)经济/技术效益。闪迪3D BiCS 内存包含 48 层,是业界的高水平标志。对于消费者和大型企业等而言,由于狭小的空间可以容纳更多的内存,智能设备和数据中心设备会变得更加智能。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。