三星于2024年10月推出了PM9E1固态硬盘,现已开始发货4TB容量版本,该版本特别为英伟达DGX Spark AI桌面工作站优化设计。
PM9E1是一款M.2 2242规格的双面固态硬盘,采用三星第8代V-NAND技术,具有236层TLC格式存储单元。该驱动器配备PCIe Gen5接口,提供4个通道,随机读取速度可达200万IOPS,随机写入速度达264万IOPS,顺序读取带宽达14.5 GB/s,顺序写入带宽达12.6 GB/s。
这款4TB版本的M.2 2242规格比之前发布的512GB、1TB和2TB的M.2 2280规格PM9E1更加紧凑。为了应对严格的空间限制,三星在极小的PCB上的两侧都放置了NAND芯片、DRAM和控制器等所有组件,这在PCB布局、物料清单优化、热管理和机械可靠性方面都带来了额外挑战。
PM9E1采用三星自主设计的Presto控制器,基于5nm工艺制造,固件针对DGX Spark OS软件、英伟达CUDA软件和整体AI用户体验进行了优化。该硬盘具备设备身份验证和固件篡改认证安全功能。
与2021年推出的前代产品PM9A1相比,PM9A1采用PCIe Gen4接口和M.2 2280规格,容量为2TB,采用128层第6代V-NAND技术,TLC格式。其性能指标为随机读取100万IOPS、写入85万IOPS,顺序读写速度分别为7GB/s和5.2GB/s,明显低于PM9E1。
在大语言模型推理过程中,顺序读写速度至关重要。模型训练时需要频繁进行检查点操作以保存模型状态,这要求极高的顺序写入性能。高速的顺序读写能力可以快速加载已训练的模型,实现迅速、无缝的推理和重新训练。
Q&A
Q1:PM9E1固态硬盘的主要性能指标是什么?
A:PM9E1采用PCIe Gen5接口,随机读取速度200万IOPS,随机写入速度264万IOPS,顺序读取带宽14.5 GB/s,顺序写入带宽12.6 GB/s。采用第8代V-NAND技术,256层TLC格式存储,配备Presto控制器和双面DRAM。
Q2:为什么PM9E1特别适合AI工作站使用?
A:在大语言模型训练中,系统需要处理极其密集的数据加载和训练操作,特别是检查点保存模型状态时需要非常高的顺序写入性能。PM9E1的高顺序读写速度可以快速加载模型并实现无缝推理和重新训练,完全满足AI应用需求。
Q3:PM9E1与前代PM9A1相比有什么优势?
A:PM9E1采用PCIe Gen5而PM9A1采用PCIe Gen4,速度提升一倍。PM9E1随机读写IOPS分别为200万和264万,而PM9A1仅为100万和85万。顺序读写速度也从7GB/s和5.2GB/s提升到14.5GB/s和12.6GB/s。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。