腾讯云通过率先对基于Intel 3D XPoint技术的persistent memory工程样片的压力测试与验证,在不同应用场景下的应用优化和开发,发现persistent memory的延迟更低、吞吐更高,同时具有高耐用性和高服务质量。基于此,腾讯云将把该项技术用于其云产品中,后续将更新推出一批云存储及数据库产品,包括新一代SSD云硬盘、新一代云数据库NewCDB等。
在现有存储架构中,内存和存储介质之间存在容量、性能和时延的差距,基于Intel? 3D XPoint技术的persistent memory位于内存和存储介质之间,预计能填补两者间的性能和时延差距,对存储层次模型进行重新划分和定义。根据腾讯云的测试结果,我们发现 persistent memory读写带宽比NVME设备高数倍,并大幅降低延时问题。另外,由于写入方式不同,persistent memory也比Flash NAND更耐用,并能支持比传统DRAM更大容量的系统内存配置,同时,persistent memory具有的非易失性这一大优势能够保证数据在掉电后或系统维护中不会丢失。
基于3D XPoint新存储介质的特性以及总线带宽优势,腾讯云将Intel persistent memory作为内存及基于NAND的NVMe SSD之间的cache层,将NVMe SSD中的动态热数据加载到cache中。针对多租户环境下,热点数据的长尾分布特点,引入智能调度算法,使得Cache命中率达到95%以上,在大幅提升IOPS能力的同时大幅降低了访问延时,未来结合25GE网络和RDMA技术,将提供超高性能IOPS能力和超低延时云硬盘服务,满足OLTP数据库、NoSQL数据库和Elasticsearch日志分析等应用对性能的极致要求。
腾讯云计划运用Intel persistent memory提供新一代的云数据库服务。通过深入优化TXSQL、TXRocks和TXMongo等腾讯自研数据库内核,同时,通过Intel persistent memory及新一代的Intel? Xeon? Scalable Processors提升云上数据库性能,将更好地服务电商抢购、春晚红包等高并发的业务场景。
腾讯云副总裁王慧星表示:“腾讯云持续将最新技术引进到云计算中。通过腾讯云强大的软件硬件结合的技术能力,率先开发高性能、低成本、高可靠性的云产品方案,并及时开放给腾讯云用户,让金融、电商、直播、游戏等行业从中享受到技术红利。同时,腾讯云作为英特尔的全球战略合作伙伴之一,在双方的紧密合作中,充分整合在软件硬件生态链上的良好全球性布局,协力打造和优化新一代云产品方案。”
好文章,需要你的鼓励
这项来自麻省理工和滑铁卢大学的研究质疑了在AI文本排序中"思考过程"的必要性。研究者比较了三种文章重排模型:直接判断的StandardRR、先推理再判断的ReasonRR,以及禁用推理功能的ReasonRR-NoReason。实验结果表明,不仅推理过程没有提高排序质量,有时甚至会降低效果。主要原因是推理导致模型倾向于极端判断,难以表达"部分相关"这种微妙关系。即使应用"自洽性"等改进技术,简单直接的判断方式仍然更为高效有效。研究为信息检索系统设计提供了新视角:有时,少即是多。
TAGS是一种创新的医学问答框架,结合了泛医和专医两种视角,通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发,无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制,解决了现有方法在复杂医学推理中的短板,为构建更可靠的医学AI系统提供了新思路。
这篇研究提出了时间抽象值学习(OTA)方法,解决离线目标条件强化学习中的长期规划问题。研究团队发现现有分层方法失败的关键在于高层策略无法生成合适子目标,原因是价值函数在长期规划中估计不准确。OTA通过"选项"概念实现时间抽象,有效缩短规划视野,使价值函数能提供更准确的优势信号。在复杂迷宫导航和视觉机器人操作任务中,OTA显著优于现有方法,证明了该方法在处理长期任务时的有效性。
这项研究探索了大语言模型内部可解释特征的形成过程,分析了它们在训练过程中(时间)、模型层级间(空间)和不同规模模型(尺度)的行为变化。研究团队使用稀疏自编码器技术,成功识别出特定语义概念在神经激活中出现的时间点和位置。研究结果显示,不同领域的知识概念在模型训练和规模扩展中存在明确的激活阈值,且在空间分析中发现了早期层特征会在后期层重新激活的现象,这挑战了对变换器模型表示动态的传统认知。