Nutanix推出了一款即插即用的交钥匙GPT“魔盒”,供客户在其超融合软件平台上运行大型语言模型人工智能工作负载。
GPT(Generative Pre-trained Transformer)是一种机器学习大型语言模型(LLM),它可以解释文本请求和问题,搜索多个源文件,并通过文本、图像、视频甚至软件代码输出进行响应。受ChatGPT模型的启发,世界各地的组织都在考虑采用LLM如何改善营销内容创作,使聊天机器人更好地与客户互动,为普通研究人员提供数据科学家的能力,并在这样做的同时节省成本。
IDC基础设施系统、平台和技术集团高级研究分析师Greg Macatee表示:“通过GPT-in-a-box,Nutanix为客户提供了一个交钥匙、易于使用的的人工智能用例解决方案,为那些在生成式AI采用方面遇到困难的企业提供了更简单的部署途径。”
Nutanix希望通过构建一个软件堆栈,包括Nutanix云基础设施、Nutanix文件和对象存储,以及Nutanix AHV虚拟化管理程序和具有Nvidia GPU加速功能的Kubernetes(K8S)软件,让客户更容易试用和使用LLM。其云基础设施本身就是一个软件堆栈,包括公共或私有云中的计算、存储和网络、虚拟化程序和容器。据说,GPT魔盒可以从边缘到核心数据中心部署并进行扩展。
GPU加速涉及Nutanix的Karbon Kubernetes环境,该环境支持Kubernete之上的GPU直通模式。它还没有扩展到支持英伟达的的GPU Direct主机的处理器旁路协议,以实现GPU服务器对存储驱动器的直接访问。
Nutanix产品管理高级副总裁Thomas Cornely表示:“Nutanix GPT魔盒是一款专为人工智能准备的堆栈,旨在解决生成人工智能采用方面的关键挑战,并帮助加速人工智能创新。”
我们已经询问了“这个有见解的人工智能就绪堆栈”一词的含义,但尚未得到回复。
Nutanix还提供服务,帮助客户通过开源深度学习和MLOps框架、推理服务器以及一组精选的LLM(如Llama2、Falcon GPT和MosaicML)来确定集群规模并部署其软件。
数据科学家和机器学习管理员可以通过选择应用程序、增强的终端UI或标准CLI来使用这些模型。GPT魔盒系统可以运行其他GPT模型,并通过使用从Nutanix文件或对象存储访问的内部数据对其进行微调。
让Nutanix感到欣慰的是,最近的一项调查发现,78%的客户可能会在Nutanix云基础设施上运行他们的AI/ML工作负载。这也印证了IDC上面的支持性引用。
Nutanix希望我们认识到通过其在以下方面的参与,它在AI和开源AI社区中具有可信度:
参与MLCommons(AI标准)咨询委员会
共同创立并在定义ML存储基准和医学基准方面担任技术领导
担任云原生计算基金会(CNCF)Kubeflow(MLOps)培训和AutoML工作组的联合主席
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。