Nutanix的增长得益于转向混合云和生成式AI,以及即将支持Nvidia GPU Direct高速数据反馈协议。
Nutanix公司首席执行官Rajiv Ramaswami在接受采访时表示,他认为Nutanix的两位数增长还可以持续一段时间——因为Nutanix拥有卓越的混合云软件,而且生成式AI是他们的另一个增长动力。
Nutanix表示,已经将自己的本地企业基础架构功能迁移到了公共云,以便为运行虚拟机或容器的人员提供一致的混合云体验。我们探讨了这些话题的方方面面。
您能描述一下Nutanix在本地环境和公有云环境中的Kubernetes设施吗?
Rajiv Ramaswami:我们在多云世界中管理Kubernetes,我们希望客户在任何地方运行这些应用,应用可能是在原生EKS或AKS上运行的,而且我们在所有这些(本地环境和公有云原生环境)上都拥有统一的管理平面,包括亚马逊的服务、Kubernetes服务、我们的Azure Kubernetes服务程序,其中一些可能是运行在我们自己的平台上。
我们的愿景是人们可以在任何地方使用和运行Kubernetes集群,我们将成为管理者。我们还为块、文件和对象提供存储。……如果有人在AWS上构建应用,他们将能够使用我们的存储,并且这种存储完全是云原生的。客户可以在公有云中使用我们的存储服务器作为EBS的替代方案。
优势是双重的。首先,相同的Nutanix平台可以在任何地方使用:云、跨多个云、本地等。因此,如果你考虑以这种方式工作的话,则不必重做平台应用。第二,AOS具有许多内置的企业级弹性功能。我们跨云和全球进行灾难恢复,我们进行同步复制。现在,所有这些功能都可以在公共云中使用。而AWS(例如EBS)则不提供这些服务。
在这些情况下,通常发生的情况是,如果有人在云中构建应用,他们必须在应用层管理所有弹性,必须将其构建到应用中,而典型的企业是依赖于底层基础设施的。因此,我们基本上在公有云中提供了相同的企业关键任务存储,这与企业本地环境是相同的。
我相信您也希望让企业更容易在混合云中运行数据库对吗?
Rajiv Ramaswami:这是关于基础设施层,也就是平台的。这与大多数应用需要使用数据库的其他组件有关,这些组件是使用缓存的,例如,使用消息传递或流媒体。这是我们的宏伟愿景,具有前瞻性。
目前,Nutanix已经提供了数据库管理服务。因此,人们可以使用我们的平台管理各种数据库,例如Oracle、SQL、Mongo、Postgres。我们想要做的就是扩展它,首先,让它在公有云中可用,然后扩展服务范围。
因此,我们可以管理Kafka流或Redis进行缓存。展望未来,我们的想法是,我们要么自己提供,要么与外部合作。我们对EDB Postgres有很多了解,能够提供一系列所谓的平台层数据服务,人们可以使用这些服务来构建应用。一旦我们这样做了,这些服务就将是随处可用的。
这些数据库服务未来会包括矢量数据库吗?
Rajiv Ramaswami:愿景是很广泛的。我们没有涵盖了一切事情的路线图。我现在专注于事务型数据库。而且,我知道人们关注什么,AI和GPT in a Box。所以,绝对是的——但从长远来看,我们还没有宣布时间表或类似的东西,我们的愿景是真正打造一套随处可用的服务。
我们不是数据库引擎提供商。是的,我们可能会选择在未来某个时候这样做,但目前我们是和其他数据库提供商合作的。
无论客户的数据位于何处,您都会为客户存储大量信息,在本地环境或者是任何公有云中。大型语言模型将需要这些信息,检索增强生成(RAG)会为其提供帮助。您将采取什么措施来帮助实现这一目标?
Rajiv Ramaswami:我不会宣布新的路线图,但愿景是正确的。
这正是我们的目标。正如您所说的,我们的数据是可用的,我们可以成为管理数据的平台,我们确实认为数据将无处不在——不仅仅是在公有云中,也不仅仅是在本地环境中,而整个GPT in a Box的推出,正是为了尝试简化我们平台上AI应用的部署。
目前,这个范围稍微有限一些,也就是说,我们有一个平台,为我们提供所有存储的部分。最重要的是,我们能够提供的是自动工作场所连接到模型存储库,这样我们就可以接入Hugging Tree,可以连接到即时存储库。只需单击一下,人们就可以下载他们想要的模型,在硬件上实例化,并将其与GPU连接。...创建一个推理端点并将其导出到API进行开发——这样人们就可以实现自动化。
好的,这将承载AI推理和微调,那么训练方面怎么样?因为还是那一点,你有大量的信息,你会把哪些信息给到GPU?
Rajiv Ramaswami:GPU Direct在我们的路线图上,我们将拥有GPU Direct,特别是针对文件——这才是你真正需要GPU Direct的地方,它已经在路线图上了——我们知道需要什么。另一个需要的是高带宽I/O。我们现在支持100千兆NIC。显然,你需要能够非常快速地获取大量数据。我们理解这一点,我们正在实现这一点,我们正在做高带宽,然后是一台具有大内存的机器,所有这些都将发挥作用。
您认为AI推理必须提供准确的、完整的、不是虚假的结果吗?
Rajiv Ramaswami:当然。你需要在模型中保持准确性,当然,要确保这种准确性,就需要大量的工作。
生成式AI有很多早期用例都是辅助用例……也就是我们广义上所说的Copilot。换句话说,使用它,但在实际使用之前要对其进行验证。所以我给你举一个我们内部使用的例子,是在客户支持方面的。
我们使用我们的设计文档和知识库文章部署了模型。当支持工程师收到客户请求的时候,他或她会将其输入到我们的GPT引擎中,它会提出建议,比如“这可能是这里的问题,这是你可能想要做的。”它加快了我们的响应时间,提高了我们支持工程师的工作效率,这样就可以更好地为客户服务,这对我们来说也是更好的。
而且效果很好。我们刚刚为他们完成了试点,但我们在这里要做的最重要的事情是继续训练和微调,直到我们能够获得合理的准确性。
我的想法是,总的来说,RAG方法绝对必须有效,否则AI推理就会消亡。
好文章,需要你的鼓励
人工智能领域正在通过改进模型工作方式来释放新功能。研究人员开发了一种名为"SVDquant"的4位量化系统,可以使扩散模型运行速度提高3倍,同时提升图像质量和兼容性。这种技术通过压缩参数和激活值来大幅降低内存和处理需求,为资源受限的系统带来新的可能性。
Meta公司开发了一种机器学习模型SEAMLESSM4T,能够实现36种语言之间的近即时语音翻译。该模型采用创新方法,利用互联网音频片段避免了繁琐的数据标注。这一突破性技术有望简化多语言交流,但仍需解决噪音环境、口音等挑战,并关注技术可能带来的偏见问题。
生物制药行业正积极拥抱人工智能技术,大型企业投入巨资,小型公司谨慎布局。行业面临人才、数据和工作流程等挑战,但预计到2025年将在AI就绪度方面取得实质性进展。AI有望加速药物研发,提高效率,最终造福患者,重塑医疗保健的未来。
随着 AI 需求激增,数据中心行业面临严峻挑战。能源消耗激增威胁可持续发展目标,新项目遭遇公众反对。电力供应和分配方式亟需改革,行业或将迎来动荡的 2025 年。