Nutanix CEO谈混合云、AI和GPU Direct支持
创始人
2024-07-18 17:20:46

Nutanix的增长得益于转向混合云和生成式AI,以及即将支持Nvidia GPU Direct高速数据反馈协议。

Nutanix公司首席执行官Rajiv Ramaswami在接受采访时表示,他认为Nutanix的两位数增长还可以持续一段时间——因为Nutanix拥有卓越的混合云软件,而且生成式AI是他们的另一个增长动力。

Nutanix表示,已经将自己的本地企业基础架构功能迁移到了公共云,以便为运行虚拟机或容器的人员提供一致的混合云体验。我们探讨了这些话题的方方面面。

您能描述一下Nutanix在本地环境和公有云环境中的Kubernetes设施吗?

Rajiv Ramaswami:我们在多云世界中管理Kubernetes,我们希望客户在任何地方运行这些应用,应用可能是在原生EKS或AKS上运行的,而且我们在所有这些(本地环境和公有云原生环境)上都拥有统一的管理平面,包括亚马逊的服务、Kubernetes服务、我们的Azure Kubernetes服务程序,其中一些可能是运行在我们自己的平台上。

我们的愿景是人们可以在任何地方使用和运行Kubernetes集群,我们将成为管理者。我们还为块、文件和对象提供存储。……如果有人在AWS上构建应用,他们将能够使用我们的存储,并且这种存储完全是云原生的。客户可以在公有云中使用我们的存储服务器作为EBS的替代方案。

优势是双重的。首先,相同的Nutanix平台可以在任何地方使用:云、跨多个云、本地等。因此,如果你考虑以这种方式工作的话,则不必重做平台应用。第二,AOS具有许多内置的企业级弹性功能。我们跨云和全球进行灾难恢复,我们进行同步复制。现在,所有这些功能都可以在公共云中使用。而AWS(例如EBS)则不提供这些服务。

在这些情况下,通常发生的情况是,如果有人在云中构建应用,他们必须在应用层管理所有弹性,必须将其构建到应用中,而典型的企业是依赖于底层基础设施的。因此,我们基本上在公有云中提供了相同的企业关键任务存储,这与企业本地环境是相同的。

我相信您也希望让企业更容易在混合云中运行数据库对吗?

Rajiv Ramaswami:这是关于基础设施层,也就是平台的。这与大多数应用需要使用数据库的其他组件有关,这些组件是使用缓存的,例如,使用消息传递或流媒体。这是我们的宏伟愿景,具有前瞻性。

目前,Nutanix已经提供了数据库管理服务。因此,人们可以使用我们的平台管理各种数据库,例如Oracle、SQL、Mongo、Postgres。我们想要做的就是扩展它,首先,让它在公有云中可用,然后扩展服务范围。

因此,我们可以管理Kafka流或Redis进行缓存。展望未来,我们的想法是,我们要么自己提供,要么与外部合作。我们对EDB Postgres有很多了解,能够提供一系列所谓的平台层数据服务,人们可以使用这些服务来构建应用。一旦我们这样做了,这些服务就将是随处可用的。

这些数据库服务未来会包括矢量数据库吗?

Rajiv Ramaswami:愿景是很广泛的。我们没有涵盖了一切事情的路线图。我现在专注于事务型数据库。而且,我知道人们关注什么,AI和GPT in a Box。所以,绝对是的——但从长远来看,我们还没有宣布时间表或类似的东西,我们的愿景是真正打造一套随处可用的服务。

我们不是数据库引擎提供商。是的,我们可能会选择在未来某个时候这样做,但目前我们是和其他数据库提供商合作的。

无论客户的数据位于何处,您都会为客户存储大量信息,在本地环境或者是任何公有云中。大型语言模型将需要这些信息,检索增强生成(RAG)会为其提供帮助。您将采取什么措施来帮助实现这一目标?

Rajiv Ramaswami:我不会宣布新的路线图,但愿景是正确的。

这正是我们的目标。正如您所说的,我们的数据是可用的,我们可以成为管理数据的平台,我们确实认为数据将无处不在——不仅仅是在公有云中,也不仅仅是在本地环境中,而整个GPT in a Box的推出,正是为了尝试简化我们平台上AI应用的部署。

目前,这个范围稍微有限一些,也就是说,我们有一个平台,为我们提供所有存储的部分。最重要的是,我们能够提供的是自动工作场所连接到模型存储库,这样我们就可以接入Hugging Tree,可以连接到即时存储库。只需单击一下,人们就可以下载他们想要的模型,在硬件上实例化,并将其与GPU连接。...创建一个推理端点并将其导出到API进行开发——这样人们就可以实现自动化。

好的,这将承载AI推理和微调,那么训练方面怎么样?因为还是那一点,你有大量的信息,你会把哪些信息给到GPU?

Rajiv Ramaswami:GPU Direct在我们的路线图上,我们将拥有GPU Direct,特别是针对文件——这才是你真正需要GPU Direct的地方,它已经在路线图上了——我们知道需要什么。另一个需要的是高带宽I/O。我们现在支持100千兆NIC。显然,你需要能够非常快速地获取大量数据。我们理解这一点,我们正在实现这一点,我们正在做高带宽,然后是一台具有大内存的机器,所有这些都将发挥作用。

您认为AI推理必须提供准确的、完整的、不是虚假的结果吗?

Rajiv Ramaswami:当然。你需要在模型中保持准确性,当然,要确保这种准确性,就需要大量的工作。

生成式AI有很多早期用例都是辅助用例……也就是我们广义上所说的Copilot。换句话说,使用它,但在实际使用之前要对其进行验证。所以我给你举一个我们内部使用的例子,是在客户支持方面的。

我们使用我们的设计文档和知识库文章部署了模型。当支持工程师收到客户请求的时候,他或她会将其输入到我们的GPT引擎中,它会提出建议,比如“这可能是这里的问题,这是你可能想要做的。”它加快了我们的响应时间,提高了我们支持工程师的工作效率,这样就可以更好地为客户服务,这对我们来说也是更好的。

而且效果很好。我们刚刚为他们完成了试点,但我们在这里要做的最重要的事情是继续训练和微调,直到我们能够获得合理的准确性。

我的想法是,总的来说,RAG方法绝对必须有效,否则AI推理就会消亡。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

广东博众投资大阳智投的投顾服务... 广东博众投资大阳智投的投顾服务,股民缴费被骗赶紧这样退款!广东博众投资正规吗?广东博众投资靠谱吗?广...
全新淘金app登录不上了亏损的... 全新淘金app登录不上了亏损的钱能退吗?找大卫可以追回亏损,维权流程公布!拇指订购APP、全新订购A...
我去!马斯克都转发了 这周末两天,在上海浦东嘉里城参加一年一度的雪球嘉年华,还和不少知道我来上海的粉丝,线下见了面聊了聊。...
CRS全球征税包含哪些国家和地... 在经济全球化与资本跨境流动日益频繁的背景下,跨境逃避税问题成为各国税收征管的共同挑战。为破解这一难题...
九方智投服务费能退吗怎么退?推... 九方智投服务费能退吗怎么退?推垃圾股导致亏损,退费成功经验公开什么是投顾?为客户提供投资建议比如:买...
原创 通... 一支年涨幅已超9倍的龙头股,今日在A股中显得格外醒目,股价盘中创下466.66元的历史新高。 12月...
首次突破4400美元,现货金价... 来源:中国黄金网 12月22日,伦敦现货金价强势拉涨,于12:55左右首次突破4400美元/盎司历史...
慧研智投荐股可靠不误导性宣传把... 投资本是一场自我的修行,只有起点,没有终点。切洋葱的时候你总是闭着眼睛,以为这样就不会流眼泪了,但当...
盈盈订购APP虚假宣传与非法期... 盈盈订购APP虚假宣传与非法期货交易亏的钱怎么退回?可以维权追回输的钱,快速退费流程!掌上银牛APP...
杭州高能云(高能智投)超详细退... 杭州高能云(高能智投)超详细退费攻略来袭!已退款!误导性宣传!在监管的灰色边缘,众多投资顾问依然疯狂...