TensorRT LLM加速Gemma!NVIDIA与谷歌牵手,RTX助推AI聊天
微型计算机杂志
2024-02-23 00:44:33

原标题:TensorRT LLM加速Gemma!NVIDIA与谷歌牵手,RTX助推AI聊天

NVIDIA今天在其官方博客中表示,今天与谷歌合作,在所有NVIDIA AI平台上为Gemma推出了优化。Gemma是谷歌最先进的新轻量级2B(20亿)和7B(70亿)参数开放语言模型,可以在任何地方运行,降低了成本,加快了特定领域用例的创新工作。

这两家公司的团队密切合作,主要是使用NVIDIA TensorRT LLM加速谷歌Gemma开源模型的性能。开源模型Gemma采用与Gemini模型相同的底层技术构建,而NVIDIA TensorRT LLM是一个开源库,用于在数据中心的NVIDIA GPU、云服务器以及带有NVIDIA RTX GPU的PC上运行时,可以极大优化大型语言模型推理。这也这使得开发人员能够完全利用全球超过1亿台数量的RTX GPU AI PC完成自己的工作。

同时,开发人员还可以在云计算服务器中的NVIDIA GPU上运行Gemma,包括在谷歌云基于H100 Tensor Core GPU,以及很快谷歌将于今年部署的NVIDIA H200 TensorCore GPU——该GPU具有141GB的HBM3e内存,内存带宽可以达到4.8TB/s。

另外,企业开发人员还可以利用NVIDIA丰富的工具生态系统,包括具有NeMo框架的NVIDIA AI Enterprise和TensorRT LLM,对Gemma进行微调,并在其生产应用程序中部署优化模型。

NVIDIA表示,先期上线支持Gemma的是Chat with RTX,这是一款NVIDIA技术演示应用,使用检索增强生成和TensorRT LLM扩展,在基于RTX GPU的本地Windows PC上为用户提供生成式AI应用的功能。通过RTX聊天,用户可以轻松地将PC上的本地文件连接到大型语言模型,从而使用自己的数据对聊天机器人进行个性化设置。

由于该模型在本地运行,因此可以快速提供结果,并且用户数据保留在设备上。与基于云的LLM服务不同,使用Chat with RTX聊天可以让用户在本地PC上处理敏感数据,而无需与第三方共享或连接互联网。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

当心!上海汇正财经交了服务费被... 当心!上海汇正财经交了服务费被骗了可以退吗?想要退费的股友请看!一分钟教你如何退款  《中华人民共和...
闻讯!柠檬订购为何一直亏损!难... 在柠檬订购被虚假宣传亏了很多钱是不是还能要回?有办法追回来!12月维权退钱流程!柠檬订购提供交易服务...
惊异』上海凯石证券炒股靠谱吗?... 惊异』上海凯石证券炒股靠谱吗?投资者被骗亏损亲身退费经历讲述!已退费!  《中华人民共和国消费者权益...
劝告!银山金牛带单大曝光!亏损... 在银山金牛被虚假宣传亏了很多钱是不是还能要回?有办法追回来!12月维权退钱流程!银山金牛提供交易服务...
举报!上海凯石证券炒股靠谱吗?... 举报!上海凯石证券炒股靠谱吗?投资者被骗亏损亲身退费经历讲述!已退费!  《中华人民共和国消费者权益...
利空!小赢淘金正规平台吗?大曝... 在小赢淘金被虚假宣传亏了很多钱是不是还能要回?有办法追回来!12月维权退钱流程!小赢淘金提供交易服务...
被骗』北京格隆汇服务费怎么要回... 被骗』北京格隆汇服务费怎么要回来?投资者被骗亏损亲身退费经历讲述!可挽回  《中华人民共和国消费者权...
留意!琼海订购不正规内幕!被骗... 在琼海订购被虚假宣传亏了很多钱是不是还能要回?有办法追回来!12月维权退钱流程!琼海订购提供交易服务...
起点订购APP贵金属投资是坑人... 起点订购APP贵金属投资是坑人的高回报诱导致血本无归亏损完了怎么退?找大卫可以追回亏损,成功退款流程...
当心!上海汇正财经内部会员值得... 当心!上海汇正财经内部会员值得购买吗?虚假承诺骗取服务费,误导性宣传坑惨股友,可处理  《中华人民共...