压缩算法为大语言模型“瘦身”
创始人
2024-11-22 14:21:35

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。(记者刘霞)

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

众多电池新科技亮相深圳国际电池... 深圳5月16日电 (记者 王坚)以“链动全球·赋能绿色·驱动未来”为主题的第十八届深圳国际电池技术交...
面对称可回收液体火箭完成低空飞... 5月14日下午,由中山大学航空航天学院吴志刚教授团队研制的“逸仙-3号”面对称可重复使用火箭,在广东...
宁波银行业绩说明会,管理层最新... 【导读】宁波银行业绩说明会来了!管理层回应净息差、中收表现及董事会换届等问题 中国基金报记者 马嘉昕...
市工商联赴八一农垦大学开展校企... 为深化校地企合作、促进科技创新与产业创新,赋能现代农业与民营经济发展,5月13日-14日,市委统战部...
「数据看盘」游资、量化抢筹多只... 龙虎榜方面,机器人概念今日逆势走强,其中三丰智能获两家量化资金(开源证券西安太华路、华鑫证券上海陆家...
全线跳水,超15万人爆仓 来源:第一财经 5月16日晚,加密货币市场全线跳水,截至发稿,比特币、以太坊大跌超3%,比特币报78...
金价暴跌 当地时间15日,受美元指数上涨等因素影响,国际金价和白银价格均下跌。截至收盘,纽商所6月交割的黄金期...
原创 帮... 各位朋友,如果最近你觉得地上的生意有点卷,那不妨把目光投向天空——不对,是太空!因为商业航天赛道,正...
千名企业家齐聚深圳,王传福:中... 5月15日,2026仰望商业研究院千人大会在深圳大运中心体育馆成功举行。据了解,此次“千人大会”会聚...
俄外长:俄罗斯认真履行对华能源... 【俄罗斯外交部长谢尔盖·拉夫罗夫表示,俄罗斯正在履行向中国供应能源的所有义务,莫斯科和北京存在广泛的...