腾讯混元推出0.3B端侧模型 内存占用仅600MB
创始人
2026-02-11 05:01:42

2月10日,腾讯混元宣布正式推出一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,等效参数量仅有0.3B,内存占用仅600MB。

据介绍,通过对此前混元的小尺寸语言模型——HY-1.8B-Instruct进行 2 比特量化感知训练(QAT)产出,这一模型对比原始精度模型等效参数量降低了6倍,并且在沿用原模型全思考能力同时,在真实端侧设备上对比原始精度模型生成速度提升2—3倍,可大幅提升使用体验。此次腾讯混元推出HY-1.8B-2Bit模型,可以在边缘设备上无压力部署。这也是首个在实现2bit产业级量化的端侧模型实践。

随着大语言模型普及,如何将模型在比如手机、耳机或者智能家居设备应用,成为业界难题,尤其不少应用对模型的离线部署、私密性等都有更高的需求,这就需要更多能够在端侧运行的又小又强的模型。

腾讯混元表示,端侧部署的展开,本质上是一条在“小而精,快而准”的艰难探索之路,我们既需要模型足够聪明,能应对千变万化的真实需求,又必须将它约束在极其有限的硬件资源内部署并快速推理,这就好像在给模型进行“减脂增肌,减重提质”。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

当“科普大篷车”遇上寒假托管 ... 科普不再遥远,文化就在身边。这个寒假,四平市科技馆把生动有趣的科学课堂“搬”进了市中小学社会实践教育...
微信官方多开有戏了!PC版灰度... 微信多开一直是不少用户的刚需。一个人同时使用个人号、工作号早已是常态,但无论是手机端还是电脑端,微信...
萝卜快跑携手Uber:2026... 自动驾驶领域迎来重要进展,萝卜快跑与全球出行巨头Uber联合宣布,双方计划于2026年第一季度在阿联...
马斯克xAI再失一员大将!联合... 马斯克旗下人工智能初创公司xAI再失一名联合创始人。 2月10日,吴宇怀(Tony Wu)在社媒上发...
AI大战烧到小红书:内测AI视... 来源:市场资讯 (来源:每日经济新闻) 春节AI大战的战火,终究还是烧到了小红书。 2月10日,《每...
江苏知识产权数智创新赋能中心揭... 江南时报讯(记者 邓雯婷) 2月9日,在2026年紫金山创投大会上,江苏知识产权数智创新赋能中心(下...
原创 宁... 宁波银行董事会换届:陆华裕时代落幕,新班子如何掌舵3万亿资产? 在马年春节前夕,宁波银行迎来了一场备...
传媒热门股,遭机构及外资同时抛... 今日(2月10日)A股三大指数涨跌不一,上证指数收于4128.37点,上涨0.13%;深证成指涨0....
“购在中国 年味天府”百家场景... 红星新闻网(记者 宋雅婷)2月10日报道2月10日晚,“购在中国 年味天府”百家场景乐购新春活动在灯...
格力电器获得发明专利授权:“取... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“取液...