腾讯公布大语言模型训练专利:可提高模型的准确性
创始人
2025-02-08 15:21:33

【CNMO科技消息】据CNMO了解,2月7日,腾讯科技(深圳)有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利正式公布。这一技术通过在模型训练中引入多重摘要文本的对比学习机制,显著提升了模型的泛化能力与生成准确性,为AI语言处理领域提供了新的方向。

根据专利摘要,腾讯的新方法创新性地引入“第一摘要文本”与“第二摘要文本”,两者信息量不同且前者包含正确与错误语句的混合。模型通过对比这两种摘要,学习区分正确与错误表达,同时减少单一数据源导致的过拟合问题。这种设计不仅扩展了模型的学习维度,还通过动态调整优化了生成结果的可靠性。

CNMO注意到,该方法与近年来对比学习在文本摘要领域的应用趋势相契合。此前研究显示,对比学习通过构造正负样本调整模型表示空间,已在提升摘要质量、缓解暴露偏差等方面取得成效。腾讯此次将对比学习框架融入大语言模型训练,进一步拓展了该技术的应用边界。

有媒体分析称,腾讯的专利通过多样化摘要文本及对比机制,为模型提供了更贴近真实应用的学习环境,尤其对智能客服、内容生成等需高精度输出的领域具有直接意义。此外,该技术或能加速大模型落地进程。例如,在短文本对话场景中,腾讯曾推出基于混合注意力机制的对话模型专利,若结合新训练方法,有望进一步提升回复的相关性与丰富性。

可以看到,腾讯近年来在大语言模型领域动作频频,从2023年的微调方法专利到此次训练框架创新,显示出其全链条技术布局的野心。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

良信电器申请混合式固态开关装置... 国家知识产权局信息显示,良信电器(海盐)有限公司、上海良信电器股份有限公司申请一项名为“一种混合式固...
医疗小程序开发服务商梳理 场景... 导语:医疗行业数字化转型加速,医疗小程序开发成为医院、药企、健康管理机构等提升服务效率的核心工具。基...
2026年陕西省科学实验展演活... 为广泛普及科学知识、阐释科学原理、传播科学故事、弘扬科学家精神,近日,省科技厅、省教育厅、省科协将联...
涨的是车价,要的是老命 来源:市场资讯 (来源:虎嗅APP) 出品|虎嗅汽车组 作者|邢书博杨杰 题图|视觉中国 2026...
浅谈微博社会榜内容传播 日常浏览微博不难发现,平台内有着各类细分内容榜单,其中社会榜区别于娱乐资讯、数码好物等内容榜单,主要...
坐在马斯克和库克中间的女人 【留美学子】第3804期 13年国际视角精选 仰望星空·脚踏实地 【 陈 屹 视 线 】 教 育 ·...
天玑技术+生态双轮驱动,联发科... 5 月 13 日,联发科天玑开发者大会 2026(MDDC 2026)正式举办。本届大会以“全域芯智...
临港“零界魔方”下月举办OPC... 2026上海超级个体(OPC)经济大会(简称“OPCX 2026”)暨零界魔方焕新生态发布会将于6月...
荣耀600系列发布会定档5月2... 【CNMO科技消息】5月14日,荣耀正式官宣全新数字系列新品——荣耀600系列,并宣布新机将于5月2...
推荐iPhone 17,主要是... 推荐iPhone 17,主要是因为它这次升级很实在,性价比高!标准版4499元起,用上了A19芯片,...