航天信息申请大语言模型专利,有效提高调整后的大语言模型的性能
金融界
2024-01-14 19:30:11

原标题:航天信息申请大语言模型专利,有效提高调整后的大语言模型的性能

金融界2024年1月13日消息,据国家知识产权局公告,航天信息股份有限公司申请一项名为“一种大语言模型训练方法、装置及相关设备“,公开号CN117390450A,申请日期为2023年10月。

专利摘要显示,本申请提供了一种大语言模型训练方法、装置及相关设备,通过获取预训练大语言模型;采用初始微调数据集对预训练大语言模型进行微调,得到微调大语言模型;基于提问数据以及答复数据构建优化微调数据集,答复数据是由微调大语言模型输出的针对提问数据的答复数据;利用优化微调数据集,对微调大语言模型进行迭代优化,获得训练好的大语言模型。本申请的这种大语言模型训练方法,基于用户的使用反馈,不断迭代优化微调大语言模型的方法,在迭代优化微调大语言模型的过程中产生了大量的数据对优化数据集进行调整,可以有效的减少训练及优化过程使用的样本数据获取的成本,并有效提高调整后的大语言模型的性能。

来源:金融界

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

原创 真... 千呼万唤始出来!OPPO年度顶级影像旗舰 ——Find X9 Ultra的真机谍照,终于在今日(4 ...
AI复活9岁女儿在数据世界读书... (来源:JSTV荔枝视频) 转自:JSTV荔枝视频 #妈妈不知儿子去世跟AI儿子聊了1年#【#AI复...
歌尔科技申请手语翻译方法专利,... 国家知识产权局信息显示,歌尔科技有限公司申请一项名为“手语翻译方法、可穿戴设备及可读存储介质”的专利...
为什么检查没问题却一直耳鸣?朱... 很多耳鸣患者都有一个共同困惑:明明去医院做过检查,被告知“没什么大问题”,但耳鸣却一直存在,甚至越来...
神舟二十一号航天员在轨工作超五... 4 月 5 日消息,中国载人航天工程办公室今日发布新一期天宫 TV,神舟二十一号航天员乘组张陆、武飞...
2026世界互联网大会亚太峰会... 4月13日至14日,2026年世界互联网大会亚太峰会将在香港举办,主题为“数智赋能创新发展——携手构...
特斯拉D3芯片亮相,专为太空算... 来源:市场资讯 (来源:IT之家) IT之家 4 月 5 日消息,据 not a tesla app...
点不到外卖的加拿大留子,想在欧... 出品|虎嗅商业消费组 作者|周月明 编辑|苗正卿 题图|饭团 国内外卖战场,硝烟未散。2025年,美...
阿里Qwen3.6-Plus,... Anthropic前段时间出了一份《2026 Agentic Coding Trends Repor...
宁夏锦华化工取得降低单耗的破料... 国家知识产权局信息显示,宁夏锦华化工有限公司取得一项名为“一种降低单耗的破料系统”的专利,授权公告号...