我国首部大模型国家标准实施，填补技术评价体系空白_资讯

我国首部大模型国家标准实施，填补技术评价体系空白

创始人

2025-12-26 20:20:51

新京报讯据市场监管总局消息，近日，GB/T 45288《人工智能大模型》系列国家标准正式实施，标志着我国大模型产业进入“科学权威、统一规范”新阶段。作为首部聚焦通用大模型的国家标准，该系列填补了技术评价体系空白，明确性能、安全与服务能力要求，配套评测能力已获中国合格评定国家认可委员会（CNAS）认可。

基于此构建的“求索”-LMBench评测基准，整合方法、数据集与自动化平台，成为行业公认的“能力标尺”。评测体系已形成主流大模型白名单，为央企、国企选型提供依据，并支撑中石化、南方电网等建设行业大模型，完成对华为盘古、讯飞星火、中国移动九天等模型的场景验证。

截至目前，标准工具完成千余项评测任务，调用大模型超95万次，精准识别幻觉控制、内容安全等共性问题，助力近30家厂商技术迭代，推动形成“研发—评测—应用—升级”闭环。

标准国际化同步推进。面向东盟编制英语、老挝语、高棉语版本，填补区域空白；我国开源模型架构已被新加坡等国项目采用，彰显标准引领下的全球影响力。

编辑张磊

上一篇：北京铭记文化传播有限责任公司短剧上映分红靠谱吗？？短剧投资是正规可靠的吗？短剧上映分红真有几倍收益吗？短剧份额分红真的可以赚钱吗？？

下一篇：美在途中（厦门）网络科技有限公司短剧份额投资分红靠不靠谱？？短剧投资是真的假的？承诺高票房高分红只为骗你投资还是真的可以赚钱？？

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

我国首部大模型国家标准实施，填补技术评价体系空白

相关内容

热门资讯