我国首部大模型国家标准实施,填补技术评价体系空白
创始人
2025-12-26 20:20:51

新京报讯 据市场监管总局消息,近日,GB/T 45288《人工智能 大模型》系列国家标准正式实施,标志着我国大模型产业进入“科学权威、统一规范”新阶段。作为首部聚焦通用大模型的国家标准,该系列填补了技术评价体系空白,明确性能、安全与服务能力要求,配套评测能力已获中国合格评定国家认可委员会(CNAS)认可。

基于此构建的“求索”-LMBench评测基准,整合方法、数据集与自动化平台,成为行业公认的“能力标尺”。评测体系已形成主流大模型白名单,为央企、国企选型提供依据,并支撑中石化、南方电网等建设行业大模型,完成对华为盘古、讯飞星火、中国移动九天等模型的场景验证。

截至目前,标准工具完成千余项评测任务,调用大模型超95万次,精准识别幻觉控制、内容安全等共性问题,助力近30家厂商技术迭代,推动形成“研发—评测—应用—升级”闭环。

标准国际化同步推进。面向东盟编制英语、老挝语、高棉语版本,填补区域空白;我国开源模型架构已被新加坡等国项目采用,彰显标准引领下的全球影响力。

编辑 张磊

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

绿色挖矿与区块链钱包:低碳时代... 在 “双碳” 目标与全球环保意识觉醒的背景下,区块链行业正加速摆脱 “高能耗” 标签。绿色挖矿凭借可...
美股三大股指早盘涨跌不一 12月26日早盘,美股三大股指涨跌不一。北京时间22时35分,道指下跌0.07%,纳指上涨0.16%...
浦发银行:对信达资产集团等五家... 来源:滚动播报 (来源:北京商报) 北京商报讯(记者 宋亦桐)12月26日,浦发银行发布公告称,根据...
最新!盈盈订购app亏钱了怎么... 白银现货平台骗局大起底:高收益背后的财富陷阱与维权实战”在抖音、今日头条等平台打广告的顶点订购app...
汇正财经投资选股可靠吗误导性宣...  汇正财经投资选股可靠吗误导性宣传骗取股民服务费!退款其实很简单!上海汇正财经顾问有限公司不靠谱可以...
上海海能投顾给股民虚假宣传诱导... 上海海能投顾给股民虚假宣传诱导,指导股民炒股亏钱,忽悠买的荐股服务被坑退费成功!那些疯狂拉群洗脑的营...
新消费观察 | 多维度适配消费... 精准功效、性价比平衡、消费结构变化等关键词正在逐渐成为当前中国美妆市场发展的聚焦方向,而越来越快的更...
指南针股票准不准收取25800... 指南针擒龙版值得购买吗?退款流程详解及注意事项如下!被忽悠交费不给好票亏损不断可退费!大家能在指南针...
福州大学发布《福建省上市公司智... 转自:新华财经 2025年12月25日上午,《福建省上市公司智力资本信息披露评价报告(2025)》发...
注意!珍牛订购APP亏钱了怎么... 白银现货平台骗局大起底:高收益背后的财富陷阱与维权实战”在抖音、今日头条等平台打广告的顶点订购app...