国内首张大模型高阶通用能力测试证书颁发
创始人
2026-01-07 13:41:22

近日,在海南省海口市举办的全国信标委人工智能分委会“标准周”活动期间,国内首张大模型高阶通用能力国家标准符合性测试证书正式颁发,标志着我国大模型高阶通用能力评测实现标准化落地,为大模型产业规范化发展树立了关键里程碑。

为破解大模型高阶能力评测缺乏统一标准的行业痛点,中国电子技术标准化研究院于2025年9月启动“求索”大模型高阶通用能力测试工作。其中,大模型高阶通用能力聚焦复杂逻辑处理、代码应用实践、多模态交互等产业核心需求场景,构建了涵盖深度推理与复杂问题求解(含数学推理、图表推理)、代码理解与生成(含意图优化、多语言代码生成)、多模态理解与生成(含行为识别、视频问答、文本生成视频等)的全维度评测框架。测试全过程严格遵循国家标准GB/T 45288.2-2025《人工智能 第2部分:评测指标与方法》,通过科学量化的指标体系,确保评测结果的权威性、公正性与可比性,为行业提供了清晰的技术发展导向。

中国电信自主研发的星辰语义大模型依托国产算力与训练框架研制,是国内唯一全国产、全尺寸、全开源的基础大模型。模型训练攻克国产万卡集群长稳训练技术难题,国产万卡集群利用率高达98%,训练效能较英伟达同等算力达93%。模型综合能力达到业界较高水平,当前已成功研发的多款核心基础模型中,2025年上半年的TeleChat2.5系列35B、115B模型综合能力表现优异,2025年12月TeleChat3-105B正式开源,为国内首个全国产化训练的千亿参数细粒度 MoE模型,同步开源稠密参数模型TeleChat3-36B,综合能力在MMLU-Pro、Math-500等多项权威评测基准中位列同等规模参数开源模型TOP3。模型竞争力获得行业广泛认可,开源社区累计下载量超50万次,斩获中国通信学会《2024年度十大科技进展》、2025世界人工智能大会卓越人工智能引领者奖(SAIL奖)等多项权威荣誉。

目前星辰系列语义大模型已实现规模化应用,全面支撑了各类toC、toH和产数类项目的交付。toC、toH方面,包括星小辰、AI眼镜、云智手机在内的多款产品中,上线了意图理解、AI代接、自由对话等多项自主研发能力,在实际业务中为用户带来了较好的交互体验。产数业务在电信集团内部的知识采编、通信助理、数字人客服等场景落地,覆盖全国31省,对外赋能中车、国能、航天等企业,真正推动芯片、模型、应用全链条自主可控,全面提升了我国在通用人工智能领域的自主创新能力。(记者 董芳忠)

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

【深圳市鑫富祥网络科技有限公司... 随着黄金白银等贵金属价格暴涨,贵金属投资的浪潮席卷而来,其中白银现货交易凭借“高杠杆”和“全天候交易...
【上海充满期待网络科技有限公司... 随着黄金白银等贵金属价格暴涨,贵金属投资的浪潮席卷而来,其中白银现货交易凭借“高杠杆”和“全天候交易...
【上海迪志计算机科技有限公司】... 随着黄金白银等贵金属价格暴涨,贵金属投资的浪潮席卷而来,其中白银现货交易凭借“高杠杆”和“全天候交易...
北京国华复文化传媒有限公司短剧... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。短剧投资靠不靠谱?...
北京瑞诗宁影视传媒短剧上线分红... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。短剧投资靠不靠谱?...
股掌柜证券咨询可靠吗引诱暗示交... 股掌柜证券咨询可靠吗引诱暗示交费!夸大收益遭陷阱可退费!申请退款流程如下股掌柜证券不可信,推荐的股票...
App不得频繁索要个人信息权限... 为规范互联网应用程序个人信息收集使用活动,保护个人信息权益,促进个人信息合理利用,根据相关法律法规,...
老董内部实战交流群短剧份额认购... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。短剧投资靠不靠谱?...
《以身入局》短剧收益权转让需要... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。短剧投资靠不靠谱?...
万隆证券收费9800元可靠吗所...   万隆证券收费3888元可靠吗?虚假宣传欺诈消费者荐高位股!误导性宣传坑惨股友!专业人士教你一招退...