中国电信网络大模型数据集入选国家数据局高质量示范案例
创始人
2025-09-15 14:01:08

记者9月15日从中国电信获悉,近期,国家数据局发布首批104个具有推广示范价值的高质量数据集典型案例,中国电信申报的“网络大模型高质量数据集”从663个案例中脱颖而出。这是继今年5月荣膺国务院国资委首批30项高质量数据集优秀建设成果后,中国电信在该领域取得的又一成果,充分彰显了在推动数字经济高质量发展中领军企业的责任与担当。

上证报中国证券网讯(记者 王子霖)记者9月15日从中国电信获悉,近期,国家数据局发布首批104个具有推广示范价值的高质量数据集典型案例,中国电信申报的“网络大模型高质量数据集”从663个案例中脱颖而出。这是继今年5月荣膺国务院国资委首批30项高质量数据集优秀建设成果后,中国电信在该领域取得的又一成果,充分彰显了在推动数字经济高质量发展中领军企业的责任与担当。

中国电信网络大模型高质量数据集旨在精准破解大模型在通信行业落地应用时面临的通用性与专业性鸿沟、知识冲突与幻觉、深度数据匮乏等核心挑战。网络大模型通过构建科学体系化的高质量数据集,为云网运营的全面AI化及自智水平提升奠定了坚实的数据基石,不仅显著赋能企业自身发展,更惠及广大行业客户,有力促进了产业链的协同共进。

中国电信网络大模型高质量数据集以“5+2”云网知识体系为坚实基础,以组织、流程、运营和安全为四大支柱,确立了科学体系化的建设方法。通过深度整合通信领域多源复杂数据,打造了6TB大规模、高质量、多模态领域数据集,并构建数百个场景化知识库。统一建设的启明知识管理平台提供高效的数据集加工工具、分钟级建库工具、精准数据增强服务及动态管理能力,知识增强服务检索量已突破千万次,准确率稳定在90%以上。

在技术层面,网络大模型团队融合多源智能解析、动态清洗、多级去重及数据合成等先进技术,研发出高精度的隐私保护算法与高效的知识图谱流水线。首创的SIE(来源-索引-编码)分层建库技术,实现了多模态数据的分钟级建库入库;创新的多模态混合检索架构及重排序技术,显著提升了隐性知识发现效率与召回准确率,构建起通信行业高质量数据治理的典范。

网络大模型高质量数据集首创SIE分层建库技术,打通实时数据与大模型动态交互链路;依托“5+2”知识体系,实现数据精准治理与高安全性知识转化;创新性构建了“生产-规划-采集-加工-应用-评估-反馈”的全生命周期闭环运营模式,建立了从集团到省公司的多级协同机制,保障了数据集的持续优化与价值释放。通过职责分工、质量追溯、周期联动等创新管理手段,确保了数据集的动态更新与高质量维护,有力支撑了数百个知识库的高效稳定运行。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

江苏知识产权数智创新赋能中心揭... 江南时报讯(记者 邓雯婷) 2月9日,在2026年紫金山创投大会上,江苏知识产权数智创新赋能中心(下...
原创 宁... 宁波银行董事会换届:陆华裕时代落幕,新班子如何掌舵3万亿资产? 在马年春节前夕,宁波银行迎来了一场备...
传媒热门股,遭机构及外资同时抛... 今日(2月10日)A股三大指数涨跌不一,上证指数收于4128.37点,上涨0.13%;深证成指涨0....
“购在中国 年味天府”百家场景... 红星新闻网(记者 宋雅婷)2月10日报道2月10日晚,“购在中国 年味天府”百家场景乐购新春活动在灯...
格力电器获得发明专利授权:“取... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“取液...
腾讯混元推出0.3B端侧模型 ... 2月10日,腾讯混元宣布正式推出一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,等效参...
穹彻智能完成A轮融资,将投入具... 转自:贝壳财经 新京报贝壳财经讯(记者张晓慧)2月10日,具身智能企业穹彻智能宣布,公司于近日完成A...
提速48倍!全国首个AI电力评... 项目预审进入“分钟时代” 作者/ IT时报 孙妍 编辑/ 郝俊慧 孙妍 凌晨两点,灯火通明的办公室内...
北海银滩VR体验馆开幕!从海底... 🤖 由 文心大模型 生成的文章摘要 前文介绍了北海银滩大国重器体验馆正式对外开放,馆 2026年...
向新而行,以质致远,平安消费金... 于2026年初的时点回看,2025年是凝心聚力、开拓奋进的一年。众多消费金融机构积极呼应发展新质生产...