延续近期中国电信在AI领域多项榜单及赛事行业领先的势头,由中国电信自研的多模态大模型TeleMM-2.0,近日在最新公布的国际榜单中排名第三,成果涵盖语音、语义、多模态等多项大模型能力以及自研算法,充分展现其在AI技术研发领域的领先实力。
多模态理解摘金夺银 落地多类应用场景
1月10日,最新MMLongBench-Doc长文档理解榜公布,TeleMM-2.0排名第三;此前公布的OCRBench v2榜单中,TeleMM-2.0系列模型列中文榜第一、英文榜第二;在最新的OpenCompass多模态榜单中,TeleMM-2.0-Thinking位居总榜第二。
据介绍,MMLongBench-Doc是用于评估长上下文文档理解能力的基准测试;OCRBench v2专注于评估大型多模态模型在视觉文本定位和推理方面能力;OpenCompass则通过多维度指标体系评估语言及多模态模型的综合能力。
该模型在多项榜单取得优异成绩,得益于其团队构建的坚实数据引擎、强大训练框架,和精准的能力强化策略,并以智传网(AI Flow)理论为基础,实现了在文本/视觉 OCR 和多模态长文档理解任务中的卓越表现。
在实际应用落地层面,TeleMM-2.0可显著加速推理效率,实现快速部署应用,为企业和个人用户提供标准化接口,在跨学科推理、数学计算、表格图表分析、空间推理中均表现出业界领先的模型能力,现已落地政务、工业、交通等多类应用场景,提供高效、可靠的多模态智能解决方案。
语义语音屡创佳绩 实现换位思考共情表达
语义赛道方面,中国电信自研的星辰语义大模型TeleChat-Thinking在OpenCompass总榜排名国内第五、全球第八。作为国内首个全国产化训练的千亿参数细粒度MoE语义大模型,TeleChat3-105B-A4.7-Thinking此前已正式开源,其基础模型训练数据超15T,专家稀疏比处于业界前列。
语音领域顶级会议ICASSP2026近日发起HumDial类人语音对话系统挑战赛,在情感智能赛道中,星辰大模型基于此前提出的超拟人语音对话大模型GOAT-SLM,结合注入式情感归因思考(Injected Emotional-Attribution Thinking,IEAT)数据构造策略,形成了一套面向情感理解与共情生成的统一建模方案,从100余支全球顶尖报名参赛队伍中脱颖而出,一举夺得冠军。
借助超拟人语音对话大模型,训练团队不仅实现内容理解,更让模型通过语气、语速、说话人特征等信息,进一步捕捉语音背后的情绪。而透过注入式情感归因思考,模型更可提前分析,将情绪状态和情绪诱因注入思考过程,如同实现人与人对话时的换位思考,学会共情。不仅如此,模型还同时学习生成文本回复和语音回复,写出共情的文字,用合适的语气、情绪表达出来——比如安慰时语调放缓,鼓励时语气坚定,确保文字有温度,语音有情绪。
星辰大模型由中电信人工智能科技有限公司与中国电信人工智能研究院(TeleAI)自主研发,覆盖语义、语音、视觉、多模态四种核心能力,是央企首个“全模态、全尺寸、全国产”的“三全”大模型体系。
自研算法全球第四 认知智能复杂推理获突破
全球数据库与人工智能领域权威评测基准BIRD(Big Bench for Large-scale Database Grounded Text-to-SQL Evaluation)日前公布最新榜单,中国电信旗下星海大数据AI技术团队自主研发的“智文灵思Agent算法”以全球第四的成绩脱颖而出。
这标志着中国电信在认知智能、复杂逻辑推理等AI核心技术上取得重大进展,展现出央企在通用人工智能(AGI)前沿赛道已具备与国际顶尖科技企业同台竞技的硬核实力。
据了解,BIRD基准由达摩院、香港大学等顶尖机构联合发起,被业界誉为Text-to-SQL领域的“奥林匹克”。该基准摒弃理想化实验环境,着重考察模型在应对海量异构数据、复杂跨表关联查询及高噪声干扰等实际挑战时的综合实战能力。
面对“语义歧义消解”与“复杂逻辑泛化”等行业共性难题,“智文灵思Agent算法”构建全链路语义锚点引擎,打造异构混合专家系统, 并引入前沿智能体闭环架构,让算法代码实现自主进化。
目前,该算法已全面集成于中国电信旗舰级知识中枢产品——“星海智文”平台。平台摒弃简单的文档问答模式,立足于“企业级人机协同”的深度需求,为政企客户提供安全、可控、自主的智能底座。(记者 张颖洁)