国内首个通过人机辩论图灵测试的大模型在上海诞生
创始人
2025-07-31 01:20:32

“如果能一键消除所有痛苦回忆,要不要按?”大屏幕上,两名服装、长相一模一样的辩手对这个涉及情感、伦理、心理学、哲学等的论题展开激烈辩论。这背后,一方是真人辩手武汉大学教师陈铭,另一方则是上海企业MiniMax提供的大模型。在7月26日举办的“2025中国·AI盛典”的辩论赛赛后投票中,42%的观众把大模型认作是人类,这表示大模型已经通过了人机辩论的图灵测试。

图灵测试是衡量机器是否具备人类智能水平的经典标准,由被誉为“人工智能之父”的图灵在1950年提出:如果一台机器在自然语言对话的过程中能“骗过”超过30%的人类参与者,那么就可以被视作具有智能。

这是国内大模型首次通过人机辩论图灵测试,不仅标志着我国在AI自然语言理解和逻辑思维方面取得重大进展,更展现了上海作为全球人工智能高地的创新实力。据了解,这位“辩手”的文本大模型学习了万亿条人类数据,而其语音大模型仅需6秒声音片段即能模拟真实人声。辩论影像则由节目组运用AI技术统一处理,100位观众仅凭辩论内容、语言风格和思维逻辑判断谁是人类。

在辩论中,模型表现亮点众多。如在论点构建中,针对“人工智能是否应拥有法律人格”等辩题,模型能快速检索法律条文、伦理案例,构建多层次论证框架;在临场应变时,面对人类辩手的即兴诘问,模型半秒内即可生成反驳话术,例如在“技术失业”议题中能结合制造业自动化数据提出“岗位结构转型”新视角;在情感渲染方面,模型通过语音合成技术模拟语气变化,在“教育公平”辩论中以富有感染力的叙述引发观众共鸣。

赛后,曾多次获得国际辩论赛冠军的陈铭发微博称:“对于推理能力的成熟程度,辩论几乎是最佳试金石。以我这次的亲身体验来看,经过针对性训练的推理大模型,辩论能力恐已超过90%的人类辩手。观点、逻辑、梗、金句、上价值,再加上极富感染力的输出,AI流畅无比,信手拈来,在语言技术上人类几乎已经没有什么自留地了。”同时,他也认为AI尚未完美,“最后的荣耀,还是在那些‘大’问题的深度思考上。对于根本性哲学思考的观点突围,AI仍力有不逮。”

上海交通大学人工智能学院院长李颉指出,该模型在辩论场景的突破为政务咨询、金融谈判等强交互领域提供了新范式。目前,MiniMax已与复旦大学合作,将相关技术应用于科技伦理审查智能体系统“一鉴”,实现伦理风险自动标注与合规性分析。

中国工程院院士、之江实验室主任王坚认为,这场图灵测试的意义,早已超越了简单的“辨别人机”。他表示:“当年的图灵测试为人工智能定了一个极具挑战的目标,今天我们看到,通过图灵测试只是人工智能的下一个新的开始。

本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有。如因无法联系到作者侵犯到您的权益,请与本网站联系,我们将采取适当措施。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

原创 A... 今日,京东在京召开媒体发布会,宣布今年京东618将于5月30日晚8点正式开启。而今年京东618最大的...
寻城记——XR解码济南大明湖西... 齐鲁晚报·齐鲁壹点 王建伟 于子洋 5月18日,国际博物馆日到来之际,山东数字文化集团推出创意视频《...
英国拟调整银行业务分离规则 据路透社5月18日报道,英国政府今日发布银行业务分离(ring-fencing)规则的拟议改革方案,...
最低月租9.9元!中国电信推出... 中国电信(资料图) 5月17日,中国电信推出系列试商用“Token套餐”,具体包括以下三部分内容: ...
广东省贸促会周部长及企业代表莅... 2026年5月16日下午,广东省贸促会周油松部长、东莞市森亿合智能包装有限公司周邦副总经理、广州同华...
A股震荡,如何布局? 5月18日,A股延续调整态势,超3000只个股收跌,有色金属、大消费、医药等板块领跌;电子、计算机等...
中山大学:构建人工智能人才培养... 近日,教育部等五部门发布《“人工智能+教育”行动计划》,提出推动人工智能人才培养与素养提升、促进人工...
华为申请通信方法和通信装置专利... 国家知识产权局信息显示,华为技术有限公司申请一项名为“通信方法和通信装置”的专利,公开号CN1220...
Odoo免费开源社区版:Odo... 地区:中国广东省东莞市 行业:电脑配件制造 已应用模块:销售、财务、库存,以及淘宝、京东、多公司...
3D硬金凭什么比黄金贵?看完终... 在黄金消费市场,你可能会发现一个有趣的现象:同样是黄金饰品,3D硬金的价格往往比传统黄金高出不少。这...