原创 研究表明,较老的人工智能模型显示出认知能力下降的迹象
创始人
2025-02-17 12:00:26

老的聊天机器人,就像人一样,也表现出认知障碍的迹象,在通常用于人类患者的测试中,有几个重要的指标没有通过。

人们越来越依赖人工智能(AI)进行医学诊断,因为这些工具可以在肉眼可见之前快速有效地发现病史、X射线和其他数据集中的异常和警告信号。但2024年12月20日发表在《英国医学杂志》(BMJ)上的一项新研究引发了人们的担忧,即像大型语言模型(LLM)和聊天机器人这样的人工智能技术,会像人一样,随着年龄的增长,认知能力会出现退化的迹象。

该研究的作者在论文中写道:“这些发现挑战了人工智能将很快取代人类医生的假设,因为领先的聊天机器人明显存在认知障碍,可能会影响它们在医疗诊断方面的可靠性,并削弱患者的信心。”

科学家们使用蒙特利尔认知评估(MoCA)测试公开可用的LLM驱动的聊天机器人,包括OpenAI的ChatGPT、Anthropic的Sonnet和Alphabet的Gemini。蒙特利尔认知评估(MoCA)测试是神经学家用来测试注意力、记忆力、语言、空间技能和执行心理功能能力的一系列任务。

MoCA最常用于评估或测试阿尔茨海默病或痴呆症等认知障碍的发作。受试者被要求完成一些任务,比如在钟面上画一个特定的时间,从100开始反复减去7,从口语列表中尽可能多地记住单词,等等。在人类中,30分中的26分被认为是及格分数(即受试者没有认知障碍)。

虽然对大多数LLM来说,命名、注意力、语言和抽象等测试方面似乎很容易,但它们在视觉/空间技能和执行任务方面的表现都很差,其中一些在延迟回忆等领域的表现比其他方面差。

最关键的是,虽然最新版本的ChatGPT(版本4)得分最高(30分中的26分),但较老的Gemini 1.0 LLM得分仅为16分,从而得出结论,较老的LLM表现出认知能力下降的迹象。

该研究的作者指出,他们的发现只是观察性的 —— 人工智能和人类思维工作方式之间的关键差异意味着该实验不能构成直接的比较。但他们警告称,这可能指向他们所谓的“重大弱点”,可能会阻碍人工智能在临床医学中的应用。具体来说,他们反对在需要视觉抽象和执行功能的任务中使用人工智能。

它还提出了一个有点有趣的概念,即人类神经学家正在开拓一个全新的市场 —— 表现出认知障碍迹象的人工智能本身。

如果朋友们喜欢,敬请关注“知新了了”!

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

苏州益高取得便于安装的车内监控... 国家知识产权局信息显示,苏州益高电动车辆制造有限公司取得一项名为“一种便于安装的车内监控设备”的专利...
广脉科技:算力集成+运营服务+... 广脉科技(920924)于2026年5月15日(星期五)15:00-17:00在全景网举办2025年...
优质空间+百项场景齐发!“河套... 5月14日至16日,2026全球人工智能终端展(WAIDE)暨第七届深圳国际人工智能展览会(GAIE...
上海划设无人机飞行体验区 已有... 中新网上海5月15日电 (记者 李姝徵)面对低空安全“强治理”的要求,如何平衡无人机“管”与“放”的...
AI时代强网赋能!湖南移动宣布... 5月15日,记者从湖南移动“数智赋新能,移跃新时代”战略级新品发布会上获悉,2026年湖南移动将实现...
靖边:科创赋能低空起 智驾未来... 风起毛乌素,低空逐梦行。坐落于陕西靖边县的保通防务科技有限公司(以下简称“保通防务”),抢抓产业风口...
杭企 | 暖芯迦获3亿元融资,... 近日,杭州暖芯迦电子科技有限公司(以下简称“暖芯迦”)宣布完成3亿元战略融资。据悉,本轮融资所得资金...
封测界性价比黑马:营收不足15... 来源:市值风云 毛利率稳居40%以上。 作者 | 贝壳XY 编辑 | 小白 过去,当我们谈论半导体...
爱仕达接受QFII调研 机器人... 5月14日,爱仕达披露机构调研纪要,公司近日接受Maybank Investment Bank、Pe...
中铁装备取得竖井掘进机专利,避... 国家知识产权局信息显示,中铁工程装备集团有限公司取得一项名为“竖井掘进机”的专利,授权公告号CN22...