最新研究!AI的创意表现或超过人类!
蝌蚪五线谱官方
2024-01-13 11:50:06

原标题:最新研究!AI的创意表现或超过人类!

过去二十年,人工智能取得了飞跃式发展,但其成果主要集中在计算、大数据的等领域,对于需要运用创造性思维的领域,人工智能的表现并不突出,人类智能仍然占据着不可撼动的地位。但随着ChatGPT等大语言模型的推出,这一现象将要被改写了。

大语言模型是由人工智能技术驱动的自然语言处理工具,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,像真正的人类一样来聊天交流。在参加一些衡量人类创造力的测试时,人工智能的表现正越来越好。

2023年9月14日,挪威卑尔根大学、斯塔万格大学的研究人员在《科学报告》发表了一项题为《人工智能在创造性发散思维任务中仍不敌人类最佳表现》(Best humans still outperform artificialintelligence in a creative divergent thinking task)的研究。研究指出,大型语言模型AI对话机器人在创造性思维任务测试上或能超越一般人类。不过,得分最高的人类受试者依然能超过对话机器人的最佳答案。

参加测试的有ChatGPT3、ChatGPT4以及基于 GPT-3 构建的 Copy.Ai三个大型语言模型AI对话机器人,还有人类。AI和人类被试都被要求在30秒内想出四种物体(绳子、盒子、铅笔、蜡烛)的其他用途,越多越好,这是发散性思维的一个例子,通常用于评估人类的创造性思维。

研究人员从流利度、灵活性、原创性和精细度四个维度、8个评分项上,使用了两种方法来评估人工智能和人类的表现。第一种是算法,用于评估该物体的建议用途与原始用途之间的接近程度。第二种方法用到了6名人类评估员,在不知道哪个答案是由AI给出的情况下,直接根据创意和原创性给每个答案打分。之后研究人员会计算人类和人工智能打出的平均分。

结果显示,AI在这一任务中的平均表现超过了人类,但人类被试的得分差距更大——最低分远低于AI,但最高分普遍比AI高。并且最佳人类回答在 8个评分项中的7项都超过了所有AI的最佳回答。

当然,这个结果并不一定表明人工智能已经发展出了超越人类的创造力,因为参加测试的大语言模型,它们都是从海量语料中进行了深度学习,它们的确能够基于这些已经存在的语料,组合推理出某个物品的用途,尽管这种组合推理的能力还很初级。但当面对全新的、从未出现在训练语料库中的物品时,大语言模型与人类的创造性思维还是存在着明显差距的。

例如,人类哪怕面对一个从未见过的物品,也能够从物品的外表、结构、功能等角度来理解这个物品,从而与已知的物品进行类比,推测出该物品是用来干什么的。而大语言模型过于依赖语言输入,无法从视觉上理解该物品,这就已经输了一局。即使人类用语言从该物品的外表、结构和功能等方面对大语言模型进行描述性输入,期望它能理解这个新物品的模样时,由于语言描述本身不可避免地会带入一些隐含意义的词语,这相当于人类在不知不觉中已经隐晦地告诉大语言模型,这个新物品可能具有什么用途。

此外,当物品的用途需要复杂多步的推理才能推断出来时,大语言模型很难“创造性”地建立联想,因为在大量推理任务中大语言模型做得并不好。

转载自:科普中国

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

首次搭载国产“心脏”!我国全面... ◎ 科技日报记者 张晔 实习生 赵林芳 4月3日,国产最大直径敞开式硬岩掘进机(TBM)在江苏省常熟...
NASA阿尔忒弥斯2号奔月途中... IT之家 4 月 5 日消息,在地球上卫生间传出烧焦味就已经够让人糟心了,而当美国国家航空航天局(N...
史上最大IPO将至,Space... 问AI· SpaceX的商业模式如何支撑其天价估值? 2019年,沙特阿美以294亿美元的募资规模...
原创 4... 今天是2026年4月4日,周六。4月第一轮油价调整,基本已经没悬念了。 这次调价时间就在下周二晚上,...
土耳其,狂抛黄金!原因何在? 据路透社日前报道,为应对中东冲突引发的能源供应短缺以及土耳其里拉贬值压力,土耳其黄金储备在过去两周大...
中东大国,黄金储备14天骤减近... 据央视财经援引路透社日前报道,为应对中东冲突引发的能源供应短缺以及土耳其里拉贬值压力,土耳其黄金储备...
美国宣布100%药品关税,可能... 文︱陆弃 美国白宫最近宣布的100%药品关税政策看似震撼,实际上,可能最终没一家制药商会因此受罚。你...
金瑞矿业2025年营收3.33... 上证报中国证券网讯 金瑞矿业4月3日披露年报,2025年,公司实现营业收入3.33亿元,同比下降3....
国赛获奖到央视聚焦:微医智能体... 继斩获2025全国智慧医保大赛一、二等奖,领跑国家级医保创新赛场后,微医“AI+医保监管”的先行实践...
原创 特... 特朗普露出罕见历史性表情!美国彻底陷入绝境!昨天,在听取美军飞行员营救行动的绝密简报后,一贯嚣张跋扈...