研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
知新了了
2024-03-21 16:02:22

原标题:研究人员给了人工智能一个“内心独白”,结果大大提高了其性能

科学家们用一种名为“QuietSTaR”的技术训练了一个人工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。

一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。

这种方法训练的人工智能系统,会在对提示做出反应之前进行思考,就像许多人在说话之前会考虑我们接下来应该说什么一样。这与科学家训练主流人工智能聊天机器人的方式不同,比如ChatGPT,它们不会“思考”自己写的内容,也不会预测对话中下一步的不同可能性。

这种新方法被称为“Quiet-STaR”,它指示人工智能系统在回应对话提示之前并行生成许多内在原理。当人工智能回答提示时,它会将这些有或没有基本原理的预测混合在一起,打印出最佳答案 —— 这可以由人类参与者根据问题的性质进行验证。

最后,它通过抛弃那些被证明是错误的基本原理来学习。实际上,这种训练方法使人工智能代理能够预测未来的对话,并从正在进行的对话中学习。

研究人员将Quiet-STaR算法应用于Mistral 7B,这是一个开源的大型语言模型(LLM),并于3月14日将结果发布在预印本数据库arXiv上。(该论文尚未经过同行评议。)

“Quiet-STaR”训练过的“Mistral 7B”在推理测试中的得分为47.2%,而训练前的得分为36.3%。它在学校的数学考试中仍然不及格,得分为10.9%。但这几乎是vanilla版5.9%的初始分数的两倍。

像ChatGPT和Gemini这样的模型是由神经网络构建的 —— 机器学习算法的集合,以模仿人类大脑的结构和学习模式的方式排列。然而,使用这种架构构建的系统在常识推理或情境化方面非常糟糕 —— 人工智能聊天机器人并没有真正的“理解”。

过去提高LLM推理能力的尝试是高度特定于领域的,无法应用于不同类型的人工智能模型。

研究人员将自学推理器(STaR)算法作为他们工作的基础,这是这种训练算法的一个例子,但受到这些限制的阻碍。

开发 Quiet STaR 的科学家之所以将其如此命名,是因为它的原理可以在后台悄悄地应用于几种不同类型的LLM,且独立于原始训练数据。现在,他们想研究,像他们这样的技术如何缩小基于神经网络的人工智能系统和类人推理能力之间的差距。

如果朋友们喜欢,敬请关注“知新了了”!

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

请看!全城掘金为何老师喊单频频... 全城掘金4元投资贵金属是真的吗?贵金属白银订购平台亏了钱依法追回全城掘金炒白银3元起投就是揭秘,四元...
【真实案例】爱赢公司退费成功故...   投资金融平台越来越多,推荐荐股的人也就越来越多,但凡是稳赚不赔的荐股,初看起来似乎是有利可图,对...
留意!盈盈订购亏损被骗内幕,不... 盈盈订购4元投资贵金属是真的吗?贵金属白银订购平台亏了钱依法追回盈盈订购炒白银3元起投就是揭秘,四元...
杭州高能云投顾坑骗广大股民去购... 杭州高能云投顾坑骗广大股民去购买服务,投顾交费被骗真相曝光!在监管的灰色边缘,众多投资顾问依然疯狂揽...
【避坑指南】爱赢投顾退费中的常...   投资金融平台越来越多,推荐荐股的人也就越来越多,但凡是稳赚不赔的荐股,初看起来似乎是有利可图,对...
快讯!斗金订购平台投资亏损是被... 斗金订购4元投资贵金属是真的吗?贵金属白银订购平台亏了钱依法追回斗金订购炒白银3元起投就是揭秘,四元...
【荆州专享】爱赢公司退费流程【...   投资金融平台越来越多,推荐荐股的人也就越来越多,但凡是稳赚不赔的荐股,初看起来似乎是有利可图,对...
通告!全新淘金亏损被骗别惊慌!... 全新淘金4元投资贵金属是真的吗?贵金属白银订购平台亏了钱依法追回全新淘金炒白银3元起投就是揭秘,四元...
掌上生财APP登录不上了亏损的... 掌上生财APP登录不上了亏损的钱能退吗?可以维权追回输的钱,快速退费流程!掌上生财app由哈尔滨贵金...
小心!柠檬订购是合法平台吗?被... 柠檬订购4元投资贵金属是真的吗?贵金属白银订购平台亏了钱依法追回柠檬订购炒白银3元起投就是揭秘,四元...