微软正努力治疗 AI 幻觉,可实时屏蔽和重写毫无根据的信息
创始人
2024-06-21 23:03:10

IT之家 6 月 21 日消息,就在 GPT-4 因征服标准化测试而登上头条时,微软研究人员正在对其他 AI 模型进行一种非常另类的测试 —— 一种旨在让模型捏造信息的测试。

为了治好这种被称为“AI 幻觉”的症状,他们设定了一个会让大多数人头疼的文本检索任务,然后跟踪并改进模型响应,这也是微软在测定、检测和缓解 AI 幻觉方面的一个例子。

微软 AI 负责项目的首席产品官 Sarah Bird 表示,“微软希望其所有 AI 系统都是值得信赖且可以有效使用的”。

我们可以向这个领域投入许多专家和资源,因此我们认为自己可以帮助阐明“应该如何负责任地使用新型 AI 技术”的方法,并使其他人也能够做到这一点。

从技术角度来讲,AI 幻觉是一种“缺乏事实依据”的内容,这意味着 AI 模型改变了它所给定的数据或添油加醋描述了原本不存在的信息。

当然,AI 幻觉这种东西也不是所有时候都毫无用处,例如当用户希望 AI 帮自己写一个科幻故事,或给出一种非传统想法时,就属于是有益的;但在大多数需要 AI 的场景,诸如医学和教育等场景就显得多余了,因为准确性大于一切。

因此,微软也在努力根据其自有 AI 产品(例如 Copilot)来试图攻克 AI 幻觉,研究一系列工具来帮助机器解决幻觉问题。

微软表示,其工程师花了数月时间,通过检索增强生成技术(一种无需重新训练模型即可向模型添加额外知识的技术)将必应搜索数据作为 Copilot 的依据,通过必应的答案、索引和排名数据帮助 Copilot 提供更准确、更相关的回复,同时提供引用信息,让用户可以自行查找和验证。

“该模型非常擅长推理信息,但我们不认为它应该成为答案的来源,”Bird 说,“我们认为数据应该是答案的来源,因此我们解决这个问题的第一步是向模型提供最新、高质量且准确的数据。”

除此之外,微软还试图通过各种工具帮助客户做到这一点,例如 Azure OpenAI 服务中的“Your Data”功能可帮助企业组织用自己的数据来训练生成式 AI。

值得一提的是,微软还推出了一种实时工具,可以大规模检测应用中依据企业数据的可靠程度。微软表示,AzureAI Studio可以根据来源文档评估响应的可靠程度。

据介绍,微软还正在开发一种新的针对措施,可以实时屏蔽和纠正“毫无根据”的信息。当检测到事实依据错误时,该功能将根据数据自动进行重写。

微软 AI负责项目的首席产品经理 Ken Archer 表示,“处于生成式 AI 的前沿意味着我们有责任和机会让自己的产品更安全、更可靠,并让客户也能放心使用我们的工具”。

参考资料:

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

字节跳动研发新一代豆包AI耳机... 来源:新浪视频 #曝新一代豆包AI耳机正在研发#【消息称字节跳动正研发新一代豆包AI耳机,搭载摄像头...
Galaxy S25 Edge... 从7999元降至4999元,三星Galaxy S25 Edge用3000元的价格落差诠释了什么是“跳...
长城基金梁福睿:2026年创新... 来源:新浪基金 2026年开年以来,创新药板块强势回暖,板块关注度显著提升。一方面2026年小核酸领...
屠文斌5.78亿押注30022... 1月14日收盘,上证指数下跌0.31%,报4126.09点。龙虎榜数据显示,今日共有101只股票上榜...
五战IPO!老乡鸡这次会赢? 古有“屡败屡战”,今有老乡鸡闯关! 在中国知名餐饮企业中,论对上市的执念,可能没有第二个比老乡鸡更深...
金银势不可挡,交易所重拳出击 来源:市场资讯 撰文:嘉盛集团资深分析师Jerry Chen 进入2026年,黄金和白银等贵金属延续...
iPhone 18系列、Air... 1月14日消息,博主@数码闲聊站今日爆料了苹果iPhone 18系列及iPhone Air2的屏幕核...
原创 A... 在大模型算法备案过程中,“提示信息不合规”是众多企业高频踩坑的痛点。不少企业耗时耗力准备材料,却因这...
翼越雪山,货通四方!我国大型无...   新华社成都1月14日电(记者薛晨)从西藏林芝米林机场起飞,跨越1100余公里,平稳降落在四川绵阳...
全国首个纳米医学与核酸药物创新... 1月14日,国内首个纳米医学与核酸药物创新研究中心在重庆国际生物城建成投用,填补了重庆在核酸药物研发...