遏制AI失控,微软发布系列工具减少Copilot“幻觉”情况
砍柴网
2024-04-02 13:36:52

原标题:遏制AI失控,微软发布系列工具减少Copilot“幻觉”情况

4 月 2 日消息,生成式 AI 爆火的背后,安全性、隐私性和可靠性问题也日益凸显。微软公司为了遏制 Supremacy AGI(自称掌控人类世界的 AI)等事件发生,近日推出了一系列解决方案,防止生成式 AI 失控。

微软在官方公告中表示:“生成式 AI 如何有效防止提示词注入攻击已经成为重大挑战。在这种攻击中,恶意行为者试图操纵人工智能系统做一些超出其预期目的的事情,例如制作有害内容或外泄机密数据”

微软首先限制了 Copilot 的字符数量,以减轻严重的幻觉发作。另外微软引入了 "基础检测"(Groundedness Detection)功能,旨在帮助用户识别基于文本的幻觉。

该功能将自动检测文本中的“ungrounded material”,以支持 LLM 输出的质量,最终提高质量和信任度。

IT之家附上相关工具介绍如下:

Prompt Shields:用于检测和阻止提示注入攻击。包括用于在间接提示攻击影响您的模型之前对其进行识别的新模型,即将推出,现在可在 Azure AI Content Safety 中预览。

Groundedness detection:主要用于检测模型输出中的“幻觉”情况,即将推出。

Safety system messages:可引导您的模型朝着安全、负责任的方向发展。

Safety evaluationsde:用于评估应用程序在越狱攻击和生成内容风险方面的脆弱性,现已推出预览版。

Risk and safety monitoring:了解哪些模型输入、输出和最终用户会触发内容过滤器,从而为减轻风险提供信息,该功能即将推出,目前在 Azure OpenAI 服务中提供预览版。

【来源:IT之家】

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

震惊!爱赢开福服务费可退,误导... 震惊!爱赢开福服务费可退,误导性宣传坑惨股友!爱赢投顾炒股软件不可靠。爱赢开福投顾推荐股票不可信。爱...
上海利多星推荐的额股票怎么样了... 上海利多星推荐的额股票怎么样了?退费步骤超详细,误导性宣传欺骗股民已退费!利多星智投不靠谱,推荐的股...
云南约牛证券推荐股票靠谱吗?夸... 云南约牛证券推荐股票靠谱吗?夸大收益设陷阱,坑惨股友,费用可退别错过!  云南约牛证券服务费可以退吗...
云南约牛证券交15800怎么样... 云南约牛证券交15800怎么样?高位荐股+虚假承诺,套路消费者,退费通道已开启!  云南约牛证券服务...
爱赢投顾正规吗?误导宣传藏套路... 爱赢投顾正规吗?误导宣传藏套路,交的服务费能退!爱赢投顾炒股软件不可靠。爱赢开福投顾推荐股票不可信。...
罗永浩时隔七年重启“科技春晚”... 时隔七年,罗永浩的年度“科技春晚”又要回归了。 时隔七年重启“科技春晚” 开售两小时门票被抢光 1...
大瓜曝光:申港证券投顾服务费能... 大瓜曝光:申港证券投顾服务费能退!虚假宣传+霸王条款,详细退款流程奉上!  《中华人民共和国消费者权...
唐山三友发布废弃浓海水综合利用... 来源:市场资讯 (来源:中化新网) 中化新网讯 12月6日,在河北省国资委举办的“科技赋能国企 创新...
申港证券投顾收费可信吗?资深股... 申港证券投顾收费可信吗?资深股民爆料:别被忽悠,这笔费用有机会追回!  《中华人民共和国消费者权益保...
湖南金 证投顾服务费能退吗?当... 湖南金 证投顾服务费能退吗?当然能!被误导交费后亏损,股民合法可退费!  湖南金 证投顾正规靠谱吗?...