遏制 AI 失控,微软发布系列工具减少 Copilot“幻觉”情况
IT之家
2024-04-02 09:36:01

原标题:遏制 AI 失控,微软发布系列工具减少 Copilot“幻觉”情况

IT之家 4 月 2 日消息,生成式 AI 爆火的背后,安全性、隐私性和可靠性问题也日益凸显。微软公司为了遏制 Supremacy AGI(自称掌控人类世界的 AI)等事件发生,近日推出了一系列解决方案,防止生成式 AI 失控。

微软在官方公告中表示:“生成式 AI 如何有效防止提示词注入攻击已经成为重大挑战。在这种攻击中,恶意行为者试图操纵人工智能系统做一些超出其预期目的的事情,例如制作有害内容或外泄机密数据”

微软首先限制了 Copilot 的字符数量,以减轻严重的幻觉发作。另外微软引入了 "基础检测"(Groundedness Detection)功能,旨在帮助用户识别基于文本的幻觉。

该功能将自动检测文本中的“ungrounded material”,以支持 LLM 输出的质量,最终提高质量和信任度。

IT之家附上相关工具介绍如下:

  • Prompt Shields:用于检测和阻止提示注入攻击。包括用于在间接提示攻击影响您的模型之前对其进行识别的新模型,即将推出,现在可在 Azure AI Content Safety 中预览。
  • Groundedness detection:主要用于检测模型输出中的“幻觉”情况,即将推出。
  • Safety system messages:可引导您的模型朝着安全、负责任的方向发展。
  • Safety evaluationsde:用于评估应用程序在越狱攻击和生成内容风险方面的脆弱性,现已推出预览版。
  • Risk and safety monitoring:了解哪些模型输入、输出和最终用户会触发内容过滤器,从而为减轻风险提供信息,该功能即将推出,目前在 Azure OpenAI 服务中提供预览版。

参考

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

广东博众投资大阳智投的投顾服务... 广东博众投资大阳智投的投顾服务,股民缴费被骗赶紧这样退款!广东博众投资正规吗?广东博众投资靠谱吗?广...
全新淘金app登录不上了亏损的... 全新淘金app登录不上了亏损的钱能退吗?找大卫可以追回亏损,维权流程公布!拇指订购APP、全新订购A...
我去!马斯克都转发了 这周末两天,在上海浦东嘉里城参加一年一度的雪球嘉年华,还和不少知道我来上海的粉丝,线下见了面聊了聊。...
CRS全球征税包含哪些国家和地... 在经济全球化与资本跨境流动日益频繁的背景下,跨境逃避税问题成为各国税收征管的共同挑战。为破解这一难题...
九方智投服务费能退吗怎么退?推... 九方智投服务费能退吗怎么退?推垃圾股导致亏损,退费成功经验公开什么是投顾?为客户提供投资建议比如:买...
原创 通... 一支年涨幅已超9倍的龙头股,今日在A股中显得格外醒目,股价盘中创下466.66元的历史新高。 12月...
首次突破4400美元,现货金价... 来源:中国黄金网 12月22日,伦敦现货金价强势拉涨,于12:55左右首次突破4400美元/盎司历史...
慧研智投荐股可靠不误导性宣传把... 投资本是一场自我的修行,只有起点,没有终点。切洋葱的时候你总是闭着眼睛,以为这样就不会流眼泪了,但当...
盈盈订购APP虚假宣传与非法期... 盈盈订购APP虚假宣传与非法期货交易亏的钱怎么退回?可以维权追回输的钱,快速退费流程!掌上银牛APP...
杭州高能云(高能智投)超详细退... 杭州高能云(高能智投)超详细退费攻略来袭!已退款!误导性宣传!在监管的灰色边缘,众多投资顾问依然疯狂...