OpenAI向开发者开放语音AI引擎
创始人
2024-10-03 04:20:34

鞭牛士报道,10月2日消息,据外电报道,OpenAI 正在向其他开发人员开放其语音AI引擎,该引擎为 ChatGPT 的高级语音模式提供支持。

开发人员将能够实时访问这项技术,AI 可以理解语音命令,并在类似通话的现场场景中进行语音交谈。

该过程之前要求开发人员至少经历三个步骤:首先转录音频,然后运行生成的文本模型来得出查询的答案,最后使用单独的文本转语音模型。

此举为提供对话式语音界面的人工智能应用浪潮铺平了道路。

新的语音转语音功能是 OpenAI 在周二旧金山举行的 DevDay 活动上发布的几个公告之一。

该功能的早期测试者包括营养和健身应用程序 Healthify 和语言学习应用程序 Speak。

向开发人员提供的其他新功能包括基于图片微调模型的能力。

在为记者进行的演示中,OpenAI 高管展示了新的音频功能与 Twilio 的 API 相结合的示例,该功能允许 AI 助手致电虚构的糖果店并订购 400 个巧克力草莓。

在工具的定制演示中,有一个例子是与人工智能系统对话,帮助寻找本地产品,比如草莓。然后,人工智能会打电话给商家订购草莓,并接受用户关于订购数量和期望花费的指示。

OpenAI 表示,任何使用此类技术的人都不得隐瞒它是人工智能而非人类,而且只向开发人员提供六种预设,而不是创建新的声音。

开发人员只能使用 OpenAI 提供的声音——与 ChatGPT 中的选项相同。

虽然声音不会以任何方式被加水印,开发人员也不必让人工智能系统识别自己,但 OpenAI 表示,使用其系统发送垃圾邮件或误导人们违反了公司的服务条款。

这些公告是在围绕 ChatGPT 制造商的一系列新闻中发布的,包括其正在进行的大规模融资活动以及上周首席技术官 Mira Murati和另外两名高管的离职。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

Vistra Corp.(维斯... 一、公司概况Vistra Corp.(NASDAQ: VST)是一家总部位于美国得克萨斯州达拉斯的综...
什么样的街区让外籍嘉宾感慨“科... 钢琴大师机器人以0.02毫米级手指精度流畅演奏,外骨骼设备让普通人轻松举起数十公斤重物、机器人功夫之...
科迪华农业科技:全球农业科学领... 一、公司概况科迪华农业科技(Corteva, Inc.,股票代码:NYSE: CTVA)是一家总部位...
2026卫星互联网产业生态大会... 2026年6月25日上午,依托MWC上海全球移动通信行业盛会平台,2026卫星互联网产业生态大会——...
2026年拍照效果好的折叠屏手... 许多摄影爱好者都在寻找一款既能满足大屏娱乐办公需求,又能提供顶级拍照体验的折叠屏手机。特别是对于人像...
中国要有自己的“Mythos”... AI打破了“漏洞难找”的旧规则,打开了安全竞赛的新战场。这里没有通用的安全共识,谁先用智能体和算力构...
亚洲保险巨头友邦保险:百年深耕... 一、公司概况友邦保险控股有限公司(AIA Group Limited)(港交所股票代码:01299....
国芯思辰| 国产双通道14位2... 智能天线系统拥有阵列信号采样、数字波束赋形、自适应空域滤波、多目标跟踪等核心技术,可实时优化波束指向...
2026年万元预算分屏体验好的... 对于追求高效办公和沉浸娱乐的用户来说,折叠屏手机的大屏分屏功能无疑是核心吸引力。当预算来到万元级别,...
作为科技人形护理机器人全球首发... 6月25日,深圳作为科技有限公司(以下简称“作为科技”)在桂林榕湖饭店隆重举行“智护·无界”人形护理...