讯飞星火多模态交互大模型上线 语音、视觉、数字人交互三合一
创始人
2024-11-15 12:21:13
0

科大讯飞公司近日宣布,其最新研发的讯飞星火多模态交互大模型正式投入运营。这一技术突破标志着科大讯飞从单一的语音交互技术拓展到音视频流实时多模态交互的新阶段。新模型集成了语音、视觉和数字人交互功能,用户可通过一键调用,实现三者的无缝结合。

讯飞星火多模态交互大模型的推出,首次引入了超拟人数字人技术,该技术能够使数字人的躯干和四肢动作与语音内容精准匹配,快速生成表情和动作,极大提升了AI的生动性和真实感。通过整合文本、语音和表情,新模型能够实现跨模态的语义一致性,让情感表达更加真实连贯。

此外,讯飞星火支持超拟人极速交互技术,利用统一神经网络直接实现语音到语音的端到端建模,使得响应速度更快、更流畅。该技术能够敏锐感知情绪变化,并根据指令自由调整声音的节奏、大小和人设,提供更为个性化的交互体验。

在多模态视觉交互方面,讯飞星火能够“听懂世界”“认清万物”,全面感知具体背景场景、物流状态等信息,使得对任务的理解更加精准。通过综合语音、手势、行为、情绪等多种信息,模型能够作出合适的回复,为用户提供更为丰富和精准的交互体验。

相关内容

热门资讯

“机器鱼”时代来临?大型海洋馆... 大型海洋馆展出假鲸鲨引争议 海洋馆“机器鱼”时代来临? 近日,关于“大型海洋馆展出假鲸鲨”的话题在网...
联通服务之光:在岗位上绽放的卓... 在通信行业的广阔天地中,有许多默默耕耘的奉献者,他们以自己的热情和专业,为客户提供着优质的服务,成为...
广汽“揽胜”,广汽传祺S7亮相... 11月15日,第二十二届广州国际车展盛大开幕,吸引了众多汽车厂商和车迷的目光。其中,广汽传祺携旗下全...
收购半导体资产溢价达300%!... 封面图片由AI生成 时隔三天,华海诚科(688535.SH)的收购案开始披露更多细节! 11月11日...
欢迎来洽谈!粤港澳大湾区一国企... 财联社11月15日讯(记者 彭科峰)又见地方国资驰援地方银行。 11月15日,惠东县交通投资集团有限...
民航局发布民用无人驾驶航空器飞... IT之家 11 月 15 日消息,中国民用航空局刚刚发布公告称,要求民用无人驾驶航空器运行人在使用轻...
搭载固态电池的eVTOL完成首... 固态电池在eVTOL(电动垂直起降飞行器)上完成“首秀”。11月14日,“飞行汽车第一股”亿航智能宣...
所乐思取得带有摄像头的模块化智... 金融界2024年11月14日消息,国家知识产权局信息显示,所乐思(深圳)科技有限公司取得一项名为“带...
三星G61SD显示器评测:色彩... 1 序章 对于追求画面色彩表现的竞技玩家来说,OLED显示器是一个绕不开的话题,尤其是由三...
Petronas建立人工智能和... 马来西亚国家石油公司(Petronas)通过马来西亚石油管理公司(MPM)签署了两份谅解备忘录(Mo...
任天堂 Switch 后续机型... 来源:动点科技 任天堂在各类产品之间创造了更强的凝聚力,为 Switch 的后续机型开了个好头...
上海汇正财经(领航家)私人订制...   上海汇正财经顾问有限公司根本没有任何实力,欺骗股民购买牛人掌股、私人订制等服务!!!  上海汇正...
建发22.1亿竞得厦门岛内湖里... 观点网讯:11月15日,厦门土拍市场迎来新一轮竞拍,此次土拍共涉及4幅地块,总计价建筑面积26.99...
2024年双十一全网销售数据解... 2024年双十一全网销售数据解读报告显示,全网销售总额达到14418亿元,同比增长26.6%。 电商...
数字中国建设工作推进会议召开,... 11月15日,三大股指午后持续拉升,截至下午13:20,数字经济ETF(560800)跌0.87%。...
深圳市飞宇光纤取得熔融拉锥封装... 金融界2024年11月14日消息,国家知识产权局信息显示,深圳市飞宇光纤股份有限公司取得一项名为“一...
大跌7%,黄金跌上热搜 受多重因素影响,今天国际金价继续延续前一天下跌趋势,跌破每盎司2600美元关口,黄金价格创下两个月新...
AI大爆发! 来关注今天市场。 A股市场上午整体窄幅震荡。多个和AI相关的概念板块涨幅居前,包括Sora概念、智...
“二十年磨一剑”目前处于临床科... 央视网消息:3D打印大家都已经很熟悉了,但您能想象用这种方法打印器官吗?在正在举办的第26届高交会上...
成都往返北上广 都能坐C919... 国产大飞机C919在成都又添执飞新航线。11月13日,国航采用C919飞机执飞了成都往返北京航线。紧...