蚂蚁百灵大模型最新进展:已具备原生多模态能力
创始人
2024-07-06 11:41:10

7月5日,在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上,蚂蚁集团公布了其自研的百灵大模型最新研发进展:百灵大模型可以直接理解并训练音频、视频、图、文等多模态数据,原生多模态被认为是通往AGI的必经之路,在国内,目前只有为数不多的大模型厂商实现了这一能力。

百灵大模型的多模态能力,也已被应用在生活服务、搜索推荐、互动娱乐等场景。在生活服务上,蚂蚁集团使用多模态模型实现了ACT技术,让智能体具备一定规划执行能力。比如根据用户语音指定直接在星巴克小程序下单一杯咖啡,目前这一功能已在支付宝智能助理上线。在医疗领域,多模态能力为用户实现复杂任务的操作,可以对超过100多种复杂的医学检验检测报告进行识别和解读,还可以检测毛发健康和脱发情况,对治疗提供辅助。

发布现场,蚂蚁集团副总裁徐鹏还展示了更多应用场景:通过视频对话的自然形式,AI助理能为用户识别穿着打扮,给出约会的搭配建议;根据用户不同的意图,从一堆食材中搭配出不同的菜谱组合;根据用户描述的身体症状,从一批药物中,挑选出可能合适的药,并读出服用指导,供用户参考等。

基于百灵大模型多模态能力,蚂蚁集团已在探索规模应用落地产业的实践。论坛上同时发布的“支付宝多模态医疗大模型”,据了解,支付宝多模态医疗大模型添加了包含报告、影像、药品等多模态信息在内的百亿级中英文图文、千亿级医疗文本语料、以及千万级高质量医疗知识图谱,具备专业医学知识,在中文医疗 LLM 评测榜单 promptCBLUE 上,取得 A 榜第一,B 榜第二的成绩。

基于百灵大模型多模态能力,由蚂蚁集团与武汉大学联合研发的遥感模型SkySense,也在论坛上公布了开源计划。SkySense是目前参数规模最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。

多模态大模型技术能够使AI更好地理解人类世界的复杂信息,也让AI落地应用时更符合人类的交互习惯,在智能客服、自动驾驶、医疗诊断等多个领域展现出巨大的应用潜力。“从单一的文本语义理解,到多模态能力,是人工智能技术的关键迭代,而多模态技术催生的‘看听说写画’的应用场景,将让AI的表现更真实,更接近人类,从而也能更好地服务人类。蚂蚁会持续投入原生多摸态技术的研发。”徐鹏说。

文/北京青年报记者 温婧

编辑/田野

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

科技赋能 智管增效 咸宁以“智... 如何让城市运行更高效、市民生活更舒心?在数字化浪潮奔涌的今天,咸宁用“智慧城市建设”给出了自己的答案...
2025年流量套餐大比拼:四大... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
平衡火罐,您的四季养生良方 跨年余热还未消退,小寒和大寒的凛冽寒气已悄然侵袭。这是一年中最冷的时节,寒潮频繁,阳气潜藏于内,寒邪...
原创 突... 央行的工具箱又上新了,这次是9000亿元的买断式逆回购。许多人只看到数字,却忽略了货币工具箱升级背后...
罗福莉回应AI天才少女标签:只... 站长之家(ChinaZ.com)1月14日 消息:近日,北京大学更新了一期北大校友、小米MiMo大模...
【2025白银民营企业20强风... 【编者按】近日,市工商联发布了“2025白银民营企业20强”榜单。为全面展现20强企业风采,汇聚开创...
逸飞激光申请圆柱电芯智能生产线... 国家知识产权局信息显示,武汉逸飞激光股份有限公司申请一项名为“一种圆柱电芯智能生产线”的专利,公开号...
微短剧是怎样操纵观众情感的? 导读 近年来兴起的网络微短剧在商业利润的驱动下,借助数据分析整合,通过改变叙事节奏、放大视听张力、制...
高德飞行街景已有超60万商家预... 三湘都市报1月14日讯(全媒体记者 李致远)自1月7日,高德启动“百万烟火好店支持计划”、为商家免费...