引领多模态大模型新高度,山海UniGPT-mMed登顶MMMU权威测评榜
创始人
2024-10-09 10:40:45
0

近日,多模态人工智能模型基准评测集MMMU更新榜单,云知声山海多模态大模型UniGPT-mMed以通用能力、医疗专业能力双双排名第一的优异成绩登顶榜首,力压GPT-4V,充分彰显其硬核实力。

作为国内权威多模态基准评测,MMMU由IN.AI Research等多家机构联合构建,专注于考量人工智能在解决大学层次多学科问题时的多模态理解与推理能力。

该评测集涉及艺术与设计、商科、科学、健康与医学、人文与社会科学、技术与工程等六个常见学科,包含 1.15 万个精心选取的多模态问题,涵盖 30 个不同的科目和183 个子领域。同时,MMMU 中许多问题都需要专家级的推理能力,例如,使用傅立叶变换或均衡理论来推导问题的解,这在满足评测内容广泛性的同时,也确保了其深度。

此外,MMMU还提出了两个独特的挑战:一是其涵盖多种图像格式,从照片和绘画等视觉场景到图表和表格,可用于测试 LMM 的感知能力;二是MMMU的输入形式是文本和图像的混合,要求AI模型能够将图像和文本信息结合起来进行深入理解,并在此基础上执行复杂推理。这不仅考验了模型的学科知识储备,也对其综合分析和应用能力提出了更高要求。

评测结果显示,云知声山海多模态大模型UniGPT-mMed以总分57的优异成绩登顶榜首,并在健康与医学细分赛道超越GPT-4V,力压一众大模型拔得头筹,充分展现出其在拥有业内一流的通用能力之外,更具备打造世界领先的行业大模型的能力。

UniGPT-mMed是云知声基于山海大模型底座构建的多模态大模型。其通过分析和整合海量论文、书籍及网站数据,利用精细化数据处理技术,自动识别并提取图片及其相关文本描述,并通过多模态分析技术评估图片的质量和图文之间的匹配度,筛选出最优数据。与此同时,系统能够参考图片和上下文信息对图片进行重新描述,使得图文数据更加对齐。

通过预设问答场景,UniGPT-mMed能够将图文对齐数据转化为高质量的场景问答数据集,并采用思维链和自我反思技术,进一步优化生成数据,最终构建起一个包含数亿条高质量图文问答的数据集,进而为用户提供更加丰富、准确和可靠的信息检索和问答服务。

此次评测,是云知声在多模态大模型赛道持续深耕、不断技术创新的成果体现。

作为中国AGI技术产业化的先行者,云知声于2016年开始打造Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗、智慧座舱、智慧交通等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局,致力推动千行百业的智慧化升级。

作为云知大脑的核心,山海大模型具备语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,能够满足更多场景的应用需求。今年8月,云知声推出山海多模态大模型,通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出,带来实时多模态拟人交互体验,开启AGI新范式。

目前,山海大模型已相继在OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测、SuperBench等多个权威评测中屡创佳绩,稳居国内大模型第一梯队;在医疗专业能力上,其基于山海大模型孵化的医疗大模型在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖,并在MedBench评测中位列全球第一,各项指标全面超越GPT-4。

登顶MMMU评测榜,充分印证了云知声山海多模态大模型在通用能力、专业能力层面的突出实力,也将鞭策云知声持续迭代多模态大模型技术底座,实现大模型技术在多领域场景下的渗透和应用,以技术创新为各行各业带来更多智能化变革。

相关内容

热门资讯

树立行业标杆!5G赋能烟草行业... 在科技飞速发展的时代浪潮下,5G 技术如同一股强劲的东风,为烟草行业带来了前所未有的变革与机遇。共同...
京东远升申请信息定位及其模型训... 金融界2024年10月9日消息,国家知识产权局信息显示,北京京东远升科技有限公司申请一项名为“信息定...
猛攻AI,字节还有几张牌? 来源 | 伯虎财经(bohuFN) 作者 | 楷楷 近日,大模型行业再掀“价格战”,阿里云宣布...
上市申请失效数月,“卖卡大户”... 二级市场很火,但基石投资者们还是很冷静! 年初,让大家见识到一张张小卡片吸金能力的卡游,IPO没有动...
【最新】国家发改委:促进房地产... 国家发展改革委主任郑栅洁10月8日在国新办发布会上介绍,针对当前经济运行中的新情况新问题,党中央、国...
孝感联成无纺布取得进料料斗专利... 金融界2024年10月9日消息,国家知识产权局信息显示,孝感联成无纺布有限公司取得一项名为“一种进料...
跑分超300W!联发科天玑94... 【太平洋科技快讯】10月9日,联发科正式发布了天玑9400旗舰手机处理器,该处理器被定位为“旗舰5G...
股指期货早盘普跌 10月9日早盘,股指期货普跌。9时31分,中证1000股指期货(IM)主力合约下跌3.63%,中证5...
贾康:试谈股市行情与前景 中国股市的近期表现牵动各方神经,是在宏观调控层面有货币政策“放大招”后,多种因素综合作用之下,陡然而...
商显大厂背后供应商浮出水面 中... 近日,2024中国商显产业领袖峰会暨ISVE智慧显示展在深圳成功举办,作为国内优秀的电容触控芯片及应...
10.8纯碱日评:纯碱市场价格... 纯碱市场分析 今日国内纯碱市场成交重心有所上移。截至目前,西北地区轻质纯碱价格在1250-1350...
金价越长越高,金店反而面临倒闭... 在繁华的商业街区,一家家金店犹如镶嵌在都市脉络中的璀璨明珠,曾几何时,它们是财富与尊贵的象征,门庭若...
节后首周18只产品“上架” 四... 今年前三季度,基金发行规模已经超过去年同期。根据Wind数据,截至9月30日,以基金成立日为口径计算...
原创 一... 他是亚洲首富,继承父亲的遗产后不仅没有丝毫懈怠,反而将其麾下的信实集团打造成了“铜墙铁壁”一般,现如...
致信新股民!五大券商,集体发声 新股民即将登场。 10月9日A股市场表现备受市场关注,主要因为国庆假期申请新开户的股民最早可在10月...
星空有约|重阳节,来看大火星! 10月11日迎来重阳节。九九重阳节,大火星也逐渐西斜,即将落入地平线之下。公众可抓住本年度最后的窗口...
金价回调但市场积极逢低买入,最... 汇通财经APP讯——10月8日,贵金属分析师Christopher Lewis指出,虽然近期黄金市场...
长江智慧航运建设取得阶段性成果   新华社武汉10月8日电(记者李思远、张阳)交通运输部长江航务管理局8日发布消息,长江智慧航运工作...
350套H100取代4万CPU... 美东时间10月8日周二在华盛顿举行的“英伟达AI峰会”期间,英伟达强调了同台积电在加速计算领域合作的...
证券日报:“借基”入市或是个好... 近期,在多重利好因素助推下,A股市场交投活跃,日均成交量屡创新高,投资者信心显著增强,新手开户热情持...