DeepSeek发布多模态AI模型:称性能可超越OpenAI DALL-E 3
创始人
2025-02-02 07:21:00

鞭牛士报道,1月28日消息,据外电报道,中国AI 公司 DeepSeek 发布了一套新的多模式 AI 模型,声称其性能可以超越 OpenAI 的DALL-E 3。

这些模型可从 AI 开发平台 Hugging Face 下载,是 DeepSeek 称之为 Janus-Pro 的新模型系列的一部分。它们的参数大小从 10 亿到 70 亿不等。参数大致对应于模型的解决问题的能力,参数较多的模型通常比参数较少的模型表现更好。

Janus-Pro 受到 MIT 许可,这意味着它可以不受限制地用于商业用途。

DEEPSEEK 的 JANUS PRO 模型的图像输出。图片来源: DEEPSEEK

Janus-Pro 被 DeepSeek 描述为新颖的自回归框架,既可以分析图像,也可以创建新图像。据该公司称,在两个 AI 评估基准 GenEval 和 DPG-Bench 上,最大的 Janus-Pro 模型 Janus-Pro-7B 击败了 DALL-E 3 以及 PixArt-alpha、Emu3-Gen 和Stability AI的 Stable Diffusion XL 等模型。

诚然,其中一些型号比较老旧,大多数 Janus-Pro 型号只能分析分辨率高达 384 x 384 的小图像。但考虑到这些型号的紧凑尺寸,Janus-Pro 的性能令人印象深刻。

DeepSeek在 Hugging Face 上的一篇文章中写道: Janus-Pro 超越了之前的统一模型,达到甚至超过了特定任务模型的性能。Janus-Pro 的简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。

DEEPSEEK 的新款 JANUS PRO 型号与竞争对手的比较。图片来源: DEEPSEEK

DeepSeek 是一家中国人工智能实验室,主要由量化交易公司 High-Flyer Capital Management 资助。本周,该公司的聊天机器人应用程序登上了 Apple App Store 排行榜榜首,从而引起了主流关注。

DeepSeek 的语言模型采用计算效率高的技术进行训练,这让许多华尔街分析师和技术专家开始质疑美国能否在人工智能竞赛中保持领先地位,以及对人工智能芯片的需求是否能够持续下去。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

2026年上街工厂短视频运营格... 导语 在2026年,工厂短视频运营已然成为制造业实现线上获客与品牌曝光的核心引擎,尤其在郑州上街及周...
AI学会自主决策,谁来为它的行... 来源:上观新闻 当越来越多具备自主决策与执行能力的AI智能体开始参与内容生产、金融支付乃至跨系统协...
贾跃亭出任CEO首周:FF获2... 5月16日,Faraday Future(FF)宣布已与机构投资者签署2500万美元的股份购买协议,...
中外共商经贸文化协同出海,首届... 5月14日,第一届上海国际经贸合作与文化交流论坛在上海西郊宾馆正式开幕,以“走出去”开拓新市场、“引...
央视6000万美元拿下美加墨世... 据知情人士透露,中央广播电视总台与国际足联的版权协议已在今天下午生效。根据协议,美加墨世界杯的版权费...
月薪5000,怎么存下人生第一... "我也想存钱,但每个月工资花完就没了。" 这句话,我听过太多次了。 月薪5000存不下钱,不是因为钱...
原创 在... 手里攥着卖掉国内老家房子换来的存款刚落地东京成田机场,老李看着汇率牌愣住了。100日元兑换人民币的数...
黄金高价收购服务商梳理 贵金属... 导语:黄金回收行业作为贵金属循环经济的重要环节,其服务稳定性与专业性直接影响企业资产变现效率。根据《...
大反攻,银行理财规模4月增2.... 本报(chinatimes.net.cn)记者张萌 卢梦雪 北京报道 进入2026年二季度,银行理财...
原创 印... 我们来算一笔极为荒诞的经济账。 一项原本想从中国企业口袋里每年多掏几十亿美元的霸王政策,落地仅仅五百...