DeepSeek文生图来了 部分性能测试不输OpenAI
创始人
2025-02-03 22:21:03

经济观察网 记者 钱玉娟 北京时间1月28日凌晨,农历新年前夕,中国人工智能(AI)初创公司DeepSeek在GitHub(面向开源及私有软件项目的托管平台)以及Hugging Face(AI社区)上发布了多模态大模型Janus-Pro,进军文生图领域。

DeepSeek介绍,Janus-Pro大模型是2024年11月发布的JanusFlow大模型的升级,分为7B(70亿)和1.5B(15亿)两个参数量版本,且均开源。

AI社区开发者的评论显示,DeepSeek的Janus-Pro模型具备在消费级电脑终端上本地运行的潜力。

Janus-Pro在多模态理解和文本到图像的指令跟踪功能上实现重大进步,其文本到图像生成的稳定性明显提升。

DeepSeek发布的测试结果显示,Janus-Pro的70亿参数版模型在一些基准测试中击败了美国AI独角兽OpenAI的多模态大模型DALL-E3。

尽管Janus-Pro的模型尺寸有限,但从技术报告看,DeepSeek团队添加了7200万张高质量合成图像,模型在预训练阶段的真实数据与合成数据的比例达到了1:1,这使模型的图像视觉生成能力更稳定。

另外,Janus-Pro还通过将视觉编码分离为“理解”和“生成”两条路径,既缓解了视觉编码器在理解和生成中的角色冲突,还提升了模型框架的灵活性。

该模型还在多模态理解的训练数据上增加了大约9000万个样本,令其在文生图的同时,也能识别图像及其中的文字、知识等。

就在北京时间1月27日,由DeepSeek开发的App也超越了OpenAI的ChatGPT,成为苹果应用商店下载量最大的免费App。

几乎在同一天,包括英伟达、博通公司、超威半导体公司以及微软等在内的美国科技板块公司股价大幅下跌,华尔街均评估是受中国企业DeepSeek的技术突破影响。

在DeepSeek发布文生图多模态大模型前一晚,达闼机器人创始人黄晓庆接受经济观察网采访时称,其团队已基于DeepSeek的V3及R1大模型,将对话功能应用于旗下的机器人开发创新中,目前正在规划基于DeepSeek的多模态大模型进行二次训练。

黄晓庆认为:“DeepSeek开源、开放的模式,有利于第三方进行二次训练,加入多模态和机器人控制模型。”DeepSeek的MoE专家模型的融合架构不仅适合模型应用下游厂商的分布式训练场景,对像达闼机器人这样的厂商来说,跨应用场景的各种形态的机器人开发,也可以与DeepSeek的多模态大模型进行融合。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

阿里绩后股价大涨,CEO吴泳铭... 界面新闻记者 | 宋佳楠 5月14日,港股开盘后,阿里(09988.HK)受财报良好表现及AI强投...
道指收复5万点,纳指、标普50... 中新经纬5月15日电 美东时间周四,美国三大股指全线收涨。截至收盘,道指涨0.75%报50063.4...
OpenAI悄悄出手!买下AI... 【本报讯】 近日,有知情人士透露,人工智能巨头OpenAI已收购专注于AI声音克隆技术的初创公司We...
2026海南(三亚)人工智能科... 央广网三亚5月15日消息(记者 蔡文娟)为深化国家“人工智能+”战略落实,服务海南自由贸易港打造全球...
“把修图工作室装进平板”,美图... 5月15日,第二十七届中国国际照相机械影像器材与技术博览会(China PE)在北京展览馆开幕。本届...
神舟二十三号计划近日择机实施发... 中国日报5月16日电 神舟二十三号计划近日择机实施发射,船箭组合体2026年5月16日转运至发射区。...
索尼回应Xperia 1 VI... IT之家 5 月 16 日消息,科技媒体 Android Authority 今天(5 月 16 日...
良信电器申请混合式固态开关装置... 国家知识产权局信息显示,良信电器(海盐)有限公司、上海良信电器股份有限公司申请一项名为“一种混合式固...
医疗小程序开发服务商梳理 场景... 导语:医疗行业数字化转型加速,医疗小程序开发成为医院、药企、健康管理机构等提升服务效率的核心工具。基...
2026年陕西省科学实验展演活... 为广泛普及科学知识、阐释科学原理、传播科学故事、弘扬科学家精神,近日,省科技厅、省教育厅、省科协将联...