升级对标Sora,腾讯混元开源文生图大模型
市界
2024-05-14 20:39:02

原标题:升级对标Sora,腾讯混元开源文生图大模型

5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布。混元文生图包含了模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。

这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。

过去,视觉生成扩散模型主要基于的是U-Net 架构,但随着参数量的提升,基于Transformer 架构的扩散模型展现出了更好的扩展性,有助于进一步提升模型的生成质量及效率。

升级后的腾讯混元文生图大模型采用的是全新的DiT架构(DiT,即Diffusion With Transformer),这也与此前OpenAI旗下的Sora和著名开源大模型平台Stability最新的文生图模型Stable Diffusion 3使用了同款架构和关键技术,是一种基于Transformer架构的扩散模型。

升级后的混元文生图大模型不仅可支持文生图,也可作为视频等多模态视觉生成的基础。

中文原生也是此次腾讯混元文生图大模型的一大亮点。此前,Stable Diffusion等主流开源模型核心数据集以英文为主。混元文生图则具备更强的中英文双语理解及生成能力,在古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色。

据了解,从2023 年 7 月起,腾讯混元文生图团队便明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构,并对原有模型进行了改进:新一代DiT模型具备了更长的文本理解能力,支持最长256个字符(业界主流是77个)的图片生成指令。增加了中文原生的理解能力;并增加了多轮对话的能力。

据了解,目前腾讯已开源了超 170 个优质项目,均来源于腾讯真实业务场景,已覆盖了微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等核心业务板块。(赵子坤/文 李原/编辑)

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

浦发银行:对信达资产集团等五家... 来源:滚动播报 (来源:北京商报) 北京商报讯(记者 宋亦桐)12月26日,浦发银行发布公告称,根据...
最新!盈盈订购app亏钱了怎么... 白银现货平台骗局大起底:高收益背后的财富陷阱与维权实战”在抖音、今日头条等平台打广告的顶点订购app...
汇正财经投资选股可靠吗误导性宣...  汇正财经投资选股可靠吗误导性宣传骗取股民服务费!退款其实很简单!上海汇正财经顾问有限公司不靠谱可以...
上海海能投顾给股民虚假宣传诱导... 上海海能投顾给股民虚假宣传诱导,指导股民炒股亏钱,忽悠买的荐股服务被坑退费成功!那些疯狂拉群洗脑的营...
新消费观察 | 多维度适配消费... 精准功效、性价比平衡、消费结构变化等关键词正在逐渐成为当前中国美妆市场发展的聚焦方向,而越来越快的更...
指南针股票准不准收取25800... 指南针擒龙版值得购买吗?退款流程详解及注意事项如下!被忽悠交费不给好票亏损不断可退费!大家能在指南针...
福州大学发布《福建省上市公司智... 转自:新华财经 2025年12月25日上午,《福建省上市公司智力资本信息披露评价报告(2025)》发...
注意!珍牛订购APP亏钱了怎么... 白银现货平台骗局大起底:高收益背后的财富陷阱与维权实战”在抖音、今日头条等平台打广告的顶点订购app...
海能投顾业务员夸大宣传老师实力... 海能投顾业务员夸大宣传老师实力,很肯定的告诉你,是可以退的,退款流程公布!在监管的灰色边缘,众多投资...
钱坤证券投资咨询有限公司可靠吗...  钱坤证券投资咨询有限公司可靠吗投顾费维权实战指南:从收集证据到退款成功的完整流程钱坤证券确实是一家...