美团发布并开源视频生成模型:部分参数比肩谷歌最先进模型Veo3
创始人
2025-10-27 19:40:43

10月27日消息,美团LongCat团队今日发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平)。

不同于以往针对单一任务训练的模型,LongCat-Video通过多任务联合训练机制,在同一框架内即可处理零帧、单帧及多帧条件输入。

此外,LongCat-Video重点突破了长视频生成难题,原生支持输出5分钟级别的视频。相比常见模型在长时序生成中易出现的画面漂移、色彩偏移等问题,该模型通过在视频续写任务上的原生预训练,保持了较高的时间一致性与视觉稳定性。

近年来,“世界模型”被业界认为是通往下一代人工智能的核心方向。它能在时空维度上建模物理规律与场景逻辑,使AI具备理解、预测甚至重构现实世界的能力。

在这一背景下,视频生成模型被视为构建“世界模型”的关键路径。通过视频生成任务压缩几何、语义与物理知识,AI可以在数字空间中模拟真实世界的运行过程。

美团LongCat团队表示,LongCat-Video的推出是公司迈向这一目标的关键一步。未来,该模型将与自动驾驶、具身智能等业务相结合,为美团在连接“原子世界”和“比特世界”方面提供技术支撑。

文生视频任务中,LongCat-Video可以根据提示词准确还原不少脑洞大开的画面

据介绍,LongCat-Video可生成720p分辨率、30帧率的高清视频,其突出特点在于能够原生生成长达5分钟的连贯视频内容。模型通过视频续写预训练、块稀疏注意力等机制,旨在解决长视频生成中常见的画面断裂、质量下降等问题,保持时序一致性与运动合理性。

在效率方面,针对高分辨率、高帧率视频生成的计算瓶颈,LongCat-Video通过“二阶段粗到精生成(C2F)+ 块稀疏注意力(BSA)+ 模型蒸馏”三重优化,视频推理速度提升至10.1倍,实现效率与质量的最优平衡。

LongCat-Video视频生成模型视频推理速度提升至10.1倍

在内部评测体系中,美团构建了一套覆盖文本生成视频与图像生成视频两大核心任务的基准,评估维度包括文本对齐、视觉质量、运动质量与总体表现,并在图生视频任务中额外增加了图像一致性指标。

为确保评测的科学性,团队采用人工与自动双轨评估机制,其中人工评价分为绝对打分与相对偏好两种方式,所有样本均由多名标注员独立评分,最终通过加权平均得出结果。

自动评测部分则由内部训练的多模态“判官模型”完成,与人工结果的相关性高达0.92,保证了客观性。

据发布的评测结果显示,LongCat-Video在文生视频任务的四个核心指标中,视觉质量得分几乎与谷歌的Veo3持平,整体质量超越了PixVerse-V5和国内领先的开源模型Wan2.2。

在运动质量方面,LongCat-Video生成的视频动作流畅、镜头移动自然,展现出较强的物理合理性。在文本对齐度上,LongCat-Video表现略差于Veo3。

在图生视频任务中,LongCat-Video画面细节丰富、风格真实,但在图像一致性和动作连贯性上仍有改进空间。技术报告认为,模型在处理高精度参考帧时对细节的保持较为谨慎,这在视觉质量上带来加分,却略微影响了动态平滑度。

LongCat-Video视频生成模型在文生、图生视频基础任务上达到开源SOTA

在公开评测平台VBench 2.0上,LongCat-Video在“常识理解”一项中以70.94%的得分位居所有开源模型第一,总分达到62.11%,仅次于谷歌Veo 3与生数Vidu Q1等商用闭源模型。

作为构建"世界模型"的技术尝试,LongCat-Video未来或可应用于自动驾驶模拟、具身智能等需要长时序建模的场景。该模型的发布标志着美团在视频生成与物理世界模拟领域迈出重要一步。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

赵东交流圈中志浩刺梨产业开发(... 如果你正苦于不知如何着手挽回损失,或者担心自己处理不好,可以添加锐明法律微信随时在线,电话同步:19...
广东典匠企业咨询有限公司买酒送... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 “买酒、买高山白...
深圳迎宾品牌发展签署贵州迎宾酒... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。近年来,各类投资不...
广东国宾酒业有限公司买酒送股权... 追损是个系统工程,如果你正苦于不知如何着手挽回损失,或者担心自己处理不好,可以添加锐明法律微信随时在...
迎宾(深圳)商务咨询有限公司买... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合 在股票投资交流中,...
惠创联盟直播间李总讲课诗酒茶第... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。骗子:“存钱利率才...
东方创富会国英控股直播间讲课老... 最近是不是总在股票群、直播间,甚至刷个短视频都能看到这类消息?“买几箱酒,就能白拿公司股权,等上市分...
惠创联盟直播间李总讲课战略经销... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为其他类似股权情景,如有雷同纯属巧合。作为普通...
中志浩刺梨产业开发(贵州)有限... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 在股票投资领域,...
学梦起航大讲堂老袁深圳市琦白久... 如果你正苦于不知如何着手挽回损失,或者担心自己处理不好,可以添加锐明法律微信随时在线,电话同步:19...