火山引擎发布大模型训练视频预处理方案,已应用于豆包视频生成模型
创始人
2024-10-15 17:21:57
0

10月15日,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。

火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长层面为企业寻找解法。”谭待说。

自研多媒体处理框架BMF ,助力豆包视频生成模型突破业界难题

据介绍,对训练视频进行预处理是保障大模型训练效果的重要前提。预处理过程可以统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息,从而使模型能更高效地学习视频中的特征和知识,提升训练效果和效率。

抖音集团视频架构负责人王悦表示,对大模型厂商而言,上述过程中面临着诸多挑战。

“首先,超大规模视频训练数据集导致计算和处理成本激增,”王悦说,“其次是视频样本数据参差不齐,然后是处理链路环节多、工程复杂,最后还面临着对GPU、CPU、ARM等多种异构算力资源的调度部署。”

图说: 抖音集团视频架构负责人王悦介绍火山引擎大模型训练视频预处理方案。

借助Intel的CPU、GPU等不同资源,火山引擎此次发布的大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本。BMF lite支持端侧大模型接入和算子加速,更加轻量、通用。

Bytedance Research 负责人李航介绍,豆包视频生成模型PixelDance在训练过程中采用了火山引擎的大模型训练视频预处理方案,充分利用了大量潮汐资源,为模型训练提供了有力支撑。火山引擎视频云团队提供的点播解决方案还为PixelDance生产的视频提供了从编辑、上传、转码、分发、播放的全生命周期一站式服务,让模型的商业化应用有了保障。

据了解,豆包视频生成模型PixelDance于9月24日发布,该模型采用 DiT 架构,通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,突破了多主体运动的复杂交互、多镜头切换的内容一致性难题,在业界引起广泛关注。目前,豆包视频生成模型已通过火山引擎面向企业开启邀测。

多项“音视频+AI”技术方案,助力企业全链路适配AIGC时代

此次活动中,火山引擎还发布了跨语言同声复刻直播方案、多模态视频理解与生成方案、对话式AI实时交互方案和AIG3D&大场景重建方案,从视频的生产端、交互端到消费端,全链路融入了AI的能力。

火山引擎视频云负责人Yongyuan 指出,在AI视频时代,人和AI交互变得更加动态和生动,这要求处理链路更加智能和交互。

以对话式AI实时交互方案为例,依托豆包大模型和火山引擎视频云自研的多项算法,火山引擎为用户提供了智能对话和自然语言处理的强大能力,可实现毫秒级人声检测和打断响应,以及丝滑稳定的端到端响应体验。

在沉浸式消费体验方面,火山引擎通过AI生成3D内容和大场景重建方案,为山西高平二郎庙金代戏台和北京正乙祠两座珍贵的历史建筑生成了3D数字资产,并以虚拟直播间的形式应用于抖音的戏曲直播场景。

大会上,王悦还透露了字节自研视频编解码芯片的最新进展,经过抖音集团内部的实践验证,该芯片在同等视频压缩效率下,成本节省了95%以上,还在2024MSU世界编码器大赛中一举夺得最佳ASIC编码器。

王悦表示,该芯片将于近期正式对外开放测试,招募首批种子用户,共同探索商业价值的可复制性。

火山引擎视频云团队为字节跳动提供音视频技术,并通过火山引擎服务外部客户。

文/张德帅

更多内容请下载21财经APP

相关内容

热门资讯

9月新能源销量:金九之下,零售... 今年年初,当比亚迪董事长王传福抛出他的预测,“单月新能源车零售渗透率会突破50%大关。”瞬间,遭到了...
高台:首台全自动水库割草设备投... 近日,县水务局购置的新型液压式全自动水库割草设备在大湖湾水库投入运行,标志着我县在水库清洁方面迈出了...
原创 地... 10月8日,港交所网站挂出地平线PHIP办招股书,意味着地平线正式通过港交所另寻,即将踏入港股市场。...
归来!出任耐克全球CEO 希尔... 耐克集团(NYSE:NKE)正面临数十年来最艰难的局面之一,作为全球最大的运动品牌,耐克长期将竞争对...
有点意外!ESG基金也有锐度 自9月24日以来,中国资产突然爆发,这一波行情可以用“旱地拔葱”来形容,尽管近期有所回调,但上证指数...
2024年世界标准日祝词及海报... 2024年世界标准日祝词——美好世界的共同愿景: 聚焦可持续发展目标 人工智能时代的工业、创新和基础...
原创 2... 2024年10月10日至12日,上海这座国际大都市再次成为全球科技界的焦点,随着上海国际消费电子展(...
企业眼中的农高会 | 极目农业... 金秋时节,硕果飘香。伴随着旋翼转动的轰鸣声,一架满载作业的农业无人机,在位于杨凌的陕果产业科研创新基...
未来之翼:无人机技术的崛起 引言 Introduction 无人机技术,作为现代科技的先锋,正在迅速改变我们的生活和工作方式。从...
联仁健康亮相2024中国移动全... 转自:经济参考网 近日,联仁健康医疗大数据科技股份有限公司(以下简称“联仁健康”)亮相2024中国移...
东宏股份涨0.93%,成交额5... 来源:新浪证券-红岸工作室 10月15日,东宏股份涨0.93%,成交额5978.06万元,换手率1....
银行IPO“哑火”千日 多重利好政策的推动下,银行股重新走上了上升通道。然而,在近期银行板块回暖的背景下,银行IPO却迎来了...
沪金再破600 京东金融社区大... 沪金再破600元大关! 尽管周一早盘,现货黄金震荡走弱,但市场热度不减,午后民生银行积存金一度冲上6...
大北农第三季度净利暴涨超3倍,... 图源:图虫创意 猪价持续回升,去年大亏的大北农(002385.SZ)今年前三季度实现盈利。 据大北农...
原创 董... 格力空调在国内家电市场中,一直都凭借着强悍的品牌实力位居领先地位,甚至在全球的家电业,格力品牌也有很...
事关培育专精特新中小企业、打造... 事关培育专精特新中小企业、打造独角兽企业、帮助企业拓展市场……工业和信息化部权威解读来了! 完善“...
肖振东卸任华为天津公司董事长 天眼查App显示,近日,华为技术(天津)有限公司发生工商变更,肖振东卸任法定代表人、董事长,由陈旻接...
入市第一天就套牢?A股风云变幻... 近期,中国股市经历了一波史诗级的上涨行情。自9月20日以来,A股多日千股涨停的神话,沪指不仅快速收复...
郑煤机拟10.49亿元收购恒达... 【大河财立方 记者 徐姣】10月14日,郑州煤矿机械集团股份有限公司(以下简称郑煤机)公告称,拟使用...
双十一抢跑,商家们发愁的不只是... 文 | 山上 “亲,您反馈的问题,已有服务人员联系您沟通处理完毕,祝您生意兴隆!” 经历了上半年一...