火山引擎发布大模型训练视频预处理方案 已应用于豆包
创始人
2024-10-15 14:00:47

10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。

火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长层面为企业寻找解法。”谭待说。

据介绍,对训练视频进行预处理是保障大模型训练效果的重要前提。预处理过程可以统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息,从而使模型能更高效地学习视频中的特征和知识,提升训练效果和效率。

抖音集团视频架构负责人王悦表示,对大模型厂商而言,上述过程中面临着诸多挑战。

“首先,超大规模视频训练数据集导致计算和处理成本激增,”王悦说,“其次是视频样本数据参差不齐,然后是处理链路环节多、工程复杂,最后还面临着对GPU、CPU、ARM等多种异构算力资源的调度部署。”

借助Intel的CPU、GPU等不同资源,火山引擎此次发布的大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本。BMF lite支持端侧大模型接入和算子加速,更加轻量、通用。

据了解,豆包视频生成模型PixelDance于9月24日发布,该模型采用 DiT 架构,通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,突破了多主体运动的复杂交互、多镜头切换的内容一致性难题。目前,豆包视频生成模型已通过火山引擎面向企业开启邀测。

【来源:网易科技】

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

广东首个GMP干细胞药厂项目正... 2026年5月20日,2026国际(广州)干细胞与精准医疗产业化大会在广州国际生物岛开幕,广东省首个...
怎么在济南选择奢侈品名表回收及... 随着消费升级的推进,不少济南市民家中都有闲置的黄金首饰、高端腕表、品牌包袋等贵重物品,无论是想要盘活...
618观察:直播电商挖掘出了怎... 618大促正式落下帷幕。 此次大促过程中,抖音电商消费券带动直播成交额超百万元的商家数量同比增长15...
原创 S... 海外科技产业曝出重磅产业合作,SpaceX 官宣与 AI 初创企业 Reflection AI 签署...
合规致远·价值共生:时代传媒集... 2026年,全面注册制改革进入深水区,5月24日,《上市公司董事会秘书监管规则》正式施行,监管“长牙...
十四年上市路,三闯港股IPO!... 星标★IPO日报 精彩文章第一时间推送 深耕光储领域的古瑞瓦特历经十四年资本长跑,三度闯关港股。公司...
2025投中私募股权基金业绩基... 来源:市场资讯 (来源:) K型曲线的右侧,账面浮盈与到手现金之间,是一条越来越深的沟壑。 作者 ...
马云“插秧图”来了!周靖人现身 每经记者:陈婷 每经编辑:程鹏 记者|陈婷 编辑|程鹏 杜恒峰 校对|张锦河 每日经济新闻记者获悉,...
巨星科技入局,这家头部民营银行... 【导读】巨星科技拟成为网商银行第九大股东 中国基金报记者 嘉合 6月23日,记者获悉,继2025年网...
跨越山河的守护:平安消费金融以... 践行“金融为民”,不仅体现在每一处服务细节中,更彰显于每一次社会责任的主动担当里。作为持牌消费金融机...