豆包开源视频大模型激活每个摄像头
创始人
2025-02-12 19:01:49

民生证券近日发布计算机行业点评:豆包开源视频大模型激活每个摄像头。

以下为研究报告摘要:

事件:2月10日,据豆包大模型团队官宣发布视频生成实验模型“VideoWorld”,不同于Sora、DALL-E、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。

开源视频生成模型最新成果,可仅靠视觉认知世界。

视频生成成为通用知识学习方法,在现实世界充当“人工大脑”。作为一种通用视频生成实验模型,VideoWorld去掉语言模型,实现了统一执行理解和推理任务。同时基于一种潜在动态模型,可高效压缩视频帧间的变化信息,显著提升知识学习效率和效果。且目前该项目代码与模型已开源。在不依赖任何强化学习搜索或奖励函数机制前提下,VideoWorld达到了专业5段9x9围棋水平,并能够在多种环境中,执行机器人任务。团队认为,视频生成可以成为一种通用的知识学习方法,并在现实世界充当思考和行动的“人工大脑”。

模型仅靠“视觉”即可学习知识,“预测”未来,并“理解”因果关系。研究团队构建了两个实验环境:视频围棋对战和视频机器人模拟操控,它在保留丰富视觉信息的同时,压缩了关键决策和动作相关的视觉变化,实现了更有效的视频学习,且这种纯视觉模型可“预测”未来,并能“理解”因果关系。在未来,豆包团队将着力解决其在真实世界环境中的应用,仍面临着高质量视频生成和多环境泛化等挑战。

视觉认知世界的能力有望激活“视觉市场”为其打开增长空间。

海康威视为代表的“视觉市场”有望在视频大模型的能力催化下收益,作为全球知名的视频监控行业龙头企业,根据2024年度全球安防50强榜单,海康威视以97.22亿美元的2023年安防产品销售收入稳居第一,超过后两名的总和。2022年,海康威视明确智能物联(AIOT)战略,2023年,公司正式推出“观澜大模型”助力各行业实现数字化、智能化升级。根据Omdia报告,2022年海康威视在全球视频监控市场中的占有率达到25.9%,大幅领先于第二名。在庞大的视频监控部署网络下,开源视频大模型的诞生对海康而言无疑是一剂强心针。

萤石网络公司2023年智能家居摄像头业务营收占比62.07%,且作为公司的现金牛业务及第一增长曲线,市场占有率处于市场前列,且连续多年在双11、618等购物节的天猫、抖音等平台相关类目品牌排行中位列第一。且公司在视觉技术方面拥有硬件、软件、云平台高度融合的生态闭环,端云协同,为智能检测、智能识别、AI分析推理等功能提供了强大支持。视觉大模型的发布有望进一步助推萤石网络视觉领域业务再上台阶。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

黄金跳水 连续四日下挫!今日跌... 财联社5月15日讯(编辑 王蔚)今日,黄金价格跳水,日内跌幅超2%,已连续四个交易日走低,截至发稿日...
佳源服务股东大会全票反对重选阮... 观点网讯:5月15日,佳源服务控股有限公司召开2026年股东周年大会,其中重选阮红女士为非执行董事的...
小米开源自动驾驶模型 Xiao... 5月14日消息,小米正式开源自动驾驶模型Xiaomi OneVL。小米CEO雷军亲自解读了该模型的技...
李彦宏首提 DAA,需问 DA... 5 月 13 日,Create2026 百度 AI 开发者大会在北京开幕。李彦宏在开幕演讲中提出了一...
跨境贸易便利化行动再升级!国际... 5月15日凌晨,一批来自孟加拉国达卡的3150公斤服装产品,在双流国际机场空侧快速完成换单后,直接搭...
股价位列A股第四!科创板“新秀... 财联社5月15日讯(编辑 梓隆),今日(5月15日),联讯仪器长阳攀升,截至收盘,其大涨超6%,盘中...
八年后,他再次站在甲醛仪前,关... 我干了八年空气检测,钻过上千户人家的新房子,拧开过几万支采样管。今天,我想讲几个故事,关于那些“免费...
年销7亿却没有工厂,互联网老兵... 舒义在快消品圈子里算个“异类”。 早年踩着互联网风口,舒义大学没毕业就赚了第一桶金500万,后来创立...
最强二代!万向集团鲁伟鼎接班九... 在中美顶级企业晚宴中,坐着一位低调的浙商大佬。 5月14日晚间,在美国总统特朗普访华的欢迎宴会上,与...
国家电网公司举办控股上市公司2... 5月15日,国家电网公司在上海证券交易所举办控股上市公司2025年度暨2026年第一季度集体业绩说明...