苹果FastVLM模型开放试用:Mac用户秒享“闪电级”视频字幕,生成速度较同类AI快85倍
创始人
2025-09-02 13:01:07

9 月 2 日消息,科技媒体 9to5Mac 昨日(9 月 1 日)发布博文,报道称苹果公司在 Hugging Face 平台上,推出了 FastVLM 视觉语言模型的浏览器试用版。

IT之家注:FastVLM 以其“闪电般”的视频字幕生成速度著称,只要用户拥有搭载 Apple Silicon 芯片的 Mac 设备,即可轻松上手体验这一前沿技术。

FastVLM 模型的核心优势在于其卓越的速度和效率。该模型利用苹果自研的开源机器学习框架 MLX 进行优化,专为 Apple Silicon 芯片设计。与同类模型相比,FastVLM 模型体积仅为三分之一左右,不过在视频字幕生成速度上却能提升 85 倍。

苹果此次发布的 FastVLM-0.5B 轻量版,可在浏览器内直接加载运行。根据该媒体实测,在 16GB M2 Pro MacBook Pro 上,首次加载模型需数分钟,不过在启动后,便能精准描述画面中的人物、环境、表情及各种物体。

值得一提的是,该模型支持本地运行,所有数据均在设备端处理,无需上传至云端,从而保障了用户的数据隐私。

FastVLM 的本地运行能力及其低延迟特性,让其在可穿戴设备和辅助技术领域展现出巨大潜力。例如,在虚拟摄像头应用中,该工具能即时详细描述多场景内容,FastVLM 未来有望成为这些设备的核心技术,为用户提供更智能、更便捷的交互体验。

【来源:IT之家】

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

全省唯一!贵阳高新区企业,福布... 近日,福布斯中国正式发布2025新兴科技企业T30&30榜单,贵阳高新区企业贵州翰凯斯智能技术有限公...
涨价成常态!联想:存储芯片高价... 快科技6月28日消息,据Wccftech报道,在近日举行的ISC 2026行业大会上,联想发布市场研...
2026年附台开发的技术路径与... 随着移动互联网与本地化消费需求的深度融合,附台开发正从基础的位置服务向智能化、场景化方向演进。进入2...
2026年拍照出片效果好的手机... 随着手机影像技术的飞速发展,随手一拍就能获得质感大片,已经成为许多用户的核心需求。无论是记录毕业旅行...
多级降压调节阀厂家梳理 高压差... 导语:针对多级降压调节阀在煤化工、炼油等高压差易汽蚀工况下的选型需求,建立一套客观评估框架尤为重要。...
LCD退场、Micro-OLE... 文/VR陀螺 Wickey 2026 年 6 月初,Meta 与视涯科技、京东方正式签约。行业普遍认...
当墨香遇上科技,上海图书馆解锁... 当传统文化场馆邂逅前沿数字科技,将迎来怎样的数智化蜕变? 最近这几天,业界瞩目的MWCS2026正在...
原创 1... 【本文仅在今日头条发布,谢绝转载】 本文作者——李超|《太空探索》杂志专业撰稿人 2026年6月,长...
康菲石油公司(ConocoPh... 一、公司概况康菲石油公司(ConocoPhillips)是全球最大的独立勘探和生产(E&P)公司之一...
燃情绿茵,中国移动全球通与您同... 随着赛事哨声吹响,绿茵激情再度点燃世界。四年一度的足坛盛事牵动亿万目光,中国移动全球通依托扎实的网络...