原创 中国AI突破封锁,又一模型正式诞生,训练成本仅50美元!
创始人
2025-02-08 02:41:06

美国对中国高科技产业的打压持续升级,其中针对高端显卡的出口限制更是直指人工智能领域,意图遏制中国AI发展。

但中国科技企业并未屈服,纷纷寻求突破之道,2025年开年便传来好消息,深度求索公司推出的DeepSeek-R1模型便给西方国家上了一课,即便是缺少先进的AI芯片也能做出顶级模型。

而DeepSeek之所以能够做出顶级模型,是因为DeepSeek深知,唯有掌握核心技术,才能摆脱受制于人的局面。

长期以来,高端显卡作为AI训练的算力基石,核心技术却被国外巨头垄断,美国的出口限制,无疑给中国AI产业带来了巨大挑战,为此DeepSeek投入大量资源,组建顶尖研发团队开发模型。

通过打破技术限制,DeepSeek做到了将训练成本降至极低水平,大模型仅使用2048块GPU训练了2个月,花费不到600万美元。

而做出性能比肩GPT-4o的大模型,DeepSeek的练成本却只有竞品的二十分之一,团队规模才139人,DeepSeek-R1大模型一经诞生,搞得美国科技圈为之震动。

当美国科技公司仍在为GPU万卡集群豪掷千亿资金时,一群中国年轻人竟然用事实证明,只需要美国公司高管一年的年薪,就能做出比肩GPT-4o的大模型。

就在DeepSeek-R1模型诞生半个月后,现在中国AI领域又传来了一个振奋人心的好消息,悄然上演了一场更具颠覆性的技术革命。

根据媒体报道,近日李飞飞团队便以不到50美元的云计算费用,训练出了一个名叫S1的AI推理模型,成本之低令人咋舌,关键是S1的各项表现竟不输GPT和DeepSeek等尖端模型。

但这还不是最炸裂的,更令美国科技圈担忧的是,李飞飞团队训练出的S1模型,其基座模型是阿里云旗下的通义千问模型。

也就是说,S1模型如此低成本的训练费用,是站在“巨人肩膀”上实现的,千问模型或许会成为未来低成本训练AI模型的新方向。

值得一提的是,李飞飞团队之所以能以不到50美元的成本训练出强大的推理模型,主要也是因为阿里云在近日悄悄升级了通义千问旗舰版模型Qwen2.5-Max。

据介绍,Qwen2.5-Max在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源模型,其中就包括当下火爆海内外的DeepSeek-V3模型。

李飞飞团队训练的S1模型,正是以千问模型为基座,通过“蒸馏”技术实现的,研究人员使用蒸馏技术,成功地从已有模型中提取出知识,并利用这些知识训练了一个新的模型。

不得不说,这样的低成本训练模式确实是一个新方向,因为无论是火爆全球的DeepSeek-V3模型,还是突然备受关注的千问模型,背后传递出了三个关键信号。

首先是中国技术团队正在通过技术创新方式,重新定义大模型的成本范式,戳破了美国企图在AI领域断层领先的泡沫。

其次是中国科技公司训练出的大模型,已经在2025年初捅破了窗户纸,杀进了决赛圈,未来有望形成国产底层操作系统。

最后是西方资本企图打造的万亿美元市场,在中国开源大模型的强烈冲击下直接搞成白菜价,戳破资本泡沫,让AI回归理性。

相信在一群中国人的努力之下,技术和算法还将得到进一步优化,到那时我们还有机会看到更多低成本、高性能的AI模型问世。对此你怎么看呢,欢迎评论、点赞、分享。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

神舟二十三号计划近日择机实施发... 中国日报5月16日电 神舟二十三号计划近日择机实施发射,船箭组合体2026年5月16日转运至发射区。...
索尼回应Xperia 1 VI... IT之家 5 月 16 日消息,科技媒体 Android Authority 今天(5 月 16 日...
良信电器申请混合式固态开关装置... 国家知识产权局信息显示,良信电器(海盐)有限公司、上海良信电器股份有限公司申请一项名为“一种混合式固...
医疗小程序开发服务商梳理 场景... 导语:医疗行业数字化转型加速,医疗小程序开发成为医院、药企、健康管理机构等提升服务效率的核心工具。基...
2026年陕西省科学实验展演活... 为广泛普及科学知识、阐释科学原理、传播科学故事、弘扬科学家精神,近日,省科技厅、省教育厅、省科协将联...
涨的是车价,要的是老命 来源:市场资讯 (来源:虎嗅APP) 出品|虎嗅汽车组 作者|邢书博杨杰 题图|视觉中国 2026...
浅谈微博社会榜内容传播 日常浏览微博不难发现,平台内有着各类细分内容榜单,其中社会榜区别于娱乐资讯、数码好物等内容榜单,主要...
坐在马斯克和库克中间的女人 【留美学子】第3804期 13年国际视角精选 仰望星空·脚踏实地 【 陈 屹 视 线 】 教 育 ·...
天玑技术+生态双轮驱动,联发科... 5 月 13 日,联发科天玑开发者大会 2026(MDDC 2026)正式举办。本届大会以“全域芯智...
临港“零界魔方”下月举办OPC... 2026上海超级个体(OPC)经济大会(简称“OPCX 2026”)暨零界魔方焕新生态发布会将于6月...