“买个菜不用开坦克去”!全球AI浪潮开始聚焦“小而美”
创始人
2024-07-08 02:01:59
0

财联社7月5日讯(编辑 潇湘)在全球范围内,人工智能军备竞赛最初的起点是追求“大”: 巨型模型在海量的数据上进行训练,试图模仿具有人类智能水平的人工智能。

然而如今,大量科技巨头和初创企业正在开始考虑缩小AI软件的规模,使其更便宜、更快速、更专业……

这类AI软件被称为小型语言模型(SLM)或中型语言模型,使用较少的数据进行训练,通常专为特定任务而设计。

作为对比,那些知名的大型语言模型(LLM),如OpenAI的GPT-4,开发成本超过1亿美元,训练的参数达到了逾1万亿。而较小的语言模型则通常在较窄的数据集上进行训练——例如,可能仅仅聚焦于法律问题上,其训练成本往往可能不到1000万美元,参数不到100亿。较小的模型也将消耗较少的算力,因此响应每个查询的成本也较低。

近几个月来,微软就正在大力宣传其名为“Phi”轻量级AI模型系列。微软首席执行官Satya Nadella表示,这些模型的大小只有OpenAI的ChatGPT免费模型的1/100,而执行许多任务的效果却几乎一样好。

微软首席商务官Yusuf Mehdi表示,“我认为,我们越来越有理由相信,未来将是一个由不同(大小)模型组成的世界。”

Mehdi称,微软是全球首批在生成式人工智能上押注数十亿美元的大型科技公司之一。而我们也很快意识到,人工智能的运营成本比公司最初预计的要高。

微软最近还推出了新型的AI笔记本电脑,搭载数十个人工智能模型进行搜索和图像生成。这些模型需要用到的数据非常少,可以在终端设备上运行,而不需要像ChatGPT那样访问庞大的基于云端的数据中心。

谷歌以及人工智能初创公司Mistral、Anthropic和Cohere今年也发布了更小的模型。苹果在六月份公布该公司的AI路线图时,也计划使用小型模型,这样就可以完全在手机上运行软件,使其更为快捷方便、也更为安全。

就连一直处于大型模型模型浪潮前沿的OpenAI,也在5月发布了其旗舰模型的新版本GPT-4o,并称该模型运营成本更低。一位发言人OpenAI表示,该公司对未来发布更小的模型持开放态度。

AI模型浪潮开始聚焦“小而美”

对于许多任务来说——比如汇总文档或生成图像,大型语言模型如今显得可能会有些“奢侈”。一些行业人士将此形容为“相当于开着坦克去买菜”。

目前从事区块链技术研究的Illia Polosukhin是2017年谷歌一篇开创性论文的作者之一,该论文为当前的生成式人工智能热潮奠定了基础。Polosukhin近来就表示,单单计算“2+2”不应该需要进行无数次运算。

事实上,从财务成本的考量来看,在生成式人工智能技术的回报尚不明确的情况下,企业和消费者也一直在寻找以更低成本运行AI的方法。

位于以色列特拉维夫的人工智能公司AI21 Labs的联合创始人Yoav Shoham称,由于只需使用较少的算力,在许多情况下,小型模型回答问题的成本仅为大型语言模型的六分之一。如果你要进行数十万甚至数百万次回答,使用大模型在经济上其实行不通。

当前的关键在于,如何更有效地将这些较小的模型集中在一组数据上,如内部通信、法律文件或销售数字,以执行撰写电子邮件等特定任务——这一训练过程被称为微调(Fine-tuning)。通过微调,可以让小型模型在执行这些任务时与大型语言模型一样有效,而成本只是大型模型的一小部分。

初创公司Snorkel AI的联合创始人Alex Ratner表示,“让这些更小、更专业的模型在这些更枯燥但更重要的领域工作,是目前人工智能的前沿领域。”

Snorkel AI目前的业务范围包括帮助企业定制人工智能模型。

企业用户也正转向小模型?

在企业用户端,信用评级公司益百利近来已将其用于金融咨询和客户服务的AI聊天机器人,从大语言模型转向了小语言模型。

益百利首席数据官Ali Khan表示,在公司内部数据上进行训练时,小型模型的表现与大型模型不相上下,而成本仅为大型模型的一小部分。他表示,这些小模型可以针对一个明确的问题领域和一系列任务进行特定训练。

Salesforce人工智能部门主管Clara Shih则表示,这些小模型的响应速度相比大模型也更快。

Shih称,“使用大型模型你会付出过高的成本并且有延迟问题。有时候也根本用不着。”

值得一提的是,在开始向小语言模型转变的同时,诸多AI巨头大型语言模型的迭代速度也在放缓。

自OpenAI去年发布GPT 4(与之前的模型GPT 3.5相比,功能有了显著提升)以来,还没有新的迭代模型(GPT 5)发布。研究人员认为,造成这种情况的原因包括用于训练的高质量新数据稀缺。

这一趋势也让人们开始更为关注小模型。领导Phi模型项目的微软公司高管塞Sébastien Bubeck表示,“现在正是大家都在等待的一个小间歇期,这会让人们的注意力转向,他们会想,‘好吧,我们还能不能让这些东西更高效?’”

目前,还不清楚这种迭代停滞是暂时的,还是遭遇了一个更为棘手的技术瓶颈问题。但是,小型语言模型的大量涌现,仍说明了人工智能正在从科幻小说般的梦幻演示,演变成了不那么令人兴奋的商业现实。

当然,许多公司并没有完全放弃大型语言模型。苹果已宣布将在其Siri助手中加入ChatGPT,以执行撰写电子邮件等更复杂的任务。微软表示,其最新版的Windows也将集成OpenAI的最新模型。不过,两家公司都只是将OpenAI集成作为其整体人工智能方案的一部分,而显然并没有把所有的筹码都押注于此。

(财联社 潇湘)

相关内容

热门资讯

拉曼高光谱成像与机器学习在生物... 生物制药树脂作为一类关键的材料,在生物制药领域扮演着至关重要的角色。这些树脂主要由聚合物化学成分组成...
运营商财经网康钊:法国不遗余力... 运营商财经 康钊/文 根据新华社10月4日报道,欧盟委员会4日宣布,对自中国进口电动汽车加征关税...
库克微博发文缅怀乔布斯!他近期... 10月5日,苹果(AAPL,股价:226.800美元;总市值:3.448万亿美元)首席执行官蒂姆·库...
扎克伯格成世界第2大富豪,身价... 【#扎克伯格成世界第2大富豪#,身价仅次于马斯克】 据IT之家报道,10月4日,据彭博亿万富翁指数显...
三星电子海外147000名员工... 来源:芯智讯 10月2日消息,继此前传出三星将对海外子公司的非生产人员进行大规模裁员的消息之后,据...
德国财长:反对对华电动车加征关... △德国联邦财政部长林德纳(资料图) 当地时间10月4日,欧盟就是否对中国电动汽车征收为期五年的反补贴...
无需水泥更高效!瑞士科研人员打... (央视财经《第一时间》)瑞士一所大学的科研人员近日制造了一台“建筑机器人”,使用环保材料“打印”房屋...
战斗民族果然彪悍!俄罗斯人用真... 快科技10月4日消息,近日,一段俄罗斯人用真人测试理想L9自动刹停的视频在社交平台引发热议(视频中误...
【奋进强国路 阔步新征程】建设... 央视网消息(新闻联播):制造业是国家经济命脉所系,是立国之本、强国之基。新中国成立75年以来,我国制...
非银机构多点发力促消费 为引导金融租赁公司、企业集团财务公司、消费金融公司和汽车金融公司(以下简称“非银机构”)更好发挥差异...
法国育碧突传“卖身”消息,腾讯... 财联社10月6日讯(编辑 赵昊)据媒体报道,知情人士透露,腾讯控股和吉利莫特(Guillemot)家...
原创 老... 最近,一则有关美联储降息的消息激起了全球资本市场的涟漪。几乎一瞬间,资本似乎都打了兴奋剂,本来是想借...
原创 离... 最近几天离岸人民币突然大跳水,可以说是惊出众人一身冷汗。自从美国加息预期加强之后,人民币一路从7.3...
原创 京... 文 | 卢万磊 最近,华为的三折叠屏手机,其颠覆性的设计引发市场持续关注。作为华为第一款三折叠屏手机...
云南农产品前8月进出口双增长 今年以来,省商务厅和有关部门聚焦云南省果蔬、咖啡、花卉、中药材等优势产品,稳住南亚东南亚市场,积极开...
中金:国庆假期期间主动外资本周... 来源:港股那点事 格隆汇10月5日|中金发布研究报告表示,假期期间港股与中概继续大涨,被动外资加速流...
广发证券:国庆后市场对政策的乐... 【广发证券:国庆后市场对政策的乐观期待依然会推高股市】财联社10月1日电,广发证券认为,行情大幅快速...
机器学习在水处理中重金属去除的... 随着工业化和城市化的快速发展,水体污染成为一个全球性的环境问题。尤其是重金属污染,由于其对人体健康和...
OpenAI获66亿美元融资,... 【ITBEAR】近日,全球AI领域的领军企业OpenAI在旧金山成功筹集了66亿美元的新资金,使其估...
赵建:因节日港股成为了A股的“... 赵建西京研究院创始院长中国首席经济学家论坛成员 国庆小长假,香港只休了一天,剩余的前三天“独舞”。...