为什么在探索大模型之余,百融云创还要将小模型做精?
创始人
2024-07-27 01:01:14

最近AI产业出现了新的风向标:小模型正在积极爆发。

在ChatGPT横空出世后的一段时间内,业内严格遵循Scaling Law(规律定律),即更大参数、更大数据和更强算力才能够收获更好的模型智能。

但最近“大力出奇迹”的理念正在转变,海外巨头例如Mistral、Deepseek、微软、Meta、Google争相推出了一系列小巧但功能强大的小模型,甚至连Scaling Law的提出者OpenAI都杀入小模型赛场,发布了轻量版GPT-4o mini。

种种迹象显示,AI赛道的竞争格局正在重塑,那就是大模型不再是唯一,而只是AI产业的组成部分,越来越多的小模型、专用模型以及行业定制模型正在崭露头角,它们将与大模型互补结合,对外输出更加智能化的解决方案。

轻量版模型风起时

小模型集体涌现的一大背景是海内外市场竞相掀起的模型价格战,甚至将API调用的价格卷至“白菜价”。激烈的商业竞争下,模型在性能提升之余,需要更加考虑性价比、更加侧重轻巧化落地,从这个角度来说,针对不同的应用场景,将模型参数做小、做精几乎是种必然。

“大模型竞争会加剧‘倒退’至小尺寸,一些非常小的模型思考能力也会非常好且可靠。”曾参与创办OpenAI的AI大牛Andrej Karpathy如此表示。

国内市场也不乏轻量版模型布局者,比如阿里、商汤、科大讯飞、百融云创等等。作为一站式服务的AI科技领航者,百融云创(百融云-W,6608.HK)在百模大战交锋正酣之时便提出重要的是寻求算力参数、用户意图与实时反馈之间的平衡,需要警惕陷入“博算力”的误区。

同时,百融云创也是为数不多的坚定推进“模型应用一体化”布局的AI科技公司。2023年,该公司将AI软件栈与开发工具栈进行深度整合,搭建形成的AI大模型全栈开发体系覆盖从模型预训练、微调、对齐到部署工程优化等环节,极大地压缩了模型的训练、迭代和推理成本。

在这一全栈开发体系下,百融云创搭建了大模型(BR-LLMs)的应用一站式开发平台——Cybertron(赛博坦),并将大模型与RAG(检索增强生成)等技术相结合,对外以Agent、Copilot形式落地到金融、出行、租赁、物流等多个垂直场景中。

百融云创AI创新负责人认为,并不是所有的应用场景都需要非常强大的模型,某些特定场景比如绿色项目鉴定、智能单据识别等情形,并不依赖庞大复杂的模型结构,更加需要的是借助大模型帮助实现精准化文本解析、信息抽取和语义匹配,由此可以借助Cybertron平台的“知识库”来优化模型,从而求取模型性能与成本效益之间的最优性价比。

除了成本平衡约束,小模型的崛起还与大模型端侧化落地趋势相关,因小模型可以更好适配终端算力受限的场景。比如微软把Phi-3系列模型中的3.8B mini版直接装进了苹果A16芯片的手机里,使其可以在Phone 15上运行。另外,Google Gemini系列中的Nano已经在Pixel 8 Pro和三星Galaxy S24上实现部署。机构推测,OpenAI未来推出的GPT-5极有可能是端侧的小参数模型版本。

基于端云协同战略方向,百融云创也在发力将智能语音、多模态等技术集成到端侧,除了在布局参数量较大的2D与3D数字人Avatar之外,也在开发高效、低能耗的端侧小模型,以应用于手机、车载等智能终端。

未来是混合AI的时代

从技术上来说,轻量级模型参数虽小,但要实现有限算力下的超强性能门槛并不低,需要大量的训练数据投入、模型优化及对于硬件的有效利用等等。

以百融云创的智能语音机器人(Voice-GPT)来说,该产品基于Transformer架构,内置了FreeSWITCH(软交换)、ASR(自动语音识别)、TTS(文字转语音)、NLP(自然语言处理)等技术,自2018年推出以来持续赋能商业机构存量焕活、新客运营等。目前其在音色、情感、语速、对话层面百融云创能够提供“真人级”的互动体验,同时对客户语音识别的准确率能达到99%以上。

上述性能的实现除因百融云创在语音识别、语音理解等通用技术领域的沉淀之外,还得益于其自主研发的一种语音质检分析方法及系统。该质检系统在精确捕捉客户意向、交互情绪之后,会自动反馈生成可视化报告,“反哺”模型优化升级。以百融云创与某国有银行合作为例,通过将Voice-GPT嵌入银行的零售业务线,相比人工工况,可节省约90%的运营成本。

值得注意的是,百融云创还借势决策式AI的力量来增益大模型性能。财报显示,在2023年,该公司共上线了300余个小模型,其中针对用户画像分析、个性化推荐等蕴含决策式AI技术的小模型可以增强模型间的互补性,提高对于不同应用场景的适配度。

在百融云创看来,单一模型无法解决垂直行业的所有问题,需要的是多模型、多元化的AI技术组合拳。以大模型为基座,将其与成熟的小模型结合,再加上充分的行业Know-How,可以提升整个数智系统的成熟度和性价比,从而跑通大模型应用的PMF,构筑起更加坚固的护城河。

以百融云创帮助金融机构搭建的“一站式绿色金融解决方案”为例,该方案的底层技术包含机器学习、深度学习、OCR、模糊匹配等,在此基础上搭建的工具层中,既包含模型套件,还有流程引擎、报表工具等,大模型只是其中一个组成模块,通过模型间的互补增强,整个AI解决方案打开的是包括绿色项目识别认定、环境效益测算、绿色客户管理等十余个应用场景。

“未来,模型应用的发展趋势将呈现大模型与小模型相结合的特点,同时,机器学习平台将致力于开发更多的大模型组件、工具链,构建开闭源模型生态,并与底层算力资源进行紧密绑定。”艾瑞咨询在报告中如此表示。

来源:金融界资讯

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

厦门达愉文化传媒有限公司短剧投... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。最近许多人找到我们...
《逃婚世子小神医》短剧投资的回... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。最近许多人找到我们...
老虎淘金APP平台订购白银输的... 老虎淘金APP平台订购白银输的不少钱亏损的钱能退吗?可以依法追回亏损,10天维权退款方法!白银投资里...
《长安诡事传》怎么样?短剧投资... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。最近许多人找到我们...
《我家娘子河东狮》短剧投资真的... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。最近许多人找到我们...
最新!盈盈订购app亏钱了怎么... 白银现货平台骗局大起底:高收益背后的财富陷阱与维权实战”在抖音、今日头条等平台打广告的顶点订购app...
《烬天》短剧投资是真是假?经过... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。最近许多人找到我们...
北京铭记文化传播有限责任公司 ... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。最近许多人找到我们...
《那年风吹夏正暖》短剧投资的制... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。最近许多人找到我们...
新华社出图·年度记忆丨闪耀世界... 2025年是“十四五”规划收官之年 我国创新指数首次跻身全球前十 这一年来 世界见证了 中国科技创新...