中信证券:OpenAI发布草莓模型o1 通用推理能力显著提升
创始人
2024-09-18 00:40:39

智通财经APP获悉,中信证券发布研报称,北京时间9月13日凌晨,OpenAI发布全新AI推理系列大模型o1。该系列模型通过引入大规模强化学习算法,将模型思维展现为思维链,从而显著提高了模型通用推理能力和对齐效果。根据OpenAI官方测评,o1不仅在绝大多数推理任务中表现优于GPT-4o,甚至在部分推理密集型基准测试中可与人类专家相媲美。推理性能提升的同时,o1系列模型推理算力需求大幅提升,o1-preview定价约为GPT-4o的12倍,后续降本值得关注。

投资层面看,尽管o1系列模型纯文字输出形式限制了其应用场景,但是随着底层算法能力提升带来的通用推理能力的进步,中信证券认为AI爆款应用有望从科研、编程等高价值场景起率先解锁,软件、互联网有望率先受益。除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,中信证券仍然持续看好 AI 算力层面,尤其是得益于商业端逐步成熟而带来的更多的 AI 推理侧算力的机会。

中信证券主要观点如下:

事项:

北京时间9月13日凌晨,全球AI产业领头羊OpenAI正式发布一系列旨在专门解决复杂任务的全新AI推理大模型o1,即之前酝酿已久的草莓模型。根据OpenAI官方推特,o1系列模型将包括o1、o1-preview和o1-mini,其中o1-preview已开放使用,ChatGPT Plus和Team的用户以及API使用等级达到5级(API付费超1000美元)的开发者已获得该模型访问权限,企业版和教育版的用户预计将从9月16日起获得该模型访问权限。与此前The information、The medium等媒体报道基本一致,o1模型在功能、推理和性能表现上基本符合预期。

模型机理及评测效果:强化学习加持下编码/数学/推理能力提升显著。

根据OpenAI技术博客,o1模型在训练过程中引入了大规模强化学习算法,从而加强了其执行复杂推理任务的能力。而根据“Reinforcement learning: An introduction”(Sutton),强化学习起源于上世纪60年代,旨在通过奖惩机制让智能体在复杂环境中最大限度获得长期全局最优收益。强化学习主要包括定义问题、选择策略、学习价值函数(如Q学习)、模型控制和策略优化等步骤。此前谷歌围棋机器人AlphaGo的核心技术即为强化学习。在应用该项技术后,o1系列模型的输出过程与GPT系列模型存在显著不同:o1系列模型会先用至多20~30秒产生较长的思维链再进行输出,即先将复杂任务拆解为子任务进行分析,在汇总子任务结果后输出最终结果,而非GPT系列模型立即开始生成的模式。根据OpenAI官网,o1模型在理科测试、数学、编程等绝大多数推理任务中表现明显优于GPT-4o,甚至在部分推理密集型基准测试中o1模型的表现与人类专家相媲美。例如,在国际奥林匹克资格考试中,o1正确解答了83%的题目,而GPT-4o仅正确解答13%;在PhD水平科学问答测试中,o1和o1-preview表现均优于人类专家与GPT-4o。

市场定位:安全性与推理能力显著提升有望解锁应用,模型成本有待优化。

风险因素:

AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;私有数据相关的政策监管风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;AI潜在伦理、道德、用户隐私风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。

投资策略:

本次o1系列模型的更新仍然是围绕底层算法层面,尤其是大语言模型的推理能力。从技术角度,o1系列大模型的基础能力在大规模强化学习方法加持下在得到显著提升,不仅证明了在scale继续堆规模和训练计算投入的道路上仍有不断的迭代空间,更表明推理阶段有望继续遵循Scaling Law,从而带来推理端算力需求的大幅增长。应用层面,尽管o1系列模型仅有文字输出能力限制了其应用场景的开阔,但是随着底层算法能力提升带来的通用推理能力的进步,我们认为AI爆款应用有望从科研、编程等高价值场景起率先解锁,软件、互联网有望率先受益。除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,我们仍然持续看好 AI 算力层面,尤其是得益于商业端逐步成熟而带来的更多的 AI 推理侧算力的机会。

来源:智通财经网

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

领益智造:收购立敏达,卡位AI... 【12月24日国盛指领益智造收购立敏达,开拓增长新引擎】12月24日,国盛指出,领益智造收购立敏达,...
国诚投资高净值俱乐部服务费能退... 国诚投资高净值俱乐部服务费能退吗?误导性宣传坑惨股友真相曝光。夸大收益遭陷阱可退费!深圳市国诚投资咨...
上海华迹智能科技有限公司原始股... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。​ 什么是原始股?...
博通商学院上海华迹智能华璇传感... 尽管原始股投资中出现风险事件的概率不低,但“人无股权不富”的说法也有其现实依据——如果恰好遇上高速发...
海能怎么退费? 投顾服务其实是... 海能怎么退费? 投顾服务其实是套路!股民被诱导前提下均可退费!夸大收益遭陷阱可退费!“交了两万六的投...
上海华迹智能科技有限公司股票是... 不过,在这份对财富的期待背后,也潜藏着一些需要警惕的投资风险。部分机构或个人会以“企业即将上市”为宣...
赤壁青砖茶:老字号求变 剑指年... 传统茶品如何拥抱新市场?在擦亮“万里茶道”名片国际传播项目——“赤壁青砖茶走进呼和浩特”采访活动中,...
博通商学院上海华坞科技合伙企业... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 股民朋友们通过购...
和众汇富投资vip会员服务费能... 和众汇富投资vip会员服务费能退吗?投顾服务其实是套路!股民被诱导前提下均可退费!不少投资者在与和众...
京东回应法国仓库遭盗抢:目前仓... 近日,有消息称,京东位于法国塞纳-圣但尼省的仓库遭窃,超过5万台3C数码设备(包括手机、电脑和平板电...