马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4
太空与网络
2024-03-29 21:36:31

原标题:马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

就在刚刚,马斯克Grok大模型宣布重大升级。

难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。

来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大”

新版本Grok有啥突破?

一是上下文长度飙升,从8192增长到128k,和GPT-4齐平。

二是推理性能大幅提升,数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。

消息一出,评论区立刻就躁起来了。

具体跑分结果如何,咱们立马来看。

Grok-1.5来了

首先,对于上下文窗口。

这次是一把直接提升到之前的16倍,来到128k量级。

这也就意味着Grok可以处理更长和更复杂的提示,同时保持其遵循指令的能力。

在“大海捞针”(NIAH)测试中,Grok-1.5在128K token的上下文中完美检索嵌入的文本。

整个图一水儿的蓝色(100%的检索深度):

其次,推理方面。

Grok-1.5处理编程和数学相关任务的能力大幅提升,全面超越Grok-1、Mistral Large、Claude 2。

数学方面,Grok-1.5在MATH基准测试上得分50.6%,超越中杯Claude 3 Sonnet;GSM8K上得分90%。

编程方面,Grok-1.5在HumanEval基准测试上得分74.1%,超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4,仅次于大杯Claude 3 Opus。

看起来,Grok这次的实力也是不可小觑。

Grok系列与其他大模型相比还有一个特色,不使用通用的Python语言+Pytorch框架。

据官方介绍,Grok 1.5采用分布式训练架构,使用Rust、JAX+Kubernetes构建。

为了提高训练可靠性和维持正常运行时间,团队提出了自定义训练协调器,可自动检测到有问题的节点,然后剔除。

除此之外,他们还优化了checkpointing、数据加载和训练重启等流程,最大限度地减少故障停机时间。

这,才速速有了现在的Grok 1.5~

更多信息官方也暂时还没有披露。

可以确定的是,新版本未来几天会先推送给早期测试者。并按照“老规矩”,很快将在𝕏平台上线。

网友们表示:Grok进步真的相当迅速。

不提别的,Grok新版本各指标已经全面超越Claude 2。而xAI成立仅一年,只比Anthropic落后9个月。因此:

打赌12个月后,xAI完全有可能成为领导者。

还有人评价更高,认为马斯克这是发了另一个“GPT-4等效模型”,喊着:

OpenAI搞快点啊。

你期待新版本的Grok吗?

参考链接:

[1]https://twitter.com/xai/status/1773510159740063860[2]https://x.ai/blog/grok-1.5

>End

>>>

本文转载自“量子位”,原标题《马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4》。

为分享前沿资讯及有价值的观点,太空与网络微信公众号转载此文,并经过编辑。

未按照规范转载及引用者,我们保留追究相应责任的权利

部分图片难以找到原始出处,故文中未加以标注,如若侵犯了您的权益,请第一时间联系我们。

HISTORY/往期推荐

坚持道路自信 直面未来挑战——“对标SpaceX”的思考

混合所有制模式:新型举国体制在商业航天发展中的逻辑演进和实践路径(之一)

混合所有制模式:商业航天领域推进新型举国体制的重要途径

迪斯尼传播快乐,美丽星球点亮梦想

>>>

充满激情的新时代,

充满挑战的新疆域,

与踔厉奋发的引领者,

卓尔不群的企业家,

一起开拓,

一起体验,

一起感悟,

共同打造更真品质,

共同实现更高价值,

共同见证商业航天更大的跨越!

——《太空与网络》,观察,记录,传播,引领。

>>>

·《卫星与网络》编辑委员会

高级顾问:王国玉、刘程、童旭东、相振华、王志义、杨烈

· 《卫星与网络》创始人:刘雨菲

·《卫星与网络》副社长:王俊峰

· 微信公众号(ID:satnetdy)团队

编辑:艳玲、哈玫,周泳、邱莉、黄榕

主笔记者:李刚、魏兴、张雪松、霍剑、乐瑜刀子、赵栋

策划部:杨艳、若㼆、李真子

视觉总监:董泞

专业摄影:冯小京、宋伟

设计部:顾锰、潘希峎、杨小明

行政部:姜河、林紫

业务部:王锦熙、瑾怡

原创文章转载授权、转载文章侵权、投稿等事宜,请加微信:18600881613

商务合作;展览展厅设计、企业VI/CI及室内设计、企业文化建设及品牌推广;企业口碑传播及整体营销传播等,请加微信:13811260603

杂志订阅,请加微信:wangxiaoyu9960

· 卫星与网络各分部:

成都分部负责人:沈淮

长沙分部负责人:宾鸿浦

西安分部负责人:郭朝晖

青岛分部负责人:江伟

· 卫星与网络总部负责人:农燕

· 会议活动部负责人乔颢益、许克新、董今福

· 投融资及战略层面合作:刘雨菲

· 本平台签约设计公司:一画开天(北京)文化创意设计有限公司

· 航天加(深圳)股权投资基金管理负责人:杨艳

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

警惕高 能云智投“收费带炒股”... 警惕高 能云智投“收费带炒股”的套路!荐股是幌子,服务费换垃圾票,能退费高 能云智投投顾服务费是可以...
高 能云智投“收费带炒”暗藏哪... 高 能云智投“收费带炒”暗藏哪些猫腻?荐股只为套服务费,垃圾票亏本金,合理退费有方法高 能云智投投顾...
股民真实爆料:高 能云智投“收... 股民真实爆料:高 能云智投“收费带炒股”坑人无数,荐股是幌子,垃圾票亏了能退服务费高 能云智投投顾服...
高 能云智投“收费带炒股”靠谱... 高 能云智投“收费带炒股”靠谱吗?答案在这里!荐股虚设,服务费换垃圾票,退费有妙招高 能云智投投顾服...
别再被高 能云智投“收费带赚... 别再被高 能云智投“收费带赚”的谎言忽悠!荐股就是幌子,垃圾票亏惨,服务费可追回高 能云智投投顾服务...
能不能追回在鲲鹏订购app输的... 能不能追回在鲲鹏订购app输的本金?不用怕大卫有办法 有用的退款流程!目前,从事现货交易不像证券、期...
我国科研人员突破海水制氢提镁联... 针对电解水制氢成本高的挑战,海南大学联合中国科学院宁波材料技术与工程研究所,突破直接电解天然海水制氢...
如何拿回在贵州云上大宗输的本金... 如何拿回在贵州云上大宗输的本金?需尽快维权退款 成功不收费退款流程!在云上大宗商品旗下雪花订购APP...
如何追回在指尖订购APP亏的钱... 如何追回在指尖订购APP亏的钱?解决办法有很多 有用的退款流程!指尖订购APP亏钱了是可以要回来的,...
怎么拿回在天龙订购白银APP亏... 怎么拿回在天龙订购白银APP亏损的本金?不用担心可以退款 2026年正规维权流程!建议广大投资者:当...