马斯克Grok3问鼎AI榜首,20万GPU加持下能否经受住市场考验?
创始人
2025-02-20 05:01:28

近期,科技界迎来了一场震撼发布——马斯克麾下的xAI公司推出了备受瞩目的Grok 3人工智能模型。这款被誉为“地球上最聪明的人工智能”的新品,在直播发布会上吸引了超过百万观众的瞩目,马斯克亲自站台,展示了其无与伦比的实力。

Grok 3背后的超级计算机集群Colossus,拥有惊人的20万块GPU,为其提供了强大的算力支持。在多项AI基准测试中,Grok 3展现出了卓越的能力,尤其是在数学、科学和编程领域,其表现更是令人瞠目结舌。例如,在美国数学邀请赛(AIME)的模拟测试中,Grok 3取得了52分的高分,远超ChatGPT的20分。在GPQA测试中,Grok 3更是以满分75分的成绩傲视群雄,而ChatGPT仅得57分。在编程能力的比拼中,Grok 3同样以57分大幅领先ChatGPT的28分。

发布会上,马斯克还展示了Grok 3的另一项绝技——生成复杂动画和游戏。这一能力在其他AI模型中极为罕见,无疑为Grok 3增添了更多的神秘色彩。然而,尽管在基准测试中表现出色,Grok 3在实际应用中却遭遇了一些挑战。部分用户反馈称,在处理特定问题时,Grok 3的回答会出现错误,这引发了对其稳定性的质疑。对于经济学和社会学等领域的问题,Grok 3的回答也显得不够精准,这或许是因为模型训练时未能全面覆盖这些领域。

尽管Grok 3在多项测试中取得了优异成绩,但它仍未能解决“表情符号之谜”这一困扰AI模型多年的难题。这一挑战仍然摆在Grok 3面前,等待其去攻克。

事实上,Grok 3已经成为第一个在AI基准测试平台lmarena.ai上得分超过1400分的模型,这一成绩在该平台上堪称天花板级别。相比之下,其他模型如ChatGPT的得分仅在1000分左右。然而,尽管Grok 3在理论上取得了如此辉煌的成就,但在实际应用中仍需面对诸多挑战。用户对其稳定性和特定领域知识覆盖面的质疑,将成为其未来能否在市场上站稳脚跟的关键。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

美股新高刷屏,A股却跌穿420... 隔夜美股又创新高,纳指、标普500双双刷新历史,道指站上50000点。英伟达大涨超4%,一片欢腾。同...
半导体设备ETF招商(5619... 格隆汇5月15日|5月15日,半导体产业链全面爆发。截至发稿,半导体设备ETF招商(561980)盘...
2026 天津名酒回收实录:津... 天津,九河下梢、码头商埠,自古就有 “好酒藏深巷” 的传统。2026 年,随着京津冀消费升级、老酒收...
韩国综合股指KOSPI盘中突破... 当地时间15日,韩国综合股指KOSPI盘中突破8000点,再度创下该指数有史以来最高点纪录。受韩国半...
515投资者保护日|华宝基金“... 来源:新浪基金 5月15日,新浪财经2026年度基金投教案例评选结果正式揭晓!华宝基金“ETF全知道...
追觅造车主体公司232万元股权... 5月15日消息,天眼查APP显示,追觅科技创始人俞浩实控的星空计划(上海)汽车科技有限责任公司(下称...
矩子科技:机器视觉设备已全面搭... 矩子科技(300802)5月15日下午在全景路演成功举办2025年度业绩说明会。针对投资者关于AI深...
载合卡车完成10亿元级战略融资... 近日,载合卡车宣布累计完成10亿元级融资。 作为AI重卡赛道的新锐领军者,载合卡车汇集了BV百度风投...