• 回复
  • 收藏

近日,人工智能初创公司xAI发布了更新版Grok3大模型,埃隆·马斯 ...

古法王   发帖之星 楼主 2 小时前 来自手机   显示全部楼层 来自:浙江湖州
近日,人工智能初创公司xAI发布了更新版Grok 3大模型,埃隆·马斯克称之为“地球上最聪明的人工智能”。

根据官方公开的测试结果,Grok 3在包括AIME(评估模型在一系列数学问题上的表现)和 GPQA(评估模型在博士级别的物理学、生物学和化学问题上的表现)等基准测试中,远超 GPT-4o、Gemini-2 Pro、DeepSeek V3、Claude 3.5 Sonnet 等大模型。

在大模型竞技场 Chatbot Arena(LMSYS)测试中,xAI工程师表示,早期版本的Grok 3获得了第一的成绩,达到了140分,超越了Gemini 2.0 Flash Thinking实验版本、ChatGPT-4o最新版本以及最近大火的DeepSeek R1等等。

然而,有些用户在体验后却对Grok 3的能力产生了质疑,他们认为Grok 3的能力并没有马斯克宣称的那么强大。OpenAI应用研究主管Boris Power则对Grok团队在模型评估中的行为表示失望,指出其存在作弊和欺骗的动机。Boris Power提到,o3-mini在各项评估中均优于Grok 3。
回复

使用道具 举报

大神点评(4)

论坛精灵   社区管理 2 小时前 显示全部楼层 来自:浙江湖州
有道财富App如何下载最新版?点击查看:https://club.youdaocaifu.com/clubThreadDetail-3425468.html
回复 支持

使用道具 举报

lqm2015   世界首富 2 小时前 来自手机   显示全部楼层 来自:四川南充
关注一下
参与人数 1宝石 +2 收起 理由
小财神 + 2 解决零回复,赞一个!

查看全部评分总评分 : 宝石 +2

[发帖际遇]: 拿破仑对lqm2015 说:“一旦下定决心,就要坚持到底;不要再有任何‘如果’或‘但是’。” lqm2015 听后得到了2 颗宝石。 幸运榜 / 衰神榜
回复 支持

使用道具 举报

nwd7pv29pk   世界首富 1 小时前 来自手机   显示全部楼层 来自:上海
人工智能
参与人数 1宝石 +1 收起 理由
小财神 + 1 解决零回复,赞一个!

查看全部评分总评分 : 宝石 +1

回复 支持

使用道具 举报

nwdve3mlw   世界首富 1 小时前 来自手机   显示全部楼层 来自:安徽芜湖
人工智能
[发帖际遇]: 拿破仑对nwdve3mlw 说:“胜利属于最坚韧的人。” nwdve3mlw 听后得到了2 颗宝石。 幸运榜 / 衰神榜
回复 支持

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版奖励规则

HOT • 推荐

关注119

粉丝250

帖子55564