长沙站|武汉站|成都站|南京站|杭州站|攀枝花|苏州站
无锡站|常州站|重庆站|长春站|东莞站|佛山站|广州站
桂林站|贵阳站|惠州站|合肥站|江门站|嘉兴站|金华站
昆明站|柳州站|宁波站|南昌站|南宁站|青岛站|上海站
您当前的位置:首页 > 新闻资讯 > 快讯
性能登顶,Grok 4 正式发布
来源:一起淘      时间:2025-07-11      点击:

昨日,xAI 正式发布新一代旗舰模型 Grok 4,马斯克还强调其是目前世界上最聪明的 AI。

据悉,本次 Grok 4 共有两个版本:Grok 4 是单智能体模型,而 Grok 4 Heavy 则是多智能体版本。其中 Heavy 支持多个智能体并行思考,在推理过程中横向比对、纵向协同,调用更大规模的计算资源以完成更复杂、更精密的任务。

性能表现上,Grok 4 在《人类最后的考试(HLE)》中,不使用任何工具的情况下,得分为 25.4%,超过了 Google Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高配版)的 21%;而在使用工具的情况下,Grok 4 Heavy 的得分达到 44.4%,远高于使用工具后 Gemini 2.5 Pro 的 26.9%。

常规的基准测试中,Grok 4 Heavy 在博士级难度的问题集 GBQA 中取得满分成绩;而在多项编程相关测试中,Grok 4 Heavy 的表现同样抢眼——都远超当前排名第二的模型。

另外,Grok 4 还在知名分析机构 Artificial Analysis 的 7 个推理相关基准评估中位列第一(得分为 73),是目前推理能力综合得分最高的模型,紧随其后的则是 OpenAI 的 o3-pro(估算值)71 分。

性能虽好,但 Grok 4 的价格可谓是真的「不讲武德」:最高可去到 3000 美元/年档位(约合人民币 21524 元)。目前,Grok 4 和 Grok 4 Heavy 已全面上线。

顶一下
回首页
回首页

一起淘最新邀请码、知买推客,注册邀请码免费发放 一起淘最新邀请码、知买推客,注册邀请码免费发放
来源:本地生活服务      点击:
2025-05-07 17:05:27