谷歌Gemini3.1Pro正式发布最直观的变化就是在推理能力上。ARC-AGI

科技小周说 2026-02-20 21:08:52

谷歌Gemini3.1Pro正式发布最直观的变化就是在推理能力上。ARC-AGI-2测试77.1%的得分,几乎是上一代的两倍,在复杂逻辑题上终于有了能和竞品掰手腕的底气。

不过它也不是完美的。实测中能感觉到,强推理带来了一定的延迟,在实时交互场景下不如预期丝滑。而且在SWE-Bench Pro这类纯编码测试里,它依然略逊于GPT-5.3。

从整体来看,这更像是一次精准的补短板操作,接下来就看实际落地场景里,这份实力能不能真正转化成用户粘性了。

0 阅读:0
科技小周说

科技小周说

感谢大家的关注