马斯克宣布Grok 4.2可能在圣诞节前发布,同时放出Grok 4.1 Fast在AI工具调用测试中的分数,实测Grok 4.1 Fast拿下93分,直接超越谷歌Gemini 3成为榜首。这次测试用的是Bench Telecom基准,专门考验AI在实际任务中的工具调用能力。结果有点意外,Grok和Hermes居然并列第一,都是93分,Claude 和 Perplexity 紧随其后87分。更关键的是速度优势,Grok 4.1 Fast版本在保持高准确率的同时响应更快。对比之下Gemini 3只有82分,OpenAI的o1系列也才75-78分区间。

