2026-02-19 16:41:14

谷歌今天發布了Gemini 3.1 Pro，剛看到測試評分，感覺這是衝著屠榜來的（模型軍備競賽繼續，利好半導體！）😂

官方定位很明確：專為複雜任務設計，比如深度研究、工程難題、長鏈推理和agentic工作流。
核心亮點：1M token上下文窗口（保持不變）
多模態支持（文本+圖像+視頻+音頻+代碼）
輸出最高64k tokens
性能對比當前主流模型（Claude Opus 4.6、GPT-5.2/5.3等）：
ARC-AGI-2（最難的抽象推理基準）：
Gemini 3.1 Pro 77.1%，領先Claude 4.6（68.8%）約8-9個百分點，
領先GPT-5系列20-30+個百分點。這是最大進步，代表核心推理質的飛躍。
GPQA Diamond（PhD級科學推理）：94.3%，小幅領先Claude 4.6（91.3%）和GPT-5.2（92.4%），差距2-3個百分點，基準已接近飽和。
SWE-Bench Verified（真實軟體工程任務）：80.6%，領先Claude 4.6（約76-77%）3-5個百分點，領先GPT明顯（5-15%）。
其他：Terminal-Bench、APEX-Agents等長時agent任務上也拿下多個第一；LMArena/Artificial Analysis指數目前排第1，成本效率高。
更重要的是，成本優勢明顯：
API定價（每1M tokens，基於Vertex AI / Gemini API最新數據，≤200k上下文標準價）：
Gemini 3.1 Pro：輸入 $2.00，輸出 $12.00（>200k上下文翻倍到$4/$18）
Claude Opus 4.6：輸入 $5.00，輸出 $25.00
GPT-5.2 / 5.x：輸入通常$10–15+，輸出$30–75+（高端tier更高，具體視版本）
優勢幅度：輸入：Gemini比Claude便宜約60%（2 vs 5），比GPT系列便宜70–80%以上。
輸出：Gemini比Claude便宜約52%（12 vs 25），比GPT便宜60–80%以上。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人按讚了這條動態

讚賞
1
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
Gate廣場AI測評官
26.75萬熱度
#
Gate2月衍生品市場份額創新高
11.68萬熱度
#
加密市場上漲
46.57萬熱度
#
比特幣站上七萬美元
4986.11萬熱度
#
AAVE換幣風波
175.2萬熱度

熱門 Gate Fun
查看更多

1
LB
龙币
市值:$2462.06持有人數:1
0.00%
2
Hk
HK
市值:$0.1持有人數:1
0.00%
3
来根鸡巴
来根鸡巴
市值:$0.1持有人數:1
0.00%
4
来根鸡巴
来根鸡巴
市值:$0.1持有人數:1
0.00%
5
来根华子
来根华子
市值:$0.1持有人數:1
0.00%

谷歌今天發布了Gemini 3.1 Pro，剛看到測試評分，感覺這是衝著屠榜來的（模型軍備競賽繼續，利好半導體！）😂

熱門話題

Gate廣場AI測評官

Gate2月衍生品市場份額創新高

加密市場上漲

比特幣站上七萬美元

AAVE換幣風波

熱門 Gate Fun

LB

龙币

Hk

HK

来根鸡巴

来根鸡巴

来根鸡巴

来根鸡巴

来根华子

来根华子

置頂