今天凌晨,Google 发布 Gemini 3.1 Pro

核心提升在推理能力
-
• ARC-AGI-2(抽象推理基准)从 3 Pro 的 31.1% 跳到 77.1%,翻了一倍多 -
• GPQA Diamond(科学知识推理)从 91.9% 提到 94.3% -
• Terminal-Bench 2.0(终端编程)从 56.9% 提到 68.5% -
• SWE-Bench Verified(代码修复)从 76.2% 提到 80.6%

目前处于 preview 阶段,已在 Gemini API(AI Studio)、Gemini CLI、Antigravity、Vertex AI、Gemini App 和 NotebookLM 推送

代码生成 Demo
Google 在发布页面展示了四个 Demo,集中在「代码生成 + 创意设计」的交叉领域:
SVG 动画。t 生成带交互的 SVG 插画:花盆中小苗发芽,hover 时茎生长、叶子展开。3 Pro 只画出了花盆,3.1 Pro 完整实现了动画交互。因为是纯代码生成,输出的 SVG 可以无损缩放,文件体积比视频小几个数量级
实时数据仪表盘。3.1 Pro 构建了一个航天仪表盘,接入国际空间站的公开遥测数据流,实时可视化轨道信息。从 API 对接到前端渲染一步完成
3D 交互仿真。一个叫「Murmuration」的椋鸟群飞模拟——3D boid 算法,支持手部追踪操控,鸟群运动还会生成对应的音乐。多感官交互体验
文学主题转译。给 Emily Brontë 的《呼啸山庄》做一个现代个人网站。模型理解了小说的氛围基调,设计出符合主人公气质的界面,配上约克郡荒原的摄影
这四个 Demo 的共同点:都是从意图理解到完整产品的端到端输出
定价与可用渠道
标准 context(200K 以内):
每百万 token,输入 $2,输出 $12
超长 context(200K 以上):
每百万 token,输入 $4,输出 $18

订阅方面:
-
• Google AI Pro $19.99/月 -
• Ultra $249.99/月 -
• Plus $7.99/月
渠道:
-
• 开发者:Gemini API(AI Studio)、Gemini CLI、Antigravity、Android Studio -
• 企业:Vertex AI、Gemini Enterprise -
• 消费者:Gemini App、NotebookLM(Pro/Ultra 专属)

