Google Gemini Hits 750M MAU — Gemini 3.1 Pro Leads ARC-AGI-2 at 77.1%
Google Gemini Hits 750M MAU — Gemini 3.1 Pro Leads ARC-AGI-2 at 77.1%
原文链接:https://tech-insider.org/google-gemini-750-million-users-march-2026-updates/ 来源:Tech Insider / Alphabet Q4 2025 财报 发布日期:2026-03-23
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | Gemini 两年从 700 万用户增长到 7.5 亿,ARC-AGI-2 抽象推理得分 77.1% 碾压 GPT-5.2 和 Claude Opus 4.6 |
| 大白话版 | Google 把 AI 塞进搜索、Chrome、Android 等十几亿人已经在用的产品里,不用下新 App 就自动触达用户——这是 OpenAI 和 Anthropic 无法复制的分发护城河 |
| 核心数字 | 7.5 亿 MAU / ARC-AGI-2 77.1% / 240 万 API 开发者 / 850 亿次月 API 请求 / $2/MTok 输入 |
| 价值评级 | A — 三大厂中增长最快的 AI 平台,分发优势不可复制 |
| 适用场景 | AI 平台竞争分析、模型选型决策、投资策略 |
文章背景
Alphabet Q4 2025 财报披露后,Gemini 的用户增长曲线震惊了行业——两年内从 700 万到 7.5 亿,107 倍增长,速度超越 TikTok 和 Instagram 早期。同期发布的 Gemini 3.1 Pro 在 ARC-AGI-2 抽象推理基准上翻倍至 77.1%,远超 GPT-5.2(52.9%)和 Claude Opus 4.6(68.8%)。
完整内容还原
用户增长轨迹:从 700 万到 7.5 亿
| 时间 | MAU | 增长事件 |
|---|---|---|
| 2023 Q4 | 700 万 | Gemini 初始发布 |
| 2025 Q2 | 8,200 万 | 集成进 Search AI Overviews |
| 2025 Q3 | 6.5 亿 | Android/Chrome/Workspace 全面嵌入 |
| 2025 Q4 | 7.5 亿 | Gemini 3.1 Pro 发布后 |
关键在于分发模式差异:ChatGPT 需要用户主动下载独立 App,Gemini 则嵌入用户已有的产品矩阵中。Wedbush Securities 分析师 Dan Ives 评价:“Google 的结构性分发优势不可复制。他们不需要说服用户下载新应用,只需在已有数十亿用户的产品中打开 Gemini 开关。”
Sundar Pichai 在 Q4 财报电话会上强调:“我们的第一方模型现在每分钟通过 API 处理超 100 亿 token,Gemini App 月活已超 7.5 亿。“
Gemini 3.1 Pro:改变 Benchmark 竞赛格局
2026 年 2 月 20 日发布的 Gemini 3.1 Pro 在 16 项主要基准中 13 项领先。最引人注目的突破:
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2 | GPT-5.3-Codex |
|---|---|---|---|---|
| ARC-AGI-2(抽象推理) | 77.1% | 68.8% | 52.9% | — |
| GPQA Diamond(科学) | 94.3% | 91.3% | 92.4% | — |
| HLE With Tools | 51.4% | 53.1% | 45.5% | — |
| Terminal-Bench 2.0 Standard | 68.5% | 65.4% | 54.0% | 64.7% |
| SWE-Bench Verified | 80.6% | 80.8% | 80.0% | — |
| SWE-Bench Pro | 54.2% | — | 55.6% | 56.8% |
| MRCR v2 128K | 84.9% | 77.0% | 84.9% | 84.0% |
核心突破:ARC-AGI-2 翻倍
从 Gemini 3 Pro 的约 38% 跃升到 3.1 Pro 的 77.1%——所有主要模型中改进幅度最大。ARC-AGI-2 测试的是抽象推理和模式泛化能力,被认为是衡量通用智能的最佳代理指标之一。77.1% 的得分意味着 Gemini 在”举一反三”能力上已大幅超越竞争对手。
定价:性能王也是性价比王
| 模型 | 输入/MTok | 输出/MTok | 上下文窗口 | 输出速度 |
|---|---|---|---|---|
| Gemini 3.1 Pro | $2.00 | $12.00 | 1M tokens | 114 tok/s |
| Claude Opus 4.6 | $15.00 | $75.00 | 200K tokens | ~80 tok/s |
| GPT-5.3 | $10.00 | $30.00 | 128K tokens | ~90 tok/s |
Gemini 3.1 Pro 的输入成本仅为 Claude Opus 4.6 的 1/7.5,输出成本仅为 1/6.25,上下文窗口是其 5 倍。在性能接近甚至领先的同时,成本差距惊人。
3 月密集更新
- Gemini Canvas:搜索内互动工作区,用户可在搜索界面直接完成项目规划、文档撰写、简单应用构建——从”链接检索”到”任务完成”的范式转变
- Gemini App Actions:Pixel 上的 Agentic AI,自然语言跨第三方应用执行复杂任务
- Circle to Search 升级:多目标同时识别
- Workspace 全面 AI 集成:Docs/Sheets/Slides/Drive 全线嵌入 Gemini
- Deep Think 模式:数分钟级深度分析,面向严肃研究和工程
API 开发者生态
- 240 万活跃 API 开发者(同比 +118%)
- 2026 年 1 月单月处理 850 亿次 API 请求(同比 +142%)
- Google Cloud 收入同比增长 34%,Gemini 驱动
- Alphabet 年收入首次突破 $4000 亿
核心技术洞察
-
分发即护城河:Gemini 的 7.5 亿 MAU 不是靠产品力赢来的,而是靠嵌入十几亿人已有产品矩阵”被动触达”。这种增长模式 OpenAI 和 Anthropic 无法复制——除非与同等规模的分发平台深度整合。
-
ARC-AGI-2 的质变信号:抽象推理能力翻倍不是渐进改进,而是训练方法论的突破。Google 在 reasoning 训练(可能结合了 RL 和搜索增强推理)上取得了质的飞跃。
-
成本-性能帕累托前沿移动:$2/MTok 输入 + 77.1% ARC-AGI-2——Gemini 3.1 Pro 同时推动了成本和性能的帕累托前沿。这对所有依赖 API 的 Agent 开发者是直接利好。
实践指南
🟢 立即可用
- API 迁移评估:对比 Gemini 3.1 Pro vs Claude Opus 4.6 在具体任务上的表现,成本可能降低 5-7 倍
- 长上下文场景:1M token 窗口适合大代码库审查、长文档分析、多文件 Agent 工作流
🟡 需要适配
- 编码任务:GPT-5.3-Codex 在 Terminal-Bench Custom 和 SWE-Bench Pro 上仍有优势,编码密集型项目需实测对比
- Tool Use:Claude Opus 4.6 在 HLE With Tools 上略领先,工具密集型 Agent 需评估
🔴 注意事项
- “被动 MAU” 的含金量:7.5 亿用户中大量是 Search AI Overviews 的被动触达,深度使用率可能远低于 ChatGPT
- Canvas 零点击搜索:AI Overviews 导致 61% 的点击率下降——出版商和 SEO 行业面临存在性威胁
横向对比
| 维度 | Gemini | ChatGPT | Claude |
|---|---|---|---|
| MAU | 7.5 亿 | ~8.1 亿 | 未公开 |
| 分发模式 | 产品内嵌 | 独立 App/网站 | 独立 App/API |
| 定价(输入) | $2/MTok | $10/MTok | $15/MTok |
| ARC-AGI-2 | 77.1% | 52.9% | 68.8% |
| 编码(SWE-Bench) | 80.6% | 80.0% | 80.8% |
| 上下文窗口 | 1M | 128K | 200K |
| 增长驱动 | 分发优势 | 品牌力+先发 | 安全叙事+开发者 |
批判性分析
局限性
- “被动 MAU” 水分:Google 自家产品内嵌的 MAU 与独立 App 的主动使用是完全不同的用户参与度
- Canvas 的双刃剑:解决用户问题的同时摧毁了支撑 Google 广告模型二十年的点击流量生态
- $1850 亿 CapEx:大幅扩张的资本支出引发投资者对 ROI 的严重质疑(Alphabet 周跌 9%)
适用边界
- Gemini 在需要深度推理(ARC-AGI-2、GPQA)和成本敏感的场景中优势最大
- 在编码和工具使用密集型场景中,Claude 和 GPT-5.3 仍有竞争力
独立观察
- Google 正在从”搜索引擎”变成”智能操作系统”——Search → Canvas → App Actions 的进化路径清晰
- 240 万 API 开发者 + 850 亿月请求 = Gemini 的 B2B 飞轮正在加速
- 如果 ARC-AGI-2 的训练方法可以迁移到其他领域,Gemini 的能力护城河可能进一步加深