News

Google Gemini Hits 750M MAU — Gemini 3.1 Pro Leads ARC-AGI-2 at 77.1%

原文链接：https://tech-insider.org/google-gemini-750-million-users-march-2026-updates/ 来源：Tech Insider / Alphabet Q4 2025 财报发布日期：2026-03-23

速查卡

项目	内容
一句话总结	Gemini 两年从 700 万用户增长到 7.5 亿，ARC-AGI-2 抽象推理得分 77.1% 碾压 GPT-5.2 和 Claude Opus 4.6
大白话版	Google 把 AI 塞进搜索、Chrome、Android 等十几亿人已经在用的产品里，不用下新 App 就自动触达用户——这是 OpenAI 和 Anthropic 无法复制的分发护城河
核心数字	7.5 亿 MAU / ARC-AGI-2 77.1% / 240 万 API 开发者 / 850 亿次月 API 请求 / $2/MTok 输入
价值评级	A — 三大厂中增长最快的 AI 平台，分发优势不可复制
适用场景	AI 平台竞争分析、模型选型决策、投资策略

文章背景

Alphabet Q4 2025 财报披露后，Gemini 的用户增长曲线震惊了行业——两年内从 700 万到 7.5 亿，107 倍增长，速度超越 TikTok 和 Instagram 早期。同期发布的 Gemini 3.1 Pro 在 ARC-AGI-2 抽象推理基准上翻倍至 77.1%，远超 GPT-5.2（52.9%）和 Claude Opus 4.6（68.8%）。

完整内容还原

用户增长轨迹：从 700 万到 7.5 亿

时间	MAU	增长事件
2023 Q4	700 万	Gemini 初始发布
2025 Q2	8,200 万	集成进 Search AI Overviews
2025 Q3	6.5 亿	Android/Chrome/Workspace 全面嵌入
2025 Q4	7.5 亿	Gemini 3.1 Pro 发布后

关键在于分发模式差异：ChatGPT 需要用户主动下载独立 App，Gemini 则嵌入用户已有的产品矩阵中。Wedbush Securities 分析师 Dan Ives 评价：“Google 的结构性分发优势不可复制。他们不需要说服用户下载新应用，只需在已有数十亿用户的产品中打开 Gemini 开关。”

Sundar Pichai 在 Q4 财报电话会上强调：“我们的第一方模型现在每分钟通过 API 处理超 100 亿 token，Gemini App 月活已超 7.5 亿。“

Gemini 3.1 Pro：改变 Benchmark 竞赛格局

2026 年 2 月 20 日发布的 Gemini 3.1 Pro 在 16 项主要基准中 13 项领先。最引人注目的突破：

Benchmark	Gemini 3.1 Pro	Claude Opus 4.6	GPT-5.2	GPT-5.3-Codex
ARC-AGI-2（抽象推理）	77.1%	68.8%	52.9%	—
GPQA Diamond（科学）	94.3%	91.3%	92.4%	—
HLE With Tools	51.4%	53.1%	45.5%	—
Terminal-Bench 2.0 Standard	68.5%	65.4%	54.0%	64.7%
SWE-Bench Verified	80.6%	80.8%	80.0%	—
SWE-Bench Pro	54.2%	—	55.6%	56.8%
MRCR v2 128K	84.9%	77.0%	84.9%	84.0%

核心突破：ARC-AGI-2 翻倍

从 Gemini 3 Pro 的约 38% 跃升到 3.1 Pro 的 77.1%——所有主要模型中改进幅度最大。ARC-AGI-2 测试的是抽象推理和模式泛化能力，被认为是衡量通用智能的最佳代理指标之一。77.1% 的得分意味着 Gemini 在”举一反三”能力上已大幅超越竞争对手。

定价：性能王也是性价比王

模型	输入/MTok	输出/MTok	上下文窗口	输出速度
Gemini 3.1 Pro	$2.00	$12.00	1M tokens	114 tok/s
Claude Opus 4.6	$15.00	$75.00	200K tokens	~80 tok/s
GPT-5.3	$10.00	$30.00	128K tokens	~90 tok/s

Gemini 3.1 Pro 的输入成本仅为 Claude Opus 4.6 的 1/7.5，输出成本仅为 1/6.25，上下文窗口是其 5 倍。在性能接近甚至领先的同时，成本差距惊人。

3 月密集更新

Gemini Canvas：搜索内互动工作区，用户可在搜索界面直接完成项目规划、文档撰写、简单应用构建——从”链接检索”到”任务完成”的范式转变
Gemini App Actions：Pixel 上的 Agentic AI，自然语言跨第三方应用执行复杂任务
Circle to Search 升级：多目标同时识别
Workspace 全面 AI 集成：Docs/Sheets/Slides/Drive 全线嵌入 Gemini
Deep Think 模式：数分钟级深度分析，面向严肃研究和工程

API 开发者生态

240 万活跃 API 开发者（同比 +118%）
2026 年 1 月单月处理 850 亿次 API 请求（同比 +142%）
Google Cloud 收入同比增长 34%，Gemini 驱动
Alphabet 年收入首次突破 $4000 亿

核心技术洞察

分发即护城河：Gemini 的 7.5 亿 MAU 不是靠产品力赢来的，而是靠嵌入十几亿人已有产品矩阵”被动触达”。这种增长模式 OpenAI 和 Anthropic 无法复制——除非与同等规模的分发平台深度整合。
ARC-AGI-2 的质变信号：抽象推理能力翻倍不是渐进改进，而是训练方法论的突破。Google 在 reasoning 训练（可能结合了 RL 和搜索增强推理）上取得了质的飞跃。
成本-性能帕累托前沿移动：$2/MTok 输入 + 77.1% ARC-AGI-2——Gemini 3.1 Pro 同时推动了成本和性能的帕累托前沿。这对所有依赖 API 的 Agent 开发者是直接利好。

实践指南

🟢 立即可用

API 迁移评估：对比 Gemini 3.1 Pro vs Claude Opus 4.6 在具体任务上的表现，成本可能降低 5-7 倍
长上下文场景：1M token 窗口适合大代码库审查、长文档分析、多文件 Agent 工作流

🟡 需要适配

编码任务：GPT-5.3-Codex 在 Terminal-Bench Custom 和 SWE-Bench Pro 上仍有优势，编码密集型项目需实测对比
Tool Use：Claude Opus 4.6 在 HLE With Tools 上略领先，工具密集型 Agent 需评估

🔴 注意事项

“被动 MAU” 的含金量：7.5 亿用户中大量是 Search AI Overviews 的被动触达，深度使用率可能远低于 ChatGPT
Canvas 零点击搜索：AI Overviews 导致 61% 的点击率下降——出版商和 SEO 行业面临存在性威胁

横向对比

维度	Gemini	ChatGPT	Claude
MAU	7.5 亿	~8.1 亿	未公开
分发模式	产品内嵌	独立 App/网站	独立 App/API
定价（输入）	$2/MTok	$10/MTok	$15/MTok
ARC-AGI-2	77.1%	52.9%	68.8%
编码（SWE-Bench）	80.6%	80.0%	80.8%
上下文窗口	1M	128K	200K
增长驱动	分发优势	品牌力+先发	安全叙事+开发者

批判性分析

局限性

“被动 MAU” 水分：Google 自家产品内嵌的 MAU 与独立 App 的主动使用是完全不同的用户参与度
Canvas 的双刃剑：解决用户问题的同时摧毁了支撑 Google 广告模型二十年的点击流量生态
$1850 亿 CapEx：大幅扩张的资本支出引发投资者对 ROI 的严重质疑（Alphabet 周跌 9%）

适用边界

Gemini 在需要深度推理（ARC-AGI-2、GPQA）和成本敏感的场景中优势最大
在编码和工具使用密集型场景中，Claude 和 GPT-5.3 仍有竞争力

独立观察

Google 正在从”搜索引擎”变成”智能操作系统”——Search → Canvas → App Actions 的进化路径清晰
240 万 API 开发者 + 850 亿月请求 = Gemini 的 B2B 飞轮正在加速
如果 ARC-AGI-2 的训练方法可以迁移到其他领域，Gemini 的能力护城河可能进一步加深