Esc
输入关键词开始搜索
News

Google Gemini Hits 750M MAU — Gemini 3.1 Pro Leads ARC-AGI-2 at 77.1%

Google Gemini Hits 750M MAU — Gemini 3.1 Pro Leads ARC-AGI-2 at 77.1%

原文链接:https://tech-insider.org/google-gemini-750-million-users-march-2026-updates/ 来源:Tech Insider / Alphabet Q4 2025 财报 发布日期:2026-03-23

速查卡

项目内容
一句话总结Gemini 两年从 700 万用户增长到 7.5 亿,ARC-AGI-2 抽象推理得分 77.1% 碾压 GPT-5.2 和 Claude Opus 4.6
大白话版Google 把 AI 塞进搜索、Chrome、Android 等十几亿人已经在用的产品里,不用下新 App 就自动触达用户——这是 OpenAI 和 Anthropic 无法复制的分发护城河
核心数字7.5 亿 MAU / ARC-AGI-2 77.1% / 240 万 API 开发者 / 850 亿次月 API 请求 / $2/MTok 输入
价值评级A — 三大厂中增长最快的 AI 平台,分发优势不可复制
适用场景AI 平台竞争分析、模型选型决策、投资策略

文章背景

Alphabet Q4 2025 财报披露后,Gemini 的用户增长曲线震惊了行业——两年内从 700 万到 7.5 亿,107 倍增长,速度超越 TikTok 和 Instagram 早期。同期发布的 Gemini 3.1 Pro 在 ARC-AGI-2 抽象推理基准上翻倍至 77.1%,远超 GPT-5.2(52.9%)和 Claude Opus 4.6(68.8%)。

完整内容还原

用户增长轨迹:从 700 万到 7.5 亿

时间MAU增长事件
2023 Q4700 万Gemini 初始发布
2025 Q28,200 万集成进 Search AI Overviews
2025 Q36.5 亿Android/Chrome/Workspace 全面嵌入
2025 Q47.5 亿Gemini 3.1 Pro 发布后

关键在于分发模式差异:ChatGPT 需要用户主动下载独立 App,Gemini 则嵌入用户已有的产品矩阵中。Wedbush Securities 分析师 Dan Ives 评价:“Google 的结构性分发优势不可复制。他们不需要说服用户下载新应用,只需在已有数十亿用户的产品中打开 Gemini 开关。”

Sundar Pichai 在 Q4 财报电话会上强调:“我们的第一方模型现在每分钟通过 API 处理超 100 亿 token,Gemini App 月活已超 7.5 亿。“

Gemini 3.1 Pro:改变 Benchmark 竞赛格局

2026 年 2 月 20 日发布的 Gemini 3.1 Pro 在 16 项主要基准中 13 项领先。最引人注目的突破:

BenchmarkGemini 3.1 ProClaude Opus 4.6GPT-5.2GPT-5.3-Codex
ARC-AGI-2(抽象推理)77.1%68.8%52.9%
GPQA Diamond(科学)94.3%91.3%92.4%
HLE With Tools51.4%53.1%45.5%
Terminal-Bench 2.0 Standard68.5%65.4%54.0%64.7%
SWE-Bench Verified80.6%80.8%80.0%
SWE-Bench Pro54.2%55.6%56.8%
MRCR v2 128K84.9%77.0%84.9%84.0%

核心突破:ARC-AGI-2 翻倍

从 Gemini 3 Pro 的约 38% 跃升到 3.1 Pro 的 77.1%——所有主要模型中改进幅度最大。ARC-AGI-2 测试的是抽象推理和模式泛化能力,被认为是衡量通用智能的最佳代理指标之一。77.1% 的得分意味着 Gemini 在”举一反三”能力上已大幅超越竞争对手。

定价:性能王也是性价比王

模型输入/MTok输出/MTok上下文窗口输出速度
Gemini 3.1 Pro$2.00$12.001M tokens114 tok/s
Claude Opus 4.6$15.00$75.00200K tokens~80 tok/s
GPT-5.3$10.00$30.00128K tokens~90 tok/s

Gemini 3.1 Pro 的输入成本仅为 Claude Opus 4.6 的 1/7.5,输出成本仅为 1/6.25,上下文窗口是其 5 倍。在性能接近甚至领先的同时,成本差距惊人。

3 月密集更新

  1. Gemini Canvas:搜索内互动工作区,用户可在搜索界面直接完成项目规划、文档撰写、简单应用构建——从”链接检索”到”任务完成”的范式转变
  2. Gemini App Actions:Pixel 上的 Agentic AI,自然语言跨第三方应用执行复杂任务
  3. Circle to Search 升级:多目标同时识别
  4. Workspace 全面 AI 集成:Docs/Sheets/Slides/Drive 全线嵌入 Gemini
  5. Deep Think 模式:数分钟级深度分析,面向严肃研究和工程

API 开发者生态

  • 240 万活跃 API 开发者(同比 +118%)
  • 2026 年 1 月单月处理 850 亿次 API 请求(同比 +142%)
  • Google Cloud 收入同比增长 34%,Gemini 驱动
  • Alphabet 年收入首次突破 $4000 亿

核心技术洞察

  1. 分发即护城河:Gemini 的 7.5 亿 MAU 不是靠产品力赢来的,而是靠嵌入十几亿人已有产品矩阵”被动触达”。这种增长模式 OpenAI 和 Anthropic 无法复制——除非与同等规模的分发平台深度整合。

  2. ARC-AGI-2 的质变信号:抽象推理能力翻倍不是渐进改进,而是训练方法论的突破。Google 在 reasoning 训练(可能结合了 RL 和搜索增强推理)上取得了质的飞跃。

  3. 成本-性能帕累托前沿移动:$2/MTok 输入 + 77.1% ARC-AGI-2——Gemini 3.1 Pro 同时推动了成本和性能的帕累托前沿。这对所有依赖 API 的 Agent 开发者是直接利好。

实践指南

🟢 立即可用

  1. API 迁移评估:对比 Gemini 3.1 Pro vs Claude Opus 4.6 在具体任务上的表现,成本可能降低 5-7 倍
  2. 长上下文场景:1M token 窗口适合大代码库审查、长文档分析、多文件 Agent 工作流

🟡 需要适配

  1. 编码任务:GPT-5.3-Codex 在 Terminal-Bench Custom 和 SWE-Bench Pro 上仍有优势,编码密集型项目需实测对比
  2. Tool Use:Claude Opus 4.6 在 HLE With Tools 上略领先,工具密集型 Agent 需评估

🔴 注意事项

  1. “被动 MAU” 的含金量:7.5 亿用户中大量是 Search AI Overviews 的被动触达,深度使用率可能远低于 ChatGPT
  2. Canvas 零点击搜索:AI Overviews 导致 61% 的点击率下降——出版商和 SEO 行业面临存在性威胁

横向对比

维度GeminiChatGPTClaude
MAU7.5 亿~8.1 亿未公开
分发模式产品内嵌独立 App/网站独立 App/API
定价(输入)$2/MTok$10/MTok$15/MTok
ARC-AGI-277.1%52.9%68.8%
编码(SWE-Bench)80.6%80.0%80.8%
上下文窗口1M128K200K
增长驱动分发优势品牌力+先发安全叙事+开发者

批判性分析

局限性

  • “被动 MAU” 水分:Google 自家产品内嵌的 MAU 与独立 App 的主动使用是完全不同的用户参与度
  • Canvas 的双刃剑:解决用户问题的同时摧毁了支撑 Google 广告模型二十年的点击流量生态
  • $1850 亿 CapEx:大幅扩张的资本支出引发投资者对 ROI 的严重质疑(Alphabet 周跌 9%)

适用边界

  • Gemini 在需要深度推理(ARC-AGI-2、GPQA)和成本敏感的场景中优势最大
  • 在编码和工具使用密集型场景中,Claude 和 GPT-5.3 仍有竞争力

独立观察

  • Google 正在从”搜索引擎”变成”智能操作系统”——Search → Canvas → App Actions 的进化路径清晰
  • 240 万 API 开发者 + 850 亿月请求 = Gemini 的 B2B 飞轮正在加速
  • 如果 ARC-AGI-2 的训练方法可以迁移到其他领域,Gemini 的能力护城河可能进一步加深