Esc
输入关键词开始搜索
News

2026-05-19 AI 日报

2026-05-19 AI 日报

上期追踪问题回应

  1. 百度模型委员会成立后,是否会在未来 24-72 小时内进一步披露负责人、汇报关系变化,或者补出“百度胜算”的首批生产级客户与审计指标?

    • 今天实际复核了新华网 05-18 19:13:36 的百度 Q1 财报稿。能确认的新进展是:百度一季度 AI 业务收入 136 亿元,占一般性业务收入 52%;AI 云收入 88 亿元、同比增 79%;基于昆仑芯的天池 256 卡超节点已点亮并称将于 6 月 上市,吞吐较上一代提 25%、推理效率提 50%。但截至目前,仍未看到模型委员会负责人与汇报链条、也没有补出“百度胜算”的首批生产级客户名单与审计指标,因此这条追踪问题只得到“商业化与基础设施指标补强、组织与客户细节仍空缺”的部分回应。
  2. 无锡 Token 工厂和昇腾 384 超节点,是否会很快补出单位 Token 成本、首批客户行业、上线时间与稳定性指标?

    • 今天实际复核了 36Kr 05-18 20:27《运营商集体进入“Token时刻”》等新稿,能看到的是三大运营商开始把 Token 作为统一经营口径推向试商用与套餐化,但没有检出无锡 Token 工厂或昇腾 384 超节点的单位 Token 成本、首批客户行业、正式上线时间与稳定性数据。因此这条追踪问题今天仍未被硬信息补全。
  3. 蔚蓝科技 BabyAlpha A3 会不会在未来 24-72 小时内公开售价、续航、开放接口和更标准化的家庭场景评测数据?

    • 今天继续按北京时间窗口检索并复核可读原文,没有找到 BabyAlpha A3 新增的售价、续航、接口开放或标准化家庭评测数据。该追踪问题继续开放。

🇺🇸 北美区

本轮额外复核了 OpenAI News 页面与 RSS、Anthropic Newsroom 正文与页面内嵌数据;按北京时间 24 小时窗口筛选后,补入 2 条北美新增。Google/DeepMind 公开页本窗口未检到同等硬度且带明确时序的新条目,因此不硬凑。

NA-1. ⭐ [A] OpenAI 联手 Dell,把 Codex 往企业内网和混合基础设施里硬塞

概述: OpenAI 官方与 RSS 显示,这篇公告发布时间为 2026-05-18 10:00:00 GMT,折算北京时间为 2026-05-18 18:00:00。公告称 OpenAI 将与 Dell Technologies 合作,把 Codex 接到 Dell AI Data Platform 与 Dell AI Factory 一侧,让企业可在混合云和本地环境中,把 Codex 更贴近私有代码库、文档、业务系统和治理体系部署。官方还披露,Codex 每周开发者使用量已超 400 万

技术/产业意义: 这条是标准 A 级。它释放的不是“又一个渠道合作”,而是 OpenAI 正在把 Codex 从云端编码助手,推向企业级 agent 运行底座。真正的竞争点开始从模型本身,转向“能不能在企业既有数据、权限和系统边界内稳定执行任务”。

深度分析: 这次合作的核心,是把 Codex 放到更靠近企业数据平面、系统平面和治理平面的地方。OpenAI 文中已经明说,Codex 的使用场景正在从 code review、test coverage、incident response 外溢到报告准备、产品反馈路由、线索筛选和跨业务系统协同。换句话说,Codex 不再只想做开发工具,而是想做企业知识工作与软件工作流的 agent 层。Dell 在这里提供的价值,不只是硬件,而是企业原本已经信任的本地/混合基础设施与数据治理容器。若这条路线成立,企业未来采购 AI 时买的就不再只是“模型 API”,而是“模型 + 数据平台 + 系统接入 + 合规部署”整套能力。

评论观察:

  • 🟢 支持:OpenAI 亲口承认 agent 的瓶颈已转向系统可达性,而不是继续卷纯 benchmark,这个判断很成熟。
  • 🔴 质疑:官方尚未给出客户案例、部署架构图和生产指标;“connect with” 与 “explore how to connect” 也说明部分能力仍在探索阶段。

信源: https://openai.com/index/dell-codex-enterprise-partnership/

关联行动: 继续追 Dell AI Data Platform / AI Factory 与 Codex 的首批客户案例、权限治理方案、回滚审计机制和更多生产级指标。

NA-2. ⭐ [A] Anthropic 收购 Stainless,开始把 SDK、CLI 与 MCP server 生成层一起收回平台腹地

概述: Anthropic Newsroom 05-18 公告显示,公司已收购 SDK 与 MCP server tooling 厂商 Stainless;页面内嵌数据 _updatedAt2026-05-18T18:12:57Z,折算北京时间 2026-05-19 02:12:57。Anthropic 明确写道,Stainless 负责生成所有官方 Anthropic SDK,且其产品可把 API spec 生成 TypeScript、Python、Go、Java、Kotlin 等多语言 SDK、CLI 和 MCP servers。

技术/产业意义: 这条也是 A 级。因为它说明 Anthropic 已经把 agent 竞争从“模型更强”推进到“连接层工业化”。MCP 解决的是工具协议统一,Stainless 解决的是 SDK、CLI、MCP server 怎么高质量、大规模、跨语言地产生出来。两者拼起来,才像一个真正的平台闭环。

深度分析: Anthropic 这次买的不是普通开发工具公司,而是 agent 执行层里最容易被低估的基础设施:接口生成、工具打包、命令行封装、连接器生产。公告里那句 “Agents are only as useful as what they can connect to” 基本已经把战场讲透了:未来模型厂商不能只发布 API,还要控制开发者如何接入 API、如何把 API 变成 CLI、如何把工具挂到 MCP server 上,最终让 agent 真能低摩擦地碰到外部世界。Anthropic 先发明 MCP,再收 Stainless,动作非常连贯——先定协议,再收生成链。对开发者与企业来说,这可能会让 Claude 平台的工具接入更顺手;对其他模型厂商来说,这会逼着大家把 SDK/连接器质量提升到平台战略高度。

评论观察:

  • 🟢 支持:平台层自己下场整合 SDK、CLI 与 MCP tooling,是非常清晰的 agent 基建动作。
  • 🔴 质疑:收购不等于整合成功;若 MCP 生态未来过度绑定 Anthropic,开放协议是否会走向“事实单平台标准”也值得继续观察。

信源: https://www.anthropic.com/news/anthropic-acquires-stainless

关联行动: 继续追 Anthropic 是否会把更多 MCP server 自动生成、版本治理与平台连接器能力产品化,以及开发者生态是否明显向 Claude Platform 倾斜。

🇨🇳 中国区

本轮实际访问并复核了 DeepSeek API Docs、Qwen 相关公开入口、智谱模型文档、Kimi 官网、MiniMax 官网、华为昇腾页面,以及 量子位 / 36Kr / 虎嗅 / 新华网 / 腾讯新闻等中文源;同时对 DeepSeek、Qwen、豆包、智谱、Kimi、百度、腾讯混元、MiniMax、零一万物、面壁、阶跃、百川、昆仑万维、商汤、讯飞、小米、昇腾、寒武纪、海光、摩尔线程等话题做了 dated 检索与过去 7 天去重。严格按北京时间 2026-05-18 10:02 之后、原文可读、发布日期明确、过去 7 天无简单重复、只保留 A/B 级内容的标准过滤后,本轮保留 8 条中国区新增。

CN-1. ⭐ [A] 百度 Q1 首次把 AI 做到收入过半,顺手把昆仑芯 P800 量产验证与天池 256 超节点一起推上台面

概述: 新华网 05-18 19:13:36 报道,百度发布 2026 年第一季度财报:总营收 321 亿元,其中 AI 业务收入 136 亿元,占一般性业务收入 52%,这是 AI 收入占比首次过半。稿件同时给出两条更硬的新信息:昆仑芯 P800 已完成规模化验证并交付多个万卡集群;基于昆仑芯的天池 256 卡超节点已点亮,称将于 6 月 上市,吞吐较上一代提升 25%、推理效率提升 50%

技术/产业意义: 这条是标准 A 级,因为它把百度从“大会上讲 DAA”推进到“财报里证明 AI 已经吞下收入核心”。更关键的是,百度把 AI 云、芯片和 Agent 应用收入放进同一份财报口径里,说明它想讲的不只是模型能力,而是全栈 AI 商业机器已经开始转起来。

深度分析: 这份财报最值得盯的不是“AI 占比过半”这句口号,而是三层结构同时被补齐。第一层是云:AI 云收入 88 亿元、同比 +79%,说明百度的增长不再只靠广告修复,而是越来越依赖面向企业与智能体工作流的推理/部署需求。第二层是芯片:P800 规模化验证与天池 256 上市预告,意味着百度正在努力把“国产算力可用”从实验室叙事推进到商用供给叙事。第三层是应用:DuMate、文库/网盘 GenFlow、百度一镜等产品被纳入财报正文,意味着百度试图把从芯片、云、模型到智能体应用的链条全部财务化。对国内大模型公司来说,这种“芯片-云-模型-应用”一体化闭环如果跑顺,会显著提高抗价格战与抗单点技术波动能力。

评论观察:

  • 🟢 支持:财报层面的 AI 收入过半,比任何发布会口号都更能证明百度的 AI 商业化已进入新阶段。
  • 🔴 质疑:天池 256 与昆仑芯 P800 给了指标,但仍缺真实客户案例、稳定性窗口和更细粒度的成本结构,距离“国产算力大规模替代”还差硬证据。

信源: https://www.news.cn/tech/20260518/b8246dea46cd4747b8473113e7c55d3b/c.html

关联行动: 继续追百度 6 月天池 256 上市后,会不会补出首批客户、实测吞吐、单 Token 成本与更明确的模型委员会组织细节。

CN-2. [B] openJiuwen 开源 JiuwenSwarm,把中国 Agent 社区的主战场从单体 Agent 推向“群体智能协同工程”

概述: 量子位 05-18 18:26:46 报道,华为支持的 openJiuwen 社区发布并开源蜂群智能体框架 JiuwenSwarm,主张从 Harness Engineering 进一步走向 Coordination Engineering。文中给出的关键新增信息是:JiuwenSwarm 不只提供多 Agent 自主分工与动态协商,还配套 Swarm Skills、Swarm Skills Hub 与自动从执行轨迹反推技能的“自演进”机制。

技术/产业意义: 这条值 B,因为它切中的不是“再造一个 Agent UI”,而是多智能体工程范式在中国开源社区开始成体系落地。单 Agent 已经卷到上下文、工具和长链执行,多 Agent 下一步比拼的就是协同、调度、技能沉淀和复用市场。

深度分析: JiuwenSwarm 的新意在于把多 Agent 协作从论文概念变成一套工程资产管理体系。它试图解决四个连续问题:多个 Agent 如何协同、协同经验如何沉淀、沉淀能力如何共享、共享能力如何继续自演进。尤其“按角色路由不同模型”和“从任务轨迹自动反推出可复用 skill”的设定,本质是在把 Agent 团队当成一个持续学习的组织系统,而不是几个聊天机器人拼在一起。对国内企业落地来说,这比单纯炫耀一个 Agent 能跑多长工作流更有价值,因为真实复杂任务本来就需要多角色分工。如果 openJiuwen 后续真能形成稳定的 Skill Hub 生态,中国本土 Agent 社区可能会长出不同于国外单体 Copilot 路线的“团队级智能体”基础设施。

评论观察:

  • 🟢 支持:把多 Agent 协同、技能沉淀和共享市场打包开源,是很难得的工程化推进。
  • 🔴 质疑:多智能体框架最怕 demo 漂亮、真实任务里调度成本和失败链路爆炸,JiuwenSwarm 还需要更多生产级案例证明自己不是概念秀。

信源: https://www.qbitai.com/2026/05/419515.html

关联行动: 继续追 JiuwenSwarm 是否会很快公布更多企业/开发者接入案例,以及 Swarm Skills Hub 的真实增长与复用数据。

CN-3. [B] 上交 x 创智 x 瑞金发布 CX-Mind,把胸片诊断从“给答案”推进到“给可验证推理链”

概述: 量子位 05-18 14:57:10 报道,上海交通大学、上海创智学院与瑞金医院联合发布胸片多模态模型 CX-Mind,主打“可验证推理”。文章给出的硬信息包括:模型在 23 个数据集、708,473 张影像上评测,在视觉理解、报告生成和时空对齐三大能力域平均提升 25.1%;配套数据集 CX-Set 含 2,619,148 条指令样本与 42,828 条高质量交错式推理样本。

技术/产业意义: 这条值 B。它的重要性不在又一个垂类模型,而在医学影像大模型开始正面解决“答案能不能复核、路径能不能审查”这个临床落地核心矛盾。医疗 AI 真正卡住的不是没有分类器,而是医生不敢把一个黑箱结论塞进关键流程。

深度分析: CX-Mind 的关键创新是把医学推理拆成 interleaved reasoning,即“think-answer”交错单元,让模型在观察、鉴别、定位、报告生成之间显式走步骤,而不是最后吐一段看似合理的长解释。更重要的是,团队引入基于 GRPO 的课程强化学习 CuRL-VPR,用真实放射学报告同时奖励最终答案与中间过程的一致性。这意味着可解释性不再是事后附加注释,而是训练目标本身。对中国医疗 AI 来说,这比继续追单点识别分数更重要:如果推理路径可验证,模型才有可能被纳入更高价值的诊断协作场景,而不是永远停在“辅助参考”。

评论观察:

  • 🟢 支持:把“可验证推理”写进训练与奖励机制,比单纯宣传医疗大模型更接近真实临床需求。
  • 🔴 质疑:量子位文章给了多中心评测与样本规模,但离大规模医院部署还差监管、责任归属和工作流集成三道硬门槛。

信源: https://www.qbitai.com/2026/05/419396.html

关联行动: 继续追 CX-Mind 是否会公开论文/代码细节、更多真实医院试点结果,以及监管审批路径。

CN-4. [B] 清华 x 信通院提出 FedRE,用“纠缠表征”给联邦学习的性能、隐私、通信三难题做了更均衡的解法

概述: 量子位 05-18 14:44:04 报道,来自中国信通院泰尔英福公司、清华大学等团队提出联邦学习框架 FedRE,并给出论文《FedRE: A Representation Entanglement Framework for Model-Heterogeneous Federated Learning》与代码仓库。文章核心新增信息是:FedRE 通过把不同类别表征随机加权融合为纠缠表征,只上传一个纠缠表征及对应标签编码到服务器,从而同时缓解性能、隐私泄露与通信开销问题。

技术/产业意义: 这条值 B,因为它打到的是联邦学习最现实的产业痛点:企业既想要跨机构数据协同,又怕泄露隐私、承受不了通信成本,还要面对客户端模型异构。相比泛泛的“隐私计算+AI”叙事,这种带明确方法论的工程折中更值得盯。

深度分析: FedRE 的价值在于它不再走“上传所有表征”或“只传类别原型”这两条老路。前者性能强但隐私和通信都差,后者通信省但容易把决策边界学得过尖。FedRE 引入纠缠表征,让多个类别的本地信息被揉成一个更难逆向重建、但仍保留监督信号的上传对象,再配合每轮随机重采样,提高全局分类器的泛化与边界平滑程度。这种思路很适合中国政务、医疗、金融等跨机构建模场景:不是绝对最强性能,而是追求“能过隐私要求、通信成本可接受、效果又别太差”的综合最优。若后续论文与代码能被更多行业实验复用,FedRE 会成为中国隐私计算与联邦 AI 工程结合的一类代表性路线。

评论观察:

  • 🟢 支持:它提供的是一个更务实的平衡方案,而不是只在某一个维度刷分。
  • 🔴 质疑:联邦学习论文很多,真正难的是跨机构真实部署中的工程复杂度、异构系统接入和审计成本,实验室优势未必能完整迁移。

信源: https://www.qbitai.com/2026/05/419373.html

关联行动: 继续追 FedRE 的正式论文传播、更多真实行业数据集复现结果,以及是否会进入更系统的隐私计算产品栈。

CN-5. [B] 运营商集体进入“Token 时刻”,中国 AI 商业化开始把调用量直接卖成套餐

概述: 36Kr 05-18 20:27 报道,中国电信、中国移动、中国联通近期相继推出 Token 相关经营体系和套餐化服务:中国电信面向开发者与中小微企业推出试商用 Token 套餐,上海移动推出 1 元 40 万 Tokens 的通用服务,中国联通也把 Token 计划升级为个人版与团队版。文章给出的新增核心判断是:三大运营商正在尝试把通话分钟数、流量 GB 之后的下一代计量单位,改写成 Token。

技术/产业意义: 这条值 B。因为它意味着中国 AI 商业化正从“模型/API 厂商卖算力”走向“基础设施巨头把 Token 当作标准化商品去经营”。谁掌握 Token 的计费、结算、连接和安全链路,谁就可能拿到 AI 时代新的流量入口。

深度分析: Token 经营对运营商有天然吸引力:它本质上还是“按量计费、按月扣费、通过全国网络交付数字资源”,只是把资源从带宽换成了推理调用。36Kr 文中给出的背景数据也很关键:运营商传统业务增长放缓、ARPU 下滑,而云、智算与 AI 成为必须接棒的新引擎。因此它们不满足于只卖机柜和带宽,而是想直接控制 Token 这一商业计量层。更值得注意的是,这种变化会反过来影响中国 AI 行业的价值分配:如果 Token 真的被运营商规模化卖给企业和个人,模型厂商、云厂商、运营商之间的边界会重新洗牌,未来可能出现“模型能力被渠道和计费层重新封装”的新竞争形态。

评论观察:

  • 🟢 支持:把 Token 做成运营商品类,是中国基础设施玩家开始认真接管 AI 商业化结算层的信号。
  • 🔴 质疑:Token 套餐听起来新,但如果底层模型同质化、用户真实需求不够强,最后可能只是把旧通信业务换个 AI 包装继续卖。

信源: https://www.36kr.com/p/3814636808789769

关联行动: 继续追三大运营商会不会补出更多单位 Token 成本、首批客户结构、模型分成机制与调用增长数据。

CN-6. [B] 华为系正在“养”出半个具身智能创业圈,具身赛道的人才与资本开始出现明显派系化

概述: 量子位 05-18 16:54:30 报道,具身智能赛道里已有约 10 家明确华为背景的创业公司,且最近单月还在持续扩张。文章列出的硬信息包括:前华为车 BU 高管陈亦伦创办的它石智航此前创下中国具身智能单轮融资纪录 4.55 亿美元;华为云具身智能 1 号员工周顺波离职创业后,新公司欧拉万象成立仅 1 个月就获得数千万元种子轮融资。

技术/产业意义: 这条值 B,因为它揭示的不是单笔融资,而是中国具身智能赛道的“人才母体”正在快速成形。华为系如果持续向外溢出车 BU、诺亚方舟、昇腾、华为云的人才与方法论,国内具身竞争会从散点创业转向成体系派系竞争。

深度分析: 量子位这篇稿子的价值在于把“又有人离职创业”提升为组织结构现象。具身智能本质上需要感知、决策、执行、硬件工程、供应链和 2B 交付等复合能力,而这些正是华为长期积累最密的地方。车 BU 的自动驾驶经验可以迁移到轮式/人形机器人,昇腾与华为云提供算力和工程化底座,诺亚方舟则补模型与决策算法。换句话说,华为系创业者不是单点技术突围,而是在复制一整套“全栈工程+复杂项目交付”的作战方法。这会抬高具身创业的起点,但也会让赛道更卷:未来比的不只是机器人本体,而是谁能同时把组织、算力、数据与产业化能力一起搬出来。

评论观察:

  • 🟢 支持:华为系外溢说明中国具身智能正从概念热进入人才与组织能力真实流动阶段。
  • 🔴 质疑:派系化能提高起点,但也可能带来路径依赖;从自动驾驶经验平移到通用具身,并不保证商业化一定跑通。

信源: https://www.qbitai.com/2026/05/419414.html

关联行动: 继续追华为系具身创业公司后续融资、产品化节奏,以及谁会率先把“全栈华为方法论”验证成可复制收入。

CN-7. [B] 大厂高管与“天才少年”扎堆 Agent 创业,中国应用层竞争开始从模型参数卷向行业落地与专家工作流

概述: 36Kr 05-18 20:29 报道,AI Agent 已成为中国创业投资市场最拥挤赛道之一,既有百度前副总裁景鲲创办 MainFunc、推出 Genspark 并累计融资超 4 亿美元、估值达 12.5 亿美元,也有钉钉原副总裁王铭、字节离职团队与大量年轻算法人才涌入。文章还援引数据称,2025 年中国 AI Agent 行业市场规模达 182.34 亿元,同比增长 78.03%

技术/产业意义: 这条值 B。因为它说明中国 AI 创业的重心正在明显下沉到应用层和工作流层:基座模型厂商铺平台,创业团队则去抢模型触不到的行业缝隙和专家场景。

深度分析: 这波 Agent 创业潮有两个值得盯的结构变化。第一,AI 编程工具把做原型的门槛大幅砍低,使“先做出产品”不再是最大壁垒,真正的竞争点开始转向谁更懂行业、谁能把工作流做深、谁更早拿到付费客户。第二,人才结构明显升级:从前一轮 SaaS 创业的产品经理/销售主导,转向“大厂高管 + 核心研究骨干 + 极年轻算法天才”混合上桌。这意味着中国 Agent 创业接下来会更像一场“专家系统与垂类操作系统”的战争,而不是简单聊天壳子竞赛。对 Lighthouse 来说,值得持续观察的是:谁能最先把 Agent 从 demo 热度转成可复购收入和真正的组织嵌入。

评论观察:

  • 🟢 支持:创业重心转向行业专家与深工作流,说明市场开始从幻觉叙事回归更硬的 PMF 问题。
  • 🔴 质疑:赛道过热、融资故事太多,若底层模型与渠道被大厂吃死,很多创业团队会发现自己只是替平台教育市场。

信源: https://www.36kr.com/p/3814636994534918

关联行动: 继续追中国 Agent 创业公司接下来 1-2 个季度的真实付费、留存和垂直场景跑通情况。

CN-8. [B] 更新:千问打通淘宝后,商家侧已经开始研究怎么“教 AI 认好货”,生成式电商优化产业链露头

概述: 05-14 已在 Lighthouse 追踪过“千问接入淘宝”主线;36Kr 05-18 17:00 这篇稿子的新增信息,不是接入本身,而是商家侧已经开始围绕 AI 推荐黑箱研究新的商品优化、信源投喂与 GEO(生成式引擎优化)玩法。文中点出的关键变化是:当流量分配权从传统搜索算法转到大模型,商家开始通过 AI 友好标题、详情页语义标签、外部测评与内容铺设,主动塑造模型对“什么是好货”的认知框架。

技术/产业意义: 这条值 B,而且属于标准“更新/补充”。它的重要性不在阿里又发了什么功能,而在 AI 购物一旦接入真实电商流量,新的优化产业链、黑箱博弈和平台治理问题几乎立刻冒头。

深度分析: 这篇稿子之所以值得收,不是因为它夸张,而是它把 AI 电商最现实的下一步说透了:推荐逻辑不再显式公开后,商家的优化目标就会从“讨好搜索算法”转向“进入大模型的认知框架”。这与传统 SEO/快排非常相似,只不过战场从关键词和点击率换成了信源权重、语义标签、测评内容与场景化叙事。更关键的是,平台与模型厂商面临的治理难题会同步升级——不仅要防止低质商品被刷上来,还要处理数据投毒、AI 偏好迎合与售后责任边界。如果阿里不能尽快补出更透明的推荐原则和纠错机制,“千问接淘宝”带来的不只是转化机会,也会带来一整套新型平台治理成本。

评论观察:

  • 🟢 支持:它把 AI 电商真正的博弈点从“接没接入”推进到“接入后如何被操纵、如何治理”,非常关键。
  • 🔴 质疑:这篇更多是结构化观察而非官方公告,平台真实推荐机制、纠错链路与责任边界仍有大量不确定性。

信源: https://www.36kr.com/p/3814376459559171

关联行动: 继续追阿里/淘宝会不会补出 AI 推荐排序原则、商家申诉机制,以及首批类目里真实转化与误推荐案例。

下期追踪问题

  1. 百度天池 256 超节点 6 月上市前,是否会在未来 24-72 小时内补出首批客户、单 Token 成本、稳定性窗口与更细的昆仑芯 P800 量产指标?
  2. JiuwenSwarm 和中国 Agent 创业潮,是否会很快出现真实企业落地、付费客户或可复用 Skill 生态数据,证明多 Agent 与垂直 Agent 不只是 demo 热闹?
  3. 千问接入淘宝之后,阿里会不会补出更明确的 AI 推荐治理规则、商家申诉入口、首批开放类目和转化数据,回应“AI 认好货”带来的黑箱化担忧?