News

AI 日报 — 2026年3月21日上午

上期追踪

上期提到的三个关注点回顾：

OpenAI-Astral 收购的社区反应和监管审批进展 → 社区讨论仍在发酵中，尚无监管审批公开进展。GitHub 上出现了 superpowers-zh 汉化分支项目（30+ stars），说明 Astral 工具链的开发者关注度在跨语言扩散
GPT-5.4 的 5T tokens/天能否维持 → HomeSec-Bench 新基准测试显示 Qwen3.5-9B 在本地硬件上达到 GPT-5.4 的 93.8% 水平（见第9条），这对 API 付费需求构成潜在压力
开源 Bot PR 问题是否扩散 → 本期未发现新的大规模 Bot PR 事件报道，但 GitHub 开发者工具生态持续演进（OpenCode 认证同步插件热度上升）

硬件/算力/产业

1. Super Micro 联合创始人涉嫌 25 亿美元 AI 芯片走私被捕，股价暴跌 25%

[硬件/算力 | 产业震荡]

Super Micro Computer 联合创始人被指控参与一项价值 25 亿美元的 AI 芯片走私案。消息公布后，SMCI 股价单日暴跌 25%。

技术/产业意义： 这是 AI 算力供应链安全领域迄今最大的刑事案件。Super Micro 是 NVIDIA GPU 服务器的核心组装商之一，直接影响全球 AI 数据中心的硬件供给。此案揭示了 AI 芯片在出口管制下的黑市需求之巨大——25 亿美元规模说明地下芯片流通已形成成熟产业链。

深度分析： 这不仅是一起企业丑闻。在美国对华芯片出口管制持续收紧的背景下，高端 AI 芯片的二级市场价格远高于官方定价，走私利润空间巨大。Super Micro 作为 AI 基础设施的关键中间商，其高管涉案将引发整个 AI 服务器供应链的信任危机——下游云厂商可能重新审计供应商合规性，短期内加剧算力供给紧张。

评论观察：

🟢 “这说明芯片管制执法在加强，长期利好合规供应商”
🔴 “SMCI 已经因为会计问题被 NASDAQ 警告过，这次可能是致命一击”

信源： Forbes | Hacker News 讨论

关联行动： 关注 SMCI 后续是否面临 NASDAQ 退市风险，以及其他 AI 服务器厂商是否受到连带调查。

2. Samsung 宣布 730 亿美元 AI 芯片扩张计划，全面挑战 SK Hynix

[硬件/算力 | 战略投资]

Samsung 宣布 2026 年将投资超过 730 亿美元（同比增长 22%），重点投入 AI 芯片制造和研究。联席 CEO Jun Young-hyun 表示，Agentic AI 推动的需求激增是核心驱动力，资金将流向先进机器人等”面向未来”领域。

技术/产业意义： Samsung 正试图从 SK Hynix 手中夺回 NVIDIA 首选 HBM 供应商地位。730 亿美元的投资规模接近整个 AI 芯片产业的年度资本支出总额，这场军备竞赛将直接影响 HBM4 的量产时间线和 AI 训练/推理的成本曲线。

深度分析： Samsung 在 HBM3E 上的良率问题导致其落后于 SK Hynix，后者几乎独占了 NVIDIA H100/B200 的 HBM 供应。730 亿美元的激进投入有两层含义：一是 Samsung 判断 AI 算力需求远未见顶；二是 HBM 竞争从技术竞赛升级为资本竞赛——谁先实现 HBM4 量产，谁就能锁定下一代 GPU 的独家供应。

评论观察：

🟢 “双供应商竞争将压低 HBM 价格，最终受益的是 AI 开发者”
🔴 “Samsung 过去两年的制程良率问题不是靠砸钱能解决的”

信源： WSJ | The Verge

关联行动： 跟踪 Samsung HBM4 工程样品的认证进度，以及 NVIDIA 是否会在 Blackwell Ultra 中引入 Samsung 作为第二供应商。

政策/监管

3. Pentagon 正式反驳 Anthropic 诉讼：AI 公司可能在战时”禁用或篡改模型行为”

[政策/监管 | 重大法律战]

美国国防部（现称 Department of War）向法院提交了 40 页反驳文件，反对 Anthropic 的临时禁令请求。核心论点：Anthropic 拒绝政府标准的”任何合法用途”条款，且可能在”认为红线被突破”时”尝试禁用其技术或在正在进行的作战行动中改变模型行为”——这构成不可接受的国家安全风险。

技术/产业意义： 这是 AI 公司安全理念与国家安全需求之间的正面碰撞。此案的判决（3月24日听证）将为 AI 公司与政府的合作模式设定先例——AI 公司是否有权在军事部署中保留”紧急制动权”？

深度分析： 法律文件揭示了一个深层矛盾：Anthropic 的负责任 AI 理念要求保留对模型使用方式的最终否决权，而军方认为这恰恰是”供应链风险”——如果 AI 供应商可以单方面禁用前线使用的技术，这比技术缺陷本身更危险。案件涉及的法律框架（APA、第一修正案）可能重塑整个 AI 军工复合体的合同结构。

评论观察：

🟢 “Anthropic 在捍卫 AI 安全的核心原则，即使代价是失去政府合同”
🔴 “如果你卖武器给军队，你不能保留’在我认为不对时远程关闭武器’的权利”

信源： CourtListener 完整法律文件 | The Verge

关联行动： 3月24日旧金山联邦法院听证会是关键节点，其裁决将影响所有 AI 公司的政府合同谈判策略。

生态/社区

4. arXiv 宣布脱离康奈尔大学独立运营

[生态/社区 | 里程碑事件]

全球最重要的预印本服务器 arXiv 正式宣布脱离其创始机构康奈尔大学，成为独立实体。这是 arXiv 自 1991 年创立以来最重大的组织变革。

技术/产业意义： arXiv 每年承载超过 200 万篇论文，是全球 AI/ML 研究的核心基础设施。独立运营意味着 arXiv 将获得更大的筹资自主权和治理灵活性，但也需要自行承担运营成本和技术维护——这对依赖 arXiv 的整个 AI 研究社区至关重要。

深度分析： 此举反映了学术基础设施正在从”大学附属项目”向”独立非营利组织”转型的趋势。arXiv 的年运营成本约数百万美元，过去由康奈尔图书馆及 Simons Foundation 等资助。独立后的关键问题是：可持续的资金模式是什么？AI 大厂（OpenAI、Google、Meta）是否会成为核心资助者——如果是，这是否影响学术中立性？

评论观察：

🟢 “独立是好事，arXiv 需要更灵活的治理来应对 AI 时代的论文爆发”（HN 628 points，211 评论）
🔴 “如果 AI 公司成为主要资助者，arXiv 的中立性会不会受影响？”

信源： Science.org | Hacker News 讨论（628 points）

关联行动： 关注 arXiv 独立后的治理结构公告和新的资金模式。

5. Signal 创始人 Moxie Marlinspike 将为 Meta AI 带来端到端加密

[产业动态 | 隐私技术]

Moxie Marlinspike（Signal 创始人）宣布其加密 AI 聊天应用 Confer 的隐私技术将整合进 Meta AI。这将使 Meta 的 AI 产品获得端到端加密能力——用户与 AI 的对话将只有用户本人可见，Meta 也无法访问。

技术/产业意义： 这是继 10 年前将 Signal Protocol 带入 WhatsApp 后，Moxie 与 Meta 的第二次合作。AI 聊天是”历史上最大的集中式数据湖”——人们将最私密的想法、医疗记录、财务信息倾诉给 AI。加密 AI 推理不仅是技术挑战（需要在加密环境中运行模型），更是商业模式的根本改变——Meta 将无法使用 AI 对话数据做广告定向。

深度分析： Confer 的核心技术是”私有推理”——模型在可信执行环境中运行，输入输出端到端加密。将此技术应用于 Meta AI 的规模（数十亿用户）是前所未有的工程挑战。关键问题：加密推理是否会显著增加延迟和成本？Meta 是否真的愿意放弃 AI 对话数据的商业价值？

评论观察：

🟢 “Moxie 是互联网隐私领域最有信誉的人，他的参与是质量保证”
🔴 “Meta 的隐私承诺历史记录不佳，技术上可行不代表公司会真正执行”

信源： Confer 官方博客 | The Verge

关联行动： 关注 Confer 技术集成的具体时间线，以及对 Meta AI 推理延迟和成本的影响。

产业动态

6. Meta 宣布 AI 将在未来几年全面替代人工内容审核

[产业动态 | AI 部署]

Meta 正式发布 AI 支持助手并全球上线 Facebook 和 Instagram，同时宣布将”减少对第三方供应商（人工审核员）的依赖”。AI 系统已能每天发现并阻止 5,000 次人类审核团队未能捕获的诈骗尝试。

技术/产业意义： 这是社交媒体平台用 AI 大规模替代人工的第一个明确时间表。内容审核曾因导致审核员 PTSD 而饱受争议，AI 替代在伦理上有合理性；但同时也意味着数千名内容审核员将面临失业，而 AI 审核的准确性和公平性尚待验证。

深度分析： Meta 的策略是双管齐下：AI 支持助手处理用户问题（5秒内响应），AI 内容审核替代重复性人工审核。关键数据：AI 已能每天额外发现 5,000 次诈骗——这些是人工审核从未发现的。但 AI 审核也有固有问题：对文化语境的理解、讽刺和反语的识别、以及少数族裔内容的误判率。

评论观察：

🟢 “AI 审核员不会得 PTSD，处理极端内容时这是更人道的方案”
🔴 “内容审核工人刚开始组织工会争取权益，Meta 就宣布用 AI 替代他们”

信源： Meta 官方博客 | The Verge

关联行动： 关注内容审核工人工会（Content Moderator Union Alliance）的回应，以及 AI 审核误判率数据。

7. Microsoft 发布 MAI-Image-2，跻身全球文生图 Top 3

[产业动态 | 模型发布]

Microsoft AI Superintelligence 团队发布 MAI-Image-2 图像生成模型，在 Arena.ai 文生图排行榜上排名全球第三（按实验室排名）。模型支持增强的照片真实感、可靠的图内文字生成、以及丰富的场景构建能力。已在 Copilot 和 Bing Image Creator 上线。

技术/产业意义： Microsoft 的图像生成从”搭载 DALL-E”转向自研模型，MAI-Image-2 是其独立 AI 模型战略的重要里程碑。文生图领域正从 Midjourney/DALL-E 双巨头格局向多极竞争演进。

深度分析： MAI-Image-2 的三大卖点——照片真实感、文字渲染、复杂场景——正好是商业应用中最重要的能力（广告、电商、设计）。特别值得注意的是：微软提到 GB200 集群已投入运营，这意味着 MAI 团队拥有顶级算力支持，后续模型升级速度可能很快。

评论观察：

🟢 “文字渲染终于靠谱了，这是实际商业使用的关键”
🔴 “Arena.ai 排名波动大，Top 3 的意义有限”

信源： Microsoft AI 官方博客 | The Verge

关联行动： 在 MAI Playground 测试文字渲染和复杂场景生成能力，与 DALL-E 4 和 Midjourney v7 对比。

8. Google Stitch 升级”Vibe Design”——AI 原生设计画布

[工程实践 | 产品更新]

Google Labs 发布 Stitch 重大更新，将其从 AI 代码生成工具升级为”AI 原生软件设计画布”。新功能包括：无限画布、设计 Agent（可跨项目推理）、DESIGN.md 设计系统标准、语音实时设计评审、以及即时原型预览。

技术/产业意义： “Vibe coding” 之后 Google 正在推动 “Vibe design”。Stitch 的 DESIGN.md 概念特别值得关注——它试图建立一种 Agent 友好的设计系统描述标准，可在不同设计和编码工具间迁移。这可能成为 AI 设计领域的”package.json”。

深度分析： Stitch 的进化路径揭示了 Google 对 AI+设计的思考：不是替代 Figma，而是在设计的更早期阶段（从商业目标到视觉概念）引入 AI。设计 Agent 可以并行探索多个方向、管理设计历史、执行即时原型——这比单纯的”文字转 UI”高了一个维度。关键挑战是：设计师是否愿意在创意阶段让 AI 参与？

评论观察：

🟢 “DESIGN.md 的跨工具迁移能力是真正有价值的创新”
🔴 “我们现在什么都要 vibe 吗？先是 vibe coding，现在 vibe design”（The Verge 编辑吐槽）

信源： Google Blog | The Verge

关联行动： 尝试用 DESIGN.md 描述现有项目的设计系统，测试跨工具兼容性。

9. Qwen3.5-9B 本地运行达 GPT-5.4 的 93.8%——HomeSec-Bench 实测

[模型/算法研究 | 基准测试]

SharpAI 发布 HomeSec-Bench 基准测试结果：Qwen3.5-9B（Q4_K_M 量化）在 MacBook Pro M5 上以 25 tok/s 运行，通过率 93.8%，仅比 GPT-5.4 Cloud（97.9%）低 4 个百分点。零 API 成本、完全本地、13.8GB 内存占用。

技术/产业意义： 这是”本地 AI vs 云 AI”辩论的一个重要数据点。9B 参数的量化模型在特定领域任务上逼近最强云端模型，说明对于垂直场景，本地推理可能已经”够用”。对于隐私敏感应用（家庭安防、医疗、金融），这意味着不再需要将数据发送到云端。

深度分析： HomeSec-Bench 覆盖 96 个 LLM + 35 个 VLM 测试，涉及工具调用、安全分类、事件去重等实际任务。几个关键发现：(1) Qwen3.5-35B-MoE 的 TTFT（435ms）甚至比所有 OpenAI 云模型都快；(2) 27B 和 9B 模型得分相同（93.8%），说明在此任务上 9B 已达到饱和；(3) GPT-5-mini（2025版）因 API 温度参数拒绝大量失败，仅 62.5%。

评论观察：

🟢 “本地 AI 家庭安防零月费零隐私风险，这就是未来”（HN 62 points）
🔴 “HomeSec-Bench 是他们自己做的基准，需要第三方验证”

信源： SharpAI HomeSec-Bench | Hacker News 讨论

关联行动： 在自己的 M 系列 Mac 上试跑 Qwen3.5-9B，测试在个人任务上的实际表现。

模型/算法研究

10. CubiD：首个高维表征的离散视觉生成模型（CVPR 2026）

[模型/算法研究 | 视觉生成]

CubiD（Cubic Discrete Diffusion）是首个在高维表征空间（768-1024维）上进行离散视觉生成的模型。通过对高维离散表征的细粒度 masking，CubiD 在 ImageNet-256 上达到 SOTA，从 900M 扩展到 3.7B 参数具有良好的 scaling 行为。关键发现：离散化 token 同时保留了理解和生成能力。

技术/产业意义： 当前离散视觉生成模型受限于低维 token（8-32维），牺牲了语义丰富性。CubiD 证明高维表征可以被有效离散化并用于生成，这为统一多模态架构（同一组 token 既做理解又做生成）开辟了新路径。

深度分析： CubiD 的核心创新是”任意维度、任意位置可 mask 和预测”——这比传统 masked modeling 更细粒度。生成步数固定为 T（远小于 h×w×d），不随特征维度增长，解决了高维离散生成的计算瓶颈。CVPR 2026 接收说明其方法论已获得社区认可。

评论观察：

🟢 “统一理解和生成的 token 是多模态架构的圣杯”
🔴 “ImageNet-256 上的 SOTA 不等于实际生成质量好”

信源： arXiv:2603.19232 | GitHub

关联行动： 关注 CubiD 开源代码的复现结果，尤其是在 1024 维 DINOv2 表征上的生成质量。

11. F2LLM-v2：覆盖 200+ 语言的多语言嵌入模型家族，MTEB 11 项第一

[模型/算法研究 | NLP基础设施]

F2LLM-v2 发布了 8 个规模（80M-14B）的通用多语言嵌入模型家族，支持 200+ 语言，特别加强了中低资源语言。通过两阶段 LLM 嵌入训练 + matryoshka 学习 + 模型剪枝 + 知识蒸馏，14B 版本在 MTEB 11 项基准上排名第一。全部模型、数据、代码和中间检查点开源。

技术/产业意义： 嵌入模型是 RAG、搜索、分类等下游应用的基础。F2LLM-v2 将多语言嵌入的质量推向新高度，且提供从 80M 到 14B 的完整规模选择——从手机端到数据中心都能找到合适的模型。完全开源使其成为商业嵌入 API 的有力替代。

评论观察：

🟢 “80M 到 14B 全尺寸开源，这是嵌入模型领域的 Llama 时刻”
🔴 “MTEB 排名已经越来越像过拟合基准的竞赛”

信源： arXiv:2603.19223

关联行动： 测试 F2LLM-v2 的小尺寸版本（80M/400M）在中文 RAG 场景的实际表现。

12. Flash-KMeans：Song Han 团队重新审视 K-Means，GPU 实现性能飞跃

[工程实践 | 系统优化]

Song Han 团队提出 Flash-KMeans，通过 IO 感知和无竞争的 GPU 内核设计，解决了传统 GPU K-Means 实现中 N×K 距离矩阵的 HBM IO 瓶颈和原子写竞争问题。这使 K-Means 从”离线预处理原语”升级为”在线系统原语”。

技术/产业意义： K-Means 在 AI 系统中无处不在：向量量化、embedding 聚类、模型压缩（VQ-VAE）、推理加速（聚类注意力）。Flash-KMeans 让这些操作可以在推理链路中实时完成，而非预计算。这类似于 Flash Attention 对注意力计算的意义——底层原语的加速会解锁上层应用。

评论观察：

🟢 “Song Han 团队再次证明系统级优化比算法创新更有即时影响力”（HN 133 points）
🔴 “需要看具体加速倍数和在哪些 GPU 架构上有效”

信源： arXiv:2603.09229 | Hacker News 讨论（133 points）

关联行动： 等待开源代码发布，评估在 LLM 量化（如 AQLM）中的集成潜力。

13. FASTER：让机器人 VLA 策略实现实时反应的通用加速框架

[模型/算法研究 | 机器人/具身AI]

FASTER（Fast Action Sampling for ImmediatE Reaction）解决了 VLA（Vision-Language-Action）模型部署中的关键延迟问题。通过 Horizon-Aware Schedule，FASTER 将即时动作的去噪压缩为单步（10倍加速），同时保持长期轨迹质量。在消费级 GPU 上实现了真正的实时响应，已在真实乒乓球任务中验证。

技术/产业意义： VLA 模型（如 π₀.₅ 和 X-VLA）的部署瓶颈在于”第一个动作的延迟”——机器人需要等所有采样步骤完成才能开始移动。FASTER 打破了这一瓶颈，让通用策略模型具备了实时操控能力，这对工业机器人和日常服务机器人都至关重要。

评论观察：

🟢 “在真实乒乓球任务上验证说明这是工程可用的，不只是理论”
🔴 “消费级 GPU 上的延迟改善数据需要更详细的报告”

信源： arXiv:2603.19199 | 项目页面

关联行动： 关注 FASTER 是否会被整合进 LeRobot 等开源机器人训练框架。

14. Tinted Frames：VLM 会根据问题框架”选择性失明”

[模型/算法研究 | VLM分析]

研究发现 VLM（视觉语言模型）的视觉注意力会被语言框架显著调制：多选题和是/否问题会导致模型对图像的注意力大幅下降，注意力从任务相关区域转移到无信息 token 上。研究者提出了基于可学习 token 的轻量级提示调优方法来修复这一问题。

技术/产业意义： 这揭示了 VLM 的一个系统性缺陷：同样的视觉推理任务，仅仅因为问题的表述方式不同（开放式 vs 多选），模型就会给出不同质量的答案。这对所有使用 VLM 的应用（自动驾驶、医疗影像、安防）都是安全相关的发现。

评论观察：

🟢 “机械式分析 attention 模式来解释 VLM 失败模式，非常扎实”
🔴 “提示调优方案的泛化性需要在更多 VLM 上验证”

信源： arXiv:2603.19203

关联行动： 在自己的 VLM 应用中测试不同问题框架是否影响准确性。

15. VEGA-3D：用视频生成模型的隐式 3D 先验增强 MLLM 空间理解

[模型/算法研究 | 3D理解]

VEGA-3D 提出用预训练视频扩散模型作为”潜在世界模拟器”，从中提取时空特征来增强多模态 LLM 的空间推理能力。无需显式 3D 监督，通过 token 级自适应门控融合机制注入密集几何线索。在 3D 场景理解、空间推理和具身操控基准上超越 SOTA。

技术/产业意义： 核心 insight 是：视频生成模型为了生成时间一致的视频，必然学到了鲁棒的 3D 结构先验。VEGA-3D 是首个将这种隐式知识”提取”出来并用于增强理解模型的框架，为解决 MLLM 的”空间盲区”提供了一条优雅的路径。

评论观察：

🟢 “plug-and-play 框架，不需要修改基础模型，实用性高”
🔴 “视频扩散模型本身的计算开销是否会成为瓶颈？”

信源： arXiv:2603.19235 | GitHub

关联行动： 跟踪 VEGA-3D 在具身 AI 任务中的实际部署效果。

16. NVIDIA Cascade RL：后训练 LLM 的级联强化学习 + 多域在线蒸馏

[模型/算法研究 | 训练方法]

NVIDIA 发布了 Cascade RL 和多域在线蒸馏的后训练方法论（作者包括 Bryan Catanzaro、Mohammad Shoeybi 等 NVIDIA 核心研究员）。该方法将强化学习与在线策略蒸馏结合，系统化地解决了多领域后训练中的能力平衡问题。

技术/产业意义： 后训练是当前 LLM 能力提升的关键阶段。NVIDIA 公开其方法论（而非仅发布模型）说明其在开放研究方面的姿态变化——从过去的纯硬件厂商向 AI 全栈研究机构转型。

评论观察：

🟢 “NVIDIA 在 LLM 训练方法论上的投入越来越认真”
🔴 “没有看到具体的基准数字和对比实验”

信源： arXiv:2603.19220

关联行动： 关注此方法是否会被整合进 NeMo 框架。

其他值得关注

17. Google AI 被发现篡改 The Verge 文章标题

[生态/社区 | AI 争议]

The Verge 记者发现 Google 的 AI 系统在搜索结果中重写了 The Verge 的新闻标题。这引发了新闻出版界对 AI 搜索重写原始内容的广泛担忧。

信源： The Verge

关联行动： 关注新闻出版商联盟是否会就此采取法律行动。

18. Amazon 正在开发 AI 手机，代号”Transformer”

[产业动态 | 硬件]

据报道，Amazon 正在开发一款以 Alexa AI 助手为核心的智能手机，内部代号”Transformer”，设计灵感来自 Light Phone。这是 Amazon 在 2014 年 Fire Phone 失败后第二次尝试进入手机市场。

信源： The Verge

关联行动： 关注 Amazon 是否会在 re:MARS 2026 上公布更多细节。

项目	简介
opencode-claude-auth-sync	将 Claude CLI 凭据同步到 OpenCode，无需单独 Anthropic 登录
superpowers-zh	AI 编程超能力中文版——superpowers 完整汉化 + 中国特色 skills
contextd	macOS 应用：持续捕获屏幕活动并用 LLM 总结
cursoride2api	Cursor IDE API 逆向工程教程

今日精选

最值得深读: Anthropic vs Pentagon 诉讼——这不只是一起商业纠纷，而是定义”AI 公司在军事应用中的权利边界”的里程碑案件。3月24日的听证会值得密切关注。

最值得动手试: Qwen3.5-9B + llama.cpp 本地家庭安防 AI——93.8% 的准确率、25 tok/s 的速度、13.8GB 内存，在 M5 MacBook 上零成本运行。

最值得关注趋势: 加密 AI 推理正在从概念走向现实——Confer + Meta 的合作意味着端到端加密 AI 可能在数十亿用户的平台上落地。

下期追踪问题

Anthropic vs Pentagon 听证会（3月24日）结果如何？ 法官是否会批准临时禁令？这对其他 AI 公司的政府合同有何影响？
Super Micro 芯片走私案的供应链连锁反应？ NVIDIA 是否会更换/审计合作伙伴？下游云厂商如何应对？
Confer 加密技术集成 Meta AI 的具体时间线和技术方案？ 加密推理对延迟和成本的实际影响如何？

上期追踪
硬件/算力/产业
1. Super Micro 联合创始人涉嫌 25 亿美元 AI 芯片走私被捕，股价暴跌 25%
2. Samsung 宣布 730 亿美元 AI 芯片扩张计划，全面挑战 SK Hynix
政策/监管
3. Pentagon 正式反驳 Anthropic 诉讼：AI 公司可能在战时”禁用或篡改模型行为”
生态/社区
4. arXiv 宣布脱离康奈尔大学独立运营
5. Signal 创始人 Moxie Marlinspike 将为 Meta AI 带来端到端加密
产业动态
6. Meta 宣布 AI 将在未来几年全面替代人工内容审核
7. Microsoft 发布 MAI-Image-2，跻身全球文生图 Top 3
8. Google Stitch 升级”Vibe Design”——AI 原生设计画布
9. Qwen3.5-9B 本地运行达 GPT-5.4 的 93.8%——HomeSec-Bench 实测
模型/算法研究
10. CubiD：首个高维表征的离散视觉生成模型（CVPR 2026）
11. F2LLM-v2：覆盖 200+ 语言的多语言嵌入模型家族，MTEB 11 项第一
12. Flash-KMeans：Song Han 团队重新审视 K-Means，GPU 实现性能飞跃
13. FASTER：让机器人 VLA 策略实现实时反应的通用加速框架
14. Tinted Frames：VLM 会根据问题框架”选择性失明”
15. VEGA-3D：用视频生成模型的隐式 3D 先验增强 MLLM 空间理解
16. NVIDIA Cascade RL：后训练 LLM 的级联强化学习 + 多域在线蒸馏
其他值得关注
17. Google AI 被发现篡改 The Verge 文章标题
18. Amazon 正在开发 AI 手机，代号”Transformer”
GitHub Trending 今日亮点
今日精选
下期追踪问题

AI 日报 — 2026年3月21日 上午

AI 日报 — 2026年3月21日 上午

上期追踪

硬件/算力/产业

1. Super Micro 联合创始人涉嫌 25 亿美元 AI 芯片走私被捕，股价暴跌 25%

2. Samsung 宣布 730 亿美元 AI 芯片扩张计划，全面挑战 SK Hynix

政策/监管

3. Pentagon 正式反驳 Anthropic 诉讼：AI 公司可能在战时”禁用或篡改模型行为”

生态/社区

4. arXiv 宣布脱离康奈尔大学独立运营

5. Signal 创始人 Moxie Marlinspike 将为 Meta AI 带来端到端加密

产业动态

6. Meta 宣布 AI 将在未来几年全面替代人工内容审核

7. Microsoft 发布 MAI-Image-2，跻身全球文生图 Top 3

8. Google Stitch 升级”Vibe Design”——AI 原生设计画布

9. Qwen3.5-9B 本地运行达 GPT-5.4 的 93.8%——HomeSec-Bench 实测

模型/算法研究

10. CubiD：首个高维表征的离散视觉生成模型（CVPR 2026）

11. F2LLM-v2：覆盖 200+ 语言的多语言嵌入模型家族，MTEB 11 项第一

12. Flash-KMeans：Song Han 团队重新审视 K-Means，GPU 实现性能飞跃

13. FASTER：让机器人 VLA 策略实现实时反应的通用加速框架

14. Tinted Frames：VLM 会根据问题框架”选择性失明”

15. VEGA-3D：用视频生成模型的隐式 3D 先验增强 MLLM 空间理解

16. NVIDIA Cascade RL：后训练 LLM 的级联强化学习 + 多域在线蒸馏

其他值得关注

17. Google AI 被发现篡改 The Verge 文章标题

18. Amazon 正在开发 AI 手机，代号”Transformer”

GitHub Trending 今日亮点

今日精选

下期追踪问题

AI 日报 — 2026年3月21日上午

AI 日报 — 2026年3月21日上午