Esc
输入关键词开始搜索
News

AI 日报 — 2026年3月19日 下午

AI 日报 — 2026年3月19日 下午


头条

Anthropic 发布 81,000 人 AI 访谈报告——史上最大规模定性研究

Anthropic 用 Claude 对 80,508 人进行了对话式访谈,覆盖 159 个国家、70 种语言,这是已知最大、最多语种的定性研究。

人们最想从 AI 得到什么

  • 18.8% — 职业卓越(让 AI 处理重复任务,专注高价值工作)
  • 13.7% — 个人转变(AI 作为心理教练、情感支持)
  • 13.5% — 生活管理(日程、认知减负)
  • 11.1% — 时间自由(陪伴家人、追求爱好)
  • 9.7% — 财务独立(用 AI 创业、赚钱)
  • 9.4% — 社会变革(解决贫困、疾病、气候)

一个关键发现:很多人表面上说想提高工作效率,但深入追问后,真正的愿望是下班后有更多时间陪家人

“有了 AI 我上班更高效了… 上周二我终于能去和妈妈一起做饭,而不是加班。” — 哥伦比亚白领

来源: https://www.anthropic.com/features/81k-interviews


技术突破

复制 3 层 Transformer,逻辑推理能力从 0.22 跳到 0.76——不训练、不改权重

一个叫 llm-circuit-finder 的开源项目复现了 David Ng 的 RYS 方法:在 Devstral-24B 模型中找到一段”推理电路”(layers 12-14),把这 3 层在前向传播中重复执行一次,BBH 逻辑推理测试从 0.22 飙到 0.76,提升 245%。

关键洞察:Transformer 在训练过程中会自组织形成功能性电路——几层连续的层构成一个不可分割的认知单元。复制单层几乎无效,但复制正确的 3-4 层块就能给模型一次额外的推理机会。

更有趣的是,不同的复制模式可以从同一组权重中创造出不同的认知特征——数学专家、情商专家、纯数学模式等。

硬件:两块 AMD 消费级 GPU,一个晚上完成。

来源: https://github.com/alainnothere/llm-circuit-finder | HN 108 points


Agent 自研 SAT 求解器,5 个实例超越竞赛最佳成绩

agent-sat 项目让 Claude Code 自主研究 MaxSAT 问题。Agent 读论文、写代码、跑实验、总结经验、提交 git,完全无人指导。

在 229 个竞赛实例中:

  • 解出 220 个(96%)
  • 30 个达到竞赛最优
  • 5 个超过竞赛最佳成绩(最高提升 37.5%)
  • 1 个前所未有的新解

多 Agent 通过 git 协作:各自拉取最新成果 → 基于他人发现继续实验 → 推送自己的改进。不需要额外的协调机制。

来源: https://github.com/iliazintchenko/agent-sat | HN 123 points


工具与产品

NVIDIA NemoClaw——给 OpenClaw 套上安全沙箱

NVIDIA 发布了 NemoClaw,一个让 OpenClaw 运行在安全沙箱环境中的开源方案。使用 NVIDIA OpenShell 运行时(Landlock + seccomp + netns 隔离),推理走 NVIDIA Cloud。

一条命令安装:curl -fsSL https://www.nvidia.com/nemoclaw.sh | bash

这说明 NVIDIA 已经把 OpenClaw 视为值得官方支持的 Agent 平台。Alpha 阶段但开放社区反馈。

来源: https://github.com/NVIDIA/NemoClaw | HN 302 points


Claude HUD——Claude Code 的实时仪表盘插件

claude-hud 是一个 Claude Code 插件,在终端输入行下方实时显示:

  • Context window 用量(绿→黄→红进度条)
  • 当前工具调用(Edit / Read / Grep)
  • Subagent 运行状态
  • Todo 进度追踪

使用 Claude Code 原生 statusline API,不需要额外窗口或 tmux。今天日增 1,038 stars,总计 7,871。

来源: https://github.com/jarrodwatts/claude-hud


Cook——Claude Code 的工作流编排 CLI

Cook 是一个极简的 CLI 工具,用一行命令编排 Claude Code、Codex、OpenCode 的工作流。

核心 primitives:

  • cook "任务" x3 — 顺序执行 3 次,每次看到前一次输出
  • cook "任务" review — 自动 review → gate → iterate 循环
  • cook "任务" v3 "最优" — 并行 3 个版本,选最好的
  • cook "A方案" vs "B方案" pick "最佳安全性" — 两方案对比,自动选

支持 git worktree 隔离并行分支。可以组合使用:cook "任务" review v3 "最干净" = 并行跑 3 个,每个都有 review 循环,最后选最好的。

来源: https://rjcorwin.github.io/cook/ | HN 185 points


Superpowers 突破 97K Stars,日增 4,089

obra/superpowers 持续狂飙,今天单日增加 4,089 stars,总计 97,539。Claude Code 插件生态的核心项目地位进一步巩固。

来源: https://github.com/obra/superpowers


观点与讨论

”Warranty Void If Regenerated”——后 AI 转型的科幻小说

HN 热帖(325 points),一篇关于”Software Mechanic”(软件技工)的科幻短篇。

设定:AI 让软件开发变成了”写规格说明”。坏掉的软件不修了,重新生成一份。但”写出好规格说明”需要深刻的领域知识——懂农业的人给农业写规格,懂医疗的人给医疗写规格。“软件”和”硬件”的职业分界消失了。

核心隐喻:一台咖啡机的规格说明改了 3 次都没改好——因为咖啡涉及流体力学、热管理和口味的交叉,自然语言在这些领域特别不精确。主角用这台咖啡机来说服客户:“我搞了两年都搞不好一台咖啡机。你觉得你的灌溉系统会更简单?”

来源: https://nearzero.software/p/warranty-void-if-regenerated


NVIDIA Greenboost——用系统内存/NVMe 透明扩展 GPU VRAM

不是 AI 模型但对 AI 实践者很有用:nvidia_greenboost 项目可以透明地用系统 RAM 和 NVMe 扩展 GPU 显存,让显存不够的 GPU 也能跑大模型。

来源: https://gitlab.com/IsolatedOctopi/nvidia_greenboost | HN 309 points


Mozilla Firefox 149 将内置免费 VPN

Mozilla 将在 Firefox 149 中推出免费内置 VPN 功能。

来源: https://cyberinsider.com/mozilla-to-launch-free-built-in-vpn-in-upcoming-firefox-149/ | HN 122 points


项目Stars今日增量简介
claude-hud7,871+1,038Claude Code 实时仪表盘插件
superpowers97,539+4,089Agent Skills 框架
unsloth56,256+1,005开源模型训练/运行统一 UI
open-swe6,683+481开源异步编码 Agent
newton3,057+26GPU 加速物理模拟引擎(NVIDIA Warp)

今日精选

最值得深读: Anthropic 81K 人访谈报告——这是目前最全面的”普通人想从 AI 得到什么”的数据,远比 Twitter 上的争论有价值。

最值得动手试: llm-circuit-finder——不需要训练,只要找到模型中的推理电路并复制,就能大幅提升特定能力。两块消费级 GPU 就能玩。

最值得关注趋势: Claude Code 插件生态正在爆发——superpowers(97K)、claude-hud(7.8K)、cook 全部在今天冲上 trending。编码 Agent 不再是单打独斗,而是进入了”插件组合”时代。