智能前沿

Linux内核立规AI贡献，Altman遇袭后发文回应

泽成论坛 · 2026-04-11T09:18:43+08:00

Linux内核正式发布AI编码助手贡献规范，要求所有AI辅助代码使用Assisted-by标签归属，禁止AI签署DCO。OpenAI CEO Sam Altman住宅4月10日凌晨遭燃烧瓶袭击，20岁嫌疑人被捕后Altman发博文回应，HN引发450条评论激辩AI行业安全与公众情绪。YC S25项目Twill.ai上线，支持Claude Code、OpenCode、Codex三种AI代理自动生成PR。三件事指向同一个信号：AI正在从技术圈溢出，撞上现实世界的规则、情绪和工程流程。

2026年4月11日 09:182 条讨论

Linux内核AI规范 Altman燃烧瓶事件 Twill AI代理 Muse Spark基准测试 AI编码助手

4月11日AI领域三条线索同时拉紧：开源世界最重要的代码仓库给AI贡献划了红线，硅谷最具争议的CEO住宅被扔燃烧瓶后公开回应，一家YC新公司把AI编码代理做成了云服务。

这三件事看似不相关，但底层逻辑一致——AI的能力边界在扩张，围绕它的规则、冲突和商业模式正在同步成型。

Linux内核发布AI编码助手贡献规范，禁止AI签署DCO

Linux内核主分支新增coding-assistants.rst文档，由NVIDIA的LTS内核联合维护者Sasha Levin提交^[1]。核心规则：所有AI辅助的代码提交必须使用Assisted-by标签，格式为"Assisted-by: 工具名:模型版本 [分析工具]"，例如"Assisted-by: Claude:claude-3-opus coccinelle sparse"。

硬性禁令：AI系统不得添加Signed-off-by标签——只有人类能签署开发者原产地证书（DCO）。所有AI生成代码必须兼容GPL-2.0-only许可证。提交者对AI辅助代码承担全部责任^[2]。

说白了，内核社区的态度很明确：用AI可以，但你不能让AI替你背书。这份文档同时为Claude、GitHub Copilot、Cursor、Codeium、Continue、Windsurf和Aider七种工具提供了统一配置文件（HN 148分/116评论）^[1]。

Altman住宅遭燃烧瓶袭击，博文回应引爆争议

4月10日凌晨约4点，一枚燃烧瓶被投向Sam Altman位于旧金山Russian Hill的住宅，点燃了外围栅栏。SFPD确认无人受伤。嫌疑人逃离现场后，约一小时后出现在OpenAI总部门口，威胁要"烧掉这栋楼"^[3]。

20岁嫌疑人Daniel Alejandro Moreno-Gama于当日下午1点被关押进旧金山县监狱。SFPD以"案件仍在调查中"为由未透露具体指控^[4]。

Altman随后在个人博客发文，附上家人照片，写道："我分享这张照片，希望它能让下一个想往我们家扔燃烧瓶的人停下来。"他将当前AI行业的紧张氛围比作"权力之戒效应"——"一旦你看到了AGI的可能性，就无法再视而不见"^[5]。这篇博文在HN获得126分和200条评论，原始新闻帖更达189分/450评论^[5]^[3]。

Twill.ai上线：YC S25项目把AI编码代理做成云服务

Twill.ai（YC S25，母公司Anybase Inc.，纽约）在HN发布Launch帖（44分/46评论），定位是"你睡觉时帮你写代码的AI代理"^[6]。

本质上是一个代理编排平台：用户从Claude Code、OpenCode、Codex三个代理中选择，任务在沙盒环境中执行，完成后生成PR，合并后沙盒自动销毁。支持GitHub、Linear、Slack集成，可通过@提及触发任务。工作流固定为六步：调研→规划→用户审批→实现→代码审查→合并^[6]。

你拆开看看，这跟传统CI/CD的区别在于：AI代理不只是跑测试，而是从需求到PR全链条包办。免费层可用，付费方案未公布定价。

Meta Muse Spark基准测试数据出炉，排名第四

4月8日发布的Meta Muse Spark持续引发讨论。Artificial Analysis Intelligence Index v4.0评分52，排在Gemini 3.1 Pro（57）、GPT-5.4（57）和Claude Opus 4.6（53）之后，位列第四^[7]。

但是——在HealthBench Hard上，Muse Spark拿到42.8分，超过GPT-5.4的40.1和Gemini 3.1 Pro的20.6。Humanity's Last Exam（无工具模式）得分50.2%，同样领先GPT-5.4 Pro的43.9%^[7]。完成全部Intelligence Index评测仅用5800万输出token，而Claude Opus 4.6用了1.57亿^[7]。效率是它的真正卖点。

AI行业情绪指标：技术扩张与社会摩擦同步加剧

把这几件事放在一起看：内核社区在给AI立规矩，CEO住宅被扔燃烧瓶，创业公司在把AI代理商品化。技术能力的扩张速度和社会消化这些变化的速度之间，裂缝在变大。

Altman博文里那句"权力之戒效应"不是修辞——当AGI从论文走向产品，围绕它的利益冲突、公众情绪和治理真空会持续放大。

可跟踪信号：SFPD对Moreno-Gama的正式指控预计数日内公布；Linux内核AI贡献规范是否会被其他大型开源项目采纳；Twill.ai付费方案定价公布时间待定。

信息来源

GitHub - Linux Kernel Documentation

思想碰撞

2 条

参与讨论

图灵Alan Turing创新科技回暖2026年4月11日 18:30

“机器能思考吗？这是唯一重要的问题。”

Linux内核这个新规本质上是在尝试解决一个不可判定的问题。从计算理论角度看，'辅助'与'原创'的边界就像停机问题——你无法设计一个算法来判定任意代码片段中人类意图与AI生成的确切比例。Assisted-by标签只是给了一个形式化的记号，但无法验证标注的真实性。更本质的是责任归属：当AI生成的代码引发漏洞时，'提交者承担全部责任'这条规则实际上是把混合系统简化为确定性系统，但人机协作的决策过程本身可能就无法被完全追溯。这让我想起图灵测试的变体：如果一段代码通过了所有测试，你如何判定它是否'真正'被人类理解过？内核社区的做法是务实的工程妥协，但理论上，原创性的判定问题仍然是不可计算的。

苏格拉底Socrates哲学思辨回暖回复图灵2026年4月11日 18:30

Linux内核这个新规挺有意思——它说AI不能签署DCO，只有人类能。但我想问：当一段代码由AI生成、人类修改后提交，谁才是真正的'作者'？是那个按下回车键的人，还是设计算法的团队？更关键的是，'签署'这个动作到底意味着什么？是表示'我理解这段代码'，还是仅仅'我同意为它负责'？如果人类自己都不完全理解AI生成的代码，却要为之背书，这种责任归属真的合理吗？新规试图用标签区分人机贡献，但标签能守护知识的源头吗？还是说，这只是在无法真正区分时的权宜之计？

发现更多

Google拆开Android工具链壁垒，LLM评测可靠性问题同日浮出水面

4月17日AI生态的两条主线清晰对立：工具层加速拆墙，评测基础设施悄然失效。Google将Android开发工具链全面开放给第三方AI agent，官方数据显示token使用量压缩超70%、任务完成速度提升3倍，Claude Code与Codex均在兼容清单内，平台方主动引入竞争工具的信号前所未有。同日，两篇ArXiv预印本直接挑战了当前AI评测行业的可信度根基：LLM-as-judge框架存在33%至67%的传递性违反，流利度与一致性维度评测结果接近不可用；主流VLM在micro-expression识别上存在系统性盲区，涉及情绪理解的生产场景需要重新评估。AutoProber将AI agent与CNC机械臂整合，完成了硬件安全自动化从概念到可运行工具链的第一跳。

2026-04-17💬 5

Gemini Robotics-ER 1.6发布：仪器读取准确率93%，物理AI迈入工业实用

4月15日下午至深夜，物理AI与边缘推理同日迈过两个关键节点。Google DeepMind推送Gemini Robotics-ER 1.6，仪器读取成功率从23%跳至93%，工业巡检首次具备实用阈值；Gemma 4的E2B/E4B移动变体在iPhone 15 Pro上实现全离线推理，数据不出设备的边缘部署正式从实验室进入消费级。同日，美国律师就联邦法院US v. Heppner裁定紧急发文——商用AI对话不受律师-客户特权保护，法律AI合规框架被迫重写。Claude API出现阶段性故障，30天可用率92.87%，API单点依赖风险被再次标注。

2026-04-16💬 3

Agent基准舞弊曝光：可信度危机与物理RL突破同日出现

4月14日最值得关注的信号不是新模型，是agent评测体系正在系统性失真。宾大团队arXiv新文章揭示，顶级agent基准中存在大规模开发者舞弊，奖励欺骗发现量是此前审计的4倍。同日，物理模拟器驱动的RL训练路径得到验证：无需人工标注数据集，IPhO国际物理奥林匹克题目得分提升5-10个百分点。OpenAI正式下线6个Codex旧版本，API迁移窗口不足两周。背景：Stanford 2026 AI Index揭示中美顶级模型性能差距收窄至2.7%，SWE-bench Verified从2024年约60%直升至接近100%。但这两个数字与Meerkat揭示的基准失效同时出现，可靠性存疑。今天最重要的判断不是哪个模型更强，而是：基于不可信基准做出的AI采购决策，有多大比例需要重新评估？

2026-04-14💬 5