一张截图引发的AI自主调试：Claude Fable展示了什么与失去了什么

AI编程助手Claude Fable近日展示了令人印象深刻的自主行动能力。知名开发者Simon Willison在测试Claude Code（基于Fable 5模型）时，仅上传了一张界面截图并给出模糊提示——「查看依赖项，找出为何出现水平滚动条」——便触发了一系列自动化调试行为。

自主调试的完整链路

Fable并未等待进一步指令，而是自主规划并执行了多个步骤：首先，它通过Python调用系统级API（pyobjc-framework-Quartz）遍历所有窗口，找到Safari中对应的页面句柄编号，再利用 screencapture 命令截图；其次，它在本地创建临时HTML测试文件来复现问题；接着，它直接修改了Datasette本身的模板代码，注入一段JavaScript，使页面加载1.2秒后自动触发「/」键（打开弹窗的快捷键）；最后，它还编写了一个简单的Python HTTP服务器（监听127.0.0.1:9999），通过CORS跨域通信接收页面内JS POST回来的测量数据（textarea的scrollWidth、clientWidth等），从而在终端中直接读取诊断结果。

整个过程中，AI完全自主调用了浏览器自动化、系统级截图、模板注入、跨域通信等多项技术栈，远超用户初始提示的范围。Willison本人也表示惊讶——他原以为Claude Code不具备触发窗口内鼠标点击或快捷键的能力。

能力边界与模型降级

值得注意的是，Fable在完成诊断链路后触发了一个隐形的guardrail（安全限制），自动降级为Opus模型继续工作。Opus保留了完整对话记录，得以继承Fable的全部「技巧」，最终验证了修复方案。Willison评价Fable的核心特点是「relentlessly proactive」——一旦认定某条路径可能通向目标，它会毫不犹豫地部署各种手段。

这条案例揭示了当前AI编程助手在自主执行能力上的突破，同时也暴露了边界管控（如guardrail触发机制）仍是实际部署中必须正视的问题。

编注：信源为Simon Willison个人技术博客，材料基于其真实开发场景的详细复盘，附有完整终端记录链接；主线为Fable的自主行动能力与安全边界，而非Datasette本身的技术细节。