美国人工智能公司Anthropic自摆乌龙。 3月31日,该公司在更新AI工具时,因打包设置错误,不慎将旗下热门编程工具“Claude Code”的内部源代码泄露到互联网。短短数小时内,这些代码被疯狂复制传播。

截至4月1日上午,Anthropic以版权为由,从全球最大代码托管平台GitHub上强制删除了超过8000份被转载的Claude Code内容。
公司发言人承认,此次泄露源于发布在NPM注册表上的@anthropic-ai/claude-code套件2.1.88版本。该版本意外包含一个59.8MB的JavaScript source map文件,该文件指向完整的TypeScript原始码,导致约51.2万行TypeScript代码被公开,涉及文件数量在1900到2300个之间。
Anthropic强调,这不是黑客攻击,而是“打包失误”。 声明写道:“今天稍早,Claude Code的一个版本发布中包含了部分内部原始码。其中未涉及任何敏感的客户资料或凭证。这是人为错误,并非安全漏洞。”
泄露事件被一名X平台用户率先发现。这些代码随即被镜像到GitHub上的多个代码库,复制次数达数万次。
那么,到底泄露了什么?Anthropic发言人表示,此次泄露不包含该公司核心中的内部数学模型(即“权重”),也不包含训练数据或基础架构。泄露的是Claude Code的CLI客户端与代理层(agent harness),具体包括:工具调用逻辑、内存架构、权限模型、token计算、思考模式(thinking mode)、重试机制等。这些属于Anthropic产品层的专有技术。
潜在后果不容小觑。 由于完整源码已被大量开发者及竞争对手分析,这让其他AI初创公司和对手更容易审视Claude Code的逻辑,寻找漏洞或设计绕过方式。底层指令包含了产品的关键设计理念、回答提问的策略、安全与优先级逻辑等核心信息。
更令人担忧的是,黑客获得了大量新线索来寻找安全漏洞,进而可能攻击Claude Code,给Anthropic及其用户带来风险。例如,Claude Code的很多安全限制——如禁止生成有害内容、禁止诈骗——都写在底层代码中。获得源码的不法分子或可设计针对性编码,绕过这些限制。
截至发稿,Anthropic未在自己官网发布任何关于泄露的公告。业内惯例表明,代码泄露后,公司通常需要更新安全策略与打包流程。