23.Claude Code 源码精读：edit文件工具

零、背景

前二十篇文章把 Agent 的整体骨架，如Loop、工具、上下文记忆、上下文压缩、MCP、Skill、TUI、任务规划、子代理、命令、跨会话记忆、Agent.md、系统提示词、任务持久化、会话持久化、goal 命令、后台任务、定时任务、Teammate、自定义子代理都讲了一遍。

从第二十一篇文章开始，进入 Claude Code 源码精读。
前面已经看过 read_file 和 write_file 两个工具的源码。

这一篇来看最复杂的 edit_file 工具，对应 Claude Code 源码里的 FileEditTool。

read_file 是「看」，write_file 是「覆盖」，edit_file 是介于两者之间，给一段 old_string，给一段 new_string，去文件里精确替换。

听起来比 write 还简单，一次 strings.Replace 就完事。
但 edit 的麻烦在于： read 和 write 的所有边界条件都需要考虑，还额外多出一堆只有「字符串替换」语义才会遇到的问题。

一、三件套对照：哪些共用、哪些独占

读 / 写 / 编辑这三个工具，看似各管一摊，其实大半的设计都是共用的。

维度	`read_file`	`write_file`	`edit_file`
路径合法性（空路径、目录、不存在）	✓ 拒绝	✓ 拒绝	✓ 拒绝
二进制 / 设备文件拦截	✓	—	—
Must read first	生产者	✓ 消费者	✓ 消费者
No stale writes（hash 比对）	—	✓	✓
写后 `InvalidateReadState`	—	✓	✓
写后 `RecordEditPreState`	✓	✓	✓
`MkdirAll` 父目录	—	✓	✓
CRLF 风格	归一化输出	故意不保留	保留原风格
字符串匹配	—	—	✓（独占）
弯引号归一化 + 风格保留	—	—	✓（独占）
唯一匹配 / `replace_all` 消歧	—	—	✓（独占）
删除时吞尾随换行	—	—	✓（独占）
错误信息里带 “Did you mean”	✓	—	✓
反馈给模型的内容	cat -n 文本	行数 / 字节数	snippet + 行号

从这张表能直接读出 edit 的特征。

共用部分集中在「读必先于写」「写不能盖掉别人的改动」「写完同步状态」这一类前置/后置逻辑上，三个工具是同一套机制，只是站位不同。
这一部分前两篇文章已经讲过了，本篇用一节快速带过。

edit 独占部分集中在「字符串替换语义」本身，匹配怎么找、找到多个怎么办、删除如何处理换行符、引号风格怎么保留、CRLF 为什么和 write 反着来。
这是 edit 真正的复杂度所在，本篇会逐项详细拆开。

graph LR
    subgraph 共用逻辑
        A1["路径校验"]
        A2["editPreState<br/>must read first"]
        A3["hash 比对<br/>no stale writes"]
        A4["写后状态刷新"]
    end
    subgraph edit 独占
        B1["弯引号归一化匹配"]
        B2["唯一匹配 / replace_all"]
        B3["删除吞尾随换行"]
        B4["CRLF 保留"]
        B5["snippet 反馈"]
    end

    style A1 fill:#0d2137,color:#58a6ff
    style A2 fill:#0d2137,color:#58a6ff
    style A3 fill:#0d2137,color:#58a6ff
    style A4 fill:#0d2137,color:#58a6ff
    style B1 fill:#162118,color:#3fb950
    style B2 fill:#162118,color:#3fb950
    style B3 fill:#162118,color:#3fb950
    style B4 fill:#162118,color:#3fb950
    style B5 fill:#162118,color:#3fb950

二、共用逻辑：一节快速带过

这一节把三个工具共用的机制集中处理，因为前两篇已经详细拆过，这里只点到为止。

Must read first
edit_file 进来后查 editPreState，没记录就直接拒绝并提示「先 read_file」。
状态由 read_file 完整读取后写入，edit_file 和 write_file 共同消费。

No stale writes
读完到改完之间文件可能被外部改动。
改之前用 hash 比一次，不一致就拒绝并提示重新 read：

写后状态刷新
清掉 read_file 的去重缓存，再用新内容重新 RecordEditPreState，让模型可以在同一个 turn 里连续 edit 同一个文件而不必中间穿一次 read：

目录 / 不存在路径
目录直接拒绝；不存在路径分两种语义（创建 / 误用），后面会单独讲。

这四条机制是 read / write / edit 三件套的「共享逻辑」，单看 edit 没什么新意。真正让 edit 复杂的是下面这几节。

三、字符串匹配的坑：弯引号 vs 直引号

这是 edit 第一个独占问题，模型给的 old_string 在文件里找不到。

最容易踩的一类是引号被悄悄换掉了。
"（直引号、ASCII）和 “ ”（弯引号、typographic quote）在显示上几乎一致，但在字节层面是完全不同的字符。
模型训练数据里两种都有，输出的时候究竟是哪一种谁都不知道。

结果就是，文件里写的是 “hello”（弯引号），模型给的 old_string 是 "hello"（直引号）。
朴素的 strings.Contains 找不到，edit 报错。

FileEditTool 在这里有一道两轮匹配的 fallback。

第一轮精确匹配命中，返回的就是 search 本身。
第二轮归一化命中，返回的是原文里那段位置的实际内容（带弯引号），不是模型给的直引号版本。

graph TD
    A["edit_file 进入<br/>old_string 直引号"] --> B["第一轮：精确匹配"]
    B -->|"命中"| H["原样返回"]
    B -->|"未命中"| C["第二轮：弯引号归一化"]
    C --> D{"归一化后命中？"}
    D -->|"否"| F["报错 not found"]
    D -->|"是"| G["返回原文段（带弯引号）"]
    G --> Q["用于后续<br/>preserveQuoteStyle"]

    style B fill:#0d2137,color:#58a6ff
    style C fill:#0d2137,color:#58a6ff
    style H fill:#162118,color:#3fb950
    style G fill:#162118,color:#3fb950
    style F fill:#3a1212,color:#f85149

四、引号风格保留：写回也要讲究

匹配阶段做了归一化，写回的时候要做一道反向操作：把模型 new_string 里的 ASCII 引号「升级」成弯引号，否则文件里会出现「弯引号原文 + 直引号补丁」的混排。

判断每个引号该是「左」还是「右」靠的是上下文。

对单引号还多了一条特殊规则——英文撇号：

don't 这种缩写中间的撇号，前后都是字母，在排版上一定是闭单引号（’），不能写成开引号。

这套保留逻辑只在「第一轮没命中、第二轮归一化命中」时才触发，99% 的场景根本不会进来。
但一旦进来，需要保证写回的内容和原文排版一致。

五、唯一匹配 vs replace_all：消歧的两条路

edit 的另一道独占机制，old_string 在文件里命中多次时，默认拒绝执行，除非模型主动开了 replace_all=true。

这条规则的意义在于，把「替换哪一处」的歧义完全消除。

graph TD
    A["匹配次数"] --> B{"几个？"}
    B -->|"0"| X1["报错：not found"]
    B -->|"1"| OK["执行替换"]
    B -->|">=2"| C{"replace_all?"}
    C -->|"true"| ALL["全部替换"]
    C -->|"false"| X2["报错：消歧两选一"]

    style X1 fill:#3a1212,color:#f85149
    style X2 fill:#3a1212,color:#f85149
    style OK fill:#162118,color:#3fb950
    style ALL fill:#162118,color:#3fb950

六、删除一行：吞掉那个尾随换行

这是另一类只有 edit 才会遇到的细节：删除语义。

当 new_string="" 而 old_string 不为空时，edit 的语义是「把 old_string 这段从文件里删掉」。

最朴素的实现 strings.Replace(original, oldString, "", n) 会留下一个非常恼人的副作用，原本 old_string 后面那个 \n 还在。

只在两个条件同时成立时触发：old_string 自己不以 \n 结尾（说明是「半行」），且原文里 old_string + "\n" 存在（说明位于行尾）。

这两个条件保证了只有「删除整行」的场景才会吞尾随换行。
如果 old_string 已经带 \n 或位于行中间，不动它。

七、新文件创建：edit 的另一条入口

edit_file 还承担了「创建新文件」的语义。
old_string="" 且文件不存在时，把 new_string 当作整个文件内容写出去。

文件不存在时分两条路。

old_string != ""：模型在「编辑一个不存在的文件」，明显误用。
错误信息带上 cwd，findSimilarFile 在父目录里找一下相近名字的兄弟文件给出 “Did you mean” 提示。
这里与 read_file 的实现保持一致，即把「错误信息里带正确答案」。

old_string == ""：合法的「创建」语义，先创建目录，再写文件。

还有一种 corner case 是文件存在但内容为空，这时 old_string="" 是「填充空文件」语义，单独走写文件，返回的消息会区分「created」还是「filled empty file」。

graph TD
    A["edit_file"] --> B{"文件存在？"}
    B -->|"否"| C{"old_string=''?"}
    C -->|"非空"| X["报错 + Did you mean"]
    C -->|"空"| D["创建新文件"]
    B -->|"是"| E{"是目录？"}
    E -->|"是"| Y["拒绝"]
    E -->|"否"| F{"内容为空 + old=''?"}
    F -->|"是"| G["填充空文件"]
    F -->|"否"| H["标准编辑路径"]

    style X fill:#3a1212,color:#f85149
    style Y fill:#3a1212,color:#f85149
    style D fill:#162118,color:#3fb950
    style G fill:#162118,color:#3fb950
    style H fill:#162118,color:#3fb950

八、CRLF：和 write 选了相反的方向

edit 和 write 在换行处理上的决策完全相反。

write 那一篇里讲过，FileWriteTool 故意不保留 CRLF。
因为整文件覆盖时强行还原 CRLF 会让原本错配的 bash 脚本继续保持错配。

但 FileEditTool 主动保留原文件的 CRLF 风格。

两个工具选了相反方向，背后是同一条原则，write 是覆盖语义、整个文件你说了算；edit 是局部修改语义、原文风格不该被这一次小改动改掉。

九、写后反馈：snippet + 行号

最后一道独占机制是反馈。

最朴素的反馈是「The file has been updated successfully.」一句话。
模型只能从「没报错」推断改成功了，但不知道改到哪一行、周围长什么样。

FileEditTool 在 tool result 里附带一段编辑后的 snippet：

The file main.go has been updated successfully.

Snippet (around line 42 after the edit):
import "os"
import "strings"

func main() {
fmt.Println("hello, world")
os.Exit(0)
}

snippet 里前后各 4 行上下文 + 改动那几行，带 cat -n 风格的行号。

这是给模型的「self-check 信号」，不需要再调一次 read_file，tool result 本身就把答案带回来。

十、最后

三个工具最终组成了最基本的增删改查操作。

read 的目标是「省 token、稳输出」。

write 的目标是「别让模型把自己不知道的东西覆盖掉」。

edit 的目标是「让字符串替换在真实代码里足够鲁棒」。

三把刀都打磨好了，Agent 才有动手术的底气。

《完》

-EOF-

本文公众号：天空的代码世界
个人微信号：tiankonguse
公众号 ID：tiankonguse-code

本文首发于公众号：天空的代码世界，微信号：tiankonguse
如果你想留言，可以在微信里面关注公众号进行留言。