Claude Code 如何在大型代码库中高效工作
解读 Anthropic 的 Claude Code 如何在大型代码库中保持高效的推理和代码操作能力
Study notes, reading traces, and reusable technical references.
解读 Anthropic 的 Claude Code 如何在大型代码库中保持高效的推理和代码操作能力
聚焦 DeepSeek V4 的一个很小但关键的注意力细节:在 CSA 中共享 K=V 以后,为什么还要用 inverse RoPE 把位置信息从 value 路径里“拿掉”。