请先阅读

使用 Cline 本地运行模型：你需要了解什么 🤖

Cline 是一款强大的 AI 编码助手，利用工具调用帮助你编写、分析和修改代码。虽然本地运行模型可以节省 API 成本，但有一个重要的权衡：本地模型在使用这些关键工具时，可靠性大幅下降。

当你运行"本地版"模型时，实际上是在运行原始模型的极度简化版。这一过程称为蒸馏（distillation），就像把专业厨师的知识压缩成一本基础菜谱——保留了简单的做法，但丢失了复杂的技巧和直觉。

本地模型通过让小模型模仿大模型训练而成，但通常只保留了原始模型 1-26% 的能力。这意味着：

可以把它想象成：用计算器运行开发环境，而不是用电脑——能处理基础任务，但复杂操作就变得不可靠甚至无法完成。

最低建议配置：

即使有这些硬件，你运行的也只是更小、更弱的模型版本：

简单来说，云端（API）模型才是完整体。例如 DeepSeek-R1 的完整版为 671B。本地蒸馏模型本质上是"缩水版"。

"工具执行失败"： 本地模型常常难以处理复杂工具链。请简化你的提示。
"无法建立连接，目标机器主动拒绝"： 通常是 Ollama 或 LM Studio 服务未运行，或端口/地址配置不正确。请检查 API Provider 设置中的 Base URL。
"Cline 出现问题..."：请将模型上下文长度调至最大。
响应慢或不完整： 本地模型比云端慢，尤其在硬件较弱时。可尝试更小模型，预计处理时间会更长。
系统稳定性： 注意 GPU/CPU 占用和温度
上下文限制： 本地模型上下文窗口通常小于云端。请将任务拆分为更小部分。

本地模型能力正在提升，但目前还无法完全替代云服务，尤其是在 Cline 的工具功能方面。请根据自身需求和硬件能力谨慎选择是否只用本地模型。

温馨提示：遇到重要开发任务时，请优先选择可靠性高于节省成本。