上下文协同工作

首先，什么是上下文窗口？它与在 Cursor 中高效编程有什么关系？

从更宏观的角度来看，大型语言模型（LLM）是一种通过学习海量数据集中的模式来预测和生成文本的人工智能模型。它为像 Cursor 这样的工具提供支持，通过理解你的输入并根据以往见过的内容建议代码或文本。

Token（标记）是这些模型的输入和输出。它们是文本的片段，通常是单词的一部分，LLM 会逐个处理这些 token。模型不会一次性读取完整句子，而是根据前面的 token 预测下一个 token。

要查看一段文本如何被分词，你可以使用像这个这样的分词器。

什么是上下文？

在 Cursor 中生成代码建议时，"上下文"指的是提供给模型的信息（以"输入 token"的形式），模型随后利用这些信息预测后续内容（以"输出 token"的形式"）。

上下文有两种类型：

意图上下文定义了用户希望模型实现的目标。例如，系统提示通常作为用户希望模型如何表现的高层指令。在 Cursor 中，大多数"提示"属于意图上下文。"把那个按钮从蓝色变成绿色"就是陈述意图的例子；它是指令性的。
状态上下文描述了当前世界的状态。向 Cursor 提供错误信息、控制台日志、图片和代码片段等，都是与状态相关的上下文。它是描述性的，而非指令性的。

这两种上下文协同工作，通过描述当前状态和期望的未来状态，使 Cursor 能够给出有用的编程建议。

你能为模型提供的相关上下文越多，它就越有用。如果在 Cursor 中提供的上下文不足，模型会尝试在缺乏相关信息的情况下解决问题。这通常会导致：

幻觉：模型试图进行模式匹配（但实际上没有模式），从而产生意外结果。当像 claude-3.5-sonnet 这样的模型没有获得足够上下文时，这种情况很常见。
Agent 会尝试自行收集上下文，比如搜索代码库、读取文件和调用工具。强大的推理模型（如 claude-3.7-sonnet）可以通过这种策略走得很远，而提供正确的初始上下文将决定后续的走向。

好消息是，Cursor 天生具备上下文感知能力，设计上就要求用户最少干预。Cursor 会自动引入模型认为相关的代码库部分，比如当前文件、其他文件中语义相似的模式，以及会话中的其他信息。

不过，可用的上下文非常多，因此手动指定你认为与任务相关的上下文，是引导模型朝正确方向前进的有效方式。

最简单的显式提供上下文的方法是使用 @-符号。当你明确知道需要包含哪个文件、文件夹、网站或其他上下文时，这种方式非常有效。越具体越好。以下是如何更精确地指定上下文的方法：