Cursor 3.6 深度评测:它不只是「最强的 AI IDE」,它正在重新定义编程
开篇钩子
2026 年的 AI 编程工具市场已经卷到令人窒息。从 GitHub Copilot 到 Claude Code,从 Trae 到 Codex CLI,每个月都有新玩家入局。但有一个名字几乎出现在每个技术论坛的「你用什么写代码」讨论里——Cursor。
我在过去半年里深度使用了 Cursor 的每个大版本,从 2.x 时代的 Composer 初版,到 3.0 的 Cloud Agents,再到 3.6(2026 年 5 月 29 日发布)的 Auto-review Run Mode。说实话,每次更新都让我觉得「这工具是不是快到天花板了」,然后下一个版本又打我的脸。
目前 Cursor 的定价体系已经相当成熟:Hobby 免费(有限额度的 Agent 请求和 Tab 补全)、Individual $20/月(Pro/Pro+/Ultra 三档,含前沿模型访问、MCP、Skills、Hooks、Cloud Agents 等)、Teams $40/人/月、Enterprise 定制报价。
截至 2026 年 5 月,Cursor 已被超过半数财富 500 强企业采用,从 Stripe 到 NVIDIA 都在用。Andrej Karpathy 的评价很精准:「最好的 LLM 应用都有一个自主性滑块——在 Cursor 里,你可以从 Tab 补全开始,用 Cmd+K 做定向编辑,也可以完全放手让它以 Agent 模式自主运行。」
核心体验
Tab 补全:快到不真实的预测
用 Cursor 最直观的感受是它的 Tab 补全速度快得让人觉得在作弊。不是简单地自动补全变量名,而是预测你接下来要写的整个逻辑块。
有一次我在写一个 Rust 的 async 函数,刚敲完函数签名和 let client = reqwest::Client::new();,Cursor 已经在灰字里预填了整个 match client.get(&url).send().await { ... } 代码块,包括错误处理和 serde_json::from_value 的反序列化逻辑。它甚至猜到了我用的是 serde 库。Tab 按下那一瞬间,我第一次觉得:「这已经不是补全了,这是读心术。」
Cursor 的 Tab 模型是自研的,不依赖 GPT 或 Claude,所以延迟极低——通常在 200ms 以内。坏处是它只在「可预测」的场景下强大,面对高度自定义的内部框架或非常规代码风格时,猜中的概率会骤降到 50% 以下。
Composer 2.5:多文件魔法
如果说 Tab 补全是 Cursor 的肌肉记忆,那 Composer 就是它的大脑。2026 年 3 月推出的 Composer 2,5 月升级到 2.5,已经完全不是最初那个「对话式编辑」工具了。
Composer 2.5 的核心能力是有计划的代码生成。你给它一个需求,它不会直接动手改代码,而是先生成一个「Plan」——分步骤的任务列表。你会看到它列出:「1. 创建新的 API route 文件 2. 修改前端组件的 fetch 逻辑 3. 更新 TypeScript 类型定义 4. 添加单元测试」。然后它逐个执行,每个步骤完成后你可以选择接受、修改或拒绝。
我在重构一个旧项目时,用 Composer 把 Vue 2 Options API 的 4 个组件迁移到 Vue 3 Composition API + TypeScript。它一次性搞定了模板迁移、响应式变量转换、以及 defineProps 的类型声明,跨 6 个文件共修改了约 400 行代码。手动做这件事我估计要花 40 分钟,Composer 用了大约 3 分钟(包括我审核的时间)。
但它不是完美的。同一个重构里,它把 this.$emit('update:modelValue', value) 改成了 emit('update:modelValue', value)——完全正确。但在另一个文件里,它漏掉了 this.$refs 的迁移,导致运行时错误。所以 Composer 是「框架逻辑正确性 90%、细节覆盖率 70%」的水平——你还是得审计。
Agent 模式与 Cloud Agents
Cursor 的 Agent 模式允许 AI 自主执行终端命令和文件操作。目前有两个层次:
本地 Agent:在你自己的机器上运行,能读文件、改代码、跑终端命令、操作 Git。我日常用它做「写测试→跑测试→修失败的测试」这个循环,体验极佳。你只需要说「给 auth module 写测试」,Agent 会自己判断需要测试哪些函数、用什么 mock 策略、写完自己跑一遍确认通过。
Cloud Agents:这是 Cursor 3.0 引入的重磅功能。Agent 在 Cursor 的云端基础设施上运行,有自己的独立环境。你可以同时启动多个 Cloud Agent 并行处理不同任务,它们能 build 项目、运行 E2E 测试,甚至部署到 staging 环境。完成后你会收到一个录屏回放和代码 diff。
Cloud Agent 执行一个 dashboard 构建任务大约花了 14 分钟,期间它读取了 12 个文件、执行了 4 次搜索,最终产出了一个包含实时图表的完整前端页面。但这个功能的痛点也很明显:Cloud Agent 消耗的额度远高于本地 Agent,Pro 用户要注意用量。
.cursorrules:团队规范的硬编码
很多团队在用 AI 工具时遇到同一个问题:AI 生成的代码风格不统一。.cursorrules 解决了这个痛点。
# .cursorrules
- 使用 TypeScript strict mode,禁止 any 类型
- API 路由使用 trpc v11 模式
- 组件使用 shadcn/ui + Tailwind CSS
- 错误处理统一用 Result<T, E> 模式
- 禁止使用 console.log,用 pino logger这个文件放在项目根目录后,Cursor 的所有 AI 功能(Tab、Composer、Agent)都会遵守这些规则。我的团队里有一个 .cursorrules 仓库,不同项目 clone 对应的规则文件即可。对比团队文档里的「编码规范」写了没人看,.cursorrules 是真正被执行的——因为不遵守规范的代码根本就不会被生成出来。
真实评测
优点
- Tab 补全延迟极低(200ms 级),预测准确率高得离谱,是 Cursor 最核心的竞争力。
- Composer 2.5 的 Plan + Execute 模式大幅降低了「AI 乱改代码」的风险。
- 多模型支持:可以在 GPT-5.5、Claude Opus 4.8、Gemini 3.1 Pro、Grok 4.3 之间自由切换,甚至用自研的 Composer 2.5 模型。
- Cloud Agents 让并行开发成为现实,你写代码 AI 也在写代码。
- 生态已完善:飞书集成、JIRA 集成、Marketplace、CLI、Bugbot(Agentic Code Review)都已经很成熟。
- SOC 2 认证,企业级安全合规。
缺点
- $20/月的 Pro 订阅不算便宜,Pro+ 和 Ultra 更贵(非公开定价),重度用户每月的实际成本可能远超 $20。
- 对网络要求高。国内用户需要稳定的代理,否则 Composer 的流式输出会频繁中断。
- 重度依赖可能导致编码基本功退化。有个真实的隐患:习惯了 Tab 补全后,你会发现自己越来越懒得记 API 签名,因为「反正 AI 会帮我补」。
- **Agent 模式的「过度自由」**偶尔会删掉你没有要它删的代码。虽然有 Git 可以回退,但那种「等等你干了什么」的瞬间心跳是真实存在的。
- 扩展平台的完整功能需要 Pro 订阅,Hobby 版的额度限制让它在实际日常使用中体验大打折扣。
实际上,论坛上(forum.cursor.com)有好几个热帖在讨论「Pro 会员的用量到底多少才算够」。官方声称 Pro 包含「extended limits」,但具体数字并不透明,很多人月末突然发现用量被限制,体验断崖式下跌。
社区声音
V2EX 上有一位开发者的评论我觉得很真实:「Cursor 是我每月最心甘情愿付的 $20。它不像 Netflix 那样是可选的娱乐——它是我的生产工具,没有它我的编码速度会慢 40%。」但也有人吐槽:「每次大版本更新后都要重新适应 UI 变化,Composer 2 到 2.5 的操作逻辑又改了。」
横向对比
| 特性 | Cursor 3.6 | GitHub Copilot | Claude Code | Trae |
|---|---|---|---|---|
| 月费 | $20 起 | $10/$19 | 需 Claude 订阅 | 免费 |
| 补全延迟 | 极低(~200ms) | 低(~300ms) | N/A(CLI) | 中等 |
| 多文件编辑 | Composer 2.5 | Copilot Edits | 原生支持 | 支持 |
| 多模型 | 6+ 模型可选 | GPT + Claude | Claude 独占 | Claude + GPT |
| Cloud Agent | 支持 | 不支持 | Routines(接近) | SOLO |
| .cursorrules | 项目级规则 | Custom Instructions | CLAUDE.md | 不支持 |
| 企业合规 | SOC 2 | SOC 2 | 商业条款 | 待完善 |
选 Cursor 的理由:你追求的是「最快的补全 + 最强的多文件编辑 + 最大的模型自由度」。如果你对终端有执念且只信任 Claude 模型,Claude Code 更合适。如果预算为零且想要云端 Agent,Trae SOLO 是目前唯一的免费选项。
适用人群
推荐给: 专业开发者、独立开发者、全栈工程师、追求极致效率的团队。如果你每天写代码超过 4 个小时,$20/月绝对物超所值。
不建议: 编码初学者(过度依赖会阻碍学习基础语法)、只有偶尔编码需求的用户、对网络环境不稳定的国内用户(除非有稳定代理)。
上手建议
- 第一件事:配置 .cursorrules。哪怕只写三条规则,Agent 的输出质量都会明显提升。
- 模型选择有讲究:日常代码补全用自带的 Tab 模型(最快),复杂重构用 Claude Opus 4.8(最稳),创意性功能开发用 GPT-5.5(最灵活),快速实验用 Composer 2.5(性价比高)。
- Agent 模式建议先 dry-run:让 Agent 输出计划但不执行,你审过之后再让它动手。
- 快捷键是生产力核心:
Cmd+K(行内编辑)、Cmd+L(Chat)、Cmd+I(Composer)、Cmd+Shift+Enter(接受所有改动)。花 10 分钟记住这些,比你多花 $20 订阅 Ultra 更划算。 - Cloud Agent 适合异步任务:下班前提交一个重构任务,第二天早上看结果。不要实时盯着它跑——它会让你焦虑。
- 关注 changelog:Cursor 的更新频率极高(大约每 1-2 周就有新功能),不看 changelog 你会错过很多实用技巧。