别再问会不会用 AI：我把 AI 使用水平分成 8 级

AI 使用方法论 2026-05-26 · 悦微日报

一

看完 Steve Yegge 那期访谈之后，我脑子里一直卡着一个问题：我们说一个人“会用 AI”，到底是什么意思？

很多人的理解还停在工具层面。

会用 ChatGPT，算会用 AI。

会写 prompt，算会用 AI。

会让 Claude Code 改代码，算会用 AI。

会让豆包写小红书文案、让 Gemini 总结 PDF、让 Midjourney 出图，也算会用 AI。

这些当然都算，但我越来越觉得，这些只能说明你“接触了 AI”，不能说明你真的把 AI 放进了自己的工作和生活。

真正的差别不在于你打开了哪个模型，而在于你敢把多少真实任务交给它。

Steve Yegge 那期访谈里讲了一个 AI 工程师 8 级，从完全不用 AI，到用 agent 编排器让 agent 跑 agent。我之前写过一篇程序员自评。

后来我意识到一个问题：AI 使用水平不该只给程序员分级。

普通人也需要一把尺子。

因为未来几年，真正被 AI 拉开差距的，可能不是“会不会写代码”的人，而是“会不会把自己的事情交给 AI 处理”的人。

所以我想重新写一个 8 级版本。不是照抄 Steve，而是借这个方向，重新看一个程序员和一个普通人，在 AI 面前到底经历了同一条怎样的心理台阶。

二

第一级，是不用。

这没什么好嘲笑的。有些人工作里暂时用不上，有些人担心隐私，有些公司不让用，有些人就是还没遇到非用不可的场景。

我身边就有不少这样的老程序员。因为我周围大多是日本工程师，这种情况还挺明显：他们写了很多年 Java、PHP、C#，业务系统维护得很稳，遇到问题第一反应还是查文档、看日志、问同事，而不是打开 AI。他们不是不会写代码，也不是能力差，很多人的基本功比年轻人扎实得多。只是 AI 还没有进入他们的默认动作。

真正的问题不是 L1，而是很多人会从 L1 直接跳到一句很笼统的判断：“AI 没什么用。”

这句话通常不是判断，是没走进去。

第二级，是把 AI 当搜索框。

程序员问它报错是什么意思，普通人让它翻译一段英文、总结一篇文章、改一封邮件。这个阶段很舒服，因为 AI 像一个更会说话的搜索引擎。

但它还没有改变你的做事方式。

它回答，你执行。

很多人会卡在这里很久，然后觉得自己已经“会用 AI”了。其实这只是会问问题，还不是会用 AI 做事。

第三级，AI 开始替你交付一个小东西。

程序员让它写一个脚本、改一个函数、补一段测试。普通人让它写一封完整邮件、做一份旅行计划、整理一份会议纪要。

这一步的变化很大。

因为你第一次从“问它”变成“交给它”。

不过这个阶段交出去的东西通常很小。错了也不太要命。你心里知道，最后还是自己兜底。

三

第四级，我觉得是很多人的第一个分水岭。

这一层不是“AI 能不能写”，而是“你会不会 review”。

程序员到了 L4，不再盯着 AI 每一行怎么写，而是看 diff、跑测试、看关键路径。普通人到了 L4，也不再逐句改它的文案，而是看它给的方案方向对不对、有没有漏掉重要条件、有没有编造事实。

这时 AI 会让人变快，也会让人变累。

因为它三分钟给你五页东西，你十分钟之内要判断这五页哪里能用、哪里危险、哪里要重写。

以前你慢慢写，判断是分散发生的。

现在 AI 一口气把半成品堆到你面前，判断被压缩到一起。

所以我现在不太相信“用了 AI 就轻松”这种话。低级用法可能轻松，高级一点反而更耗脑子。你不是不用判断了，你是被迫更快地判断。

第五级，才是真正的门槛：放手。

不是让 AI 写一段话，也不是让它改一个函数，而是把一个完整任务交出去。

对程序员来说，可能是“这个模块的 bug 你先查完，能修就修，最后给我 diff 和测试结果”。

对普通人来说，可能是“我下个月去东京 5 天，这是预算、偏好和同行人情况，你先做一版完整行程，把交通、酒店、每天安排和风险点都列出来”。

注意，这不是完全不管。

L5 不是懒。

L5 是你不再盯过程，而是开始设计边界和验收标准。

你得告诉 AI：目标是什么，不能碰什么，输出长什么样，什么时候必须回来问你，最后你怎么判断它做得对不对。

我自己做 yuewei-digest 的时候，真正有一次跨到 L5，是批量处理 158 篇长文。以前我会一篇篇看输出。后来发现不可能，只能让它整批跑，最后看成功率、失败模式和可修复原因。

那次我才意识到：放手不是不负责，而是把负责的粒度从“盯每一步”变成“看整个系统”。

这一步，普通人也会遇到。

你让 AI 帮你写一封邮件不难。你让 AI 帮你完整准备一次求职、一次旅行、一次装修、一次选题研究，就会立刻碰到同样的问题：资料够不够？边界清不清？它错了谁发现？最后谁拍板？

这才叫真正开始用 AI。

四

第六级，是同时让多个 AI 干活。

程序员会开几个 agent：一个改代码，一个写测试，一个查文档，一个做 review。

普通人也会有类似场景：一个 AI 盯行业新闻，一个 AI 整理会议，一个 AI 帮你做内容选题，一个 AI 维护旅行计划，一个 AI 管待办。

到了这一级，问题就不是 AI 能不能产出，而是你能不能接住产出。

这很反直觉。

很多人以为 AI 越强，人越闲。实际情况可能是 AI 越强，人越像一个小团队主管：到处都是结果，到处都等你确认，到处都有可能冲突。

Steve Yegge 讲过一个状态：agent 忙着干活，人反而无聊，因为总有一个 agent 在等你看结果。

这句话很有意思。它说的不是“人没事干”，而是人的工作变了。

你不再是亲自写每一段东西的人，你变成了分配任务、判断结果、处理异常的人。

第七级，会更危险一点。

因为 AI 不只是帮你生成内容，而是开始接入真实工具。

程序员这边，是自动提交、自动部署、跨仓库修改、访问数据库、跑命令。

普通人这边，是邮箱、日历、网盘、飞书、Notion、购物账户、报销系统、客户资料。

这时 AI 已经不是“助手”，而是半自动系统。

它发错一封邮件、删错一个文件、理解错一个客户、花错一笔钱，都会变成现实后果。

所以 L7 的关键词不是效率，而是权限。

低级 AI 使用靠 prompt。

高级 AI 使用靠边界。

你得知道什么能自动，什么必须确认；什么能读，什么不能写；什么能建议，什么绝对不能直接执行。

五

第八级，我愿意把它叫做“个人 AI 组织”。

程序员这边，就是 Steve 说的编排器：agent 跑 agent，任务会被拆分、派发、执行、检查、回滚、记录。

普通人这边，不一定长得那么技术。它可能更像一个个人操作系统：它知道你的长期目标、项目、资料、联系人、偏好和禁区。你给它一个目标，它能拆任务、找资料、调用工具、生成方案，把真正需要你判断的地方推回来。

这听起来有点远，但方向已经很清楚。

到这个阶段，关键问题不再是“哪个模型最强”，而是：

我的资料有没有沉淀？

我的流程有没有固定下来？

我的工具能不能被 AI 调用？

我的权限边界有没有写清楚？

我的历史判断能不能复用？

我换一个模型，这套工作流还能不能继续跑？

所以我现在越来越觉得，AI 时代真正稀缺的不是 prompt。

prompt 是一句话。

工作流是一套可以重复执行的做事方式。

L8 的人不会每天从零开始问：“帮我想想怎么办。”

他会说：“按我的流程，把这件事跑一遍；超出边界再来问我。”

六

如果按这把尺子，我自己也不是所有场景都很高。

写代码，我大概在 L4 到 L5 之间。能放手一部分，但还不敢长期多 agent 并行。

做 yuewei-digest，我可能已经摸到 L5-L6。因为日报、筛选、dense extraction、主编台，本质上已经不是单次问答，而是一套持续运行的信息工作流。

但生活里的很多事，我其实还在 L2-L3。

比如健康管理、理财、旅行、家庭事务，我很多时候还是问问 AI 建议，然后自己手动做。它没有真正接入我的流程，也没有替我跑闭环。

这说明 AI 水平不是一个总分。

它按场景分布。

你可能写代码是 L5，写邮件是 L3，理财是 L1，学习是 L4，内容创作是 L6。

所以我不建议你问“我是不是 AI 高手”。

这个问题太虚。

更好的问题是：

我最常重复的一件事，现在能不能往上升一级？

如果你现在只是问 AI，那就试着让它交付一个小结果。

如果你已经让它交付小结果，那就试着让它完成一个完整任务。

如果你已经能交完整任务，那就试着写清楚验收标准和边界。

如果你已经有多个 AI 任务在跑，那就开始设计权限、日志、归档和复盘。

不要一上来追 L8。

先把一件你每周都在做的事，从 L2 推到 L4，或者从 L4 推到 L5。

这比收藏 100 个 AI 工具更重要。

七

过去我们问一个人会不会用电脑，会问他会不会打字、会不会装软件、会不会做表格。

后来这些都变成基础能力。真正重要的是：他能不能用电脑完成自己的工作。

AI 也会这样。

今天大家还在讨论 prompt、模型、插件、工具清单。再过一两年，这些也会变成基础能力。

真正拉开差距的，会是一个人能不能把自己的工作、生活、信息和判断，改造成 AI 可以参与的系统。

所以我不太想再问“你会不会用 AI”。

我更想问：

你现在敢把哪一段真实责任交给 AI？

答案到哪里，你大概就在哪一级。