别再问会不会用 AI:我把 AI 使用水平分成 8 级

AI 使用方法论 2026-05-26 · 悦微日报

看完 Steve Yegge 那期访谈之后,我脑子里一直卡着一个问题:我们说一个人“会用 AI”,到底是什么意思?

很多人的理解还停在工具层面。

会用 ChatGPT,算会用 AI。

会写 prompt,算会用 AI。

会让 Claude Code 改代码,算会用 AI。

会让豆包写小红书文案、让 Gemini 总结 PDF、让 Midjourney 出图,也算会用 AI。

这些当然都算,但我越来越觉得,这些只能说明你“接触了 AI”,不能说明你真的把 AI 放进了自己的工作和生活。

真正的差别不在于你打开了哪个模型,而在于你敢把多少真实任务交给它。

Steve Yegge 那期访谈里讲了一个 AI 工程师 8 级,从完全不用 AI,到用 agent 编排器让 agent 跑 agent。我之前写过一篇程序员自评。

后来我意识到一个问题:AI 使用水平不该只给程序员分级。

普通人也需要一把尺子。

因为未来几年,真正被 AI 拉开差距的,可能不是“会不会写代码”的人,而是“会不会把自己的事情交给 AI 处理”的人。

所以我想重新写一个 8 级版本。不是照抄 Steve,而是借这个方向,重新看一个程序员和一个普通人,在 AI 面前到底经历了同一条怎样的心理台阶。

第一级,是不用。

这没什么好嘲笑的。有些人工作里暂时用不上,有些人担心隐私,有些公司不让用,有些人就是还没遇到非用不可的场景。

我身边就有不少这样的老程序员。因为我周围大多是日本工程师,这种情况还挺明显:他们写了很多年 Java、PHP、C#,业务系统维护得很稳,遇到问题第一反应还是查文档、看日志、问同事,而不是打开 AI。他们不是不会写代码,也不是能力差,很多人的基本功比年轻人扎实得多。只是 AI 还没有进入他们的默认动作。

真正的问题不是 L1,而是很多人会从 L1 直接跳到一句很笼统的判断:“AI 没什么用。”

这句话通常不是判断,是没走进去。

第二级,是把 AI 当搜索框。

程序员问它报错是什么意思,普通人让它翻译一段英文、总结一篇文章、改一封邮件。这个阶段很舒服,因为 AI 像一个更会说话的搜索引擎。

但它还没有改变你的做事方式。

它回答,你执行。

很多人会卡在这里很久,然后觉得自己已经“会用 AI”了。其实这只是会问问题,还不是会用 AI 做事。

第三级,AI 开始替你交付一个小东西。

程序员让它写一个脚本、改一个函数、补一段测试。普通人让它写一封完整邮件、做一份旅行计划、整理一份会议纪要。

这一步的变化很大。

因为你第一次从“问它”变成“交给它”。

不过这个阶段交出去的东西通常很小。错了也不太要命。你心里知道,最后还是自己兜底。

第四级,我觉得是很多人的第一个分水岭。

这一层不是“AI 能不能写”,而是“你会不会 review”。

程序员到了 L4,不再盯着 AI 每一行怎么写,而是看 diff、跑测试、看关键路径。普通人到了 L4,也不再逐句改它的文案,而是看它给的方案方向对不对、有没有漏掉重要条件、有没有编造事实。

这时 AI 会让人变快,也会让人变累。

因为它三分钟给你五页东西,你十分钟之内要判断这五页哪里能用、哪里危险、哪里要重写。

以前你慢慢写,判断是分散发生的。

现在 AI 一口气把半成品堆到你面前,判断被压缩到一起。

所以我现在不太相信“用了 AI 就轻松”这种话。低级用法可能轻松,高级一点反而更耗脑子。你不是不用判断了,你是被迫更快地判断。

第五级,才是真正的门槛:放手。

不是让 AI 写一段话,也不是让它改一个函数,而是把一个完整任务交出去。

对程序员来说,可能是“这个模块的 bug 你先查完,能修就修,最后给我 diff 和测试结果”。

对普通人来说,可能是“我下个月去东京 5 天,这是预算、偏好和同行人情况,你先做一版完整行程,把交通、酒店、每天安排和风险点都列出来”。

注意,这不是完全不管。

L5 不是懒。

L5 是你不再盯过程,而是开始设计边界和验收标准。

你得告诉 AI:目标是什么,不能碰什么,输出长什么样,什么时候必须回来问你,最后你怎么判断它做得对不对。

我自己做 yuewei-digest 的时候,真正有一次跨到 L5,是批量处理 158 篇长文。以前我会一篇篇看输出。后来发现不可能,只能让它整批跑,最后看成功率、失败模式和可修复原因。

那次我才意识到:放手不是不负责,而是把负责的粒度从“盯每一步”变成“看整个系统”。

这一步,普通人也会遇到。

你让 AI 帮你写一封邮件不难。你让 AI 帮你完整准备一次求职、一次旅行、一次装修、一次选题研究,就会立刻碰到同样的问题:资料够不够?边界清不清?它错了谁发现?最后谁拍板?

这才叫真正开始用 AI。

第六级,是同时让多个 AI 干活。

程序员会开几个 agent:一个改代码,一个写测试,一个查文档,一个做 review。

普通人也会有类似场景:一个 AI 盯行业新闻,一个 AI 整理会议,一个 AI 帮你做内容选题,一个 AI 维护旅行计划,一个 AI 管待办。

到了这一级,问题就不是 AI 能不能产出,而是你能不能接住产出。

这很反直觉。

很多人以为 AI 越强,人越闲。实际情况可能是 AI 越强,人越像一个小团队主管:到处都是结果,到处都等你确认,到处都有可能冲突。

Steve Yegge 讲过一个状态:agent 忙着干活,人反而无聊,因为总有一个 agent 在等你看结果。

这句话很有意思。它说的不是“人没事干”,而是人的工作变了。

你不再是亲自写每一段东西的人,你变成了分配任务、判断结果、处理异常的人。

第七级,会更危险一点。

因为 AI 不只是帮你生成内容,而是开始接入真实工具。

程序员这边,是自动提交、自动部署、跨仓库修改、访问数据库、跑命令。

普通人这边,是邮箱、日历、网盘、飞书、Notion、购物账户、报销系统、客户资料。

这时 AI 已经不是“助手”,而是半自动系统。

它发错一封邮件、删错一个文件、理解错一个客户、花错一笔钱,都会变成现实后果。

所以 L7 的关键词不是效率,而是权限。

低级 AI 使用靠 prompt。

高级 AI 使用靠边界。

你得知道什么能自动,什么必须确认;什么能读,什么不能写;什么能建议,什么绝对不能直接执行。

第八级,我愿意把它叫做“个人 AI 组织”。

程序员这边,就是 Steve 说的编排器:agent 跑 agent,任务会被拆分、派发、执行、检查、回滚、记录。

普通人这边,不一定长得那么技术。它可能更像一个个人操作系统:它知道你的长期目标、项目、资料、联系人、偏好和禁区。你给它一个目标,它能拆任务、找资料、调用工具、生成方案,把真正需要你判断的地方推回来。

这听起来有点远,但方向已经很清楚。

到这个阶段,关键问题不再是“哪个模型最强”,而是:

我的资料有没有沉淀?

我的流程有没有固定下来?

我的工具能不能被 AI 调用?

我的权限边界有没有写清楚?

我的历史判断能不能复用?

我换一个模型,这套工作流还能不能继续跑?

所以我现在越来越觉得,AI 时代真正稀缺的不是 prompt。

prompt 是一句话。

工作流是一套可以重复执行的做事方式。

L8 的人不会每天从零开始问:“帮我想想怎么办。”

他会说:“按我的流程,把这件事跑一遍;超出边界再来问我。”

如果按这把尺子,我自己也不是所有场景都很高。

写代码,我大概在 L4 到 L5 之间。能放手一部分,但还不敢长期多 agent 并行。

做 yuewei-digest,我可能已经摸到 L5-L6。因为日报、筛选、dense extraction、主编台,本质上已经不是单次问答,而是一套持续运行的信息工作流。

但生活里的很多事,我其实还在 L2-L3。

比如健康管理、理财、旅行、家庭事务,我很多时候还是问问 AI 建议,然后自己手动做。它没有真正接入我的流程,也没有替我跑闭环。

这说明 AI 水平不是一个总分。

它按场景分布。

你可能写代码是 L5,写邮件是 L3,理财是 L1,学习是 L4,内容创作是 L6。

所以我不建议你问“我是不是 AI 高手”。

这个问题太虚。

更好的问题是:

我最常重复的一件事,现在能不能往上升一级?

如果你现在只是问 AI,那就试着让它交付一个小结果。

如果你已经让它交付小结果,那就试着让它完成一个完整任务。

如果你已经能交完整任务,那就试着写清楚验收标准和边界。

如果你已经有多个 AI 任务在跑,那就开始设计权限、日志、归档和复盘。

不要一上来追 L8。

先把一件你每周都在做的事,从 L2 推到 L4,或者从 L4 推到 L5。

这比收藏 100 个 AI 工具更重要。

过去我们问一个人会不会用电脑,会问他会不会打字、会不会装软件、会不会做表格。

后来这些都变成基础能力。真正重要的是:他能不能用电脑完成自己的工作。

AI 也会这样。

今天大家还在讨论 prompt、模型、插件、工具清单。再过一两年,这些也会变成基础能力。

真正拉开差距的,会是一个人能不能把自己的工作、生活、信息和判断,改造成 AI 可以参与的系统。

所以我不太想再问“你会不会用 AI”。

我更想问:

你现在敢把哪一段真实责任交给 AI?

答案到哪里,你大概就在哪一级。