看完 Steve Yegge 那期访谈之后,我脑子里一直卡着一个问题:我们说一个人“会用 AI”,到底是什么意思?
很多人的理解还停在工具层面。
会用 ChatGPT,算会用 AI。
会写 prompt,算会用 AI。
会让 Claude Code 改代码,算会用 AI。
会让豆包写小红书文案、让 Gemini 总结 PDF、让 Midjourney 出图,也算会用 AI。
这些当然都算,但我越来越觉得,这些只能说明你“接触了 AI”,不能说明你真的把 AI 放进了自己的工作和生活。
真正的差别不在于你打开了哪个模型,而在于你敢把多少真实任务交给它。
Steve Yegge 那期访谈里讲了一个 AI 工程师 8 级,从完全不用 AI,到用 agent 编排器让 agent 跑 agent。我之前写过一篇程序员自评。
后来我意识到一个问题:AI 使用水平不该只给程序员分级。
普通人也需要一把尺子。
因为未来几年,真正被 AI 拉开差距的,可能不是“会不会写代码”的人,而是“会不会把自己的事情交给 AI 处理”的人。
所以我想重新写一个 8 级版本。不是照抄 Steve,而是借这个方向,重新看一个程序员和一个普通人,在 AI 面前到底经历了同一条怎样的心理台阶。
第一级,是不用。
这没什么好嘲笑的。有些人工作里暂时用不上,有些人担心隐私,有些公司不让用,有些人就是还没遇到非用不可的场景。
我身边就有不少这样的老程序员。因为我周围大多是日本工程师,这种情况还挺明显:他们写了很多年 Java、PHP、C#,业务系统维护得很稳,遇到问题第一反应还是查文档、看日志、问同事,而不是打开 AI。他们不是不会写代码,也不是能力差,很多人的基本功比年轻人扎实得多。只是 AI 还没有进入他们的默认动作。
真正的问题不是 L1,而是很多人会从 L1 直接跳到一句很笼统的判断:“AI 没什么用。”
这句话通常不是判断,是没走进去。
第二级,是把 AI 当搜索框。
程序员问它报错是什么意思,普通人让它翻译一段英文、总结一篇文章、改一封邮件。这个阶段很舒服,因为 AI 像一个更会说话的搜索引擎。
但它还没有改变你的做事方式。
它回答,你执行。
很多人会卡在这里很久,然后觉得自己已经“会用 AI”了。其实这只是会问问题,还不是会用 AI 做事。
第三级,AI 开始替你交付一个小东西。
程序员让它写一个脚本、改一个函数、补一段测试。普通人让它写一封完整邮件、做一份旅行计划、整理一份会议纪要。
这一步的变化很大。
因为你第一次从“问它”变成“交给它”。
不过这个阶段交出去的东西通常很小。错了也不太要命。你心里知道,最后还是自己兜底。
第四级,我觉得是很多人的第一个分水岭。
这一层不是“AI 能不能写”,而是“你会不会 review”。
程序员到了 L4,不再盯着 AI 每一行怎么写,而是看 diff、跑测试、看关键路径。普通人到了 L4,也不再逐句改它的文案,而是看它给的方案方向对不对、有没有漏掉重要条件、有没有编造事实。
这时 AI 会让人变快,也会让人变累。
因为它三分钟给你五页东西,你十分钟之内要判断这五页哪里能用、哪里危险、哪里要重写。
以前你慢慢写,判断是分散发生的。
现在 AI 一口气把半成品堆到你面前,判断被压缩到一起。
所以我现在不太相信“用了 AI 就轻松”这种话。低级用法可能轻松,高级一点反而更耗脑子。你不是不用判断了,你是被迫更快地判断。
第五级,才是真正的门槛:放手。
不是让 AI 写一段话,也不是让它改一个函数,而是把一个完整任务交出去。
对程序员来说,可能是“这个模块的 bug 你先查完,能修就修,最后给我 diff 和测试结果”。
对普通人来说,可能是“我下个月去东京 5 天,这是预算、偏好和同行人情况,你先做一版完整行程,把交通、酒店、每天安排和风险点都列出来”。
注意,这不是完全不管。
L5 不是懒。
L5 是你不再盯过程,而是开始设计边界和验收标准。
你得告诉 AI:目标是什么,不能碰什么,输出长什么样,什么时候必须回来问你,最后你怎么判断它做得对不对。
我自己做 yuewei-digest 的时候,真正有一次跨到 L5,是批量处理 158 篇长文。以前我会一篇篇看输出。后来发现不可能,只能让它整批跑,最后看成功率、失败模式和可修复原因。
那次我才意识到:放手不是不负责,而是把负责的粒度从“盯每一步”变成“看整个系统”。
这一步,普通人也会遇到。
你让 AI 帮你写一封邮件不难。你让 AI 帮你完整准备一次求职、一次旅行、一次装修、一次选题研究,就会立刻碰到同样的问题:资料够不够?边界清不清?它错了谁发现?最后谁拍板?
这才叫真正开始用 AI。
第六级,是同时让多个 AI 干活。
程序员会开几个 agent:一个改代码,一个写测试,一个查文档,一个做 review。
普通人也会有类似场景:一个 AI 盯行业新闻,一个 AI 整理会议,一个 AI 帮你做内容选题,一个 AI 维护旅行计划,一个 AI 管待办。
到了这一级,问题就不是 AI 能不能产出,而是你能不能接住产出。
这很反直觉。
很多人以为 AI 越强,人越闲。实际情况可能是 AI 越强,人越像一个小团队主管:到处都是结果,到处都等你确认,到处都有可能冲突。
Steve Yegge 讲过一个状态:agent 忙着干活,人反而无聊,因为总有一个 agent 在等你看结果。
这句话很有意思。它说的不是“人没事干”,而是人的工作变了。
你不再是亲自写每一段东西的人,你变成了分配任务、判断结果、处理异常的人。
第七级,会更危险一点。
因为 AI 不只是帮你生成内容,而是开始接入真实工具。
程序员这边,是自动提交、自动部署、跨仓库修改、访问数据库、跑命令。
普通人这边,是邮箱、日历、网盘、飞书、Notion、购物账户、报销系统、客户资料。
这时 AI 已经不是“助手”,而是半自动系统。
它发错一封邮件、删错一个文件、理解错一个客户、花错一笔钱,都会变成现实后果。
所以 L7 的关键词不是效率,而是权限。
低级 AI 使用靠 prompt。
高级 AI 使用靠边界。
你得知道什么能自动,什么必须确认;什么能读,什么不能写;什么能建议,什么绝对不能直接执行。
第八级,我愿意把它叫做“个人 AI 组织”。
程序员这边,就是 Steve 说的编排器:agent 跑 agent,任务会被拆分、派发、执行、检查、回滚、记录。
普通人这边,不一定长得那么技术。它可能更像一个个人操作系统:它知道你的长期目标、项目、资料、联系人、偏好和禁区。你给它一个目标,它能拆任务、找资料、调用工具、生成方案,把真正需要你判断的地方推回来。
这听起来有点远,但方向已经很清楚。
到这个阶段,关键问题不再是“哪个模型最强”,而是:
我的资料有没有沉淀?
我的流程有没有固定下来?
我的工具能不能被 AI 调用?
我的权限边界有没有写清楚?
我的历史判断能不能复用?
我换一个模型,这套工作流还能不能继续跑?
所以我现在越来越觉得,AI 时代真正稀缺的不是 prompt。
prompt 是一句话。
工作流是一套可以重复执行的做事方式。
L8 的人不会每天从零开始问:“帮我想想怎么办。”
他会说:“按我的流程,把这件事跑一遍;超出边界再来问我。”
如果按这把尺子,我自己也不是所有场景都很高。
写代码,我大概在 L4 到 L5 之间。能放手一部分,但还不敢长期多 agent 并行。
做 yuewei-digest,我可能已经摸到 L5-L6。因为日报、筛选、dense extraction、主编台,本质上已经不是单次问答,而是一套持续运行的信息工作流。
但生活里的很多事,我其实还在 L2-L3。
比如健康管理、理财、旅行、家庭事务,我很多时候还是问问 AI 建议,然后自己手动做。它没有真正接入我的流程,也没有替我跑闭环。
这说明 AI 水平不是一个总分。
它按场景分布。
你可能写代码是 L5,写邮件是 L3,理财是 L1,学习是 L4,内容创作是 L6。
所以我不建议你问“我是不是 AI 高手”。
这个问题太虚。
更好的问题是:
我最常重复的一件事,现在能不能往上升一级?
如果你现在只是问 AI,那就试着让它交付一个小结果。
如果你已经让它交付小结果,那就试着让它完成一个完整任务。
如果你已经能交完整任务,那就试着写清楚验收标准和边界。
如果你已经有多个 AI 任务在跑,那就开始设计权限、日志、归档和复盘。
不要一上来追 L8。
先把一件你每周都在做的事,从 L2 推到 L4,或者从 L4 推到 L5。
这比收藏 100 个 AI 工具更重要。
过去我们问一个人会不会用电脑,会问他会不会打字、会不会装软件、会不会做表格。
后来这些都变成基础能力。真正重要的是:他能不能用电脑完成自己的工作。
AI 也会这样。
今天大家还在讨论 prompt、模型、插件、工具清单。再过一两年,这些也会变成基础能力。
真正拉开差距的,会是一个人能不能把自己的工作、生活、信息和判断,改造成 AI 可以参与的系统。
所以我不太想再问“你会不会用 AI”。
我更想问:
你现在敢把哪一段真实责任交给 AI?
答案到哪里,你大概就在哪一级。