AI 让我重新思考“外行领导内行”这个事
引子:Anthropic出了一份调查报告
今天我读了 Anthropic 在 12 月 5 号发布的一篇关于内部员工(主要是程序员们)如何使用 AI(尤其是写代码)的调查报告(点击文末阅读原文查看)。这里简单列出他们的结论:
- 生产力显著上升,但“提升来自哪里”更像是“产出量变大”,而不是每类任务耗时大幅下降:员工自报目前约** 60% 工作会用 Claude,平均带来约 ****+50% 生产力提升**(相比一年前是 2–3 倍增长)
- “能完全交给 AI 的比例”并不高:更多是强监督的人机协作:多数人虽然频繁使用,但自认能“完全委派”的通常只有** **0–20%;在高风险/高标准场景里仍需要密集验证与反复迭代。
- 工程师在变得更“全栈”、更敢做事,但也出现“深技能练得更少”的张力:AI 让人能跨到不熟的领域快速产出(例如后端做 UI、研究员做可视化),学习与迭代加速;与此同时,一部分人担心“手搓”的练习减少会导致技能萎缩。
- AI 的“自主性”在上升:更复杂的任务、更长的自动操作链、更少的人类回合:在 Claude Code 数据里,任务复杂度均值从** 3.2→3.8;连续工具调用从 *9.8→21.2(+116%);人类回合从* **6.2→4.1(-33%),显示团队在把更长的工作流交给 AI 跑。
读完我最大的感受不是“哇,效率提升”,而是猛然觉得:未来的人机协作,天然就是一种“外行领导内行”。Anthropic 的报告给了我一个新角度:当内行变成 AI,它真的能做很多细活,而且速度快得离谱。于是工作形态就会变成:
- 人来决定:做什么、先做哪个、做到什么程度算好
- AI 来输出:代码/文案/方案/表格/图/脚本
- 人再把关:哪里是幻觉、哪里不靠谱、哪里需要补证据
- 人做集成:把“能用的部分”拼成“可交付的整体”
这其实就是导演在片场的工作方式:导演不亲自打灯、不亲自扛摄影机,但他要保证镜头语言成立、节奏对、剧情通,最后剪出来能上映。
现实:我们大多数人,过去和现在都是“干活的人”
外行领导内行?说到这个,职场的人都不困了。
职场中的人们,普遍对“外行领导内行”有所怨念,因为不懂的人指挥懂的人,天生带着不合理。多数普通人在职场里,长期扮演的其实是“执行者”。碰到外行领导内行的场面,我们熟悉的应对方式无非三种:
- 抱怨:他懂个啥?不理,按我自己的方式来。
- 迎合:收到!领导我马上改(然后心里骂)
- 离开:老子不干了,去找个欣赏我的人,换个地方继续当专家。
有少部分人更狠一点:卧薪尝胆,熬成领导者。但即便熬上去了,只要脱离一线,就会一定程度上变成外行,而且还是一个“不会领导内行的外行”。
你一定见过这种糟糕外行领导的经典场景吧:
第一种:魔法句子型领导”。
“这个很简单吧?”“你们就把它丢给 AI 不就出来了么?”
结果是:问题被轻视,风险被忽略,最后靠加班填坑。
第二种:“PPT 驱动型领导”:
他最擅长把事情画成三层架构和五个里程碑,各种理论框架、思维模型用得贼熟,但不问数据、不问边界、不问验收标准。
结果是:项目看起来一直在推进,每次进度排名都名列前茅,直到该要投入使用了,谁也说不清“到底要交付什么”。
第三种:“跳过定义直接要答案型领导”:
你还没弄清需求,他就问你“能不能明天给我个结论”。
结果是:团队被迫用猜的方式交付,用运气的方式上线。
这些都不是技术问题,而是导演能力缺失:不会定目标、不会拆问题、不会做取舍、不会验收。
为什么:AI 让“外行领导内行”成为全民必修课
以前你可能可以一辈子当“干活的人”:只要把手艺练熟、把分配的任务完成,就能稳定生存。甚至还用“工匠精神”来逃避改变现状,实际上并不喜欢自己的工作,或者没有主动花很多时间在具体一件事的打磨上。
Anthropic 的报告,捅破了层窗户纸:AI 的出现,把很多岗位都推向一种新结构:
- 执行层的门槛在下降:不会写代码也能产出脚本,不会设计也能出海报,不会做分析也能生成报告。
- 定义与验收的门槛在上升:你要更清楚自己要什么、更知道什么是错的、更懂得如何把结果拼成整体。
换句话说:未来竞争力更像是“总编”,而不是“打字员”。
你不会领导 AI 这个内行,就会被内行“带着跑”,最后变成一种新型加班:加班审 AI 的结果、加班改 AI 的屎山代码、加班救火 AI 种下的 bug。
外行领导内行,不论内行是 AI 还是人,都应该做到 1+1 > 2 才有意义。而要实现 1+1>2,你得学会一种姿势:**我不装懂,但我能让懂的人(和 AI)把正确的事做对。具体来说,得锻炼自己三种能力:导演能力、判断力、集成能力。
- 导演能力:把愿景变成清晰可执行、可验证的目标。直到哪些 AI 各自擅长什么,让他们各司其职。
- 判断能力:培养自己的“品味”,品味决定判断的价值取向。不断对交付结果做对比,在品味和目标的要求下,直到交付差在哪好在哪。
- 集成能力:为结果负责的能力,只有你心中有最强烈的“想要”那个结果的愿望,弥合不同内行交付之间的裂缝和鸿沟,通过各种手段,交出整体上最终完成的东西。每一个内行都做不到这一点,只有那个懂得领导内行的领导可能。
GPT的建议:导演能力、判断能力、集成能力
如何在日常刻意训练这三项能力,更好适应未来人机协作常态?下面是我跟 GPT5.2 讨论的一些建议,要不要接受,你需要有判断能力,哈哈
A. 导演能力:把“想要”翻译成“可执行”
你不需要懂所有细节,但你必须能把目标说清楚。
练习 1:三句话验收标准
每天挑一个任务(哪怕是“写一段介绍”),用三句话写清楚:
1)交付物是什么?(一页文档/一个脚本/一个页面)
2)好是什么样?(必须包含哪些点/不能出现哪些错误)
3)怎么验收?(是否可跑通/是否能复现/是否有数据来源)
你会发现:很多扯皮不是技术不行,是“没写清楚到底要啥”。
练习 2:强制让 AI 给 3 个方案
不要问 AI “给我最佳方案”,而是问:
给我 A/B/C 三个方案,各自代价、风险、适用场景,并给出你推荐的选择理由。
导演不是写剧本的人,导演是做取舍的人。
B. 判断能力:不盲信,也不一棍子打死
AI 的强,是“能产出”;人类的强,是“知道哪里不对劲”。
练习 1:五分钟红队
拿到 AI 的结果后,反过来让 AI 攻击自己:
你现在是审稿人/测试工程师/风控官,请找出这个方案最可能错的 10 个点。
这能逼你建立“错误模型”,而不是只看“看起来很顺”。
练习 2:证据分级
给所有关键结论贴一个标签:
- 直接证据(原始数据/可复算)
- 间接证据(引用二手资料)
- 推测(听起来合理但未验证)
你会越来越像一个职业编辑:知道哪些句子必须有来源,哪些可以留作假设。
C. 集成能力:把“很多片段”变成“一个系统”
AI 很擅长给你十段不错的东西,但它不一定能替你把它们拼成一辆能上路的车。
练习 1:一页“系统地图”
不管做什么项目,用一页纸画清楚:输入是什么、处理步骤是什么、输出给谁、失败会在哪里发生。
你不需要画得漂亮,只要能回答一句话:
如果它坏了,最可能坏在哪儿?
练习 2:接口意识
每次协作(不管对人还是对 AI),强迫自己写“输入/输出格式”:
- 输入:有哪些字段、范围、例子
- 输出:结构是什么、长度/格式/限制是什么
- 禁区:哪些内容不能出现、哪些操作不能做
集成能力的本质就是:接口清晰,世界安静。
结尾:外行不是问题,不会领导才是问题
“外行领导内行”过去像一种宿命:只能忍、只能走、只能熬。但 AI 的发展,我们黄袍加身,被逼成了必须领导内行 AI 的外行领导,所以得学习如何领导越来越内行的 AI。
但幸好, AI 把这变成了一个可训练的能力。我们记住别假装内行,需要做到:
- 把目标说得可验收
- 把风险盯得够具体
- 把片段拼成可交付
当你能做到这些,你就不是“外行领导内行”,你是“导演带领专业团队”:让每个内行都发挥到极致,最后作品能上映、系统能跑、结果能落地。
这才是 1+1>2 的真正含义:不是你变内行,而是你让内行的力量,变成你的生产力。