无标签

发布日期: 2025-12-18

AI 让我重新思考“外行领导内行”这个事

引子：Anthropic出了一份调查报告

今天我读了 Anthropic 在 12 月 5 号发布的一篇关于内部员工（主要是程序员们）如何使用 AI（尤其是写代码）的调查报告（点击文末阅读原文查看）。这里简单列出他们的结论：

生产力显著上升，但“提升来自哪里”更像是“产出量变大”，而不是每类任务耗时大幅下降：员工自报目前约** 60% 工作会用 Claude，平均带来约 ****+50% 生产力提升**（相比一年前是 2–3 倍增长）
“能完全交给 AI 的比例”并不高：更多是强监督的人机协作：多数人虽然频繁使用，但自认能“完全委派”的通常只有** **0–20%；在高风险/高标准场景里仍需要密集验证与反复迭代。
工程师在变得更“全栈”、更敢做事，但也出现“深技能练得更少”的张力：AI 让人能跨到不熟的领域快速产出（例如后端做 UI、研究员做可视化），学习与迭代加速；与此同时，一部分人担心“手搓”的练习减少会导致技能萎缩。
AI 的“自主性”在上升：更复杂的任务、更长的自动操作链、更少的人类回合：在 Claude Code 数据里，任务复杂度均值从** 3.2→3.8；连续工具调用从 *9.8→21.2（+116%）；人类回合从* **6.2→4.1（-33%），显示团队在把更长的工作流交给 AI 跑。

读完我最大的感受不是“哇，效率提升”，而是猛然觉得：未来的人机协作，天然就是一种“外行领导内行”。Anthropic 的报告给了我一个新角度：当内行变成 AI，它真的能做很多细活，而且速度快得离谱。于是工作形态就会变成：

人来决定：做什么、先做哪个、做到什么程度算好
AI 来输出：代码/文案/方案/表格/图/脚本
人再把关：哪里是幻觉、哪里不靠谱、哪里需要补证据
人做集成：把“能用的部分”拼成“可交付的整体”

这其实就是导演在片场的工作方式：导演不亲自打灯、不亲自扛摄影机，但他要保证镜头语言成立、节奏对、剧情通，最后剪出来能上映。

现实：我们大多数人，过去和现在都是“干活的人”

外行领导内行？说到这个，职场的人都不困了。

职场中的人们，普遍对“外行领导内行”有所怨念，因为不懂的人指挥懂的人，天生带着不合理。多数普通人在职场里，长期扮演的其实是“执行者”。碰到外行领导内行的场面，我们熟悉的应对方式无非三种：

抱怨：他懂个啥？不理，按我自己的方式来。
迎合：收到！领导我马上改（然后心里骂）
离开：老子不干了，去找个欣赏我的人，换个地方继续当专家。

有少部分人更狠一点：卧薪尝胆，熬成领导者。但即便熬上去了，只要脱离一线，就会一定程度上变成外行，而且还是一个“不会领导内行的外行”。

你一定见过这种糟糕外行领导的经典场景吧：

第一种：魔法句子型领导”。
“这个很简单吧？”“你们就把它丢给 AI 不就出来了么？”
结果是：问题被轻视，风险被忽略，最后靠加班填坑。

第二种：“PPT 驱动型领导”：
他最擅长把事情画成三层架构和五个里程碑，各种理论框架、思维模型用得贼熟，但不问数据、不问边界、不问验收标准。
结果是：项目看起来一直在推进，每次进度排名都名列前茅，直到该要投入使用了，谁也说不清“到底要交付什么”。

第三种：“跳过定义直接要答案型领导”：
你还没弄清需求，他就问你“能不能明天给我个结论”。
结果是：团队被迫用猜的方式交付，用运气的方式上线。

这些都不是技术问题，而是导演能力缺失：不会定目标、不会拆问题、不会做取舍、不会验收。

为什么：AI 让“外行领导内行”成为全民必修课

以前你可能可以一辈子当“干活的人”：只要把手艺练熟、把分配的任务完成，就能稳定生存。甚至还用“工匠精神”来逃避改变现状，实际上并不喜欢自己的工作，或者没有主动花很多时间在具体一件事的打磨上。

Anthropic 的报告，捅破了层窗户纸：AI 的出现，把很多岗位都推向一种新结构：

执行层的门槛在下降：不会写代码也能产出脚本，不会设计也能出海报，不会做分析也能生成报告。
定义与验收的门槛在上升：你要更清楚自己要什么、更知道什么是错的、更懂得如何把结果拼成整体。

换句话说：未来竞争力更像是“总编”，而不是“打字员”。
你不会领导 AI 这个内行，就会被内行“带着跑”，最后变成一种新型加班：加班审 AI 的结果、加班改 AI 的屎山代码、加班救火 AI 种下的 bug。

外行领导内行，不论内行是 AI 还是人，都应该做到 1+1 > 2 才有意义。而要实现 1+1>2，你得学会一种姿势：**我不装懂，但我能让懂的人（和 AI）把正确的事做对。具体来说，得锻炼自己三种能力：导演能力、判断力、集成能力。

导演能力：把愿景变成清晰可执行、可验证的目标。直到哪些 AI 各自擅长什么，让他们各司其职。
判断能力：培养自己的“品味”，品味决定判断的价值取向。不断对交付结果做对比，在品味和目标的要求下，直到交付差在哪好在哪。
集成能力：为结果负责的能力，只有你心中有最强烈的“想要”那个结果的愿望，弥合不同内行交付之间的裂缝和鸿沟，通过各种手段，交出整体上最终完成的东西。每一个内行都做不到这一点，只有那个懂得领导内行的领导可能。

GPT的建议：导演能力、判断能力、集成能力

如何在日常刻意训练这三项能力，更好适应未来人机协作常态？下面是我跟 GPT5.2 讨论的一些建议，要不要接受，你需要有判断能力，哈哈

A. 导演能力：把“想要”翻译成“可执行”

你不需要懂所有细节，但你必须能把目标说清楚。

练习 1：三句话验收标准
每天挑一个任务（哪怕是“写一段介绍”），用三句话写清楚：
1）交付物是什么？（一页文档/一个脚本/一个页面）
2）好是什么样？（必须包含哪些点/不能出现哪些错误）
3）怎么验收？（是否可跑通/是否能复现/是否有数据来源）

你会发现：很多扯皮不是技术不行，是“没写清楚到底要啥”。

练习 2：强制让 AI 给 3 个方案
不要问 AI “给我最佳方案”，而是问：

给我 A/B/C 三个方案，各自代价、风险、适用场景，并给出你推荐的选择理由。

导演不是写剧本的人，导演是做取舍的人。

B. 判断能力：不盲信，也不一棍子打死

AI 的强，是“能产出”；人类的强，是“知道哪里不对劲”。

练习 1：五分钟红队
拿到 AI 的结果后，反过来让 AI 攻击自己：

你现在是审稿人/测试工程师/风控官，请找出这个方案最可能错的 10 个点。

这能逼你建立“错误模型”，而不是只看“看起来很顺”。

练习 2：证据分级
给所有关键结论贴一个标签：

直接证据（原始数据/可复算）
间接证据（引用二手资料）
推测（听起来合理但未验证）

你会越来越像一个职业编辑：知道哪些句子必须有来源，哪些可以留作假设。

C. 集成能力：把“很多片段”变成“一个系统”

AI 很擅长给你十段不错的东西，但它不一定能替你把它们拼成一辆能上路的车。

练习 1：一页“系统地图”
不管做什么项目，用一页纸画清楚：输入是什么、处理步骤是什么、输出给谁、失败会在哪里发生。
你不需要画得漂亮，只要能回答一句话：

如果它坏了，最可能坏在哪儿？

练习 2：接口意识
每次协作（不管对人还是对 AI），强迫自己写“输入/输出格式”：

输入：有哪些字段、范围、例子
输出：结构是什么、长度/格式/限制是什么
禁区：哪些内容不能出现、哪些操作不能做

集成能力的本质就是：接口清晰，世界安静。

结尾：外行不是问题，不会领导才是问题

“外行领导内行”过去像一种宿命：只能忍、只能走、只能熬。但 AI 的发展，我们黄袍加身，被逼成了必须领导内行 AI 的外行领导，所以得学习如何领导越来越内行的 AI。

但幸好， AI 把这变成了一个可训练的能力。我们记住别假装内行，需要做到：

把目标说得可验收
把风险盯得够具体
把片段拼成可交付

当你能做到这些，你就不是“外行领导内行”，你是“导演带领专业团队”：让每个内行都发挥到极致，最后作品能上映、系统能跑、结果能落地。

这才是 1+1>2 的真正含义：不是你变内行，而是你让内行的力量，变成你的生产力。

刑无刀

https://xingwudao.me/2025/12/18/2025-12-18-ai-%E8%AE%A9%E6%88%91%E9%87%8D%E6%96%B0%E6%80%9D%E8%80%83%E5%A4%96%E8%A1%8C%E9%A2%86%E5%AF%BC%E5%86%85%E8%A1%8C%E8%BF%99%E4%B8%AA%E4%BA%8B/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源刑无刀 !

无标签

感觉短视频越刷越“降智”？这就叫“脑腐”

2025-12-21 刑无刀

快跨年了，祝大家“好柿连续发生”

2025-12-17 刑无刀

AI 让我重新思考“外行领导内行”这个事

AI 让我重新思考“外行领导内行”这个事

引子：Anthropic出了一份调查报告

现实：我们大多数人，过去和现在都是“干活的人”

为什么：AI 让“外行领导内行”成为全民必修课

GPT的建议：导演能力、判断能力、集成能力

A. 导演能力：把“想要”翻译成“可执行”

B. 判断能力：不盲信，也不一棍子打死

C. 集成能力：把“很多片段”变成“一个系统”

结尾：外行不是问题，不会领导才是问题

你的赏识是我前进的动力