百亿美金AI大厂内部曝光:AI 让效率翻倍,却怕自己技能退化丢工作
2025年12月5日
今年8月,Anthropic对132名内部工程师做了调查、53次访谈,并分析了20万条Claude Code使用记录。
这份调查值得参考,下面是一些核心信息。
根据调查,一年前员工在28%的工作中使用Claude,生产力提升20%。现在这两个数字是59%和50%,增长了2到3倍。实际数据显示每位工程师每天合并的代码变更增加了67%,14%的人生产力提升超过100%。
提升主要体现在产出量的大幅增加,虽然每个任务的时间略有减少。有趣的是,部分人在某些任务上花费时间反而增加了,因为需要调试Claude的代码,或者Claude让他们能坚持完成以前会放弃的任务。
正在做以前不会做的工作
27%的Claude辅助工作是原本根本不会做的。工程师们用AI扩展项目、制作交互式仪表板、编写文档测试,以及做手动执行不划算的探索性工作。
一位研究员说他们会同时运行多个Claude实例探索不同方法:“拥有一百万匹马让你能测试一堆不同的想法,更有创造性。”
8.6%的Claude Code任务是修复“papercuts”小问题,比如重构糟糕代码或构建小工具。这些以前会被降低优先级的改进累积起来带来更大效率提升。
委托AI完成任务的策略正在形成
虽然频繁使用Claude,但超过半数表示只能“完全委托”0到20%的工作。他们与Claude主动迭代并验证输出,特别是在复杂或高风险任务中。
工程师们倾向委托容易验证的任务、定义清晰的子任务、代码质量不太关键的工作,以及重复无聊的任务。“我对做这个任务越兴奋,我就越不可能使用Claude。”44%的Claude辅助工作是他们本来不会享受做的。
许多人描述了信任进程,就像采用Google Maps:从不熟悉的路线,到大致知道的路线,到现在日常通勤也用。
人们始终保留高层思考和需要“品味”的设计决策,但这个边界随模型改进不断变化。
技能在拓展,也在退化
工程师们能完成以前超出专业范围的工作。后端工程师构建UI,研究人员创建可视化。“变得更加全栈,我可以胜任前端、数据库、API代码,以前我会害怕碰不擅长的东西。”原本几周的过程现在可以变成几小时的工作会议。
但同时一些人担心技能退化,失去手动解决问题的附带学习。“如果你自己去调试困难问题,会花时间阅读文档和代码,整个过程中你在构建系统运作的模型。现在这种情况少多了,因为Claude可以直接让你找到问题。”
一位高级工程师说:“我主要在知道答案应该是什么的情况下使用AI。我通过‘艰难方式’开发了这种能力。但如果我更初级,要继续培养能力而不盲目接受模型输出,需要很多刻意努力。”
这引发“监督悖论”:有效使用Claude需要监督,而监督需要的正是可能因过度使用AI而退化的编码技能。一位工程师说:“我更担心监督问题。技能退化主要会影响我安全使用AI的能力。”一些工程师为此刻意不用AI练习保持敏锐。
对编程本质的不同看法
也许软件工程正向更高抽象层次移动,就像从汇编语言到高级语言那样。现在可能是把英语作为编程语言。
一些人说这让他们能在更高层次思考“最终产品和用户”,而不仅是代码。一位工程师说:“做底层操作在情感上不特别重要,我宁愿关心代码让我能做什么。”
另一位指出抽象有代价:随着向高级语言转变,大多数工程师失去了对内存处理的深刻理解。
工程师们对是否怀念动手编程分歧明显。有人感到失落:“编程25年了,技能胜任感是我职业满足感的核心。”有人担心新工作不够有趣:“整天提示Claude不如自己实现有趣。”
有人接受权衡:“我怀念心流状态,但生产力高得多,我乐意放弃。”有人更关注结果:“我以为我喜欢写代码,实际上只是喜欢从写代码中得到的东西。”
最有趣的是一位工程师质疑前提:“‘生疏’的框架假设编程会回到Claude 3.5之前。我认为不会。”
社交动态的变化
Claude成了问题的第一站。“我现在问更多问题,但80到90%都问Claude。”这创造了过滤机制,Claude处理常规询问,同事处理超出AI能力的复杂问题。
约一半人报告协作模式没变,但其他人描述与同事互动减少。有人欣赏减少的社交摩擦,有人抵制变化或怀念旧方式:“我喜欢与人工作,现在不那么‘需要’他们了,很令人难过。”
传统指导动态受影响,因为“Claude可以为初级员工提供很多指导”。一位高级工程师说:“初级人员不像以前常来问我,有点难过,尽管他们确实更有效地得到答案,学得更快。”
职业发展的不确定性
许多工程师描述角色从编写代码转向管理AI,把自己看作“AI代理的管理者”。一个人估计工作已转变为“70%以上是代码审查者/修订者”。
长期来看职业不确定性普遍。许多人说很难说几年后职业会是什么样。有人表达短期乐观和长期不确定的冲突:“我对短期乐观,但长期看AI最终会做所有事情,让我和许多人无关紧要。”有人更直白:“感觉像每天来上班是为了让自己失业。”
也有人更乐观:“我为初级开发者担心,但他们可能最渴望新技术。我对这个职业轨迹总体很乐观。”
总体而言许多人承认深深的不确定性:“我对什么技能在未来有用的信心非常低。”一位团队负责人说:“没人知道会发生什么,重要的是真正适应。”
使用数据显示的趋势
Claude Code使用转向更困难和自主的任务。任务复杂度从平均3.2增加到3.8(1是“基本编辑”,5是“需要专家数周/数月工作”)。Claude现在在需要人类干预前平均连续进行21.2次工具调用,六个月前是9.8次,增长116%。
人类轮次从6.2减少到4.1,下降33%。
任务分布显著变化。实现新功能从14.3%增加到36.9%,代码设计规划从1.0%增加到9.9%。
不同团队以不同方式使用Claude。预训练团队用于构建新功能(54.6%),多数是运行额外实验。对齐与安全团队做最多前端开发(7.5%和7.4%),通常创建数据可视化。安全团队做代码理解(48.9%),分析安全影响。非技术员工做调试(51.5%)和数据科学(12.7%)。
展望未来
现在还是早期阶段,形势变化迅速,发现可能不能推广到其他组织。研究反映了不确定性:发现微妙,没有单一共识。但它提出了问题:我们如何深思熟虑地应对这些变化?
我们正在与工程师、研究员和领导层对话,探讨机会和挑战。包括团队协作、职业发展、AI增强工作的最佳实践。我们也将研究扩展到工程师之外,支持外部组织调整课程。预计2026年分享更具体计划。Anthropic是负责任职场转型的实验室,我们想实验如何深思熟虑地引导这种转型,从自己开始。
相关文章
AI具备反思能力吗?Anthropic最新研究发现Claude出现内省迹象
Anthropic通过神经活动注入实验测试Claude是否具备内省能力,发现AI具备某种自我监测功能,但80%情况下仍无法准确内省
2025/10/31用AI自动化工作任务方向在哪里?n8n最新分享中已说明一切
最近,n8n完成了 1.8 亿美元的 C 轮融资,估值 25 亿美元。n8n是全球最受欢迎的自动化工作流程开发平台之一,产品远远领先扣子、dify以及众多自动化流程编排平台。
2025/10/16调查4000多家非上市SaaS公司后,我发现初创公司对员工的要求变了
在过去八年里,我调查了超过4000家非上市SaaS公司,试图了解行业内的最新动态。我从未见过行业基准的变化速度如此之快。现在,让我们拨开炒作的迷雾,探寻当今行业的真实面貌。
2025/9/2010大不适合用AI大模型的场景
媒体一直在大力推广AI应用,除了那些显而易见的禁用场景之外,沃顿商学院莫利克教授总结了五种不建议使用AI的具体情况。
2025/9/8