# 591. Matt Pocock:开发者如何用 AI 放大十倍产出,模型狂热时代的软件基本功
开场与节目定位
一凯:欢迎收听跨国串门计划,这是一档专注于让中文听众无障碍欣赏全球优质外语播客的节目。 [00:00:07]
一凯:通过先进的AI声纹克隆技术,我们不仅将内容翻译成中文,还完美保留了原主持人和嘉宾的独特声音,为您呈现全球顶尖的AI财经、健康与科技领域精品内容。 [00:00:23]
一凯:我是主播一凯,一位热衷于AI领域的产品经理很荣幸能为您搭建这座跨越语言障碍的桥梁接下来让我为您简单介绍本期我们克隆的这档节目 [00:00:35]
一凯:并分享几句非常精彩的原话本期我们克隆的是David Ondrej在2026年6月18日更新的一期AI与软件工程访谈 [00:00:46]
一凯:标题是Matt Pocock's Agentic Engineering Workflow (just copy him)主持人David Ondrej长期关注AI工具与智能体工作流这期嘉宾Matt Pocock是知名开发者教育者也是TypeScript和AI编程实践领域很有影响力的创作者节目里有几句原话很值得先听一听AI做Tactical Programming就是比你强因为它做得更便宜所以你的技能就是AI能做到什么程度的上限 [00:01:16]
一凯:大家都在看那个又大又亮的新东西但其实你应该关注那些已经有效了30 40年的东西答案是让你的代码库更容易修改这些话背后是一整套关于AI编程智能体协作和软件基本功的深入讨论那我们就一起进入这期完整对话大家都盯着模型 [00:01:39]
模型不是全部,运行框架更重要
Matt Pocock:我觉得他们更该关心运行框架 [00:01:41]
David Ondrej:你怎么把这个运行框架用到最好比如给它合适的prompt给它合适的技能让它能用起来再把模型运行的环境改好就像我前面说Fable的时候提到的 [00:01:52]
Matt Pocock:模型当然有用但我觉得运行框架同样重要而且相比模型你对运行框架的控制要大得多大家关注错了东西他们都在看那个又大又亮的新东西但其实你应该关注那些已经有效了30 40年的东西他们真的有用经常有人问我 [00:02:10]
David Ondrej:怎么才能更好的优化Token答案是让你的代码库更容易修改John Astahel在他的书 [00:02:27]
David Ondrej:A Philosopher's Software Design里讲过Tactical Programming和Strategic Programming的区别 [00:02:32]
Matt Pocock:我觉得用AI的时候这个区分特别有用Tactical Programming关注的是一线的日常工作也就是实际写代码处理语法遇到bug就排查真正把代码写出来把commit做出来Strategic Programming是赢下整场战争而不是赢下一场战斗他关注更长期的思考像是站在最上面的将军在看全局代码库应该长什么样我可以用什么策略来提升我们的速度对我来说Strategic Programming一直是最有意思最让我兴奋的部分哪怕我还是初级开发者的时候 [00:03:09]
David Ondrej:我也在想我们怎么提高速度怎么用更少资源做更多事而AI基本上已经吃掉了Tactical Programming它没了对吧都没了AI做Tactical Programming就是比你强因为它做得更便宜所以你必须很擅长Strategic Programming [00:03:28]
David Ondrej:才能把你现在能调用的这支无线Tactical Programmers [00:03:33]
David Ondrej:大军用到最好所以这是不是意味着你要知道怎么编排这些智能体 [00:03:40]
战术编程与战略编程
David Ondrej:再加上一些软件设计代码库架构的基础如果拆成大家可以学习的具体技能你会怎么拆这个问题很好Strategic Programming在AI时代 [00:03:51]
Matt Pocock:其实没有变 [00:03:52]
David Ondrej:对吧 [00:03:53]
Matt Pocock:我们做的事只是从把工作委派给初级或中级程序员变成把工作委派给AI所以做好委派需要的东西还是一样的你要先把困难的部分设计好你要确保任务范围滑得非常清楚你要思考代码库里各个模块之间的接口你要思考测试策略和好的测试本质上你要设计一个容易在里面工作的代码库并且保留刚好足够的文档这样AI才知道该去哪里改才能有效的完成修改我觉得到现在大家都同意AI的进展非常快甚至还在加速所以我觉得很多人也忽略了提升自己能力这一部分你当然可以付订阅费可以用最新的工具但说到底任何人都能这么做可还是会有人用这些工具把业务做得大很多交付比过去更多更好的软件也会有人只是稍微试一下 [00:04:47]
Matt Pocock:可能用免费版或者用更便宜的模型 [00:04:50]
David Ondrej:那你会怎么建议大家开始自学让自己变得更强经常有人问我这个问题因为我卖开发者课程对吧所以我的建议你可以打个折来听但我个人觉得我自己的技能就是AI的倍增器 [00:05:05]
Matt Pocock:如果我能掌控一个代码库能思考东西 [00:05:07]
David Ondrej:应该怎么构建然后直接告诉AI怎么做那AI能用的上下文就丰富得多我到处都能看到这一点Sactum还有我在会议上聊到的人也一直这么跟我说I会让高级开发者强十倍现在雇那么多初级开发者某种程度上已经不太说得通了因为初级开发者从AI那里得到的是一点小提升但高级开发者得到的是非常夸张的巨大提升他们能用AI做多的多的事所以你的技能就是AI能做到什么程度的上限如果你的技能水平低AI就没法越过这个上限所以用好AI本质上就是在你的领域里变强也就是在AI要替你做的那件事上变强一个更好的老师可以用AI把人教得比普通人更好 [00:05:55]
Matt Pocock:所以我觉得技能现在比以前更重要因为你手里有了这个倍增器你能委派出去的事情也更多了你最近发布了一个新的teach skill [00:06:04]
David Ondrej:对吧能不能多讲讲我对教学了解挺多 [00:06:07]
Matt Pocock:其实我当了十年老师刚大学毕业的时候我教的是唱歌和发声后来我成了开发者现在我教开发者过去四年我一直在做这件事所以我很懂教学我就想如果把我知道的一些教学原则比如最近发展区比如知识技能与智慧之间的区别编码进一个技能里 [00:06:28]
David Ondrej:会怎么样本质上就是用它为任何主题及时生成一门课程这就是我做的事而且效果非常好 [00:06:37]
Matt Pocock:我自己其实一直在用它学东西我用它自学魔方现在靠这个技能我已经可以凭记忆还原魔方了我也用它学各种各样的东西昨天我还在试如果问TeachSkill怎样成为一名高级开发者会是什么样它基本上就展开了一大段学习旅程去查很多可信资源整理出一套很完整的课程大纲最后生成的东西非常漂亮当然我们试一下我觉得大家肯定很想看到好David你想学什么我们就来个系统设计之类的吧我有个想法 [00:07:11]
teach skill:把教学原则写进技能
Matt Pocock:很多人会来找我但我教的课程其实主要面向工程师也就是已经知道 [00:07:16]
David Ondrej:怎么当工程师的人我很好奇这个技能能不能教你工程基础你懂我意思吗就是如果你是一个vibe coder它能不能帮你补上那些缺口所以我现在假装自己是一个vibe coder [00:07:30]
Matt Pocock:我会调用teach skill我现在在一个空目录里然后让它自己跑我要口述一段我们看看效果我是一个Vibe Coder我想补齐自己的知识缺口这样才能交付更好的软件我只知道一些非常非常基础的CLI命令也勉强能读一点代码用一下终端除此之外就没了 [00:07:48]
David Ondrej:你觉得我接下来应该学什么才能继续提升我的技能我把这段放进去非常简单的prompt就是普通英文任何人都能这么问对这只是一个非常非常简单的请求 [00:08:03]
Matt Pocock:而且我其实没有在讲自己想学的具体主题我讲的是我的使命我想从这件事里得到什么 [00:08:11]
David Ondrej:我今天为什么来找这位老师你可以把它理解成一种协作我在和一位老师对话而这个智能体就是我的老师他应该知道怎样教我才最好你正好提到这个而且你最近刚做了这个技能真的很巧因为我昨天就在想这个问题尤其是Fable出来之后我就在想我要怎么提升自己才能把它用到最好因为我知道我还没有达到自己能达到的位置有很多人比我强技能也比我熟所以你现在有这个技能时间点真的特别好好他现在基本上在说我已经检查了工作区这是一个空白起点Teach skill需要在一个工作区里运行因为它会把很多信息保存在那个工作区里对于一个能读代码会用基础中端的vibe code来说杠杆最高的缺口 [00:09:04]
David Ondrej:几乎从来都不是更多语法真正关键的是代码周围那些东西它们能让你在交付时不害怕这完全正确所以包括Git读错误调试软件到底怎么交付测试没错 [00:09:20]
Matt Pocock:Git是我们开始的地方但首先是使命他说我不想猜先问三个简单问题这个技能做的第一件事就是和你想做的事对齐我理解的教育学不是把信息塞进你的脑子里而是帮你在世界里重新定位把你放到世界里的一个新位置这听起来有点抽象甚至有点精神性但其实不是本质上你需要学习这些技能是为了在世界里做成某件事那就是你的使命所以他问你在构建什么对现在的你来说交付更好的软件是什么意思你正在做的具体项目是什么那我们想象我来回答假设我是一个想学会更好编程的声乐教练其实我当年就是这样的人我是发声老师 [00:10:14]
Matt Pocock:也是唱歌老师我想做一个排课应用帮我安排学生的课程记录学生的笔记让我能更好地教他们也做一些能帮助他们练习的东西这就是我想做的那类应用所以它大概会是一个全站应用有数据库有某种认证机制但这对我现在的能力来说远远超出了顺便说一下我现在用WhisperFlow做听写它很好用这里也会变成一种游戏就是看你能多快把脑子里的token输出出来再输入回你的脑子里没错我们稍微岔开讲一下听写不用听写的人速度真的会差很多对我来说它很快因为我说话还算流畅所以我能很有效地把脑子里的想法转成语言但这也是一项技能说到底它就是一项技能大家可以学会更好更快地把想法说出来如果你是开发者 [00:11:09]
Matt Pocock:口述这项技能其实强得有点过分真的非常强我发现在开发圈里能沟通能把话说清楚是一件强到离谱的事后来事实也证明了这一点现在这里生成了一个missionMD他基本上在问这个人是谁他想构建什么 [00:11:28]
David Ondrej:为什么重要成功是什么样子成功就是能把这个应用发出去不把它弄坏让它上线并且相信它对真实学生真的可用这会成为这个技能接下来所有动作的方向 [00:11:42]
技能、知识与智慧
David Ondrej:你可以看到他这里在做一些搜索找一些可信资源他说我来帮你设置资源学习记录参考速查表以及你的第一节课所以他会开始生成一些本地运行的材料这里的思路是我把技能分成两类一类是Stateless Skill不需要本地系统里有任何状态也不需要记住之前做过什么另一类是Stateful Skill也就是依赖本地信息运行的技能Teach Skill就是一个Stateful Skill因为你想想跟一个好老师一起学习时老师会记得你之前做过什么老师知道你大概在哪个位置接下来该往哪里走也知道你的目标是什么这些都会记住所以他会把一堆状态保存在本地让他能记住所有东西他首先创建了一个参考资料 [00:12:30]
Matt Pocock:现在我们有了一个参考速查表接下来他会创建第一节课这些内容会生成为HTML这样我们就能在浏览器里打开看一个信息更丰富的页面因为在终端里学东西真的太痛苦了所以你是在用Claude Code搭配Fable [00:12:47]
David Ondrej:对吧我用的是Claude Code配Opus 4.8中等推理力度我没用Fable至少现在还没有我还没决定要不要开始用Fable真的吗是啊 [00:13:00]
Matt Pocock:我不太相信那种刚发布就铺天盖地的声音它是昨天发布的吗噪音实在太多了大家都在说自己一次就做成了这个一次就搞定了那个它看起来确实像是一次明显跃升也确实好像稍微更强一点但你还得权衡Token成本可用性还有延迟我基本上更愿意在新模型刚发布实现不试等一个月左右 [00:13:25]
David Ondrej:看看实际情况怎么样我当时对OPPO 4.5也是这么做的那是上一次让我对一个模型有很强新鲜感的时候结果也挺好等一阵子看看情况并不会让你损失太多好所以这是他创建出来的文件这是第一颗Git你项目的撤销按钮你可以看到他用的是更丰富的形式实际在HTML里看比在终端里舒服很多也丰富很多这个文件保存在本地所以你以后随时可以回来参考它还会给你一些可以在终端里实际操作的内容给你真正的练习让你去做比如创建一个文件夹进入文件夹开始用Git创建一个文件查看状态暂存它保存这个快照而且因为它是在我的系统上运行它知道我的环境是什么样的它可能已经检查过我有没有安装Git之类的东西所以这就非常合适个性化教育 [00:14:20]
David Ondrej:对吧没错完全个性化这里问哪个命令会保存你已经暂存的修改快照 [00:14:28]
David Ondrej:David 你觉得你能帮我答一下吗Git 用来保存已暂存修改的快照Git commitGit commit所以他又在用教育里很成熟的技巧来提升storage strength [00:14:42]
David Ondrej:测验这东西挺尴尬的 [00:14:44]
Matt Pocock:我其实有点讨厌测验但测验对增强一个东西被记住的强度效果就是不讲道理的好哪个命令会显示当前发生了什么变化Git statusGit status对糟了我按错了Git add会对一个修改做什么暂存修改暂存修改一次commit最适合想象成一个什么保存点保存点你把一个文件弄坏了但还没有commit要恢复它 [00:15:12]
David Ondrej:你会运行什么Git restore [00:15:14]
Matt Pocock:对我觉得是Git restore是吧没错就是这个很好然后如果你愿意他还会让你去读一首资料比如ProGet这本书接着他会邀请你向老师追问后续问题并创建下一节课这个想法是我把知识看成一张图它像一大片森林你在里面探索而他在做的事就是在这张图里为你创建一条线性路径 [00:15:42]
Matt Pocock:他基本上会说你已经学了这个现在我知道你学过了它在你的学习记录里我们可以看到右上角保留了一串学习记录包括你的目标和起点所以它记录了你的目标决定先从Git开始最近发展区域当前估计值这些你大概能明白所以它很棒我真的特别喜欢对任何刚开始学习的人尤其是刚开始学开发的人我都会推荐这个因为我是开发者 [00:16:06]
David Ondrej:我知道开发者教育是怎么回事所以我把这些东西放进了这个TeachGill里我一直觉得编程 [00:16:12]
Matt Pocock:其实挺容易学的我自己学的时候没有遇到太多困难我觉得这是一种很好的学习方式这个现在是在GitHub上公开了吗大家去哪儿能找到 [00:16:21]
现场演示:补齐工程基础
Matt Pocock:GitHub上搜Matt PocockSkills进去之后直接运行这个CLI命令MPX Skills Latest at Matt Pocock Skills你可以选择Teach Skill它会保存到你的本地设置里不管你用的是Claude Code还是Codex它都能用之后你就可以在一个新的工作区里直接调用Teach你现在有一个很有名很受欢迎的skills仓库至少也是最有名的之一那一个好的智能体技能和一个差的智能体技能区别在哪里这是个很深的问题真的很深因为这取决于你想要什么你可以把技能分成两类一类是流程性技能也就是你打算自己运行的技能另一类更像能力性技能也就是你希望模型自己去调用的东西比如说一个好的能力性技能可能是你的编程规范假设你的智能体在自己干活做到一半 [00:17:16]
Matt Pocock:需要检查你喜欢react代码 [00:17:18]
David Ondrej:怎么写它要写一些react代码于是拉近一个能力性技能比如叫优秀react编程规范它读完之后就明白了 [00:17:26]
Matt Pocock:好我不应该用use effect我应该用别的方式流程性技能更像是某种步骤说明我更喜欢这样写我的技能它是你自己调用的用来让模型按某种方式表现我特别喜欢我的grimy scale这是我最受欢迎的技能之一它本质上会把模型变成一个带对抗性的面试官这个技能在productivity下面叫grill me它非常短你可以看到真正内容可能只有四句话我觉得这个技能也许五句话但它效果好的不讲道理因为它会把智能体变成一个对抗性的面试官不断问你问题采访你并提出一些你可能没考虑过的想法直到你们达成共同理解我一开始主要把它用在编程上当做plan mode的替代品也就是说在你真正去实现代码之前你先说好 这是我的想法你来采访我 [00:18:21]
Matt Pocock:我们先达成共同理解在真正动手之前尽可能把奇怪的地方意外的东西都挖出来它就是好用的不讲道理这是一个流程性技能不是能力性技能我通常更喜欢把我的技能做成流程性技能我喜欢自己掌控我喜欢说好 我们先用grill me然后再说我们来写一份产品需求文档比如我们用to PLD然后把那份PLD拆成一个个独立的issue这样我们就可以逐个推进这只是我个人喜欢的做法但也有别的技能比如Opera的Superpowers它可能是现在最受欢迎的skills仓库它走的是相反路线更偏向让模型来掌控但我一直更喜欢让我自己来掌控对我个人来说我知道我的技能是什么也知道我的能力边界我不想把自己的思考外包给模型我觉得这其实是其中一个点 [00:19:15]
Matt Pocock:我最近一直在琢磨一个清单的想法就像一张能力清单知识清单基本上如果你拿一个平均水平的使用AI的100倍开发者和一个普通的一倍开发者来对比 [00:19:27]
David Ondrej:不管怎么说吧他们之间的差异清单会是什么你可以说有些差异来自原始智力之类的东西但大多数差异可能是可以教的大多数是一些技能一些知识或者类似的东西所以我对这个想法很着迷 [00:19:42]
Matt Pocock:我觉得其中一个能力就是知道什么时候该让AI来问你也就是这种Grimmy风格的技能因为我个人发现最大的区别不是对AI说一次性把这个应用做出来而是我先描述我对这个应用的愿景然后说列出会影响这个项目的十个最关键决定 [00:20:03]
Matt Pocock:包括软件设计决策架构决策产品决策然后一直采访我直到你对它有98%的理解所以这有点像我会放进那张清单里的一个东西 [00:20:15]
David Ondrej:你觉得那张清单上还会有哪些东西我能不能先挑战一下这个想法本身我可以换个角度来回答这个问题吗 [00:20:23]
Matt Pocock:技能其实很难写尤其是因为你写的每一个技能都会把这里的description泄露进上下文窗口里当然你可以禁用这个我这里有一些技能我想是在engineering zoom out里设置了Disable Model Invocation True也就是说这个技能只能由用户调用这也意味着它的description不会泄露进上下文每一个能力型技能假设我们真有那张清单假设里面有100个不同技能 [00:20:49]
David Ondrej:那你就会把100段description泄露进上下文窗口好那我可能换个说法我说的不是给AI用的清单我说的清单就是这个人本身比如说如果你非要描述一个人虽然我知道这可能很难也可能有点还原论这个人真的极其高产比如OpenAI或Anthropic里某些顶尖的人一个人顶得上几百个普通开发者那如果把他们和一个普通开发者对比他们的能力技能知识清单会是什么明白你这个问题 [00:21:21]
从技能仓库到本地工作区
Matt Pocock:其实有点往我想说的方向走了我更倾向于把这些描述大部分都对AI隐藏起来把这些知识留在人身上也就是留在开发者身上所以我希望技能是这样被使用的你本质上还是驾驶员你来我方向盘我确实觉得现在对高级开发者来说是一个特别令人兴奋的时代你可以把自己的工作分享出来也可以把它流程化拆成可服用的快就像在代码库里一个函数重复出现了三次你得把它抽出来变成一个共享函数减少重复现在我们也能对自己的流程这么做也就是对我们构建软件的方式这么做比如我已经做过100次这种计划了 [00:22:02]
David Ondrej:我知道怎么做出好计划那我就可以把它变成一个技能发给团队然后每个人都能用同一种方式做计划也能把改进再贡献回同一个技能里让团队里的所有人都变得更强 [00:22:16]
Matt Pocock:所以你其实是在抬高工程师能力的下限这是一个特别让人兴奋的时代不过我会说技能这个词我们可能要稍微把术语弄乱一点我认为要擅长任何事情你需要三样东西知识、技能与智慧你需要知识也就是对这个东西的基本理解你脑子里要知道它是什么你需要技能也就是你得做过很多次做到有点像肌肉记忆然后你还需要智慧你要知道什么时候该做这件事 [00:22:50]
David Ondrej:也要知道它在真实世界里怎么嵌进去而智慧几乎不可能在没有亲自做过的情况下获得尤其是没有在你真正需要做这件事的具体语境里做过所以如果你想像anthropic的某个人那样 [00:23:06]
Matt Pocock:当然你可以获得知识也可以获得技能 [00:23:09]
David Ondrej:但你要怎么获得智慧呢你大概得真的去anthropic才能获得那种智慧才能真正理解这件事该怎么做 [00:23:18]
Matt Pocock:不过我觉得把前两者也就是知识和技能打包成某种可附用的东西这是我们这个奇怪时代里非常有意思的结果目前我们聊了技能 [00:23:28]
David Ondrej:那你的agentic engineering配置是什么样的你用哪些工具哪些模型多少个智能体我的配置基本上是这样我用Claude Code做规划也会在本地做一些实现我用的是OPPA 4.8 medium effort这差不多是我最后稳定下来的配置效果还可以我现在大部分开发工作还有很多其他工作都是AFK做的 [00:23:51]
Matt Pocock:也就是我不在键盘前我做这件事的方式是用我自己做的一个工具叫SandcastleSandcastle本质上就是一种在沙箱里运行智能体的方式如果你不在沙箱里运行智能体它就可能做一些很奇怪的事比如它可能随机删掉你的后目录或者把你的环境变量泄露到一些不好的网站上之类用Sandcastle你基本上可以接入Docker或Podman这类东西然后在某个沙箱里运行智能体比如运行Claude Code这非常酷也非常有效这意味着你可以一次并行跑很多智能体可以在你自己的机器上跑或者你也可以用Vercel杀向之类的东西拉起一个远程智能体然后把Commit拉回你的本地工作区我一直在这么做而且我实际上还把它和GitHub Actions结合起来了比如我们可以在这里看到在Matt Pocock-Sancasso的Actions标签页里这个是一个智能体review action [00:24:46]
Matt Pocock:是不久前跑过的它会剪出分支action跑在一个PR上它会运行review智能体而这个智能体其实就是我本地的一个prompt我们可以看到智能体做的所有事情它在检查各种东西比如类型检查运行clean然后它回复说好的我看起来都没问题所以我现在主要就是这么做事用Sandcastle在GitHub Action上跑智能体然后基本上告诉他们去做事情这非常不讲道理的有效因为你想并行多少就能并行多少你不用担心本地机器的资源限制而且拉起一个智能体让它去做点事真的非常非常快那从模型角度看这些是5.5 extra high吗还是另一些Claude Code的实力你更喜欢哪种我觉得这些还是Claude Codeopus 4.8 medium大概是这样老实说 [00:25:36]
David Ondrej:我觉得我没有怎么换过配置我大多数时候 [00:25:40]
Matt Pocock:其实不太担心模型我大概有一个比较有争议的观点所有人都痴迷于模型所有人都痴迷于一级方程式赛车的引擎但实际上引擎只是整个系统的一部分你还有整个底盘 [00:25:55]
David Ondrej:还有它怎么穿过空气大家都痴迷于模型 [00:25:59]
Matt Pocock:但我觉得他们应该更关心运行框架你能做什么才能把运行框架的能力发挥到最大比如给它正确的prompt给它正确的技能去使用改善模型运行的环境改善代码库以及所有这些东西所以就像我前面说fable的时候提到的模型有用但我认为运行框架承担的工作量同样大而且相比模型你对运行框架有更多控制权确实不过我可能想稍微挑战你一下 [00:26:30]
David Ondrej:因为我不明白为什么不能两边都做很明显我同意你需要对的技能也需要对的设置这些都重要但如果你换上一个更好的引擎所有这些不就立刻变得更强了吗 [00:26:43]
模型、配置与工作流
David Ondrej:确实会 [00:26:44]
Matt Pocock:但我觉得你得把它们看成各占一半不要把模型看成90%把运行框架的优化只看成10%现在大家太关注模型了人们对另一边没有那么感兴趣我们先退一步说机器学习里有一个很有名的观点叫苦涩的教训你知道苦涩的教训吗苦涩的教训说的是不管你在机器学习研究里做什么算力尤其是原始算力最后每次都会赢因为算力增长的太快了你基本上可以相信底层能力会变得更好而且它会超过你在上面做的任何优化这里也有一种想法可能我正在掉进苦涩的教训的反面也就是说我不该去优化我的设置优化我的运行框架而应该等模型变好等引擎变好这样我的车自然就更快我不知道但我还是觉得优化运行框架 [00:27:38]
Matt Pocock:本身能带来很多收益重点应该是创建好的代码库让智能体在里面能发挥的好而不是他还没开始干活就先把他限制住我觉得大概是这样 [00:27:53]
Matt Pocock:我同意你不应该干等那种大家只是坐着等通用人工智能什么都不做的想法确实很蠢这个我完全同意你我可能是在中间位置我每天都在主动改进自己的设置想办法更快的使用这些智能体比如弄清楚这里我该不该用TNMAX这个要不要放到VPS上这里要不要用TELSCAL我会主动改进模型以外的所有东西但同时也会尽量用最好的模型因为从根本上说就像你刚才说的你可能会掉进那个问题里为了方便讨论假设现在真的是各占一半那如果模型真的变强很多呢比如我们假设下一代OPUS 6Fable 6GPT 6或者7随便哪个你不觉得这些模型能力越强就越不需要我们指挥也越不需要手把手带着走吗还是你不这么看我不是评论家每次遇到这种问题 [00:28:48]
Matt Pocock:我都会这么说我是在用现在手里有的东西尽量把事情做到最好我没有那种洞察力能判断这些东西以后到底会不会变得更好我其实不太想预测未来我觉得如果我尽量让自己的工作区和运行框架不绑定某个智能体如果我把好的软件基本功用到我正在做的事情里如果我做的是一直以来都有效的东西那它大概率以后也会继续有效你懂我的意思吧所以如果我围绕某个模型过度优化如果我太关注模型我就会忽视基本功这就是我的观点所以基本上你关注的是过去十年二十年三十年里一直成立的东西是什么也就是那些优秀软件最核心的原则它们很可能在下一个模型出现之后依然站得住而不是像有些人那样从模型出发说这个模型可能需要更短的prompt [00:29:43]
Matt Pocock:这个模型在某个部分很差那我来补这个部分你是在搭一个真正扎实的基础而不是先从模型开始没错大家关注错了东西他们盯着那个又大又亮的新东西但其实你只要关注那些已经有效了30年40年的东西就行而且它真的有效如果你的代码库更容易修改效果就会不一样人们经常问我 [00:30:07]
David Ondrej:怎么优化token花费怎么优化token花费答案是让你的代码库更容易改因为这样你就可以用一个没那么聪明的模型如果你的代码库架构更好你就能用更便宜的模型完成同样的工作因为你的护栏更好代码更容易探索模型不需要花那么多token一直撞墙如果你从第一天起就在拖模型后腿那你就需要一个很聪明的模型才能把它的能力炸出来 [00:30:34]
Matt Pocock:所以我觉得从模型出发去思考是错误的做法所以我基本会说和你完全相反的就是那种典型的vibe coder每周都在换工具 [00:30:46]
David Ondrej:对吧replit有了新更新就去用replit agent然后又换到lovable又换这个换那个一直在换但从来不学任何编程原则也不学任何软件工程的东西什么都不学你的方法本质上差别在于方法不是说你不相信AI很明显现在你也在努力站到AI最前沿也在教大家怎么用AI更关键的是方法上的区别你是在说各位去学基础学代码是怎么工作的学好的软件应该是什么样子不管以后OpenAI领先Antropic领先还是Gemini领先这些东西都会有价值另一种完全相反的方法很遗憾 [00:31:27]
Matt Pocock:我觉得大多数AI新手都是这样就是追最新趋势只要有新更新或者新工具出来就立刻把所有东西都换掉你当然可以这么做而且这很刺激但这样其实不会真正提升你的技能我非常相信真正决定AI能做到什么程度的上限是你的技能你应该把重点放在自己身上在这个新世界里提升自己而不是想着 [00:31:50]
David Ondrej:我怎么把我的思考外包出去我怎么外包更多东西你应该把更多东西拉回到自己的掌控范围里只把战术性的东西交出去保持战略性的思维继续思考接下来几个月几周要做什么思考你的代码接下来要走向哪里路线图是什么不要只是想着把这些都交出去很多人迷恋一个想法好像你可以把所有事情都交给AI但你做不到真的做不到而且我也看不到 [00:32:18]
Matt Pocock:当然我再说一次我不是评论家我只是看我们现在手里有什么在现实世界里是我在推动这些事情我需要做产品决策我需要做产品决策我知道我要往哪里走 [00:32:33]
Matt Pocock:我觉得作为开发者我应该掌握控制权而我需要具备相应的技能才能做到这一点我同意我想分享一个关于Fable的小观察是昨天发生的有点吓人而且肯定不符合安全实践当时我在设置一个新的智能体大概是给Twitter用的基本上Twitter API出了问题开发者控制台有些按钮加载不出来我换了一个浏览器试还是不行我关掉所有扩展 [00:33:02]
把战术性交付交给 AI
Matt Pocock:还是不行所以我认真花了几分钟想调试它但失败了我的意思是这不是我当时最主要要完成的事所以我也没有尽全力去排查但我把它交给了由Fable驱动的Cursor它用了Cursor里面内置的浏览器当然我得登录那个控制台但除此之外它就开始自己点击它创建了API Key然后复制下来再次说明我不建议在生产应用里这么做这对我来说只是一个很简单的东西然后他在测试时发现那些API Key属于控制台里的另一个APP实际上没有用到我充值的额度所以他又用Cursor里面的内置浏览器把这个APP移了过去对于我来说我当时真的有种感觉我在这里到底还干什么很明显我描述了我们在构建什么 [00:33:54]
David Ondrej:为什么要构建还有一开始做了一些类似我自己版本的Groovy但后来我感觉好吧我只是登陆了控制台又充了几美元除此之外基本都是AI在做对吧所以我感觉在这个项目里我的价值比用以前的模型是低很多你怎么看如果你想想AI的输出也就是他最后在做的事他需要一个判断标准AI到最后怎么知道自己做的好不好对吧这里的理论是你可以完全从项目里消失吗不是你仍然是需要的 [00:34:26]
Matt Pocock:我们这里做的只是给了AI一组工具 [00:34:30]
Matt Pocock:给了他一个有边界的任务然后他在执行这个任务我们给了他一个目标说去做这一串事情我不觉得这有什么特别神奇这是现在智能体能做的事你给他工具他就去做 [00:34:42]
David Ondrej:但是要判断这是不是正确的事要在最后做安全测试这些还是需要你来做对吧David你仍然是需要的你需要判断他到底有没有做好 [00:34:54]
Matt Pocock:所以我们确实可以外包更多事情但我不觉得这就是一个理由让大家开始出现什么AI精神错乱之类的想法这只是AI借助电脑使用能力可以完成的一件合理的事我也看到很多人说他们可能本来是在找优化点或者在做某个功能我又拿Fable举例是因为它刚出来正是大家在聊的东西所以我脑子里最先想到它很多人反馈说他们发现了一些更深层的bug之前完全没注意到而其他模型完全漏掉了这一点上我想稍微挑战你一下我觉得这说明AI能做更多事了我不是说人要完全退出环路但如果AI在重做前端时发现很多后端API端点里有问题比如一个重大的安全问题那我会认为这就是AI参与的更深了到那个时候就不是五五开了 [00:35:48]
Matt Pocock:所以你的意思是引擎越好你只要拥有这个引擎就越能给业务带来价值而且这些效果是涌现出来的你不知道把引擎能力提高之后最后会得到什么对 他仍然会知道愿景他仍然会知道你在这里做什么比如这是给我付费社区学生用的教育代码库或者这是只给我团队用的东西大概五个人会用这个东西的目的是什么他仍然会知道核心想法知道这个由你发起的项目是什么但在具体行动上在实际会发生什么这件事上我的观点是随着模型越来越强越来越多事情会由AI来做不只是这样AI会发现哪些事需要做就像刚才那个例子它发现了很深的bug而用户当时根本不是在调试那些问题当然但我觉得 [00:36:43]
Matt Pocock:我们会以为模型是达到这个结果的唯一方式其实你也可以在代码库里跑一个定时任务比如每天跑一次做一次安全审查每天检查代码库里的一个新部分你可以用一个相对简单的模型来做这件事而且大概率能得到一些不错的结果 [00:37:02]
David Ondrej:你说应用里有一些很深的bug或者很深层的安全问题这个模型能发现其他模型发现不了 [00:37:08]
Matt Pocock:这听起来当然很有吸引力但如果你看对了地方给了合适的prompt或者说用了合适的运行框架你可能也能用更便宜的模型挖出这些bug所以我不觉得一定是那个模型本身有什么特别之处才让它能做这些事我觉得这还是五五开如果你有一个专门去找这些问题的运行框架你就能找到它们我们现在的实践其实落后了却指望模型来补这个缺口你当然可以直接跑OPUS让它去做这些事OPUS 4.5出来的时候大家就在聊这个哇OPUS找到了这么多安全问题我的反应就是当然它找到了但你也可以用一个运行框架让它一遍又一遍的去做这件事我明白我明白你基本上是在对抗这波炒作你是在试图把一些常识一些智慧放回到这里面你是在说各位模型确实在变强没错 [00:38:02]
Matt Pocock:但与此同时我们不要忽略那些显而易见的优化也不要忘了那些一直都成立的事情也许如果你有一个更好的运行框架上一代模型也能做到又或者你本来不需要在API token上花2000美元可能只要200美元诸如此类所以这一点上我完全同意你你是在努力做一个理性的声音最后我再补一句Fable看了你的代码发现了一个安全问题你从这件事里到底学到了什么你当然学到了Fable很强这没错但你也学到了你的代码里有安全问题 [00:38:36]
David Ondrej:那你未来大概就应该有个东西持续运行检查更多安全问题 [00:38:41]
Matt Pocock:我们需要把循环内置到我们的系统里循环我必须这么说也许这个话题我们也可以聊如果你对此有看法的话你需要构建这些系统让他们持续检查你的东西你需要我到底想说什么来着你需要弄清楚 [00:38:58]
David Ondrej:它为什么会发生为什么它居然会发展到这一步就像如果总有人偷你的自行车那也许你该买把锁对 完全是这样 [00:39:07]
Matt Pocock:也许我们需要设计那种会随着时间自我改进的系统这件事我们作为软件工程师已经做了很久我们写测试套件是为了测试自己的代码我们做人类审查是为了确保东西看起来符合要求 [00:39:21]
AFK 智能体、循环与队列
Matt Pocock:我们重构是为了以后能更好的修改代码当然某个模型发现我们需要多做一点这种事那我们就多做一点但我们不需要用那个很花哨的模型才能得到这些洞察这就是我会放进清单的一件事它真正区分了两类人一类人会借助AI跑得特别快做出更好更多的软件另一类人不会大多数人在那种情况下只会说Fable很好把bug修掉然后他就修了bug但有些人我不知道该不该叫十倍开发者感觉更像是十倍AI builder因为现在每个人都越来越像builder不管你原来是设计师背景还是开发者背景这种人会去看底层问题bug [00:40:11]
David Ondrej:到底是怎么发生的为什么这个bug存在这么久我都没有发现然后他会试着修补底层问题可能是加一个新技能可能是一个新系统可能是更好的预发不流程或者别的东西 [00:40:24]
Matt Pocock:我觉得这会是我放进清单的一项也就是你作为人应该具备的能力或者说你想最大化用好AI就应该具备的东西我完全同意好你刚才提到了循环这件事在推特上特别火也许现在还在火但大概一周前特别火如果我没记错好像是Peter Steinberger先开始的基本上大家都在me-eigentic loops我觉得这里面有一半是研究实验室在卖更多token意思就是你们应该跑循环给我们付更多没完没了的token别再prompt你的智能体了去找出它能永远跑下去的循环让它一直跑另一半可能确实有用 [00:41:07]
David Ondrej:你怎么看 [00:41:08]
Matt Pocock:我们这里本质上是在说两种工作的区别一种是人在环路中的工作另一种是AFK工作人在环路中的工作就是人和智能体一起在那里互相对话一起把事情想清楚这对做规划很有用对一些更复杂的实现也很有用对边界还没划清的工作也很有用也就是你需要在本地和智能体一起把事情弄明白的那类工作然后就是AFKAFK是Away from Keyboard也就是离开键盘你把任务丢给智能体它自己去做我觉得我发现AFK的那一刻才是真正开始进入AI编程的时刻 [00:41:52]
Matt Pocock:也是我真正大幅提高产出的时刻因为这样一来我就不用一直待在循环里不用处理所有权限请求也不用处理智能体需要问我的各种事情只要我能把自己从这个等式里拿掉我就把自己并行化了突然之间就有两个我三个我四个我五个我可以去产出多的多的代码然后我再去review认为循环是唯一做法这个想法很疯狂这里的历史其实可以追溯到Jeffrey Huntley在哪来着HuntleyRalph可以追溯到Ralph你记得Ralph吗我好像是一月份在讲Ralph最早那篇文章是去年7月14日发的本质上它就是一个循环这个想法是你有一个while循环意思是把这个prompt传给Claude Code然后最终它会完成本质上它就是一遍又一遍的运行Claude Code [00:42:46]
Matt Pocock:这就是我之前讲了一阵子的rough loop后来我意识到我其实不需要把它当成循环来跑我真正需要的只是一个afk智能体 [00:42:57]
Matt Pocock:接下一个具体任务然后把这个任务做完我大多数时候会把这些东西看成对列是对列不是循环对列其实就是我需要完成的任务积压我现在就在看sandcastle的issues这些是关于Sancastle的bug report功能请求之类的东西我需要先给这个条目定范围比如说这个我这里已经做了一点分整它算是已经被探索过了这个问题简单吗可行吗这一步是AFK做的也就是说这个条目从队列里被拿出来探索了一遍又放回了队列接下来我可能需要真正去实现它看起来这个还不错我会给它加上agent implements这个标签然后在我前面提到的GitHub Actions Sancastle设置里实现它这其实不是一个循环它更像是一个队列最终会被处理完等PR被合并之后 [00:43:50]
Matt Pocock:这个任务就会从队列里移走开发本质上就是这样你有一队需要完成的任务项目经理往队列里加更多东西你把队列里的任务完成我们一直都是这么做的而且会有多个节点从队列里取任务 [00:44:05]
Matt Pocock:也就是多个开发者所以说有一个单一循环可以自动去完成所有任务这和开发团队通常的工作方式并不太匹配当这些东西都像这样放在GitHub Actions里面时任何开发者都可以加这些标签触发某个动作然后让工作跑起来所以我觉得循环这个想法有用但它不是完整图景我觉得把它看成一个队列你从里面取任务来做会更好不过大多数时候这种说法其实有点没什么意义人们说你需要一个循环来prompt你的智能体其实我们真正说的只是AFK智能体 [00:44:41]
David Ondrej:你刚才说的时候不知道为什么我脑子里浮现的是一个中世纪国王管理王国的画面 [00:44:48]
David Ondrej:身边有一些大臣之类的人基本假设是这个国王最懂情况掌握最多上下文不是那种只是碰巧继承了帝国的国王如果你把一个大臣派到很远的地区然后从来不听他的汇报也不给他命令那他就是在自己循环运行这可能出问题也可能没问题取决于那个地区的问题有多复杂那个大臣有多聪明等等但说到底作为那个中世纪王国里的国王你想要的是对列这种方式你希望有人来找你 [00:45:20]
Matt Pocock:说我们有个问题比如马上要被入侵了或者这个地区出现了饥荒你手里有这样一个问题对列但你仍然是负责人对应到这里就是一个人类带着一堆智能体以对AI你仍然要做优先级判断比如我们有50个bug报告只有三个是关键问题那就先修这三个或者说我们有这些资源有一个品牌合作这家公司想跟我们合作那就先查一下他们的声誉这样理解对吗对这里你仍然可以加很多自动化比如我给SanCasso配了某种摇测系统或者像Sentry这样的可观测性工具我可以从线上应用拿到一个bug报告把它创建成issue然后立刻给这个issue打上标签比如探索这个问题也许智能体在探索之后可以返回一些结构化数据 [00:46:11]
David Ondrej:告诉我们这个问题能不能马上修还是需要人在环路中然后它去实现去review最后也许它再打一个小标签说这个能不能自动合并 [00:46:20]
review、产品判断与代码库可修改性
David Ondrej:还是最终需要提醒用户来处理我看这些系统时会觉得你需要人在环路中的检查点 [00:46:29]
David Ondrej:而且你要尽可能把这些检查点不断往右推越靠近最终步骤或者最终输出越好所以本质上你看到的就不只是bug报告你会看到bug报告看到它对代码库的探索看到修复方案还会看到一个问题我们能不能review这个对作为人类你拿到的是这些而不是只看到一个bug报告这就丰富得多也意味着你只差一次点击而不是还差一整轮调试那问题就变成了在这种情况下因为它不是一个循环对吧它只在bug出现的时候运行它没有理由无线运行不然就是无线给open AI或entropic付钱但我的问题是随着AI变得更强你刚才也说要把自己不断往右推最后一步就是推到生产环境那什么时候会跨过一个门槛让这类事情可以自动批准 [00:47:24]
David Ondrej:比如一个很小的UI改动用户请求一个新的配色方案之类的一开始也许这种可以自动批准然后范围可能会越来越大这会是什么样子你明白我的意思吗你是说怎么去掉人在环路中的检查点 [00:47:41]
David Ondrej:对基本上就是你在哪里决定一件事已经够简单简单到你甚至不用看比如你有的所有智能体还是一样你搭好了运行框架他们有你的技能你用的是好模型然后所有智能体都说这只是个小bug只是一个UI元素没对齐用户没有恶意也不是想攻击这个应用 [00:48:04]
Matt Pocock:那我们就直接把它合并到生产环境这种范围大概会扩大也就是可以直接合并到生产环境的事情会越来越多 [00:48:12]
David Ondrej:你会怎么思考这个问题 [00:48:14]
Matt Pocock:我会说review能给你带来什么 [00:48:17]
David Ondrej:对吧 [00:48:18]
Matt Pocock:当然它给你一个把关能力可以挡住危险的东西防止他们进入生产环境比如防止安全问题防止坏事发生比如防止Claude Code的源代码泄露到全世界你可以防住这些坏事但你也会获得对自己系统的洞察能看到系统内部的管线 [00:48:39]
David Ondrej:你在看它怎么工作同时判断它做得好不好第二点你不想失去 [00:48:44]
Matt Pocock:因为我们又回到了运行框架这个话题你希望随着时间改进自己的运行框架也希望对它有一定的可观测性你可以去掉一些人在环路中的检查点比如你可以说PR只是内部重构只是挪了一些代码实际上没有改变任何行为然后你可以让一个AI来判断说这个其实不太需要review但问题是谁来review那个做判断的AI [00:49:09]
David Ondrej:对吧你以后怎么给他反馈智能体说某些PR可以不用review但你很可能还是需要抽查其中一些确认他们真的可以不用review然后你再随着时间改进它 [00:49:21]
Matt Pocock:所以我们需要这样想我们review的不只是代码我们也在review生成代码的那个系统这很重要也很有用但我同意目标是在可能的地方去掉人在环路中的检查点所以也许更好的方式不是这样假设这个应用平均一天里AI自动修了20个问题而且因为都特别小就直接推到生产环境了到了一天结束的时候你不用把这些全都review一遍那样很无聊也很慢 [00:49:49]
David Ondrej:也许你会拿到一个定制的teach skill HTML文件它会告诉你这些修掉的bug里有哪些常见模式也就是说你不用去翻所有GitHub评论PR之类的东西 [00:50:00]
Matt Pocock:那些东西其实不是为这个智能体时代优化的毕竟GitHub是很久以前做出来的它会是一个定制软件或者一个定制HTML文件什么形式都行它懂你知道你的学习方式知道你常犯的错它还保留过去bug的历史记录之类的信息它会更偏向于帮你提升自己也帮你改进整个系统我们说的其实就是让review变得更顺把人的工作量从review里拿掉我见过一个特别夸张的做法每次前端有改动它都会让AI录一段视频自己一边走查代码一边展示改了什么然后它会调用一个文本转语音API把语音叠到视频上所以就像AI在一边带你看代码一边跟你讲PR里直接放一段视频 [00:50:47]
David Ondrej:展示这个东西是怎么工作的这种丰富度应该被内置到 [00:50:53]
Matt Pocock:我们做的所有事情里我们应该尽量优化人的review让人的review更快因为大家都在抱怨说代码太多了review不过来但你很可能也可以用AI来帮你review代码而且可以有很多有意思的方式我觉得我们现在才刚刚开始摸到表面很多人都想用AI做点东西可能是先做一些个人工具或者给团队做点东西但也有很多人想做一门生意可能是AI创业公司也可能是别的业务 [00:51:27]
David Ondrej:你怎么看这件事比如有一群人会说SaaS和订阅会比以往更有价值因为你会给智能体增加更多席位也有一群人说SaaS已经死了在AI时代你会怎么思考做业务做软件这件事老实说 [00:51:44]
Matt Pocock:我不觉得这件事变了多少我也不是评论员我不太看市场也不太在意SaaS是死是活如果你要做一门生意你要做的还是那些基本功你得去跟客户聊弄清楚他们需要什么然后你要做东西你要做出看起来像他们需要的原型而且能解决他们真正的问题我不觉得这里有什么变了 [00:52:06]
David Ondrej:我觉得你可以学会怎么做也可以做得更好 [00:52:09]
Matt Pocock:但我不觉得AI在这件事上会给你什么特别优势因为你真正要做的是走到现实世界里跟人聊天弄清楚人们到底需要什么所以我觉得那些经典的产品设计书在这里仍然成立只是到了真正实现的时候 [00:52:26]
David Ondrej:你会有一个巨大的优势但最核心的还是要有正确的想法做正确的东西如果你没有同时跟真人交流没有弄清楚他们想要什么那AI帮不了你一旦你弄清楚人们想要什么就可以开始往前做了 [00:52:42]
Matt Pocock:我觉得这其实正是AI出名不擅长的地方就是凭空拿出原创想法这可能也是我会给大家的主要建议之一你必须自己决定要加哪些功能如果你看到有人把这些也全都委托出去问AI我们接下来该加什么那我会说不行你应该自己负责产品当然你不用去学每一个具体语法也不用读每一个文件 [00:53:07]
David Ondrej:但你不能让AI替你决定怎么做你的应用你得有愿景你得知道为什么要做它也要知道它在解决什么问题你应该问AI的是我能从应用里删掉什么你应该问它 [00:53:22]
战术编程时代已经过去
David Ondrej:怎样把这个东西做得更简单怎样改进UX怎样真正聚焦在人们想要的东西上不要最后做成那种 [00:53:30]
Matt Pocock:我们都见过的糟糕的风头注资应用里面有一千个功能但你就是找不到自己想做的那件事所以这还是产品设计的基本功我们刚才提到高级开发者能获得十倍提升速度会快很多以我的经验看这是真的但前提是他们真的在用AI工具现在还有一批开发者还是有点拒绝相信这件事他们会说AI没那么好他们可能一年前两年前试过当时很失望但很明显现在工具运行框架模型都好很多了不过我的反驳或者也不算反驳是这样如果招聘的时候去招那些真正相信AI的年轻人呢他们对这些工具非常熟天天都在用他们知道什么模型最好什么技能最好每种情况下哪个智能体最好 [00:54:24]
Matt Pocock:当然他们也需要有一些技术基本功 [00:54:27]
David Ondrej:但你会怎么调和这个张力一边是有10年15年20年经验的高级开发者 [00:54:34]
David Ondrej:他们能获得10倍提升另一边是这些真正相信AI的人他们可能没有高级开发者那么多经验但在使用AI这件事上操作的更好招到优秀的初级开发者本来就是任何公司的目标因为如果你找到一个很优秀的初级开发者只要这个人有热情基本上就会比更有经验的人做得更好单看产出热情会胜过经验因为他们成长快得多学习也快得多所以那些对这个新时代非常兴奋也懂很多相关东西的人只要再配上一点软件基本功就会很强 [00:55:09]
Matt Pocock:因为我们这里说的其实是DX也就是开发者体验和AX也就是智能体体验之间的区别智能体体验就是智能体在代码库里工作时的体验你能做的任何事情不管是更好的技能还是增强模型能力这当然有用还有改进运行框架改进代码库这些都很棒其实人们经常忘了为了更好的AX也要改进代码库他们会忘记好的软件基本功能带来很多优势这就是高级开发者有用的地方 [00:55:43]
David Ondrej:因为高级开发者知道怎么做好的DX如果他们是好的高级开发者他们就知道怎么构建一个能和人很好协作的代码库好的DX和好的AX有很大重叠只是那个很擅长AI的初级开发者是从另一个角度切入这个问题而高级开发者是从高级开发者的角度切入你原来的问题是什么来着是他们怎么被雇用还是你会怎么做或者说这两类人你会顾谁不是问你会顾谁而是说谁可能获得更多优势谁会更有价值是那种有很多经验对软件有正确思考方式的高级开发者但他可能没那么坚定相信AI还是那种完全拥抱AI把AI用到极致也知道怎么充分使用它的人 [00:56:35]
Matt Pocock:我觉得只要你有实验心态而且对AI感到兴奋不管你是初级还是高级都会从中收获很多而且我觉得如果你首先对运行框架感兴趣也对尽可能改进各处的AX感兴趣 [00:56:49]
David Ondrej:那你就会发展得很好也会很享受 [00:56:52]
Matt Pocock:当然人们不想上AI这趟车也有很多正当理由他们可能会对伦理问题有点不舒服比如Anthropic偷了大家的小说然后塞进Cloud里但它已经来了而且现在这份工作就是这样了如果你只是一个战术性编程的人只是在那里埋头接线完成任务 [00:57:11]
David Ondrej:那你就没机会了这条路已经行不通了你不能再只是一个写代码的工具人你需要战略性的思考所以高级开发者绝对可以把这一点用到极致但初级开发者也能学会好 我最后一个问题会比较实用是给正在看的观众的如果你可以让一个普通AI好者今天就做一两件事来改进他的配置改进他的运行框架或者学点什么那会是哪一两件事 [00:57:37]
Matt Pocock:我会做的第一件事是删掉每一个技能每一个插件每一个MCP Server我会回到最开始删掉你的Cloud MD删掉你的AgentsMD回到什么都没有的状态然后观察智能体看看它会做什么以我的经验大家都会往上下文窗口里塞太多东西塞太多指令最后变得很臃肿回到一张白纸 [00:58:01]
David Ondrej:看看智能体会怎么做当你看清智能体在这种基础模式下会做什么之后再往上叠东西而且要确保这些东西是流程性技能不是能力性技能叠上去的东西应该是你自己决定的我的技能仓库就是一个很好的起点如果你真的怀念某个东西比如很怀念Superpowers里的头脑风暴那就把它加回来如果你怀念这个怀念那个也可以加回来但要确保你安装它们的方式能让你自己定制调整和实验如果你注意到问题那就试着找到解决办法把这些问题修掉并且尽量把实现工作委托给一个AFK智能体AFK是一种非常不可思议的工作方式它只需要一点设置但一旦设置好了就会非常猛好Matt感谢你的时间 [00:58:56]
David Ondrej:大家应该去哪里找到你去Twitter找我 [00:58:59]