Claude Code 负责人 Boris Cherny:爆炸式增长、token 最大化与 AI Agent 的下一站

完整转录稿

YouTube Alex Kantrowitz 2026-05-20 16:30

目录

爆炸式增长与产品定位

Boris Cherny:我从没见过增长这么深,而且它还在持续越来越指数级地增长。Claude Code 100% 是用 Claude Code 写出来的。CoWork 100% 是用 Claude Code 写出来的。Anthropic 和各类产品中越来越多的功能,也都是由 Claude Code 完成的。 [00:00:15]

Alex Kantrowitz:Anthropic 和产品中越来越多的功能,都是由 Claude Code 完成的。所以我想听听你对 token 最大化的看法,以及你觉得这会不会占到你们正在构建的这些产品使用量里的很大一部分。

Boris Cherny:你正在构建的这些产品的使用量里,占了很大一部分。我不写代码。我是给 Claude 下提示。其实现在我大部分时间做的,是让一个 Claude 去提示另一个 Claude。甚至我都不直接跟 Claude 对话了。我有一个 Claude 在跟我的 Claude 对话。

Alex Kantrowitz:我们今天要和 Claude Code 负责人 Boris Cherny 聊一聊这个产品的爆发式增长、路线图接下来会是什么,以及这一切是否可持续。接下来马上开始。欢迎来到 Big Technology Podcast,这是一档面向科技世界及其外延的冷静而细致的对话节目。今天我们请来了 Claude Code 负责人 Boris Cherny 到工作室里做客。我们会聊这个产品本身、它是怎么起飞的、路线图上下一步是什么,以及当然,它是否可持续。我们还会聊 token 最大化、token 效率问题,当然也会聊知识工作的未来。话题很多。Boris,很高兴见到你,欢迎来到节目。 [00:01:17]

Boris Cherny:是的,谢谢邀请。那我们先从 Claude Code 的增长聊起。

Alex Kantrowitz:那我们就先从 Claude Code 的增长聊起。它规模已经非常大了,对吧?我记得在最近的一次活动上,Anthropic 的 CEO Dario Amodei 说过,Anthropic 产品的需求同比增长了大概 80 倍。我记得去年这个时候和他聊过,他还在为 Anthropic 的年化营收达到 40 亿美元而兴奋。现在这听起来都很“小”了。现在的数字显示也许已经到 450 亿美元了,对吧?也就是 10 倍、80 倍的需求。问题在于,公司能以多快的速度承接这种需求。但我想听听 Claude Code 占了需求里的多大一块,以及你看到的需求增长和使用人数变化。 [00:02:03]

Boris Cherny:对越来越多的人来说,我觉得他们使用代理、使用 AI 的方式,不只是 Anthropic 的产品,而是尤其会用 Claude Code。当然,Anthropic 有很多不同的产品。你知道,有 Claude Code,有 Claude AI Chat,有 Claude Design,有 CoWork,还有 API 产品。体验 Anthropic 的方式很多。但对很多人来说,Claude Code 是他们接触我们的第一站。增长真的太夸张了。我们最初在内部放出来的时候,它就立刻飙升。所以,在我们把 Claude Code 推给 Anthropic 之外的任何人之前,我们就觉得它大概率会火。差不多在我们发布 Opus 4 和 Sonnet 4 的时候,那是去年 5 月,增长就开始指数级上升。我从没见过这么深的增长。然后它又随着 Opus 4.5 持续指数级增长,那是 11 月;接着是今年 2 月的 4.6;然后是 4.7,它就是一次次地继续拐点上移。我们团队里有很多人在科技行业干了很久,也做过各种超高速增长的产品。这种“独角兽”“超高速增长”是科技行业里常聊的话题,但即便在团队里,我们也没见过这种增长。所以我们现在一直在琢磨,怎么才能让更多人持续体验到这种增长?怎么才能让我们继续以现在的速度、甚至更陡的速度增长?我们也在不断学习如何做到这一点,如何持续扩展服务。所以一年前,很明显 Anthropic 的 AI 模型大头使用还是发生在 API 上,对吧? [00:03:44]

Alex Kantrowitz:一年前很明显,Anthropic 的 AI 模型大头使用还是在 API 上,对吧?比如一家咨询公司把它拿去在银行里落地,银行用它来总结一些计算结果。只是举个例子。相比 Claude 聊天机器人,API 几乎是使用量、收入等各方面的绝对主力。今天还是这样吗,还是 Claude Code 已经超过它了? [00:04:10]

Boris Cherny:现在是混合状态。所以,产品在 Anthropic 里所占的比重,跟一年前相比要大得多了,这一点毫无疑问。产品增长在加速,而且非常快。API 也在加速,而且增长很快。对我们来说,这两边都要投。我们必须成为一家产品公司,因为实验室做产品有很多理由。而且这件事在早期其实并不清楚。Anthropic 很早期的时候,在我加入之前,内部其实还在争论:我们到底要不要做产品?这件事真的有用吗?后来发现,它非常有用,一方面能提升心智占有率,另一方面也有助于安全。说到底,我们存在的目的就是研究 AI 安全,这些产品给了我们更好的工具去做这件事。我们的人也不多,所以世界上大多数东西我们都不会去做。所以我们也必须提供一个平台。我们有 managed agents、API、SDK,这些产品,方便别人基于它们继续构建。也有成千上万家企业选择这么做。 [00:05:10]

Alex Kantrowitz:选择这么做。对,听你把问题回答成“混合状态”很有意思。我想你现在不会说哪边更大,也许现在还不能说。但仅仅是你说它是混合状态,就已经说明 Anthropic 自己拥有和运营的产品增长得非常猛。现在我们已经把背景铺开了,这确实是一件指数级增长的事情。我们也确实看到 Anthropic 的营收跟着这个产品一起指数级增长。这是你今天亲手构思、构建、并负责运行的产品。我猜观众里可能有人会问,Claude Code 到底是什么?大多数观众当然都知道它是什么。我当时在想,怎么用一句简单的话定义它。我的写法是,它是一种用简单英语构建网站和软件的方式。后来在来这里的路上我又想,这说得有点低估它了。你会怎么形容它? [00:06:19]

Boris Cherny:我觉得这其实是个挺好的描述。行,我们接受。我觉得很多人一想到 AI,想到的就是聊天机器人。对工程师来说,大概一年前,也就是我们开始做 Quadcode 之前,AI 还主要就是那个样子。那时候对大多数人来说,AI 就是聊天机器人。后来我们意识到,模型其实已经变得很擅长写代码,也很擅长使用工具。而这两件事本来就是我们一直训练模型去做的方向,研究方向也持续了一段时间。大概一年半前,这件事开始真正变得商业可用了。所以我们在 Claude Code 上押了这个赌注,走上了和当时所有人写代码方式都不一样的路。因为当时全世界写代码,本质上就是用一个高级一点的文本编辑器。我们觉得,也许我们能做得更好,能做出一种和过去完全不同的东西。这确实是一个很大的赌注。于是我们推出了 Claude Code。而 Claude Code 和当时聊天机器人的不同点就在于,它可以使用工具。就这么简单,这就是区别。聊天机器人是你来回聊天;而代理,Claude Code 作为代理,它可以使用你的工具。 [00:07:30]

Alex Kantrowitz:而代理,Claude Code 是一个代理,它可以使用你的工具。对。我们能不能快速定义一下工具是什么?如果我理解错了你可以纠正我。工具可以是任何东西,从浏览器,到登录 Cloudflare,再到以这种方式搭一个代理,对吧?所以它不再是“这个产品本身能做什么”,而更像是“这个产品能登录到哪些地方,然后在一堆你在线上可用的产品里去执行什么事情”。

Boris Cherny:没错,它可以连接你所有不同的工具。它可以用你的浏览器,也可以用你的电脑。甚至像在电脑上编辑文件这么简单的事。你知道,一年半前还没有 AI 产品能真正做到这一点。但 Claude Code 能做的第一件事就是它能编辑桌面上的文件。如果你桌面上有一堆文件,它还能帮你整理。如果你给 Claude Code 和 CoWork 授权,它就能拥有这些访问权限。是的,它可以做到这些。这真的很神奇。就是这个很小的差异,彻底改变了人们使用这个产品的方式。 [00:08:30]

Alex Kantrowitz:也彻底改变了这个产品能为你做什么。对,我觉得最根本的一点是,AI 好像已经从“自动补全”变成了别的东西,对吧?因为在基础层面,AI 本质上就是在预测下一个会发生什么。比如你用机器学习处理一个大数据集,预测的是你会不会拖欠房贷、银行该不该批房贷。放到一句话里,就是预测下一个词;放到代码里,就是预测下一个代码片段。所以我觉得那是第一代。但你现在说的是,机器在你给它一个自然语言提示之后,真的可以自己写代码,接入工具,然后替你做事。要是我说错了你可以纠正我,但这里的用例已经从开发者接入它、用 Claude Code 写代码,扩展到了另一股力量,也就是非技术用户。像我这样的人,可以通过指挥这个 AI 代理,也就是 Claude Code,替我搭一个工作流软件或者一个网站;或者通过像 Claude CoWork 这样的东西接管你的电脑,我可能会把它叫作更容易上手的“姐妹产品”。然后我就可以说,好了,你现在可以访问我的浏览器了。你知道我喜欢订什么类型的机票。再过几周我要去印度,帮我订机票。 [00:10:01]

CoWork 用例与 token 最大化

Boris Cherny:过几周我要去印度,帮我订机票。对,就是这样。我前阵子刚用 CoWork 订了一堆机票。这个月我要飞很多次。我们有 Code with Claude 活动会去伦敦和东京,中间还有别的站点。我就和 CoWork 来回确认,说我需要在这些时间去这些地方,一共五站,很多城市。大致日程是这样的。你帮我看看邮件、看看日历,仔细核对一下,别漏了什么。它真的找出了我漏掉的两个站点,还有我填错的几个日期,而且这些都是它在看我的邮件之后发现的。然后我让它去订机票。我去处理别的事情、写代码、忙工作,一个小时后回来,它已经订好了 8 张机票和 5 家酒店。其中有一家酒店位置不对,订到了错误的区域。我让它重新预订并改掉,结果就搞定了。其实这些就是我每次测试 CoWork 和 Claude Code 时都会做的事,我有一套类似的测试用例。每次我都会换不同的模型重试。随着模型变好,这次就是我拿到过的最好结果。CoWork 加上 Opus 4.7 能做到这一点。我觉得对我来说,最难的一点就是:随着模型进步,你必须不断重设自己对它能力的预期。你跟那些一年前用过这个模型、之后就没再用的工程师聊,他们可能会说,哦,它写代码不行,我不信它一次能写几行以上,因为一年前的模型就是那样,还不太行。你要是快进到今天,把这些人拉回来,让他们试试新模型,就像很多人最近做的那样,尤其是越来越多工程师做的那样,那完全是另一种体验,能力完全不同。我觉得这是我用过的第一项技术,它每个月都会发生一次能力跃迁。作为用户,这其实挺难的,因为你必须不断重新训练自己、不断重试。你总要保持初学者心态,重新拿它去做那些它以前不擅长的事,因为下一版模型可能会完美完成。 [00:12:27]

Alex Kantrowitz:对。所以我觉得,这也是你描述出来的愿景。以前你用技术,是你被界面所约束。你会有一家为了规模化而构建的软件公司,但你拿到的很多功能可能并不适合你。每次你想订个东西,都得经历一堆花里胡哨的流程,哪怕你明明知道自己要什么,而且你也不会有一个知道你偏好的网站。现在范式有点变了。再说一遍,它是个代理。它会出去帮你做事,并且有可能按照你想要的方式塑造你在线上的体验。我觉得这正是大家抓住的机会,也正因为如此,我们才看到了,或者说你们看到了,真正的爆炸式增长。可是我现在想对这个论点稍微做一下压力测试,提出一些让我好奇的点:其中有多少是真实需求,有多少只是对潜力的无约束热情,也许我们得做个现实检查。第一点就是,需求确实很大,但问题在于,这里面有多少是真需求,有多少是被游戏化了的需求。硅谷内外现在有个做法叫 token 最大化,我相信你听说过。公司会规定员工要尽可能多地运行 AI 代理,尽量多用 AI token。然后谁用得最多,谁就会在排行榜上得到奖励,或者完成某种 AI 行动目标,而不是实际行动。所以我想听听你对 token 最大化的看法,以及你觉得这在你们正在构建的产品使用中占多大比例。 [00:14:23]

Boris Cherny:我觉得 token 最大化占比并不大。我的看法是,在 Anthropic 之前,我其实是在一家大科技公司工作过。你以前在 Facebook。

Alex Kantrowitz:你以前在 Facebook。我当时在 Facebook,对。比如说,这就是在做 token 最大化的公司之一。

Boris Cherny:比如说,这就是在做 token 最大化的公司之一。没错,没错。对。我当时的职责之一,是负责 Meta 各个应用里所有代码的健康度,也就是 Facebook、Instagram、WhatsApp 这些。我们之所以在意代码健康,基本上就是在意代码质量,是因为代码质量高,工程师就会更高产。那时有一整个大团队在做生产力提升。模型出现之前,也就是 Claude 出现之前,你会工作很久,然后每个工程师一整年下来,生产力可能只提升 1% 到 3% 左右,大概这样。那已经算不小的提升了,而且这是很难做到的,你基本上得试很多想法,最后才能找到像这样的生产力提升方式。而 Claude 出来之后,现在包括 Anthropic 在内的很多公司、我们最大的一些客户,都报告了数百个百分点的提升。我记得我们最后一次公布的数字是,Anthropic 每位工程师写出的代码量大约增长了 250%,这是自从我们推出 Claude Code 以来的结果。而且这是在代码质量、可靠性这些东西都没有退化的前提下发生的,也就是代码量大幅增长,同时这些关键指标依然稳定。所以这种生产力影响,我觉得是非常新的。人们现在都在摸索:我们怎么才能拿到这种收益?很多公司都在问这个问题,因为很多公司已经看到了效果,但还有一些公司还在摸索。我给的建议几乎总是一样。第一步,就是给每个人 token。让大家先去试,不要让他们每次都得为每个 token 去申请批准。我不一定建议 token 最大化,但我会建议让大家自由实验。第二步,是给人心理上的安全感。因为很多时候,人们在创新、在搭建能提高自己生产力的工具时,他们会改变自己的工作流来让自己更高效,试很多点子。其中一些可能不奏效,但有些会奏效。所以你得给他们心理安全感,让他们敢去试、敢去找这些新流程。然后很多公司会发现,生产力提升和创新并不是来自你最先想到的那些人。过去大家总能指出“这些是我最有生产力的工程师”。但现在很多改进,来自你压根想不到的人。可能是组织角落里的一个会计,用一种工程师想不到的方式把会计工作自动化了;也可能是某个营销人员,用你从没想过的方式把营销自动化了;也可能是个刚毕业的软件工程师,做出了很惊人的东西。这种事以前根本不会发生。挑战就在于,你没法提前识别这些工程师和这些人,你不知道他们是谁,他们总会让你意外。所以你要做的,就是让大家去试,给他们安全感。等某个用例真正开始规模化了,再去优化它。但不要提前优化。所以我不知道,竞争式地去做这件事是不是适合某些文化的公司,如果适合,那当然很好;如果其他公司想要的是营造安全感、给工程师实验空间,这也是我们在 Anthropic 做的方式,那我觉得也很棒。归根结底还是看公司。 [00:18:04]

Alex Kantrowitz:确实得看公司。对。我自己也用很多 token,我一直都在用这些工具。我觉得 Claude Code 和 Claude CoWork 对我的业务都很有帮助。我算是一个独立操作者,虽然这么说有点低估了情况,因为我背后有一群人帮我,大多是兼职,不过那是另一个节目的内容。但我确实会想,当我看到这些报道时,大公司在这些预算里占了很大一块。还有激励机制,你知道,就像我开场时说的,这种可持续性到底怎么样?有些地方的激励机制很糟糕。《金融时报》最近有篇报道说,Amazon 员工用 AI 工具做不必要的任务来抬高使用分数。一些员工表示,同事会用软件自动执行额外的、没必要的 AI 活动,以增加 token 消耗。他们说,在 Amazon 提出每周超过 80% 的开发者要使用 AI 的目标后,这反映出采用 AI 的压力。我特意跟一个 Amazon 员工核对过,他们说,对,就是这么回事。他告诉我,为了达标,他会触发一个要跑好几个小时的自动化程序,然后每天把它删掉。所以你说你不觉得这种 token 最大化是需求的重要组成部分。那你这边有没有看到什么迹象,说明这只是个别现象,不是多数情况? [00:19:35]

Boris Cherny:我也不知道有多少公司在搞这个 token 最大化。我听说它算是一种趋势,多少有一点。但如果你看 Claude Code 的客户,我们有非常、非常多的客户。所以不是说只有某一家公司在驱动使用量,不是这种情况。我想稍微退一步,问一下这种变化到底是怎么发生的。因为我觉得这些公司真正想达成的目标,我不想替它们发言,但我猜大概是组织变革和业务流程变革。你怎么让你的公司真正从 AI 中受益?这件事通常并不清楚,而且非常依赖公司本身,因为每家公司都有不同的业务、不同的文化、不同的组织结构、不同的运作方式。上世纪 90 年代《哈佛商业评论》有篇老文章,我特别喜欢,标题我忘了,大概意思是“电脑来了,为什么没人看到生产力提升?”这确实是个大问题,对吧?在我们今天看来,电脑当然会让我们更高效,这件事显而易见。但在 90 年代,这一点并不明显。当时个人电脑正在普及,正在取代大型机。电脑变便宜了,普通公司、普通创业公司都买得起,不需要再花几百万美元去买一台大型机了。可问题和悖论出现了:公司都在采用电脑,却没有看到生产力提升,怎么回事?那篇《哈佛商业评论》文章的观点是,要从电脑中获得收益,你必须围绕电脑重构整个业务流程。电脑必须成为你做事方式的中心。如果你还保留着纸质档案柜、抽屉里塞满文件,整个流程还是那种纸笔式的物理流程,电脑只是摆在边上,那你根本得不到什么收益。但如果你把档案柜都扔掉,把抽屉里那些纸都扔掉,把电脑放到中心位置,让所有业务流程都围绕它来做,你就能受益。当时公司之间就分成了两类:一类愿意做这个痛苦的转型,并从中受益;另一类没有这么做。现在我觉得情况也差不多。很多公司都在摸索怎么从 AI 的生产力提升里受益,大家都在试不同的方法,想搞清楚怎么真正吃到这些红利。 [00:22:04]

Alex Kantrowitz:而且大家一直在做各种实验,都在尝试不同办法来弄清楚怎么从中受益。我不觉得存在唯一正确的方法。好吧。其实我觉得,当我们看到 Claude Code 和 Anthropic 长得这么快时,最好就是把这些话题摊开讲清楚,听听你的视角。所以,token 最大化先聊到这儿。Token 当然就是模型的输出,也就是模型吐出来的词或者词片段,以及输入进去的词和词片段,对吧?这些就是这些公司收费的方式。token 越多,意味着你需要的数据中心越多,诸如此类。你知道,随着这些模型变得更好,它们还没有……让我换个说法。有时候我会怀疑,它们是不是还能更高效一点。像这样的大模型有时候会干很多活、用很多 token。即便最后输出很好,大家还是会想,这是不是其实只是把 token 需求往上顶了,因为本来可能只是一个很简单的流程,结果模型用了很多很多 token,还没以最优效率完成。我举个例子。我最近一直在用 Claude CoWork 做 PowerPoint 演示,它真的做得很好。我用的是 Opus 4.7 模型。有几次我说,好,你在做这个,顺手把它导出成 PDF。结果它就开始“发疯”了。它会不断循环,尽可能多地调用工具,而且就是怎么都导不出 PDF。最后我一直跟它说,不,你就是在做这个 PowerPoint,你知道文件在哪儿,导出来。然后它会说,我得道歉,我钻进了一个兔子洞,担心一个其实并没有阻塞我们的限制,文件就在那儿。然后它就导出了。我的意思是,聊聊这些模型的效率吧,以及人们担心的这种问题:随着增长,像 Opus 4.7 这样的模型会不会因为一些基本任务陷入这些循环,而消耗掉一大堆 token。 [00:24:15]

token 效率与模型改进

Boris Cherny:对。一般来说,我们看模型时,会从几个维度看。一是智能程度;二是速度;三是效率。我们通常会尽量让这三者一起往前走。但在这些里面,我觉得我们应该优先优化智能,这是最重要的。哪怕它稍微没那么高效,但更聪明、能让你做更多事,那还是非常有价值的。因为效率优化是后面再做的。先把它做得更聪明,然后再把它做得更高效,所以大体上是先做一个,再做另一个。我们一直在做很多实验,研究到底该怎么把这种控制权给到用户。因为我们不一定总知道正确的默认值。有时候你自己比我们更清楚,这种时候你自己知道得更准。所以我们有一个机制是让你选模型,你可以选 Opus、Sonnet 或 Haiku。我们还在试另一个机制,叫 effort。这个大概就是,嗯,我觉得这个词本身就很说明问题:你想让它花多少“努力”在这件事上?这个可以设置。我们有推荐的 effort。比如说,如果你想让 Opus 4.7 的智能最大化,就应该用 extra high 或 maximum effort。但如果你想让它少用点 token,就可以选 medium 或 low effort。这个控制权是你有的。 [00:25:40]

Alex Kantrowitz:而且这个控制权是你可以自己设的。对。我最近在节目里也聊过这个。后来有个评论进来。我的观点是,这些更大的模型最后会找到办法,让导出 PDF 这种事情变得更高效。结果有个评论员说,Alex,PDF 的那个问题修不好。它是 LLM 技术本身的问题,是 agentic AI 想要大规模、有用地扩散出去的最大障碍。我猜你是在看这个评论时想把它翻译成中文。对方想表达的大概是,前面我们聊过预测,这一切本质上都是概率性的,像是在预测下一个词。你不可能两次从 AI 代理那里得到完全一样的答案。所以他们想说,这种问题是这类技术的内在特征,修不好。你怎么看? [00:26:24]

Boris Cherny:我觉得不是这样。你如果往大处看,工程师是最早用 Claude Code 的人,对吧?大概一年半前就开始用了,在那之前,非工程师还没有真正以有意义的方式使用代理,那是 CoWork 之前的事。回头看一年前的 Claude Code,它还没那么好。我那时可以用它写一点代码,但如果真让我完全信任它去做整个功能或者整个产品,结果并不会好。它也会陷进循环,质量不行,或者做出来的东西要么代码差,要么根本跑不起来。可到了某个时点,它就开始变好了。随着模型本身和 Claude Code 一起进步,结果就越来越好、越来越好、越来越好。快进到今天,Claude Code 100% 是用 Claude Code 写的,CoWork 100% 是用 Claude Code 写的,Anthropic 和产品里的功能也越来越多是由 Claude Code 完成的。我们客户也这么说。我昨天在 Y Combinator 给创业公司做了一场分享,我让大家举手,几乎所有人都在用 Claude Code。然后我问,谁今天 100% 的代码都是用 Claude Code 写的?差不多一半的人举了手。接着我问,谁 0% 的代码是 AI 写的?只有一只手举起来。这个人太硬核了。对,当然还有空间。剩下的人都处在中间状态:大部分代码都是 Claude Code 写的,但还不是全部。但这基本就是今天模型所在的位置。一年前还不是这样。那时候它还远远不够好。所以你现在在 CoWork 上看到的,正是同样的事情在发生。它还很早期。我们几个月前才发布。它会继续改进,随着产品变好、模型变好,它会继续变强。但这依然是早期。我觉得今天用 CoWork 的每个人,都是早期采用者。甚至今天用 AI 的每个人,也都是早期采用者。世界上有那么多人,但真正有意义地试过 AI 的还只是少数。所以这方面还有非常大的提升空间。 [00:28:36]

Alex Kantrowitz:对。我们在旧金山 6 月 18 日办一个活动,我做出的很多宣传材料都是用 CoWork 搞出来的。当然,我不会完全一键生成,我还是会看文案。但我会把播客的下载数据传给它,让它展示增长趋势,再把演讲者名单给它。它真的很擅长生成那种“活动建议书”式的东西:这是什么活动、观众是谁、谁会上台、你为什么应该去、怎么联系。简直太离谱了,太强了。你第一次用它、第一次看到代理真的用你的工具时,感受是什么?

Boris Cherny:我自己其实也差不多是这么过来的,所以,嗯,这也是很多人都会经历的过程。比如 Claude 的浏览器扩展,你会意识到,想要真正获得这东西的价值,或者大部分价值,你就得让 Claude 接管你的浏览器去帮你做事。那种体验其实跟我第一次用 Waymo 很像。最开始那几次转弯,我会一直攥紧手机,盯着它看,心想我要不要批准、要不要看它在做什么。然后你会开始慢慢信任它,就只会一直点“批准、批准、批准”。Waymo 也一样。你会想,好吧,看起来它还不至于杀了我。五分钟后,你就开始刷手机,让 AI 在旁边干活了。我对 Claude Code 和 CoWork 的感受也是这样。 [00:29:59]

Alex Kantrowitz:这是不是很符合你的体验?

Boris Cherny:对,这也是我的体验。就像任何技术一样。我看过一个朋友在慢慢学着用 CoWork,她不是工程师。前几天有个场景,电脑上有个语言输入设置,你可以在笔记本里切换语言,结果那个地方出了问题。她不知道怎么修。以前她会怎么做?她会去 Google 搜:“我电脑这个问题怎么修?”这次她直接问了 CoWork。CoWork 说,好的,我看看,我可以用你的电脑吗?她说可以,然后它接管了电脑,屏幕上有种橙色的光效,你能看到 CoWork 打开设置、看语言切换器出了什么问题、诊断它、然后修好它。你还是在驾驶座上,所以你能看到整个过程、能监控它,它也不是在后台偷偷干什么,但就是很神奇。我其实本能上也会去打开 Google。挺有意思的是,对她来说,她已经开始把 CoWork 当成默认工具了。这也是我一直都会感受到的东西。有些人从这些产品的早期版本一路用过来,可能不会像新用户那样大胆;而新用户经常会把 Claude Code 和 CoWork 用在一些我压根没想到的事情上,特别有创意。每次看到我都学到很多。 [00:31:24]

速率限制与并行代理

Alex Kantrowitz:我每次看到也都会学到很多。现在我想说,眼下最大的缺点,我觉得,而且我也看到你在 X 上回复别人谈过这个,就是速率限制。很多人会说,我试过 Claude Code,但我差不多不用了。通常就是因为他们的 token 配额用完了,它对他们来说只能用一个小时左右,然后他们得等四个小时才能再用,于是他们就去找别的替代品。你觉得速率限制对你们产品增长能力造成了什么影响?如果有计划的话,怎么让大家不用被这些速率限制卡住? [00:32:06]

Boris Cherny:速率限制这件事,我们正在积极处理。现实情况是,真正撞到速率限制的人占比非常小,这点其实挺让人意外的。对 Pro 用户来说会高一点;对 Max 用户来说其实相当低。我觉得大家在谈论这件事时,背后其实有几个因素。第一,我们确实曾经把峰值速率限制下调过,现在已经回滚了,而且我们实际上还把速率限制翻倍了。也就是说,我们是在给大家更多额度,只是中间有一段时间我们把它调低了,所以大家撞到了限制。第二,Claude Code 的可扩展性其实很强。人们可以用插件,可以接很多集成。其中有些集成会非常低效地消耗 token。所以我们现在做的,就是把这件事展示给用户,让你自己判断:你要不要用这个插件?你可以看到你的 token 有多少比例花在它身上。第三,我觉得是越来越多的人开始变成重度用户了。刚发布 Claude Code 的时候,你一次只跑一个 Claude。现在我在电脑上,可能会同时跑五个左右。然后每晚我会跑很多个,嗯,不是每天晚上,但大多数晚上我会同时跑几百个。几百个?对,几百个,有时候上千个。这种情况一年前我根本想象不到。显然,这会消耗很多 token。很多人也在摸索这些新工作流,而这些工作流会用掉更多 token。这基本已经接近 Max 方案能覆盖的边界了。当然,如果你只想有尽可能多的 token,也可以直接按 API 付费。很多企业就是这么做的。 [00:33:46]

Alex Kantrowitz:不久前我还很确定,Anthropic 的 CEO Dario 在谈到 OpenAI 的投入和基础设施建设时,语气是那样的。他后来也说过,自己想在花钱这件事上保持克制,但这“克制”仍然意味着在数据中心上花几十亿美元,好支撑你说的这些东西。另一边我们认为是 OpenAI 的那些人则是在 YOLO 式地猛冲,对吧?可现在 OpenAI 也在用 Codex 做这件事。你当然也可以说那是 YOLO,但他们确实已经建了很多数据中心容量。你怎么看这件事?因为当人们撞到这些速率限制时,他们可能就直接转去 Codex 了。竞争非常激烈。你们内部怎么看这件事?从外部看,似乎这种在数据中心扩容上的克制,最后可能会让你们在最重要的产品战里失去用户。 [00:34:48]

Boris Cherny:会让你们在最重要的产品战里失去用户。是的。首先,我们的增长从来没有像今天这样快。所以对 Claude Code 来说,增长还在加速。而且因为大多数人其实并不会经常撞到速率限制,所以这并不是特别大的问题。对那些真的会撞到限制的人,我们的重心就是把体验做到最好。所以我们把 5 小时的速率限制翻倍了;我们今天也宣布要提高周度速率限制。当然,我们也公布了新的 Colossus 容量,已经上线来承载这些新用户。Via Elon Musk。对,通过 Elon Musk。因为这波增长真的没人能预测到,超出了我们所有最疯狂的预估。所以对我们来说,最重要的是服务好用户。我们想确保用户真的满意,我们会尽一切努力把这件事做好。 [00:35:45]

Alex Kantrowitz:把这件事做好。你对 Codex 感到惊讶吗?你怎么看他们这个竞争对手?我觉得总是会有跟风者,总会有竞争者。对我来说,这是挺令人欣慰的,而且这会逼着每个人做得更好。所以对我来说,最在意的还是尽我们所能把用户服务好。我们也鼓励团队里每个人每天都去跟用户交流,然后一点一点把产品做得更好。所以这才是我最关心的事。好,我想先歇一会儿,但我们还有很多内容要聊。我想谈谈这怎么从代码扩展到更广的场景、聊天机器人的未来,然后也许还可以聊一点点——我是说,我可以把我们的议程整页念一遍,我们真的需要两个小时。所以我们先休息一下,回来继续尽可能多聊一点。欢迎回到 Big Technology Podcast,我和 Anthropic 的 Claude Code 负责人 Boris Cherny 还在这儿。Boris,很高兴你来。就像我说的,我每天都在用你的产品,所以能跟你聊这件事真的很有意思。我们刚才已经聊到一点这个了,但我觉得我们应该强调一件事:这东西真的会从“聊天机器人”进一步延伸出去。我们聊过订机票,我也聊过营销演示。就在我们录节目这一周,你们还上线了一个新用例,Claude Code 可以用于小企业,包括接管 QuickBooks 和做一些记账。这个会往哪儿走? [00:37:17]

Boris Cherny:这个会往哪儿走?我的意思是,你觉得整体路线图会把你们带到哪里?我们在为 Claude Code 和 CoWork 想几件事,有几个大主题。第一是提升智能。我觉得这里几乎一切都取决于模型本身。模型越强,我们就能做越大胆的事。对代码来说,过去是一次写一行,现在是构建完整功能,甚至整套产品。对 CoWork 来说,过去它主要还是,嗯,刚起步没多久的时候,像是做个文档;现在已经是订机票、整合很多工具、帮你处理 QuickBooks 这种事了。所以前沿在很快地进步和移动。我们也在思考如何处理更长时间运行的任务。Claude Code 最近发布了一个叫 Auto Mode 的功能,本质上是取代权限提示。以前模型每次要用一个工具时,Claude 都会问你:我能不能用这个工具?通常你都会说可以。你会越来越烦,一直说可以、可以、可以。点“始终允许”就是那个按钮。没错,没错。但从安全角度说,你必须非常认真地对待这件事。我们意识到,与其对每一个提示都认真纠结,因为我们给用户展示了太多这类对话,大家会疲劳,然后就一直点“是”或者“始终允许”。所以 Auto Mode 就是答案。这是一种新的工具调用路由方式。它的工作方式是:每次 Claude 想用一个工具时,它会去问另一个 Claude:这个工具安全吗?这个 Claude 有一部分上下文,但没有全部上下文。而且中间还有多层安全检查。我们花了好几个月来迭代它,确保它真的安全。我们用了成千上万种基准和评估来保证安全。实际上,我们在实验室里发现,现在在真实环境里也发现,它比以前更安全。作为用户,这个好处很大,因为你不用一遍又一遍地坐在那里点“是”。而且结果其实更好,因为如果 Claude 要你执行的一长串动作里,某个地方藏着一条不安全命令,你可能会不小心同意了。但如果你用 Auto Mode 去问第二个 Claude,它就不会放行。这个是一个大投入。也许第三个大方向,就是让更多代理并行运行。Claude 这件事很酷,我们很早就在 Claude Code 用户里看到了这一点:现在几乎很少有人一次只运行一个 Claude Code。大多数人会同时跑很多很多个,从几个到几千个不等。CoWork 也开始出现同样的情况。你越习惯让 CoWork 干活,你就会先开一个任务,再开第二个,然后继续往前,同时做更多事。我觉得这里有很多机会,把这种体验做得更顺滑,也让人更容易看懂。 [00:40:08]

聊天机器人未来与 SaaS 护城河

Alex Kantrowitz:让它对人更容易理解。你要怎么做?什么时候做?对吧。它可能也会延伸到你使用聊天机器人的方式,对吧?这很有意思,因为 Anthropic 和聊天机器人之间有一种挺有意思的关系。最开始是技术先行,后来决定做聊天机器人、发布 Claude,再慢慢往企业市场靠。你看所有图表,Claude 一直都在底部。但现在你看到 Claude 的使用量在上升。我有个想法,也很想让你帮我验证一下:聊天机器人的未来,不会是“我问你一个问题,你给我一个答案”,而是“我提出一个问题,或者跟你讨论一个问题,然后聊天机器人会建议我可以采取什么行动”。就像现在我总在聊去印度的旅行,我觉得未来我拿到的就会是这样一个东西:像你刚才说的,不再有“要不要去那里”和“订机票”之间的第二步,而是一个更主动的聊天机器人会说,好,我来帮你处理。这是正确方向吗?我是不是这样想对了? [00:41:20]

Boris Cherny:我是不是这样想对了?我能看到这种方向。对,我能看到。你们在做这件事吗?代理就是未来,我们正在尝试各种不同的实验。好。我们确实在试一些类似这样的东西。对。

Alex Kantrowitz:对。好吧。但这里还是有边界,对吧?一个很有意思的看法,是人们谈到你们可以并行跑成千上万个 Claude 的限制时,会去看 Anthropic 在招什么人。我最喜欢的一个职位,是你们在招 Salesforce 管理员。你们也在招顾问,帮企业部署这套技术。很多人把这看成一种默认承认:这东西能带你走一段,但也就到这里了。Wharton 教授 Ethan Mollick 的说法是,只有当 AI 实验室把新成立的咨询、抱歉,是前线部署工程团队都拆掉时,你才能知道他们真的相信人工超级智能。只要人们还需要去搞清楚 AI 怎么有用、怎么做组织变革和系统集成,工作看起来就还挺安全的。 [00:42:25]

Boris Cherny:工作看起来还是挺安全的。你怎么看?是啊。你看我做的那种工程,我不写代码。我给 Claude 下提示。其实现在我大部分做的,是让一个 Claude 去提示另一个 Claude。所以我甚至都不直接跟 Claude 聊天了。我让一个 Claude 在跟我的 Claude 说话。我觉得在工程领域,你已经看到了一个人能拥有的杠杆能力爆炸式增长。问题变成了:一个人能做多大的业务?一个人能支持多少个产品?现在 Anthropic 的一名工程师所拥有的杠杆能力,简直离谱。我觉得在别的学科里,我们也开始看到这一点。比如做市场的人,开始用 Claude 去做很多事情。前线部署工程师,也开始用 Claude Code 去搭实现。我们的销售团队也在这样做,因为你知道,实际上在 Anthropic,我觉得大概一半的 go-to-market 团队都在用 Claude Code,另一半在用 core。我的意思是,大家都在用这些产品。所以我们看到的是,个体的杠杆在上升,但我们仍然卡在“好人才数量不够”这个瓶颈上。即便人均杠杆提高了,你还是招不到足够多的好人,因为需求太疯狂了,而且还有太多东西要建。 [00:43:45]

Alex Kantrowitz:还有太多东西要建。所以这对我们来说仍然是瓶颈。但我想说,如果有人会争辩说:如果这东西真的这么强大,那你就看看我销售组织是怎么运作的,然后用提示把 Salesforce 配成那样。还有人举的另一个例子是,我相信 Anthropic 的 AI 很强,他们让它处理 IPO 文件工作,却不请投行。这些测试是不是不公平? [00:44:18]

Boris Cherny:测试?嗯,我们已经开始看到……团队里有个人在用 Claude 报税。我不一定建议这么做,但我得承认,我自己也用 Claude 跑过税,再和我的会计比过,结果非常接近。

Alex Kantrowitz:用 Claude 报税,再和我的会计比,结果非常接近。对。我也这么干过。各位,不是说你应该这么做,但这确实是个有意思的用法。没错。但我觉得这场对话里大家忽略的根本点是,最终还是得有个人去跟 Claude 对话,要求 Claude 去做这件事。所以即使 Salesforce 是自动配置的,哪怕不是人去按所有按钮,而是 Claude 在做,也还是得有人要求 Claude 做。如果你要把 Salesforce 配成很多种不同方式,这件事本身可能就会变成一个全职工作:要求 Claude 去做这件事。到了某个点,Claude 会变得很擅长要求 Claude 去做这件事。那个人会要求 Claude 去要求 Claude 去做这件事。这个链条会越来越深,但到头来,你仍然需要有人来当“试飞员”。 [00:45:13]

Boris Cherny:但也许未来他们的工作就只是提一个问题。是啊,但想象一下,提对问题有多大的杠杆作用。

Alex Kantrowitz:这倒是。说得好。所以我们聊了 Salesforce,那就得聊 SaaSpocalypse。你对随着自动化编程越来越多,哪些软件公司会安全、哪些会遇到麻烦,有一些挺有意思的看法。你之前也聊过不同的护城河,以及哪些护城河更重要、哪些不那么重要。趁着这个话题,你能简单分享一下吗?

Boris Cherny:有一个很好的框架,叫“七种力量”,是用来讨论商业护城河的。讲这类框架的很多,但这是我最喜欢的。我在学校学过经济学,没有学计算机科学。所以我思考这类问题的方式,还是偏向这些框架。商业里有很多不同的护城河,有些公司只有一条,有些有几条,还有一些有一整个护城河组合。类型很多。其中一种是规模经济。也就是随着你扩大生产,规模回报会递增。另一种是网络效应。比如消息应用这类产品,越多人在上面,对每个人就越有价值。还有一种是转换成本。还有一种是流程力量。我觉得这些护城河大多数仍然会重要。只是相对而言,有些在未来一年会变得更重要,有些会变得没那么重要。我觉得网络效应之类的会越来越重要。因为谁在写代码其实不重要,不管你的产品核心是不是代理,也不管你的产品是不是有智能,只要你的产品有网络效应,这件事依然重要。也有一些护城河会变得没那么重要,比如转换成本。因为如果你要从供应商 A 切到供应商 B,你只需要让 Claude 去做就行了,而且 Claude 会随着时间越来越擅长这件事。所以我觉得,作为公司你应该思考的一件事就是:你的护城河是什么?我认为很多大公司其实有很多很多护城河,不只是一条,因为你要达到某种规模、并且长期建立一个有防御力的业务,就是靠不断积累这些护城河。你需要好几条。 [00:47:24]

Alex Kantrowitz:你确实需要好几条。不过对,我只是想知道,接下来这一年里什么会更有价值,什么会没那么有价值。我觉得当你看这些不同的软件公司时,如果你在用 Claude Code,护城河是不是会有点“融掉”,因为你可能会进入一个跟所有软件交互的应用里,那实际上就只剩下一家软件公司了。

Boris Cherny:对,我的意思是,这事有很多种可能的走法。我觉得这种情况是有可能的,但对我来说听起来有点太远了。因为如果我想一下,比如我在用一个消息应用,我怎么决定用哪个应用?我用的是我朋友们都在用、我能联系到的那个应用。所以我自己能不能做出一个很厉害的应用并不重要,虽然我今天就能做到。比如我可以用 Claude Code 在几个小时内做出一个很棒的消息应用,但它仍然没用,因为我联系不到我的朋友。 [00:48:16]

Alex Kantrowitz:它还是没用,因为我联系不到我的朋友。但这正是那个例子。你可以来验证我这个说法。你的消息应用里会有一个代理,当你的朋友给你发消息时,它会告诉你,我知道你在 iPhone 上经常用 Claude Code,所以你只会看到通知,然后你就能回消息。你的所有通信都有可能被集中化,只要这些公司愿意配合,作为……

Boris Cherny:你的所有通信都有可能集中化,只要这些公司愿意配合。对,我的意思是,接下来它可能最终会变成一种代理,但通信到底是怎么发生的?比如如果你看 Signal 这样的消息应用,它有自己用来通信的协议。我可以做一个应用,它也许能用同样的协议,但我觉得它其实没法给 Signal 上的其他人发消息。不过对,我可以让一个代理用我的应用,借助现有支持这件事的应用去完成消息传递。所以,是的,这事到底会怎么发展还不明显。我觉得今天大家是混着用应用和代理的。但从根本上说,我确实认为很多护城河的价值会随着时间继续上升。你还可以想另一个例子。比如 TSMC,或者某种芯片制造商。你想想他们在打造一套流程、以及让成本随规模下降的流程上投入了多少工作,这本身就是一个基本的经济力量。很多公司都在做这种事,尤其是在制造业里,规模越大成本越低。对科技公司来说,这对应的就是基础设施。如果你把基础设施做得非常好,你就能支持更多用户,而且每个用户的边际成本会随着时间下降。所以如果你有这种效应,不管你或者我能不能做出应用,这仍然是一个非常强的护城河。 [00:49:59]

自我改进、世界模型与大众采用

Alex Kantrowitz:不过我确实觉得,这两种力量都在起作用。好,我在 10 分钟里还有三个问题。看看能不能全问完。Anthropic 的联合创始人 Jack Clark 最近说,他觉得这些模型到 2028 年有大概 60% 的概率开始自我改进。也许年份或百分比会有点偏差,但大致意思差不多。你现在就在那个代码自动生成、自动运行的应用里,你觉得 Jack 说得对吗? [00:50:02]

Boris Cherny:我觉得差不多。对。你看 Claude Code 的写法,Claude Code 的代码 100% 是用 Claude Code 写出来的。我觉得从去年 11 月、也就是 Opus 4.5 之后,一直都是这样。

Alex Kantrowitz:那听起来就是一个快速起飞的场景了。你预料到会这样吗?

Boris Cherny:我是说,这种可能性是存在的。这也是 Anthropic 存在的原因。如果你去问任何人,任何工程师、任何研究员,为什么他们加入 Anthropic,他们都会说是为了 AI 安全。因为对我们来说,当我们思考未来、思考几年后的世界时,最重要的事情、也是我们最想做对的事情,就是确保这东西是安全的,确保它往好的方向发展,因为这确实可能是结果之一。我觉得现在我们还不是在说“Claude Code 正在写它自己”这种程度,但现在的确是有人在提出 prompt,Claude 开始自己想下一步该给 Claude Code 做什么,不过你知道,这些想法并不总是好想法,我自己还是会贡献大部分想法。到了某个点,这种情况会改变,模型会进步,然后它会变成更强的自我强化循环。 [00:51:35]

Alex Kantrowitz:到了某个时候,这会变化,模型会进步,然后它会变成一个自我强化循环。好。我特别想听你对“世界模型”这个争论的看法。支持世界模型的人说,大语言模型并不理解后果,你得把世界模型嵌进去,才能有有效的代理。Yann LeCun 也是这个观点。他说,没有世界模型,就不可能构建可靠的 agentic 系统。LLM 没有世界模型。按照 Yann 的说法,它们在行动前无法预测自己的后果,它们只是行动,后面发生什么就是别人的问题。我最近和 OpenAI 的 Greg Brockman 聊过,他基本上不接受这个论点,他认为 LLM 本身就是通往 通用人工智能 的直接路径,这些文本模型就是那条路。你站哪边?你觉得必须把世界模型智能内置进去,还是你认为只靠 LLM 就够了? [00:52:32]

Boris Cherny:只靠 LLM 就够了吗?如果 Jan 想坐下来,和 Claude Code 一起玩一个小时,我愿意邀请他,我很乐意在节目里给他演示一下。是啊,我也很想听听他的想法,也许他会改变主意。也许他不会,但你看,我的立场还是很坚定地站在产品这边。所以我其实没有一个特别强的观点。 [00:53:25]

Alex Kantrowitz:所以你其实没有特别强的观点。那我再追问一点,如果你不介意的话。你是站产品这一边的,但我听很多人提过这样一个想法:如果没有对世界如何运作的概念,也就是没有世界模型,LLM 就不可能理解世界如何运作以及后果这些东西。你用 CoWork 订了多少机票,八张加酒店?你肯定会觉得它对后果有一定理解,不然你也不会把信用卡给它,我猜你已经这么干了。

Boris Cherny:不然你也不会把信用卡给它,我猜你已经这么干了。那你具体怎么看这个论点?我觉得,从我读到的 Anthropic 做研究的人那里来看,这些模型的智能程度令人惊讶。因为正如你一开始说的,它们本质上就是在预测下一个 token。你会觉得这听起来有点傻,这怎么可能导向智能?但我们实际上已经发表了很多关于模型如何进行规划的研究。它们确实能推理。所有这些行为都非常令人惊讶,按理说你不会期待一个只预测下一个 token 的模型表现出这些能力。所以我不会低估它。我的意思是,我最喜欢的一个例子是,当它们写诗的时候,你能在模型里看到它们已经在考虑下一行了。Anthropic 的研究表明,它们已经在想下一行了。 [00:54:02]

Alex Kantrowitz:就是它们已经在想下一行了。这怎么可能?但确实是这样。我的意思是,这也是我对它的理解。如果我是写诗,我大概也会这么做。对,太疯狂了。你教它去预测下一个词,而如果下一个词足够难,它就必须学会真正提前规划,学会把这一切串起来。

Alex Kantrowitz:好,最后一个问题。每次我看到重大技术变革正在发生时,在我做这类报道的职业生涯里,有些成了,有些没成。我总会问自己:我们怎么确定这就是未来,而不是一场高烧式的幻觉?我觉得数据表明,这确实是真实存在的东西。但我也会想,你到底能在多大程度上对未来做外推,看看它接下来会怎么发展。有人说这只是一场幻觉,理由是也许人们只想要简单界面,并不在意一路点点点。对他们来说,用 Claude Code 说话感觉有点太技术化了,它对日常用户的吸引力,不会像它对开发者那样大。 [00:55:21]

Boris Cherny:你会怎么回答这个问题?我们最近给 Opus 4.7 办了个黑客松,其中一个获奖者是位医生,他做了一个应用。还有电工、木匠。很多人都没有编码经验,但他们用 Claude Code 做出了有用的东西。我们办的一次黑客松之后,有人甚至创建并卖掉了一家初创公司。毫无疑问,当我们第一次做出 Claude Code 时,它是给工程师用的,而工程师也确实先学会了怎么用它。但很快,非工程师的人也搞明白了怎么用它做出有经济价值的东西。实际上,如果你看今天很多使用场景,会发现用它的不全是工程师。它对人来说有用到什么程度?有用到大家愿意绕着障碍去用它。甚至在 CoWork 之前,人们就已经喜欢把 Claude Code 装在终端里用,对很多人来说,那还是他们第一次用终端。当然,现在你知道,Claude Code 已经有桌面应用、有 iOS 应用、有 Slack 应用,交互方式很多,但人们还是愿意绕弯子去用它,因为它真的太有用了。所以对我这个产品人来说,这就是最终的市场测试:这东西到底有没有用?是不是有很多人每天都在用,而且每天都还在继续用?答案是有,而且数量很多,而且还在不断增长。我一直对大家怎么用这个工具感到惊讶。 [00:56:44]

Alex Kantrowitz:是啊,很多人,而且还在不断增长。我也得说,我对自己后来居然会这样使用这些工具,也挺惊讶的。接下来会怎样,我也不太确定。总之,很期待继续用下去。

Boris Cherny:我对这些工具的使用方式也有点摸不着头脑,不知道接下来会怎样,但我也很期待继续用下去。也很高兴有机会和你聊,希望我们还能再聊一次。

Alex Kantrowitz:我也很高兴能和你聊,希望我们还能再来一次。谢谢邀请。

Boris Cherny:谢谢你的邀请。

Alex Kantrowitz:谢谢你,Boris。和你聊天很棒。也非常感谢大家收听和观看,我们下次在 Big Technology Podcast 再见。 [00:57:08]

返回该播客 打开原文