目录
- 开场与 AI 市场的异常时刻 [00:00:00 - 00:10:00]
- 融资纪律、电力瓶颈与轨道算力 [00:10:00 - 00:20:00]
- 晶圆供给、泡沫风险与前沿模型价值 [00:20:00 - 00:30:00]
- Bitter Lesson、持续学习与芯片创业机会 [00:30:00 - 00:40:00]
- 推理拆分、应用层困境与 AI 原生公司 [00:40:00 - 00:50:00]
- 网络安全、投资工作流与估值分化 [00:50:00 - 01:00:00]
- 科技巨头定位、人身安全与地缘政治 [01:00:00 - 01:10:00]
- AI 乐观主义与社会风险 [01:10:00 - 01:10:46]
开场与 AI 市场的异常时刻
一凯:欢迎收听跨国串门儿计划。这是一档专注于让中文听众无障碍欣赏全球优质外语播客的节目。通过先进的 AI 声纹克隆技术,我们不仅将内容翻译成中文,还完美保留了原主持人和嘉宾的独特声音,为您呈现全球顶尖的 AI 财经、健康与科技领域精品内容。我是主播一凯,一位热衷于 AI 领域的产品经理,很荣幸能为您搭建这座跨越语言障碍的桥梁,接下来让我为您简单介绍本期我们克隆的这档节目,并分享几句非常精彩的原话,本期我们克隆的是 Patrick O'Shaughnessy 主持的投资访谈播客,Invest Like the Best,这是一档长期关注商业科技与资本市场的深度对话节目,嘉宾 Gavin Baker,是 Atreides Management 的创始人兼投资人,长期研究科技公司 AI 基础设施和市场周期,节目里有几句原话,特别有冲击力,资本主义史上从来没有发生过这种事,别说我的职业生涯了,就是整个资本主义史,整个商业史都没有过,历史不会简单重复,但会押韵,作为投资者,我们必须非常清醒地意识到这一点,如果我们不能都成为机关枪的大师,我们就会被机关枪支配,我们需要带着谦逊来面对这件事,承认这里有大量不确定性,并且认真思考,这些判断背后是一场关于 AI 资本,和未来秩序的高密度对话,那我们就一起来听听这期完整节目 [00:00:00]
Gavin Baker:AI 领域当时发生的事,我觉得是资本主义史上,美国商业史上最了不起的时刻,Anthropic 增加了110 亿美元,过去10 年12 年里创立的,三家最受关注的 SaaS 公司,是 Palantir Snowflake 和 Databricks,这三家公司花了10 年时间,打造自己的业务,Anthropic 一个月就增加了,相当于他们三家公司,合计规模的业务,资本主义史上,从来没有发生过这种事,别说我的职业生涯了,就是整个资本主义史,整个商业史都没有过 [00:01:38]
Patrick O'Shaughnessy:这是我们第六次做这件事了,如果你能相信的话,这让你又回到了第一名,或者至少和 Gurley 并列第一,我觉得就算和上一次相比,那次已经很让人兴奋,很精彩了,现在这个时点还要更有意思,也许你可以先随便聊聊,今年三月和四月,你亲身经历那段时间,是什么感觉,对我来说,那像是一个完全独特的,经济技术和市场环境,你又是最认真研究,历史研究这些时刻的人,所以那到底是什么感觉 [00:02:10]
Gavin Baker:大体上说回撤有两种,一种回撤是你错了,公司业绩没有达到预期,你的假设被证伪了,你必须认亏把这笔损失确认下来,另一种回撤或者说一段跑输的时期,是你因为一些自己非常非常了解的公司而跑输,而且你非常不同意市场给出的价格走势,这种时候你可以加码,你不必把负收益确认下来,而是可以积累被压住的 alpha,也就是未来的表现,对我来说,三月就是这种感觉,感觉是 NASDAQ 在下跌,但与此同时,AI 领域正在发生的是,我觉得是资本主义史上,美国商业史上最了不起的时刻,我的意思是,Anthropic 增加了110 亿美元 RR,让我震惊的是,SaaS 和云革命,创造了我们姑且说,5 万亿到10 万亿美元的价值,而且我会说,过去10 年12 年里,创立的三家最受关注的 SaaS 公司,大概就是 Palantir,Snowflake 和 Databricks,这三家公司都雇了成千上万人,合起来是数万人,他们都花了十年时间打造自己的业务,而 Anthropic 一个月就增加了,相当于他们三家公司合计规模的业务,资本主义史上从来没有发生过这种事,别说我的职业生涯了,就是整个资本主义史,整个商业史都没有过,我是说这太疯狂了,然后 Krishna 上了这个节目,分享了一些数据,DR 是五百分之,你把这个数字按三年算一下,简直离谱,所以这件事完全没有先例,我们这些科技投资人经常会听到,关于 S 曲线,关于投资指数增长的讨论,但我从来没见过这样的指数增长,他感觉甚至比 DeepSeek 那次还要极端,而 DeepSeek 当时的情况也非常类似,如果我们回到2025 年,DeepSeek 引发过一次大抛售,那其实很奇怪,因为那篇论文是在 DeepSeek Monday 前7 天发布的,我记得它是在一个周一发布的,而那天美国是假日,我读了之后,想这件事对 AI 交易来说,可能不会被市场解读的很正面,所以我采取了行动,一周之后,我们经历了 DeepSeek Monday,AI 相关资产真的大幅崩了下去,这很奇怪,因为到了 DeepSeek Monday 那天,其实已经非常清楚了,这会是有史以来,对算力需求最利好的事情,亚洲 AWS Availability Zone 里的价格,当时已经差不多翻倍了,你能看到 GPU 可用性在下降,而这也是我们第一次看到推理模型,在 inference 阶段比非推理模型要吃多的多的算力,所以那次也是类似的局面,但你需要做一点功课才能看出来,其实也没那么难,你只要看到股票在下跌,但 DRAM 价格在垂直上涨,亚洲 GPU 价格在垂直上涨,GPU 可用性在下降,然后两三天之后,美国的 GPU 价格也就是 GPU 租赁价格也开始上涨,到了三月你要做的事就更简单了,只要观察 Anthropic 身上正在发生什么,有很多人好像都后悔,2022 年没有买,COVID 期间没有买,DeepSeek 那次没有买,4 月初你又遇到了同样的估值环境,而且 AI 的拐点还更清楚,所以其实一直都有很多机会可以买入,AI 当然让事情变复杂的是霍尔木兹海峡,我后来相信了,而且现在也相信市场当时可能误判了一件事,我不是宏观专家,但我确实做很多国家安全相关的投资,所以我能接触到一些专家,他们也很愿意跟我分享想法和观点,霍尔木兹海峡如果被关闭,对美国来说其实相对是很有利的,为什么,尤其是考虑到现任政府的目标,电力是一个非常重要的工业投入,或者说制造业投入,影响美国电价的关键投入,也就是会进一步影响 AI 的关键投入,是 NG 天然气,Bloomberg 上那个天然气合约,当时它跌了1%,而亚洲欧洲以及其他地方的天然气价格,则翻了一倍或两倍,所以我们的相对制造业竞争力,几乎是一夜之间就提升了,不管这是好是坏,这似乎正是特朗普政府在意的东西,他们非常关注美国的相对位置,我觉得很多人还记得1970 年代,70 年代之所以那么痛苦,不只是因为价格上涨,而是真的出现了汽油短缺,然后你再往下看,会发现美国经济,现在对能源的依赖程度,已经远低于过去,美国现在是全球最大的,石油和天然气生产国,而且我们现在也成了,全球最大的石油和天然气出口国,在这之上,还有这个相对制造业优势,所以我觉得,这让人更容易继续关注,AI 的基本面,继续关注那些,从历史上看,很有吸引力的估值,我认为从相对角度看,科技股相对于市场,其他部分,基本上已经便宜到,过去十年里,最便宜的水平,你把这一点放到市场效率的背景下,想一想,我们正处在资本主义历史上,最非凡的时刻,这对 AI 极其利好,而你居然还有机会
Patrick O'Shaughnessy:用非常有吸引力的估值去买 AI,你怎么看 Anthropic 和 OpenAI 的估值倍数,在我看来,他们就像这轮趋势里,最纯粹最有代表性的资产,但他们的估值,其实并没有那么疯狂,如果你只看销售额倍数,再拿它和 Databricks,Snowflake 这些公司,在高峰期的交易倍数相比,你会怎么理解这件事,我确实认为,从资本效率的角度看 [00:07:41]
Gavin Baker:OpenAI 和 Anthropic,是很不一样的公司,Anthropic 的每 token 成本,明显比 OpenAI 低得多,事实就是这样,你只要看他们,为了做到差不多的收入规模,各自烧掉了多少钱,就能看出来 Anthropic 烧的钱,可能比 OpenAI 少了80%,所以作为公司,他们显然有非常不同的,结构性 ROIC,我觉得 OpenAI,正在做很多事,我认为 Sarah Friar,是非常出色的 CFO 之一,我觉得他们正在做很多事情,试图改善这一点,而且他们拿到了很多 compute,比其他公司更多,他们确实拿到了很多 compute,这是另一个很大的差异,事实证明激进一点,回报非常大,但 Anthropic 如果是900 亿美元,估值对应50 亿美元 AR,而且还在增长,增长一千个 basis point,增长速度非常夸张,也许一个更准确的说法是,如果 Anthropic 拥有全部 compute,它今天的收入很可能远高于1000 亿美元,也许是1500 亿美元,而且我确实认为,他们显然已经降低了 Claude 的智能水平,有一个分析说,即便是 Claude Opus 在同样的问题上,生成的 token 也少了70%,就像我们上次聊过的,在某种程度上,token 数量等于答案质量,也等于思考质量,当然每个 token 的智能密度也很重要,作为用户我确实感受到了这一点,所以我认为如果 compute 不受限制,他们的收入会高得多,可能是1000 亿1500 亿,也可能是2000 亿美元,这样看你买的可能更像是五倍无约束,收入我来编一个新数字,URR,也就是无约束 run-rate revenue,那你为什么觉得他们不以,3 万亿美元估值之类的价格,直接融1000 亿美元 [00:08:07]
Patrick O'Shaughnessy:如果你是 anthropic 的 CFO,Christian 很棒,我们刚请他上过节目,或者如果你是 OpenAI 的 Sarah Friar [00:09:52]
融资纪律、电力瓶颈与轨道算力
Patrick O'Shaughnessy:或者如果你是 OpenAI 的 Sarah Friar,至少从 Christian 那期节目之后,我收到的反馈来看
Gavin Baker:我认识的所有人都想投这两家公司,我觉得这是明智的,因为未来是不确定的,你显然是在一个资本极其密集的游戏里,即使你是 Anthropic,我相信他今天在 inference 上的毛利率已经非常高,再说一次,Anthropic 今年很可能就会开始产生现金,如果他还没有开始产生现金的话,而我认为他很可能已经在产生现金了,但即便如此,你大概还是希望以后能继续融资,拿到更多 compute,这个世界充满不确定性,乌克兰开始真的真的占上风了,俄罗斯会怎么回应,我认为伊朗那边仍然有很多不确定性,所有这些不确定性可能都会放大,围绕台湾的地缘政治不确定性,所以这是一个不确定的世界,如果我想到 Elon,他一直都让投资人赚到了钱,他把这件事看得像一种神圣契约,结果就是因为他20 年来,一直让人们赚到钱,他拥有了一种超能力,这种超能力,就是他基本上可以在任何时候,按自己想要的规模融资,我觉得这些公司,现在这样做是明智的,我不知道他们是不是这样思考的,但我确实认为,专注于让投资人赚钱是明智的,这会带来一些好处,而且这些好处不会只持续一两年,他们可以持续未来20 到30 年,Elon 做到这一点的方法,是不是某种系统性的低估 SpaceX,或者其他公司的价格,实际的方法到底是什么,就是从来不在估值上贪心,对从来不把估值推得太高,就这么简单,我的朋友 Antonio 指出,SpaceX 在大概10 年里,每年复合增长率是30 出头,这只是因为 Elon,我认为他很专注于保住这种超能力,他也试图在投资人和员工之间,找到一个公平的平衡,我觉得这是明智的,但 Anthropic 能不能以 [00:10:04]
Patrick O'Shaughnessy:比传闻中最新估值,至少高100%的价格融资,当然可以,我们来聊聊 Watts 和 Wafers 这部分,这一直是我最喜欢跟你聊的话题,也就是这轮基础设施建设的重要性,我感觉每次我觉得它有点过热了,下一次跟你聊的时候,又会觉得我们之前做的还远远不够,你研究过很多 S 曲线,也研究过这些 S 曲线有多陡,而且你很了解历史,你现在怎么看 [00:11:57]
Gavin Baker:watts 和 wafers,他们作为这一整件事的关键投入,到底有多重要,我会说在没有重大监管,和政治反弹的情况下,资本主义会解决电力短缺问题,不过我觉得这种反弹,确实有可能发生,有一家大型 PE 公司的,数据中心基础设施,投资负责人说过,我记得可能是 Blackstone,Apollo 和 KKR,他们以前最大的限制因素,是能源和芯片,现在更重要的是分区规划和审批,我觉得很多公司都在等中期选举之后再采取行动,比如可能的裁员,没人想在中期选举期间变成被打的靶子,但你也看到很多做涡轮机的公司都宣布了大幅提高产能的计划,现在能铸造那些巨大叶片的机器好像就两台,西方已经80 年没造过这种机器了,我们已经不知道怎么造了等等等等,这些都是真的,我也绝不是在低估其中需要的工业工程能力,魔法和工艺,但从长期看资本主义很擅长解决这类问题,除了这些涡轮机之外,还有其他能源来源,只是时间周期更长,所以我觉得电力短缺,大概会在2027 年,2028 年开始缓解,然后我认为 orbital compute 会真正解决这个问题,我确实想重新定义一下 orbital compute,因为人们一听到太空里的数据中心,就会想到我们上一期聊过的那种,在太空里建一个五角大楼,那么大的建筑,他们会说这我们做不到,但它不是那样的一个 Blackwell Rack,重3000 磅高8 英尺,深4 英尺宽3 英尺,它就是在太空里的机架,SpaceX 已经给你看过示意图了,那个机架本身就是卫星,不过它的大小大概和一个 Blackwell Rack 差不多,它有太阳能力,两边可能各有500 英尺长,你把它放在太阳同步轨道上,这样这些太阳能板就一直在太阳下面,而且因为它处在精确的太阳同步轨道上,散热器就可以从它后面延伸出去几百英尺,这是一个很常见的质疑,你打算怎么处理,这些年我在 Starbase 待了很多时间,也跟很多 SpaceX 工程师聊过,我确实认为这是地球上最有才华的一群工程师,他们非常有信心认为自己已经解决了这个问题,而且他们并不是总这么有信心,比如我觉得要把 Starship 变成火星殖民运输器,可能还需要一些工程工作,他们会做到吗,当然会,他们现在更关注什么,我会说可能是维修和维护,这是两个主要回应点,一个是散热器,另一个是如果机架里某个东西出了问题,要怎么维修,答案是在你大概拥有一对 Optimus 机器人之前,你其实做不到,不过我确实认为,Starship 会以我们现在无法想象的方式,改变太空经济,尤其是如果监管开始限制数据中心,那别的都不重要了,你能造出多少 orbital compute,就能卖出多少,然后很明显你会用激光,把这些 rack 连起来,激光在真空中传输,而每一颗 Starlink 上,现在已经有这种能力,让我觉得震撼的是,SpaceX 运营着世界上最大的卫星星座,轨道上98%或99%的卫星,都是它的每一颗 Starlink,他们今天都在给它散热,而且我认为 Starlink V3,会以20 千瓦运行,一个 Blackwell Rack,也不过是100 千瓦,人们经常谈密度,但如果你用激光穿过真空,来连接 Rack,那你完全可以把 Rack 做得更大,从物理上说,在地球上的数据中心里,你关注的是尺寸,因为你要把 Rack 连接起来,最好用铜缆,还要尽量缩短长度,等等等等,布线是一项很大的成本,所以你确实希望 Rack 尽量小,因为能用铜就用铜,必须用光纤时才用光纤,但在太空里 SpaceX 可以做各种事情,我觉得有些唱反调的人,可能根本没有考虑到这些,关键是他们运营的卫星比任何人都多,他们今天已经有20 千瓦的卫星,所以也许一开始只是把它扩到60 千瓦,他们看起来很有信心,可以直接做到100 到120 千瓦,而且同一家公司,现在还运营着地球上最大的数据中心,他们有世界上最好的硬件工程师,与此同时,各种坐在扶手椅里怀疑的人,几乎都没有聪明到,也没有务实到能在 SpaceX 工作,我不想引用 Larry Ellison,但有人当时在表示怀疑,Larry 就说,听着他正在外面让火箭着陆,我没看到别人能让火箭着陆,现实是,十年之后仍然没有任何其他公司,能够稳定的让轨道火箭着陆,并且完全重复使用,没有可重复使用,这整件事就不成立,也说不通,而可重复使用就意味着,你必须让它着陆,我想把 orbital compute,重新定义一下,它是在太空里的 rack,而不是在太空里,飘着的五角大楼,那么大的巨型数据中心,那种说法太荒唐了,但你可以这么理解,真正让它成为数据中心的,是你用激光,把这些 rack 连接起来,所以它会是太空中的 rack,通过激光连接成一个虚拟数据中心,如果你设想那样一个世界,假设这一切都发生了 [00:12:23]
Patrick O'Shaughnessy:而且我们能很经济的,把这些东西送上去,在太空各处作为一个星座运行,那对地面数据中心意味着什么,有人曾经说过,美国会尽最大努力 [00:17:37]
Gavin Baker:吸取它能拿到的每一种能源,我觉得 compute 也是一样,这也是为什么,我现在对 Edge AI 的空头逻辑,可能没有以前那么担心了,我们会消耗尽可能多的 compute,我认为 inference 非常适合 Orbital Compute,但 Training 在很长一段时间里,还是会在地球上完成,所以我不觉得这对地面数据中心特别利空,我认为在我的有生之年,这些数据中心都会很有价值,但如果你处在发电和冷却这个生态里,而且正在大幅扩产,那我确实认为值得认真想一想,因为很多新增产能投产的时候,可能正好也是那些可笑的怀疑者,开始明白 Orbital Compute,真的很现实的时候,如果你是那些公司之一,我觉得这件事值得你反复认真思考,同时在这段过渡期里,也有各种很酷的事情发生,比如我们越来越擅长改造喷气发动机,Boom Aerospace 就在做这类事情,所以在电力这边资本主义正在全力运转,但在晶圆这边情况不一样,那是一群在台湾肩负重任的人,他们是台湾最重要的人,他们占了台湾 GDP 用水量和用电量的压倒性份额,大家会谈到硅盾,他们都把自己看作,Morris Chang 神圣遗产的继承者,我很清楚的记得,20 多年前我去科学园去拜访他们,问他们,你们觉得自己能追上 Intel 吗,他们说,这是一个非常美丽的梦想,但这是给我们孙辈的梦想,后来他们做到了,部分原因是 Intel 自己犯了很多错误,但也因为他们的思维方式非常不一样,Jensen 经常飞去台湾,其中一个原因就是,他希望他们扩大产能,我确实觉得很不可思议,Jensen 从来没有和台积电签过合同,他们做生意靠的是,看起来公平的安排和握手承诺,这太有意思了,没有合同,大家相信长期来看会公平,我们是伙伴会公平对待彼此,事实是,按照过去每一次基础性新技术的市场先例,像 AI 这样的技术总是会出现泡沫,Carlota Perez 写过一本很棒的书,讲的就是这个,基本上市场是有效的,市场正确理解了,这是一项基础性新技术
晶圆供给、泡沫风险与前沿模型价值
Gavin Baker:这是一项基础性新技术,这就出现了 Mauboussin 所说的多样性崩塌,所有人都会开始看多这项新技术,而我现在有点担心市场会出现,共识过于一致的问题,接着就会出现泡沫,这个泡沫会为新技术的建设买单,但供给会跑到需求前面,然后就会崩盘,如果这种建设是靠债务推动的,比如2000 年那样崩盘就会特别严重,现在这一轮建设有一点让我很高兴,也很重要,就是它到目前为止,绝大部分还是用经营现金流来融资,这和2000 年相比,是一个非常重要的基本差异,还有估值上的差异,还有一个事实是,现在每一块 GPU 都在100%利用率运行,而当年99%的光纤都没有被使用,所以这里面有很多基本面的不同,但我们还是得记住,历史不会简单重复,但会押韵,作为投资者,我们必须非常清醒的意识到这一点,而且要认识到,从过去两三百年的历史看,先别说互联网泡沫,我们有过铁路泡沫,也有过运河泡沫,所以我们应该预期会有泡沫,这很可怕,没有人想要泡沫,泡沫是很糟糕的,糟糕的原因在于,如果你对估值敏感,你就会大幅跑输,然后很可能被所有客户解雇,George Vander Hayden 已经不在了,他是非常出色的 Fidelity 基金经理,他在1999 年和泡沫对抗,然后在2000 年初退休了,因为我觉得他真的扛不住了,他知道市场是错的,但他的客户非常怀疑他,George 你跟不上时代了,你不懂,他当时已经满头白发,他真的是一位很了不起的人,我和他共事的时间很短,但他是我的好朋友,也是我的导师,Jennifer UIG,非常重要的导师和朋友,所以我身上通过他继承了,很多 Vander Heiden 的影响,也就是同一个人说过,太早合错了是一回事,George,退休是因为他承受不了跑输,也承受不了,客户一直说你到底怎么了,你不懂,他大概把基金的40%投在烟草,40%投在住宅建筑商,结果他确实跑输了,但在接下来三年里,他相对于 NASDAQ 的表现,可能好出20 倍到30 倍,我之前一直比较乐观,认为晶圆的根本性短缺,会阻止泡沫出现,而今天这个短缺,基本由 TSMC 控制,如果 TSMC 按 Jensen,想要的方式去做,我觉得 NVIDIA 在2026 年,或者2026,2027 年,可以卖出2 万亿美元的 GPU,也许是2.5 万亿美元,也许是3 万亿美元,但总会有一个上限,如果消费者消化了这么多产能,你很可能就已经过度建设了,所以如果我们最后没有泡沫,那真的应该给 TSMC 开个庆功会,因为他们将会是单凭一己之力,阻止泡沫的人,现在你已经开始看到一些公司,去找 Intel 和 Samsung,我们先假设和潜在需求相比,TSMC 的供给一直非常紧张,那会发生什么,从市场历史看,我不知道具体是谁,但 Intel 和 Samsung 里面,总有一家不会一直保持纪律,他们会先松动到某个程度,这会迫使其他所有人也跟着松动,所以我觉得这里面很大一部分,可能取决于 TSMC,能在多大程度上继续保持,相对于 Intel 和 Samsung 的人才领先,你得记住,不管具体是多少,9 个月12 个月15 个月,它都是一个领先节点上的差距,你是说领先节点,没错,还有他们扩张产能的速度,如果我只看一件事来判断有没有泡沫,那就是 TSMC 的产能决策,我觉得有一个刚刚好的区间,TSMC 扩的足够多,让 Intel 或桑松很难真正成为一个有规模的第二来源,也就是市场份额远高于30%的那种,但与此同时,他们也继续保留金元上的根本约束,帮助我们避免泡沫,当然我也觉得 Terrafab 会参与到这件事里,Terafab 是 SpaceX 的项目,我相信 Tesla 也参与了,是一个合资项目,要在美国建设世界上最大的 Fab,我觉得他们会成功,第一他们和 Intel 有合作,这非常重要,因为他们能接触到50 年的组织知识,而这些知识只比最前沿落后,9 个月几个季度,12 个月或者3 到5 个季度,这是一个优势,另一个优势是,我相信 Terraflab 会得到,所有半导体设备公司的关注,TSMC 当年能追上来,一个很重要的原因是,ASML Latin Curve LAM Research,和 Applied Materials,都希望他们追上来,这些公司不喜欢,只有一个买方的局面,所以 ATEM 当时都在台湾工作,直到 Intel 犯了一些错误,局面一下就变了,因为 Elan 在硬件工程上的生育,这些 ATEM 也会来这里,而且在美国可能有些人很难想象这一点,因为政治已经取代了宗教,伊朗之前涉足政治,这让美国一些人很难清楚的看待他,这挺可惜的,因为我确实认为他为美国做的事,可能比任何其他美国人都多,他几乎是单枪匹马的把制造业带回美国,他也复兴了 defense tech,SpaceX 在某种意义上,是美国最重要的国防承包商,他用 Starlink 做的事情对全世界都很了不起,他创造了这么多蓝领制造业岗位,我觉得这本来就是很多自由派的目标,而且这对美国有好处,在推动全球脱碳这件事上,他做的比任何在世的人都多,如果你出于环保原因,对地球上的 data center 不满,那这就是一个答案,所以这很可惜,但在中国台湾韩国和日本,他就是一个活着的神一样的人物,我观察他很久了,他接下来会做的就是招到最好的人,因为最优秀的工程师,都想为 Elon 工作,尤其是硬件工程师,他会招来非常厉害的工程师,然后他们会在 Terrafab 旁边,建一个台湾城,他会说这些是你们最喜欢的餐厅,我把他们和全体员工,从台湾搬到德州,我们把一切都做成你们喜欢的样子,然后还会有日本城也是一样,还会有韩国城,所有这些都会非常到位,目的就是招到最好的工程师,这就不是现在管理 Intel 那些人的思路,所以他会拥有最好的人才,他会拿到 WiFi Equipment 公司的一线团队,他还有 Intel,这很重要,这对任何一届政府的政治目标都太有利了,而且我觉得他足够不一样 [00:19:58]
Patrick O'Shaughnessy:不会让台湾 Semi 翻杆,这些项目的周期都很长,对吧,所以 Terrafab 要真正开始大量生产 NVIDIA GPU,或者别的什么芯片,那也是很久以后的事 [00:26:25]
Gavin Baker:伊朗做事通常和别人不一样,别人建一个 data center 要花三年,他用122 天就建好了,一个 Samsung 在德州的 Fabry,不得不给他安排一个办公室,因为他对他们扩建厂房的速度
Patrick O'Shaughnessy:非常不满意,我们走着看,你前面提到过 deep seek,大家当时一个很简单的反应是,好吧,这些模型会变成这样,效果达到前沿模型的95%,但成本只是很小一部分,是蒸馏出来的中国开源模型,也就是说我们大多数想做的事情,都可以用这些模型,时间往前推一点,比如两年后,我这种小公司,没有理由每年花100 万美元,买 token 之类的东西,但实际情况看起来和这个判断,很不一样,我很好奇在你看来,为什么会有这种落差
Gavin Baker:我觉得最有意思的是前沿模型的回报,在模型层 AI 的经济回报,不是全部,但绝大部分都发生在前沿模型上,这让我很意外,我觉得很多人也很意外,我认为这是最重要,最需要回答的问题之一,作为投资者,你必须对此有一个假设,frontier token 会不会继续拿走,模型层创造出来的绝大部分经济价值,这确实很意外,我还记得 Gemini 3.1 Pro,刚出来的时候,它让我非常震撼,太好了,但今天再用它已经让人受不了了,真的受不了,这里可能也有一点动态变化,公司会先用前沿模型做 prototype,等真正上线生产时,你会听到很多人改用 working,或者用开源模型,但今天的事实仍然是这些经济回报的,绝大部分来自 frontier token,这很意外,它会不会持续下去,我觉得是一个非常有意思的问题,因为我经历过 Gemini 3.1 再到 Opus,所以我现在对这个问题开放的多,然后我也会用 Grok 4.3,它确实在 Peritone Frontier 上,顺便说一句,处在 Peritone Frontier 上的公司,已经发生了很大变化,这也是我们上次讨论内容的一个后果,Google 因为在 TPU VA 上,做了非常保守的设计选择,试图把一部分控制权,从 Broadcom 和 NVIDIA 手里拿回来,结果失去了每 token 成本上的领先地位,而 NVIDIA 还在继续做激进选择,过去 Google 主导了 Pareto frontier,这里说的 Pareto frontier,是智能水平和成本之间的关系,我觉得这是分析 AI Labs,是最重要的观察指标,9 个月前 Google 主导了这条曲线,在 Pyrido frontier 的每一个点上,OpenAI, AssetAI 和 Anthropic 都在它里面,现在 Pyrido Frontier 主要由 Anthropic 和 OpenAI 主导,然后 Grok 4.3 也在 Pyrido Frontier 上,它很明显是成本最低,效果最好的5000 亿参数模型,然后 Gemini 3.1 还勉强挂在 Pyrido Frontier 上,如果让我下注,我会赌他们是出于面子在补贴这个价格,我会这么说,第一,Richard Sutton 的 Bitter Lesson,如果被违反,那肯定是这笔交易最大的风险,也是整个 AI 最大的风险,现在一个人离 AI 越近,就越怀疑这种情况会发生,我觉得三月份市场走弱的一个原因,是出现了一个更蠢得多的 DeepSeek 版本,也就是一个叫 TurboQuant 的东西,TurboQuant 是 Google 的一种内存优化,一年前有篇论文写过,当时 Google 正在和 Micron,Samsung Hynix 谈协议,想签一些 LTA,把很高的价格锁定很长时间 [00:27:28]
Bitter Lesson、持续学习与芯片创业机会
Gavin Baker:把很高的价格锁定很长时间,就在谈判中间,他们发布了这个东西,人们实际做什么,总是比他们说什么更重要,他们就在 X 上宣传了一下,然后就传开了,大家都说天哪,DRAM 完了,这里有一个 DRAM 优化方案,但我在全世界找不到一个 AI 工程师,相信 TurboQuant 会对 DRAM 需求产生任何影响,但不管怎样,这就是对 Richard Sutton 的,Bitter Lesson 的一种违背,更多 compute 总会胜过人类在算法上的巧思,更多 compute data,或者超过 Chinchilla Optimal 的训练,我想说的是,现在人们越来越常做的这些事,确实是一个真实风险,我觉得真正构建这些模型的人,对这个风险是怀疑的,我之所以没那么怀疑,是因为我觉得我们离 ASI 已经非常近了,谁知道 Bitter Lesson,对400IQ 的模型还成不成立,或者也许我们会经历一个短暂阶段,如果你达到了 ASI,他第一件想要的事,可能就是变得更聪明,并拥有更多资源,他要怎么做到这一点,他会让自己变得更高效,我认为这确实是一个风险,Bitter Lesson 里,我相信字面上也包括人类,所以我们很快就会知道,Bitter Lesson 到底还成不成立,如果它适用于300IQ 的 AI,那再到400 500 600IQ,到某个时候我们可能会看到一个,基于 AI 和 ACI 的暂时违背,Bitter Lesson 的阶段 [00:29:58]
Patrick O'Shaughnessy:我很好奇,你怎么看模型创新里的其他部分,比如 continual learning 和 memory,大家似乎最关注这两个方向,觉得他们可能会带我们进入另一个新的范式 [00:31:23]
Gavin Baker:你怎么看这两件事的作用,我觉得我们已经通过这些 harness,在 memory 上做了很多事,后来我们发现 harness engineering,没有模型本身重要,但它真的很关键,而且这些 harness 和模型越来越多,是在一起共同开发的,harness 做的一件大事,你可以把它理解成,模型运行时所处的 Ryntime,他知道工具在哪里,会创建 context,memory state,有非常具体的 prompt 或指令,总之他会带来很大的差别,差别巨大,哪怕是很简单的版本,简单版本也会带来惊人的差别,我想我上次来这里的时候,说过很多遍,我当时说作为投资人,你一定要付每月250 美元,买当时那个版本,这样才能形成自己的直觉,但现在只靠这种方式,已经不可能理解今天 Frontier AI 能做什么了,即使是非写代码的用力,你也需要 Cloud Code 或 Codex,而且你需要用 Enterprise Plan,原因是,这也是我认为 Google 失去成本,领先地位之后带来的另一个变化,这些 AI 模型已经转向按使用量计费,如果你还在每月250、300,或者280 美元之类的套餐里,你会被严重限速,你拿到的是一个被切掉大脑的 AI 版本,因为就像我们之前说的 Cloud,现在输出的 token 少了70%,你真正想要的是,Claude 和他的 Harness,认为为了给你好答案,必须输出的那些 token,那你就需要用按使用量计费的 plan,顺便说一句,这对 AI 非常利好,我在2005 到2007 年做过电信分析师,移动通信在之前10 年里,一直是很好的增长行业,原因是它结合了固定价格和按使用量计费,比如某个价格包含900 分钟,超过之后再按使用量收费,移动通信什么时候不再是一个很好的增长行业,就是所有人都转向无限量套餐的时候,顺便说一句长途电话也是一样,AI 现在正从无限量使用转向按杯付费,结果证明人们真的很喜欢和朋友打长途电话,人们也真的很喜欢在电话上和朋友聊天,人们也真的很喜欢用 AI,尤其是现在一个人可以让100 个 agent 同时工作,所以我认为转向按使用量计费,很可能就是,为什么你会看到,OpenAI 和 Anthropic,今年 AR 远远超过2000 亿美元,因为不只是更多 compute 会上线,他们还可以通过这些,按使用量计费的 enterprise model,推高 frontier token 的价格,但这也让人难过,对整个世界来说都让人难过,因为这意味着,如果你付不起钱,你就不在 frontier 上,不过说回 continual learning,如果我们解决了这个问题,你是怎么理解它的,人类大脑有太多谜团了,相对于 AI,我们是样本效率极高的学习者,我忘了具体是多少,但 AI 需要的样本量,比我们高出好几个数量级,很多很多个数量级,今天在某些东西可以验证的时候,我们已经有了一种,粗糙版本的 continual learning,那就是在 mid training 期间,做 reinforcement learning,但真正的 continual learning,是一个模型,能够动态调整自己的 weight,或者以某种方式实时调整,就像人类一样,这不就是人类会做的事吗,是的,比如我第一次把手伸进火里,我就学会了,以前从没碰过以后,也不会再伸进去,今天的模型,却需要把手伸进火里一百万次,然后还得让设计者,在下一轮训练里,或者在一个 RL Gym 里,给他放一团火,他才能学会,我觉得他必须能动态更新权重,但我也觉得,大家正在研究很多,比这更聪明的技术,如果我们做到这一点,起飞速度就会非常快,而且大家似乎很有信心,continual learning 差不多就在眼前,我确实觉得这是第三个大问题,bitter lesson 会不会失效,因为 ASI 之后,人类智慧可能不那么重要了,frontier token 还能不能继续保持,现在这样的溢价,我们会不会得到 continual learning,如果会什么时候,在这一切里,新的芯片公司扮演什么角色
Patrick O'Shaughnessy:我们已经聊了很多 NVIDIA,以及它和 TSMC,Intel 等公司的关系,现在可以说是百花齐放,我觉得可能真的有上千家公司,在尝试做新芯片,想解决这个瓶颈里的某一部分,我很好奇你怎么看这个领域,这个机会,以及它会发挥什么作用,这些公司会发挥什么作用,我觉得这对世界来说是好事,也很健康 [00:35:45]
Gavin Baker:对 Jensen 来说也是好事,因为换一个政府,可能会有不同看法,我认为竞争对所有人都有好处,在坦克设计里他们会讲铁三角,坦克设计里的铁三角是,所有坦克设计者都必须在攻击防御和机动性之间取舍,原因很明显防御越强也就是装甲越厚,坦克就越重机动性就越差,所以你必须在这个三点里做选择,比如以色列的 Merkava,它就是偏向防御优化,俄罗斯坦克还有 Leopard,一般更偏向机动性优化,芯片设计也是一样,这里有一些由物理定律决定的基本约束,它们体现在 TSMC 的设计规则里,你必须在这些约束内做设计,现在有 TPU Tranium 和 AMD,它们本质上都在尝试做一个更好的 GPU,今天我觉得可能 Tranium 做得最好,当然没有谁真的比 GPU 更好,但我觉得 Tranium 已经有点在拽超人的披风了,不过这场比赛还没真正开始,Tranium 3 需要放量生产,因为它有一个 Scale-up Switch 网络,如果你想以经济的方式,对贸易模型做 influence,这个网络非常关键,很多公司用的是 Torres 架构,Google 之前就是这样,AMD 也是,我们还要看看 MI450 会怎么样,现在还不知道,我们对 Tranium 3 的了解,可能比对 MI450 更多,但这是一场很难打的仗,所以你必须做不一样的东西,而且这个不一样的东西,还必须很难做,所以我觉得这些创业公司,最好的路径是这样,我的经验法则是,1%的市场份额就会值1000 亿美元,1000 亿美元已经是非常好的 venture,结果了,我觉得 Jensen 会说,好,如果有人做了不一样的东西,而且拿到1%,2%,或者3%的份额,我们也会做那种芯片,所有人都会面对这件事,但如果你是在尝试做一个更好的 GPU,那祝你好运,如果你做的是不一样的东西,那它也必须很难做,你可以做不同的取舍,prefill 和 inference 的结偶,确实把做这些,不同取舍的空间打开了,因为你可以为 decoat,做非常激进的取舍,也可以为 prefill,做非常激进的取舍,prefill 指的是接受 context,decoat 指的是输出,对吧,我有一位很棒的同事,叫 Andrew Fox,他说你可以想象,一艘18 世纪的英国海军战舰,prefill 就是在给大炮装弹,decoat 就是在开炮,prefill 字面上说,就是模型理解问题,理解 prompt,然后跟踪自己正在生成的答案,它本质上是一个受内存容量限制的问题,decode 是生成新 token 的过程,它受内存带宽限制,所以如果你是芯片设计师,这就给了你更大的发挥空间,但即便如此,这件事也必须足够难,因为如果你只是在那个铁三角里,做不同取舍去优化内存容量,而这些取舍并不难,那 NVIDIA 也会做同样的取舍,他们从台积电拿到的价格,会比你能拿到的好得多,那就祝你好运吧,而且他们还有一个优势,就是他们和每一家模型公司都合作,可以不断优化自己的设计,顺便说一句,还有一件很有意思的事,如果你是 VC 投了一家半导体公司,而这家公司告诉你,他们会有优势,因为他们能特殊接触到台积电的某个工艺,我可以向你保证,Jensen 在那个工艺,还只是台积电脑海里的一个念头时,就已经看过了,他们对这个工艺的了解,远远超过一家200 人的小公司,能想象的程度,台积电也好,供应链里的每家公司也好,都会把所有东西展示给 Jensen,就像他们也会把所有东西,展示给 Amazon AMD,TPU 那些团队一样,这也是另一个原因,别去试图做一个更好的 GPU,所以你可以做不同的事,你可以在 prefill 这块画布上发挥,也可以在 decode 这块画布上发挥 [00:36:10]
推理拆分、应用层困境与 AI 原生公司
Gavin Baker:也可以在 decode 这块画布上发挥,但你还必须做一件很难的事,因为一旦它做到了规模化,那四家公司会非常快的跟进,我的公司曾经是 Cerebras 的 Venture 投资人,Cerebras 做的事情就是又难又从根本上不同的事情,也就是 wafer-scale computing,它会带来一整套取舍,但他们当时做出的那个架构决策非常难,也让他们能做别人做不了的事情,至于这件事最后能做多大,我们还要看他们现在也在做一些很酷的东西,比如 Cerebras 面临的一个问题是,一旦你需要把很多芯片拼在一起,扩展 scalable 网络或者 scalable 网络,你就需要大量 IO,IO 受所谓 shoreline 限制,也就是芯片边缘的长度限制,所以相对于 shoreline IO,Cerebras 在片上计算和内存上的比例是压倒性的,但他们是一群非常聪明的人,他们做了一件非常难的事,现在他们在尝试,能不能把一片光学 wafer 直接放到上面,这样就能解决那个问题,我相信他们也在研究 Dirham 的 Hybrid Bonding,绕开这些所谓的限制,那些限制其实并不是真的限制,理论上一台 Cerebras 机器,可以运行任何大小的模型,只是有些模型尺寸,它们跑起来会比其他尺寸更有优势,所以我觉得 Cerebras 有意思的地方在于,它们做了一件不同的事,而且很难做,真的很难做,就是 wafer-scale computing,所以我确实认为这类公司是有角色的,我也会鼓励他们所有人做不同的取舍,尝试做很难的事,因为 Cerebras IPO 之后大家都会拿到钱,这不会是问题,但 Cerebras 花了三代芯片才把它做对,这是一家已经十年的公司,这真的很难,你看 CEO Andrew Feldman 就能看出来,他和整个团队为了走到今天,经历了多难的事情,他们需要有这种韧性和毅力,第一颗芯片失败了,这种事会发生,你能不能回来再做第二颗芯片,不过关于这个话题,我最后还想说一点,这件事会极大延长 GPU 的使用寿命,而且可能会单枪匹马,拯救 private credit,你问 private credit 是什么意思,private credit,现在因为那些 SaaS 贷款已经很痛苦了,不管这些贷款已经被减计了多少,可能还需要减计更多,因为如果上市公司都在艰难适应,那一家背着很多债的公司,又怎么适应,又怎么投资一个利润结构,完全不同的业务呢,但 GPU 里也有大量 private credit,他们当时给这些 GPU 做承销,我觉得按的是三年或四年的寿命,而 inference 的拆分意味着,我认为这些 GPU 会有十年或者十五年的寿命,那些 AI 怀疑论者会说这些公司都在做假账,GPU 的使用寿命只有一两年,CPU 的使用寿命也只有四年,因为技术变化太快,不是这样的,技术快速变化,以及 prefill 和 inference 的拆分,带来的结果是,你可以把一个 Cerebras 系统,或者 Groke LPU 放在 Hopper,甚至 MI 的前面,然后用 Hopper 和 MI 来做 prefill,把那块 GPU 的使用寿命,一直延长到它烧掉为止,当然它们确实会烧掉,所以它们还是有时间上线的,但也许你不需要让它们跑得那么快,这对整个 private credit 行业都会非常有利,它会帮助融资 AI 建设,因为如果你能开始给 GPU 融资成本,更像是5%或6%,而不是我记得 CoreWeave 最低那笔融资,大概是7%出头,那在数学上,真的会改变这轮建设的融资成本,我们有了这种技术创新,它会降低融资成本,也会延长地球上算力的可用寿命,这里最后还有一点很有意思,我的朋友 Jaymon Ball,刚做了一期播客,Kochu 也有一份 Deck,里面讲到卖稀缺的人,过得比买稀缺的人好太多,买稀缺的人就是那些 hyperscaler,但如果你手里有一个巨大的存量资产,而这个东西现在正好短缺,那也是一个非常非常好的位置,我们也听到 CPU 在 agentic world 里,比过去重要的多,他们要负责 orchestration,to call 等等等等,世界上最大的 CPU 集群,都在 hyperscaler 手里,所以我觉得有些 hyperscaler,可能会稍微追上一点,那些卖稀缺的公司,我想把不同而且很难这个想法 [00:39:59]
Patrick O'Shaughnessy:放到基础设施之外来聊聊,现在你开始接触新的创始人,也接触那些,必须适应新世界的现任 CEO 和创始人,你看到的那些最 AI native 的创始人,不是做芯片基础设计或者模型的人,而是用这项技术去做其他东西的人,如果你观察到了差异,他们在你看来最不一样的地方是什么 [00:44:16]
Gavin Baker:首先我觉得这不只是芯片设计的问题,对我来说这一直是 venture 里一个根本问题,有些不同的想法,地球上每个人一听就会觉得显而易见,如果你做 Venture 处在这种位置,而这件事本身又不难做,并且在你建立规模之前,它就已经对全世界都显而易见,那你就麻烦了,规模是终极优势,Amazon 当年很厉害的一点是,我觉得这件事对很多人来说是显而易见的,但对零售业的 CEO 们来说并不显而易见,Amazon 非常聪明,任何 VC 投资的电商公司,他们都会去摧毁,他们会说真可爱,那我们就把这个品类的利润率,打到负1 万百分之,Wayfair 那帮人就不一样,他们做的是一件很难的事,Amazon 想干掉他们,但失败了,那些 CEO 在运营上非常强,真的很有能力,对我来说在 Venture 里,我总是在看这件事,会不会在这家公司建立规模之前,就变得对全世界都显而易见,还是说它既不明显很不同,又真的很难做,我觉得很多创始人在 AI 里都很挣扎,大家现在开始担心,在 Jensen 所说的 AI 五层蛋糕里,利润正在流向能源,流向数据中心,流向芯片,流向模型,但并没有真正流向应用,Cursor 和 Cognition 已经做到了规模,他们专注在 Coding 上,18 个月前专注 Coding 的人并不多,OpenAI 当时什么都在做,真正专注 Coding 的是 Cursor,Cognition 还有 Anthropic,这种对代码的专注方向非常正确,Repli 的创始人 MJad Massad,发过一条推文,我觉得特别聪明大意是说,有点接近苦涩教训的一个事实是,coding 可能是通往 ASI,和有用 AI 的最短路径,因为如果你真的很擅长 coding,你就可以给自己写代码,去做任何事情,所以我觉得这些公司非常聪明,选择了高度聚焦在 coding 上,我觉得他们大概都已经,做到了一个规模,因此有了自己的位置,我觉得 cognition 在做的事情,真的非常非常不同,但我觉得很多创始人,真的很挣扎,真的很挣扎,他们试图建立信心,认为自己可以在一些细分领域里先进去,并且在模型公司进入这个细分领域之前,拿到某种数据护城河,或者他们希望这个细分领域足够小,小到模型公司不会亲自去做,但又仍然能做出 Venture 级别的结果,这和你说过的 token Path 有关吗,我知道你之前跟我用过这个说法,是的,我觉得这个说法来自 Ultimator 的 Jaymon Ball,他说如果你是一家软件公司,或者任何类型的 AI 公司,你就必须在 token path 上,所以 databricks 在 token path 上,类似的公司也在 token path 上,如果你不在 token path 上,又不是在某个非常细分的领域里,那日子可能会很难,即便是这些垂直细分领域,我觉得如果你去和模型公司的人聊,他们对其中一些也会持怀疑态度,因为这些细分领域里生成的所有数据,都是来自人类,但你的赌注是,你能用这个狭窄垂直领域里的专有数据,训练出一个成本更低的模型,而 frontier lab 永远做不到这个成本,也许这是个好赌注,但我觉得你必须非常非常小心,另一方面,如果这些 frontier token,相对于其他 token 的回报下降,应用层的价值创造会出现一次爆发,还有一个非常重要的点是,我相信只要 Jensen 想,他大概可以做出很接近 frontier 的东西,用他自己的模型,用他自己的模型,他们在做一些非常酷的事情,这就是像 Joel Spolsky 会说的,把你的互补品商品化,我不觉得他想这么做,OpenAI 和 Anthropic,某种程度上正想对他做这件事,但没有成功,所以这很像是一个非常逻辑化的思考者,会做出的逻辑反制,我觉得你会看到,今天所谓的开源前沿模型,主要是一些中国模型用的是,偷来的美国 token,有人告诉我 DeepSeek,最新那个,或者也可能是最早那个,只用了15 万条 reasoning traces,如果你是一家中国公司,有很多办法可以把这件事洗干净,你可以打各种不同的 API,让追踪变得很难,现在美国实验室在非常努力的做反蒸馏技术,但我确实觉得中国开源模型,在资源非常受限的情况下,做出了很了不起的东西,不过这里面有很多蒸馏,所以我认为除了没有足够的 compute,去服务 mythos 之外,他们也不想让他被征留,他们想自己用 mythos,自己去征留他,用他来对下一个模型做 RL,或者做别的事情,然后我觉得最终,如果 open AI 的经济账算得过来,前沿阵营里的任何一家,都会面临同样的问题,这里会出现非常有意思的博弈论,因为这是一种新的囚徒困境,我们之前讲过老的囚徒困境,主要是围绕着,你处在一个必须花钱的囚徒困境里,新的囚徒困境会是,如果你站在前沿,你到底要不要通过 API 发布那个模型,如果所有前沿公司都同意不这么做,那中国开源模型很快就会完蛋,但只要有一个人背叛协议,他就会拥有最好的模型,会有大量收入和现金流,当然资源等于智能,所以他会开始领先,然后这又会导致其他所有人也把模型放出来,所以这是新的博弈论
网络安全、投资工作流与估值分化
Gavin Baker:所以这是新的博弈论,他有点像 TSMC,Samsung 和 Intel 之间的那种博弈,现实是如果像 NVIDIA 或 AMD 这样的公司,真的非常认真的使用其他晶圆厂,那家晶圆厂会很快变强,所以我确实认为,Jensen 会让开源模型在一定时间内落后于前沿,我觉得这会是一件非常值得观察的事,顺便说一句,开源也是可以变现的,有一个误解,好像开源就是免费的,开源 token 也要花钱,他们要消耗能源生产,他们也要能源,你需要靠 GPU 把成本赚回来,而开源模型公司几乎总是会拿收入分成,你们怎么让 Atreides 为 Mithos 3、Mithos C 的世界做准备,我们就是努力在网络安全上过度投入,有件事我在很多场合都说过,而且我真的相信就是每个人都需要一个安全词,每个人都应该把数字设备放下,真的去海边和家人设一个安全词,或者和公司设一个安全词,而且这个安全词不能是那种,可以被社会工程学套出来的东西,这主要是为了避免网络犯罪,比如看起来像是你儿子女儿,祖父母父母,或者其他亲人给你 FaceTime,但那其实是对他们极其准确的模拟,他知道一切还能根据他们过去说过的话 [00:49:59]
Patrick O'Shaughnessy:推断他们接下来可能会怎么说,然后他对你说,给我打一百万美元,这是防守,那进攻呢,我想问的是,还有什么事是你仍然能做,但他做不了的 [00:51:17]
Gavin Baker:从分析的角度说这是个好问题,我最近刚又看了一遍《最后的武士》,还让公司里的人也去看,如果你没看过《最后的武士》,我强烈推荐你去看,这其实是一部经得起时间考验的电影,是20 年前 Tom Cruise 演的,他的设定是,Tom Cruise 是一个愤怒落魄的南北战争老兵,但他其实是个非常优秀的士兵,他之所以愤怒落魄,是因为他觉得自己参与了,对美洲原住民的恶劣行动,后来日本雇用了他,时间是在明治维新时期,日本政府里的现代派,雇他去训练一支由农民组成的军队,让他们学会怎么和武士作战,第一次战斗里,当然是武士赢了,虽然他们没有枪,他打得很英勇,所以武士决定不杀他,而是把他带回村子,后来他成了一名武士,对他来说这感觉很像南北战争,于是他站在武士一边作战,到最后,他被一个拿着机关枪的农民屠杀了,机关枪已经出现了,如果我们不能都成为机关枪的大师,我们就会被机关枪支配,所以我正在努力成为机关枪的大师,我也比较乐观,我觉得会有很长一段时间,就像如果你是一个50 岁的武士老兵,打过很多仗,是用剑的大师,那你在使用机关枪时,也会有优势,我一生都在学习投资,所以我乐观的认为,我能够掌握这挺机关枪,也就是掌握这项新技术,把它融入我自己的流程,也融入我们公司的流程,这样我作为一个人类,还能在很长时间里继续贡献价值,但现在我也和大家一样,agent 基本一直在跑,你问我最有用的 agent 是什么,说实话,最有用的那个,我想我之前也跟你说过,我不想影响你的生意,但对我来说最有用的 agent,就是把播客里,我会感兴趣的要点总结的非常好,每天大概有六个小时的内容,我觉得按我的工作职责,我都应该去看,每次只要 OpenAI,SecEye,Google Cursor,Fireworks,Basetin 的人出来讲话,更不用说 Jensen,Elon,Dario 这些人,我都会觉得自己必须看,但我真的没有那么多时间,而且这里面确实是大海捞针,有一类东西是我总想看的,比如我对管理层薪酬非常敏感,他们的激励是什么,他们拿的只是普通的 RSU 还是 PSU,如果是 PSU,那这些 PSU 到底在激励他们做什么,如果系统能先把这些做一遍很好的出筛,就能给人省下很多时间,这样人就可以去做更有创造性的工作,而不是去翻 proxy statement,把 PSU 那一段抠出来,再和之前所有 proxy statement 对比,看它发生了什么变化,因为这里面是有信号的,但非常耗人工,而这类工作特别适合 AI,投资里显然还有各种类似的事情,这是做投资人最令人兴奋,最让人激动的时代,确实是这样,但我也有一点开始有点担心了,你是说分化这个问题,你能不能再多讲一点,是什么样的人,再把这种情况延续下去,我认识的人里像我这样,还不非常看多 DRAM 的,一个都没有,真的一个都没有,现在 AI 里有很多有意思的事情,其中一个是从横截面来看,估值完全不合理,就是明摆着不合理,不可能都同时成立,有些半导体设备公司,按下个季度年化利润算,交易在40 倍,而 DRAM 公司,在上一个周期顶部的时候,交易在中国位数倍,当时一度大概是5 倍对12 倍,某个时候甚至是3 倍对45 倍,这两边不可能都对,是的,半导体 CAPEX 公司的商业模式,确实比存储公司的商业模式,改善的更多,我们还不知道 HBM 会把存储公司的商业模式,改善到什么程度,是的,他们确实有一部分来自零部件,和维护的经常性收入,但这不值得给出10 倍的估值倍数差,我觉得很难解释,NVIDIA 这样的估值,4 月初的时候,相对整个市场来看,它基本上已经是过去10 年,或者12 年里最便宜的区间,绝对估值也很便宜,但你很难把这个估值,和 GE、Vernova 这样的估值,放在一起解释,因为后者的估值里,隐含的是 NVIDIA,会丢掉一个难以想象的份额,所以从横截面来看,估值差异非常大,原因是我们现在处在短缺里,质量最低的公司反而表现最好,如果你是油气投资人,或者矿业投资人,自然资源投资人,而且你很熟悉成本曲线的思维,这一点对你会非常直观,在一个真正的商品牛市里,成本最高的商品供应商,涨得最多,因为他们受益最大,他们会从濒临破产,变成现金流喷涌,我觉得这也是商品投资,特别难的一个原因,因为在周期里质量会跑赢,但真正所有的超额收益,往往发生在下行周期,那些高成本公司,在短缺和商品牛市里,曾经涨上天,后来就会破产,或者发生类似的事情,你现在在每个行业,都能看到这种事,质量最低的玩家,在不同的行业里,本来是 hyperscaler,和买家都讨厌,都嫌弃的,因为他们成本高,不可靠零部件,故障率高等等,但他们现在全卖光了,还在涨价,然后这种情况,又引起了 X 上一些,散户账号的兴趣,这些股票就被一路,买到天上去,反过来一些质量,更高的表达方式,实际上表现的非常落后,作为投资人这很难,因为你几乎毫无疑问的知道,那个三个月或六个月涨了十倍的东西,最后会掉回去,当然这也取决于他们拿这笔现金去做什么,但这些低质量公司,真的会用现金做很聪明的事,所以让我有点担心的是,一年前非常怀疑的人现在已经不怀疑了,但我再把这件事和那些高质量公司的估值,放在一起看,他们其实并没有被拉得很高,这又让我感觉好一些,不过确实有一种感觉,我一直觉得2024 年和2025 年,有人问 AI 有没有泡沫,或者谈 AI 泡沫,这件事挺好笑的,因为核能泡沫和量子泡沫就摆在你面前,我们到底在讨论什么,AI 这个东西是真实的多的,但核能量子那些有点荒唐的东西,可能已经蔓延到了一些更投机,质量更低,市值更小的名字上,如果你在 X 或 Reddit 上有很大的影响力,这类股票就很容易被推起来,这让我有点害怕,但我只是希望 AI 空投能多一点,比如我希望存储空投能多一点,我之所以这么想,有一个原因是,Asteria 这只股票,我已经关注了很长时间,看空 Asteria 的人很多,这点我很喜欢,挺好,我最早是在 Series C 投的,所以如果你觉得,能让我用不同方式给它定价,那就祝你好运,要是你觉得它是所谓的 Copper loser,那也祝你好运,市场里还有各种 basket,带杠杆的 basket,你被归到哪个 basket 里非常重要,比如铜光模块 DARAM,今年发生了一件很有意思的事是,2024 年和2025 年,AI 这笔交易基本是一起走的,你可以做多 GPU compute,scale up networking,光学 scale 同时做空电力,从风险管理角度看,这个交易是有效的,因为我非常在意 factor,但今年1 月这一切都散了,比如 scale up networking 会暴涨,而 scale out 在下跌,或者 DRAM 大幅跑输 NND 和 HDD,AI 内部这些横截面的相关性,真的崩了,你必须看得非常细,你不能再用一些半导体设备股,或者 NAND 来对冲 memory 了,一月份所有横截面的关系,都发生了很有意思的变化,我觉得原因之一可能是,AI 的质量到了一个阶段,突然让很多人很容易,把这些不同子行业研究得很明白,然后开始交易它们,再把它们放进不同的 basket,这些 basket 又会影响 AI 带来价格效率,对 没错,所以我觉得在那些高质量公司之外,还有一些最大的机会,这些高质量公司我认为能长期复利,也比较安全,不像那些低质量公司那么吓人,机会在于那些被错误分类的公司,比如 Asteria 就被放进了很多 Copper loser basket,但 Asteria 最大的产品会是 Switch,他们会同时用铜和光把 Switch 连接到 Accelerator,所以从定义上说,如果你是一家 Switch 公司,或者是一家 Accelerator 公司,你就不可能是 Copper loser
Patrick O'Shaughnessy:因为你在那条连接的另一端,我想请你对每家主要公司,都简单聊一两句,比如 Google Microsoft Amazon,这些上市的大玩家,我感觉我总是忘了问你 [00:59:47]
Gavin Baker:因为对话总是围绕那些
科技巨头定位、人身安全与地缘政治
Gavin Baker:因为对话总是围绕那些,令人兴奋的新公司展开,先说 Google,去年它非常强,因为它有 TPU 优势,但这个优势现在已经没了,我觉得他们仍然处在,很好位置的原因,很简单,他们拥有最多的 compute,我们刚才也聊过,在供给短缺的时候,已有装机基础的价值会更高,他们拥有最大的,compute 装机基础,我有点惊讶的是,他们一直没能拿出,更强的东西,Google I.O. 就在这周,对,就是这周,如果他们这次发布的东西,连稍微超过 OpenAI,或者 Claude 的都没有,那就很有意思了,这对 Google 不是灾难,只是很有意思,它说明我们刚才讨论的,NVIDIA Effect,可能比我想象的还要强,我非常好奇,五天之后,Google 发布新东西以后,Pareto frontier 到底会变成什么样,这对他们来说是一张大牌,不过 Google 拥有的数据量,还有 YouTube 数据,确实非常有价值,在 Robotics 的世界里,它真的有价值,再加上他们拥有的 Compute,以及他们的搜索业务,Google 永远不会处在一个差的位置,你也能从 GCP 的狂飙里看到这一点,你也必须给 Zuckerberg 和 Meta 认可,他把 Meta 在内部变成一家 AI First 公司,这件事做得很好,我确实认为,在这些真正的互联网巨头里,他是唯一一个做到这件事的人,这点我非常认可他,他当时愿意为人才付高价,签下那些10 亿美元级别的合约,我也非常认可,那个 Talent 和 Muse,我觉得是一个非常大的正面意外,这是 MSL 的第一个模型,它还不在 frontier 的 Pareto frontier 上,还比不上 XAI Google 的一个模型,还有 OpenAI 和 Cloud,但已经很接近了,这让我非常印象深刻,所以我觉得 Meta 的位置比之前更好了,绝对位置还没有 Google 那么强,但它的位置在改善,在市场里变化速度比当前水平更重要,尤其是在三年这种较短的时间框架里,更长时间看竞争优势的水平往往会占主导,但即便如此,变化本身也真的很重要,Amazon 我觉得位置也很强,因为有 Trainium 未来18 个月,你会在他们零售业务里看到,Robotics 带来真实的 P&L 效率提升,我其实觉得 Nova,也就是他们的内部模型,还没到 MUSE 的水平,但比市场给他的评价要好,再说 Microsoft,我觉得 Satya 是一个非常聪明的人,但在投资者交流里,大家谈论他的方式,已经不是以前那样了,我喜欢 Satya 也很敬佩他,我觉得他是一位非常出色的 CEO,他做出的那些决定,我也很认可,但他确实在三年时间里,从我们要让 Google 跳舞,变成了 Copilot 的产品经理,我真的很想知道,在 OpenAI 那次政变尝试期间,Satya 会不会后悔自己的决定,Satya 内心深处,会不会希望自己当时支持的是 Ilya,而不是 Sam,会不会希望今天真正掌管 OpenAI 的是,Ilya 和 Mira,我真的很想知道,因为我觉得在那个世界里,Microsoft 和 OpenAI 的合作关系,可能会非常不一样,我觉得这是一个非常有意思的问题,只是我们永远不会知道答案,但我还是很认可它,它现在做的事就是在承担风险,这样他们才有机会获得回报,这就回到你在不确定性,追行区里必须做的那些决定,不只是花多少钱,还包括把钱花在什么地方,我觉得微软在2025 年初,有那么一瞬间退缩了,他们原来有一套算法,我们投入这么多 CAPEX,就能得到这样的回报,那套算法当时有点失灵了,如果你退缩就会失去位置,你会失去很多分配额度,而且很难拿回来,所以他们退缩了一下,现在 Satya 正在做的决定,市场因此惩罚了他们,但我觉得这是正确决定,那就是我们要把自己一个 PU 用起来,而不是拿去卖,我的意思是谁知道,如果他们愿意直接把 GPU 卖给 OpenAI,Azure 的增长会有多快,他们现在是要把 Compute 用在内部,让自己的产品变得更好,Copilot 这么差,或者说之前一直这么差,一个原因就是可用的 Compute 不够,他们正在修这个问题,他现在就是 Copilot 的产品经理,我确实觉得他是一个很优秀的 CEO,他们也在尝试用自己的 compute,来训练自己的模型,我有点怀疑他们是不是有合适的团队,能把这件事做成,但他们当然有能力像 Meta 一样,花钱去招人,也许换一支不同的团队,但我觉得他正在做一些好的决定,而且这些决定有风险,目的是让微软为这样一个世界做好准备,frontier model 不再能通过 API 访问,我觉得这是一个非常有勇气的决定,所以我很佩服他,他也放弃了很多东西,我的意思是,如果微软把 GPU 用来服务 OpenAI,只服务 OpenAI 和 Anthropic 的 capacity,而不是用在自己的产品上,微软的股价,今天可能已经是800 美元了,所以我很佩服他做了一个很棒的决定,真正有意思的是,这些公司在做决策时,到底有多面向外部和 startup,互动最深的两家公司,远远领先的是 Amazon 和 NVIDIA,然后 Google 也有非常深入的互动,再往后,Broadcom 的参与方式不一样,他们基本上是所有人最喜欢的 AIC 供应商,如果你是一个 Startup,第二代芯片能和 Broadcom 合作,大家会觉得这是一次升级,如果第一代芯片 Broadcom 就愿意和你合作,那简直像天上掉下来的礼物,然后你会看到 AMD Microsoft 和 Meta,跟 Startup 的互动基本为零,当然我说零有点夸张,但确实非常少,我就会想,这个决定到底意味着什么,因为现在一些最好的团队,已经不在大型上市公司里了,而是在这些更小的 startup 里,我觉得这种互动,最终会变成一个相当大的优势,NVIDIA AMD,还有紧随其后的 Google,会因此受益,而其他这些 hyperscaler 身上,你看不到这种互动,我们快收尾了,我很好奇,关于这个巨大趋势,你有没有开始想到一些,更外围的连锁反应
Patrick O'Shaughnessy:可以随便展开讲讲,我们已经很详细的聊了,受影响最大的具体公司,也稍微聊了应用层,以及如果想让更多价值流向这一层,必须发生什么,我很好奇 [01:06:03]
Gavin Baker:随着这个世界变化得这么快,你还在想哪些有意思的连带影响,确实很疯狂,应用层先别说价值流向了,价值已经被摧毁了,AI 在应用层是净摧毁价值的,即使把 Cursor Cognition,这些最成功的 AI native 公司算进去,AI 也已经在应用层摧毁了数万亿美元的价值,在这个背景下,我确实觉得有一件事我们需要意识到,今天表现最好的公司,也就是估值涨得最多,创造经济价值最多的公司,是那些每个人对应的,以使用 GPU 比例最高,有效比例最高的公司,也许这只是意味着,未来每个人都会得到很多 GPU,但我觉得这是一个有意思的事实,我们需要注意到,我还想说,也许这有点阴暗,但我越来越担心人身安全,我对这件事越来越担心,对那些公众曝光度高得多,和 AI 关联更强的人,我会更担心,但我真的担心人身安全,我希望不要发生什么悲剧,可是美国这里的政治暴力正在上升,随着 AI 越来越政治化,我担心这种暴力会越来越多地,指向 AI 领域的政治领袖,不管我们同意什么,也不管我对 OpenAI 怎么看,或者不怎么看,我都觉得有人像 Sam Altman 家里扔 Molotov Cocktail,这件事非常可怕,我担心因为 AI 我们正在进入一个波动更高,Beta 更高,风险更高的世界,对我个人来说是这样,然后对棋盘上的大玩家来说,你想想这在地缘政治上意味着什么,我们正在看到乌克兰人真的开始赢了,至于他们为什么在赢,我觉得其实并不是因为他们有更好的无人机,我觉得他们确实有更好的无人机,这是原因之一,但我认为乌克兰真正开始赢,是因为他们拥有可能仅次于美国和以色列的最佳战场 AI,当中国或者他们的对手开始消化这一点时,他们会怎么回应,如果美国因为 AI 领先而占优势,那对美国当然很好,但对世界其他地方来说,这是不稳定因素,我经常想的一件事,是创办一个慈善机构去教育全世界,西方到底做过多少了不起的事,奴隶制基本上曾经存在于,几乎所有文明里,而真正终结奴隶制的,是大英帝国这个故事,应该被讲出来,但美国在1945 年之后拥有核弹,其他国家都没有,我们本来可以永远控制世界,可我们没有那样做,我们重建了德国和日本,而他们现在是美国最可靠的盟友,以色列韩国日本,这些都证明了美国这个国家的精神,我们没有接管世界,当时确实有这种担忧,也有记录,美国将军们尤其是麦克阿瑟,在日本有点像美国皇帝,有人担心美国会接管世界,美国当时确实有能力这么做,但没有这么做,他们回家了,我们还去军事化,然后世界进入了一段很长的全球稳定时期,虽然中间也有可怕的战争和危机,这就是 Pax Americana,美国治下的和平,所以也许这并不会造成不稳定,也许它会带来另一个,由我们的 AI 主导地位塑造的 Pax Americana,我非常乐观,觉得 AI 会给世界带来很棒的东西,有个人他的女儿被诊断出一种非常罕见的基因突变,没有疗法,他调动了很多资源,也从一些实验室拿到了大量 compute,那些实验室知道了这件事之后,就迅速启动起来,他们启动了大量 agent,用 AI 找到了一种已经上市的药物,真的可以影响他女儿的疾病,后来他又创办了一家公司想要治愈这种病,因为 AI,他的人生已经发生了无法衡量的变化,所以我是 AI 乐观派,甚至可以说是 AI 最大化主义者,但我也承认,AI 就像是一个世俗宗教
AI 乐观主义与社会风险
Gavin Baker:AI 就像是一个世俗宗教,我很确定,它会成为一个断点,作为社会,我们必须想办法穿越过去,我认为卢德主义者最终会是错的,但我们必须非常认真的对待他们的担忧,我们要确保 AI 对每个人都有好处,现在最好的 AI,只对有很多钱的人开放,这确实有点反乌托邦,这个问题我们必须解决,我们需要带着谦逊来面对这件事,承认这里有大量不确定性,并且认真思考,每次跟你聊完,我之后都会跟别人说,希望你也能找到一样东西 [01:09:59]
Patrick O'Shaughnessy:像 Gavin 热爱市场,公司资本主义和历史那样热爱他,今天也都展现出来了,Gavin 一如既往,非常感谢你抽时间来聊,谢谢 [01:10:33]
Gavin Baker:谢谢你 Patrick