目录
- Sam Altman其实是Cerebras最早的 [00:00:00 - 00:15:00]
- Cerebus它现在 [00:15:00 - 00:30:00]
- 模型的表现就会持续的提升 [00:30:00 - 00:45:02]
- 所以他们当时也给了我很多 [00:45:02 - 01:00:02]
- 然后想再回来 [01:00:02 - 01:15:03]
- 那还可能是 [01:15:03 - 01:30:04]
- 一个早期 [01:30:04 - 01:39:37]
Sam Altman其实是Cerebras最早的
程曼祺:Sam Altman其实是Cerebras最早的投资人 Sam Altman在百度投之前,百度是2017年投的,在2016年的时候 Sam Altman就已经投了这家公司,那个时候Android的号召力非常强,而且那个时候百度应该是,为数不多的AI Lab 就是给了充足的预算,让你去买GPU去训练AI模型 Darrell当时能够进百度,其实是一个,他职业生涯中很重要的一个环节,其实Darrell是Greg召进去的 [00:00:00]
周楠:Greg Diamonds当时,就是认识了Darrell之后,我觉得这个人是个人才,就是他对AI的一些构想非常的深,即使他没有AI的这个背景,因为Darrell当时是数学和物理,还有生物的一个背景
程曼祺:他不是一个computer science 或者AI的这种科班出身的一个研究员,欢迎收听晚点聊,我是曼琪,今天的嘉宾是目前任职于高通创投 Qualcomm Ventures的投资人周南,他是5月中旬IPO的Cerebras Systems的早期投资人之一,这是一家提供新架构AI算力的芯片与系统公司,被外界视作英伟大的补充甚至是挑战者 9年前完成这笔投资时,周南刚从投行加入百度的硅谷人工智能实验室,那时吴文达是负责人 Anthropic的创始人Dario也曾在那儿实习,今天这期节目我们从Cerebros的IPO切入,聊了AI算力的趋势,为什么OpenAI会和他签下百亿美元的大订单,也通过回顾这段投资过程回到了十年前 Scaling Law在硅谷萌芽的阶段和当时百度美元的状态,那是一段在现在的地缘环境下,鲜少被人提及的故事,但它值得在AI历史中有一席之地,我们正式进入本期节目吧,今天非常高兴,邀请到了在美国的一位投资人,周南,做客晚点聊,来分享最近刚刚上市的一家公司 Cerebros的情况,同时我们也延展了一聊,就是算力层的一些变化,南妮可以和我们的听友,简单地打个招呼,简单自我介绍一下,好的,大家好,我是周南 [00:01:44]
周楠:首先谢谢曼琪的邀请,谢谢晚点的邀请,我呢,主要这十年都是在,美国硅谷这边做人工智能的投资,那么我的人工智能的投资,职业生涯非常巧的就是始于,十年前的百度美国研究院,我当时在百度美国研究院,就是经历了整个 AI的1.0时代的起飞,和当时的,百度的Chief Science Officer 吴文达他当时是,百度美国研究院的这个Head 我们跟他一起当时就是做了很多,关于AI的,不管是算力层面数据层面,应用层面上的一些调研,在百度工作了三年之后呢,我又加入了高通创投,在高通这六年呢,主要是集中在AI端测的投资,还有包括一些 AI在端测芯片的应用啊,等的一些延展,所以一共加起来,我在AI投资领域,差不多是十年的时间,确实是整个就是目睹了 这个AI从1.0到2.0到3.0时代的,这么一个变迁,然后也目睹了,整个当时ScalinDAO 在百度美国营业诞生,到当时我们对它的一些推测,到后面这个Chadwick的爆发 [00:02:19]
程曼祺:所以是挺有感触的,这十年 OK 那今天正好我们聊的,这个切入口,就Cerebros这家,刚刚上市的芯片公司,它也是你十年前,开始投资时候,做的第一个项目,而且它和你刚说的,那个过程都是很相关的,我们可以来回顾一下,我觉得可以先简单的,跟大家介绍一下,就是Cerebros是一家,什么样的公司吧,就它是五月中旬上市的,然后目前大概是,接近500亿美元的市值,对 [00:03:24]
周楠:Ceribus其实是,当时真的是非常巧,是我当时刚刚开始,我的投资生涯的时候,十年前,在百度美国研究院,我自己source来,然后做进调 build了投资的conviction 到最后完成投资,第一个项目,应该算是,我们做的百度的一个,当时college的CeroCero 我的Cero的一个项目,那么十年前,投资这家公司的时候,它真的是在,完全是一个,共识形成之前的一个投资,那这家公司,简单来说呢,它是一个,为AI的训练和推整个,重新设计了一个架构的,整个公司,它当时在创立之初,就是想要去建造一个,专门为深度学习的训练,而打造的一个计算系统,所以是颠覆了当时的,所有的一个市场上,大家知道的架构,也跟英伟达的架构,非常不一样,它的一个核心创新就是 Wafer Scale Architecture 就可能你在照顾书上看到了 它就是把一整片晶圆,做成了一个巨大的AI的计算引擎,然后在这个晶圆上,有84个芯片无缝互联 GPU架构它是一个一个芯片,这样子在一个晶圆上,但是这个是整个一个,这么多的芯片,无缝互联在一个晶圆上,它不只是一个芯片公司,它也是做原整的系统,包括芯片服务器,散热电源,还有康泰的编译器,软件站等等,它的这个路线是很激进的,它是要把一个晶圆,变成一个超级大的一个计算引擎,而且它是要解决什么问题呢,就是让大量的计算单元,和内存在同一个硅片上靠得更近,从而去降低它的通信或数据的搬运成本,这就是它和传统的GPU最根本的一个不同,从今天的市场看 Circus的话 [00:04:45]
程曼祺:它也不是说单单是一个硬件一个芯片,而是它是在一个英伟达之外,非常具有颠覆性的一个架构的这么一个系统 OK 对,那我刚才描述可能不太准确,就简单来说,它是个芯片公司,但更准确来说,它应该算是,寻找一种新的 AI算力方法的公司,对是的,它是构建一个,软硬结合的系统,对是的,确实现在,就是它上市之后,一度这个冲得非常高,就市值是接近1000亿美元,对,现在就对这个公司,有一种叙事,就会把它定义成,是英伟达的挑战者,你作为他们的投资人,你怎么看这种定位,我觉得这个定位,非常的有意思 [00:05:33]
周楠:我们刚刚去定下,投资家公司的时候,就是我刚刚加入,百度美国研究院的时候呢,那个时候因为有很多的 AI researcher 他们在训练模型嘛,就当时有几个researcher 第一天就跟我说,那就是以后的模型,它的size会越来越大,需要的芯片,就是它的数据会越来越多,然后要让这个模型,给大家很快的话,你也需要一个,非常强大的芯片,那个时候我的共识就是 AI researcher都在用英伟达,当时他们给我的,第一个lecture就是,不能就只依赖于,英伟达这颗芯片,因为未来会出现,非常非常大的一个模型,这个未来是多少年,当时并不知道,但是如果说,这个时候不去找这颗芯片的话,那么在十年以后,五年以后十年以后,就会形成伦伟达,独大的一个局面,而且伦伟达当时,就是在十年前的时候,它并不是对深度学习,最友好的一个芯片,因为它96%的那个,叫做DiArea 不是专门用UHR深度学习的 因为它更多的是给游戏,给图形显卡,图形,对来发明的,所以如果当时就是说,涉及到其他的,非图形的模型的话,它并不是最优的解,所以那个时候,我当时就抽下一个种子,就是我要找一个,不同架构的芯片,去能够,但不是说要去跟英美达抗衡,而是说更加的能够用于,去训练这个深度学习,所以当时的其实点,就是为了找一个,所谓的比英美达可能更好用,或者是未来,为了让英美达不垄断的一个,这么一个期待品,或者是一个第二解决方案吧,所以这个是当时,投资的一个起点,那么回到现在,就是英伟达,当然已经是这个 5 trillion dollar company 然后是这个大语言模型,时代下的王者,然后如果今天下的这个问题 Cerebus虽然已经成功上市了,那他是不是英伟达挑战者,然后离这一步还有多远呢 我觉得今天看这个事情的话呢 Cerebus应该说,他是英伟达在一些,特定workload上的挑战者,比如说influencing 就是推理上的一个挑战者,但他不能说是英伟达,全战生态的一个,全面的替代者,因为英伟达的护城河并不只是说,这些芯片,而是它的Kuda 还有包括它的开发者生态,网络系统软件,客户信任和供应链等等,这一整个一系列的一个生态,这个是它的最强的护城河,所以我觉得就是对于Survice来说,它的机会是在于说,当某些AI的这个workload 尤其是推理上的这个workload 受限于这个内存的宽带,还有包括想通信延迟,以及推理响应的速度的时候,它是一个非常优秀的一个架构的一个选择,因为它的infrastructure速度,就是比就是说它的照顾状态可能 [00:06:11]
程曼祺:就是比现在的一些解决方案要快很多,对你刚说到十年前的大家的那种想法,我想到就回忆到那个阶段,确实其实在全球范围都有类似的创业思路,比如说韩国际也是那前后成立的,对,因为那会有一个创业潮就是做ASIC 就是专用的这种集成电路,是的,认为那个是可以面向深度学习,做更好的优化的,但确实后面这十年的发展过程来说的话 ASIC并没有撼动通用GPU的地位,通用GPU 我觉得它的发展也是超出大家预期的,因为十年前,其实英伟达显然不是现在这样一个,这么受关注的巨头,我们后面就展开聊,你当时在百度美言的一些情况的时候,我觉得也可以回顾到这个过程,然后回到Circus的近况的话,其实大概两三年前,它的估值也只有数十亿美元,然后到它最近上市 是到了数百亿美元,甚至逼近一千亿美元,你觉得这是市场情绪变了,还是说这个公司自己的业务,或者说技术 [00:08:51]
周楠:真的发生了很大的变化,我觉得是市场,对于这个产品的需求变了,还有包括说市场,到了一定层出的阶段,就是我觉得这个变化点,可能有几个阶段吧,确实在两三年前的时候 GPT moment刚刚到来的时候,就是那个时候 ChainGP到来的时候 AI compute其实已经变成了一个,全球非常稀缺的战略资源,但是那个时候,大家要解决的问题是,模型的训练,就是这个模型的能力和智力水平,需要不断地迭代,所以那个时候,英伟达还是叙事的主体,在两年前的时候呢 AI的trade AI的inferencing 它不像现在需求量这么大,因为现在你会看到,一般以上的对于GPU的需求,都是用在推理上的,然后包括今年,像这个AI Agent这种爆发,更加去激发了,这个对于推理芯片的需求,所以就是,当这个推理的需求,现在在,尤其是今年,从去年开始到今年 有一个大规模的,一个爆发之后呢,那Cirbus 它的这个Value Proposition中的,这个低延迟,就Low Latency 和高吞吐 High Throughput的这种解决方案,就变得更有价值,更稀缺,所以这个时候,就是Cirbus 在这个节点上的一个爆发点,那它作为一个,目前非常优秀的一个解决方案,那估值有这样一个很大的提升,我觉得也是一个 [00:09:55]
程曼祺:水到渠成的一件事情,然后26年1月,有一个比较明显的利好,就是OpenAI和它签了一个,很大的订单,至少是200亿美元的合同,然后他们也做了一些教育设计,绑定了很深度的合作关系,你可以展开讲一讲吗,就是为什么OpenAI会对 Cerebrus的这个方案感兴趣,以及他们大概是怎么来合作的,如果你能分享一些,内部情节可以讲讲,包括比如他们接触了多久之类的,对我觉得首先就是 [00:11:14]
周楠:你如果看到一些公开市场的信息,你会看到San Montemayor 其实是Cerebras最早的投资人 San Montemayor在百度投之前,百度是2017年投的,在2016年的时候 San Montemayor就已经投了这家公司,就说明当时San Montemayor 成为Ubernet的时候,他也预测到一些同样的事情,就是当未来的这个AI的模型,做得很大,有很大应用场景的时候,你不能只依赖,因为打一架芯片
程曼祺:所以这个可以解释,为什么Semultimate 在那个时候,就去投了Cerebus 它这个时间点确实是卡着的,因为2015年12月左右,就15年底是OpenAI成立,是的 16年投的 [00:12:09]
周楠:那相当于成立没多久之后投的,它就是成立没多久之后投的,我觉得它在那个时候,就已经有相当的,对于算力市场的一个vision了,那再回到OpenAI当下,当下它已经是一个,就是在AI里面,一个霸主地位了,那我觉得它对Circus感兴趣,非常合理,一个是说 OpenAI它并不是说,我需要一个便宜点的GPU 而是说目前这个 AI Compute AI的算力,它就是模型,继续scale的一个瓶颈,就是现在算力稀缺,是number one 就是一个核心,那个大瓶颈,第二呢就是 OpenAI我觉得,这个逻辑很清晰,就不管Ubernet还是Enthropic 还是其他的这种Frontier Lab 你都不能依赖单一路线,就是你即使NVIDIA很强,我现在就是训练模型,还是推理都在用NVIDIA 任何一家模型公司,我觉得都需要去有一个 diversified的一个supply 就是你不能就依赖这一个,芯片提供商对不对,就是你需要有一些供应链的考虑,需要有一些战略自主性的考虑,所以就是它去找一个,可替代方案,是我觉得是必然要发生的事情,然后就不只是OpenAR 我可以预见到,就是你看像Anthropic 它有跟TPO签对吧 Anthropic它也在去找寻一些,其他的算力的替代方案,这个我觉得每一个Frontier Lab 都在干这件事情,然后同时呢,就是很明显的,就是推理是越来越重要的,推理呢,在这个时候就决定了,用户的产品体验,以及包括,其他developer 用这些模型的一个商业毛利,就是你需要这个推理,做到一言之,然后高吞吐,然后cost per token 也是越来越优化,所以就是说 Cerebrus 它确实在这些方面,都提供非常明显的优势,那对于这个Frontier Lab 就是有非常明显的吸引力 所以我觉得,模型公司,它不只是说要去买算力,而且它要去找到一个,英伟大的一个 option B替代方案 Cerebrus是Sam Altman 个人投的 [00:13:15]
程曼祺:还是OpenAI投的,你觉得这个在美国,这算观点交易吗,这个是他个人投的,三毛团当年个人投的,个人投的,对对对,这不算个人交,因为三毛团,它其实投了很多公司,它投了一些硬件,包括它投了一个硬件公司,也被OpenAI最后买了,对你说这个事我知道,当时我觉得,也有些人会吐槽吧,就是觉得三毛团,有很多这种资本运作,是,这就是叫它批读就好,因为它也不是说,一个特别大力的股东,对你刚刚说到,它和一些前沿的 AI Lab合作,其实最近,就6月初的时候,他们也宣布和Amazon AWS 就是和云厂上,也有更多合作,但另一方面 Cerebus自己也有,它的云业务,这个是一种,什么样的布局和思路 [00:14:20]
周楠:Cerebus它现在 [00:15:00]
Cerebus它现在
周楠:Cerebus它现在,也开始做自己的,一个云平台了,这个也让我不禁回想 10年前,我们当时投的时候,那个时候 Cerebus它的客户是,就是当时能够,有能力训练,深度学习模型的人,的一些平台,包括我知道,那个时候像Cerebus 也跟Google谈了,也跟Microsoft谈了,也跟Amazon谈了,就这种大的平台,才能够去训练,才有Data Center 才能够训练大的模型,当然也包括百度,现在我觉得,它去购价自己的云平台,就是原因很明显,因为它的客户越来越多了,就不只是这些,大的双TLF 也有很多的应用厂,也有一些做应用的客户,那么对于硬件公司来讲,就壮观这个生态,就因为我在高通做这么多年,我发现硬件公司,有一个很大的挑战,就是所谓的叫做 Adoption Friction 怎么解释这个东西,就是你说,让客户去买一套全新的硬件,就是新的一个计算的方案,解决方案 部署到自己的这个数据中心,然后呢,因为你买了一个新的硬件系统,你还要去修改这个软件站等等,这个周期会很长很长,那Circus Cloud呢,它通过去做自己的Cloud 就可以把这个整个,非常复杂的底层系统,给它封装起来,因为它有这个Cloud 那客户就直接可以,直接就使用API 可以立刻就是说 plug in Circus的产品,到自己的这个,不管是模型的训练也好,还是应用也好 API应用也好,都可以让这个Circus 立刻用起来,所以我觉得就是说,对于Sarabas的这样,客户端的一个 adoption的速度来讲
程曼祺:它去做的这个云,也是有相当的一个战略意义的,其实我当时看到,它有云业务的时候,我有一个比较阴暗的揣测,或者说我觉得,这个对公司来说,它有一种风险和诱惑吧,就是我包了一层云之后,其实我底层用什么算力,有时候对客户,对市场来说,可能都没有那么重要,因为我下面用别的算力,其实我也可以从这个云平台获得收入,但是最近我看这个创始人,就Andrew Feldman 他在Bloomberg的Tech峰会上,非常强势的表态,我们会和所有人合作除了英伟达,至少他公开层面,他是自己说,我是不会去用英伟达的芯片,或者和他们合作的,这个表态也挺有意思,我不知道你有没有观察到,就是说英伟达,英伟达它当然有很多,就是很强的生态和云场上的这些渠道,对吧,它自己就,对,它自己就,对孵化了像CoreWave [00:16:30]
周楠:然后一根像Navies这样的 Neo Cloud的紧密合作,其实这些Neo Cloud 它们也有很强的痛点,就是它的算力其实也不够,它们要为了服务它们的客户 GPU已经成了一个很大的constraint 那对于Surface来讲,因为在一个算力,是成为constraint的情况下,那它去做一个云,也是一个,对于它业务的一个延展,就是它会让它的业务,具有更强的一个护城河,然后呢,加上它如果有云的这个业务的话,那它会给客户提供,我觉得更多的,更整套的一个解决方案,就比如说,如果我是一个new model 就是我一个做模型的一个公司,那如果我去找这个,英伟达以及周边的这个cloud company 可是我还是不能解决,我的算力问题,那如果我有一个survice这样方案,再加上云,那这样我就是有一个 one stop solution 我就是可以直接去用 survice云去做推理 去运行我的推理的workload 那其实这是一个,非常省事的一件事情,但我只是从一个商业,从一个产品逻辑上,角度上去这样讲,总结来说 [00:17:24]
程曼祺:你现在能看到 Cerebros这个公司的,上限和下限是什么,就比如说你觉得,它保底能做到什么,然后如果它发展更好,能到什么状态,它的上限其实很高,因为你看现在就是说 [00:18:29]
周楠:AI computer的需求,是非常非常大,所以我觉得,在推理上的上限,可能真的是无止境的,我觉得他如果会面到,比如说500 billion 我是不会吃惊的,那么他要相信的就是说,他的这个 way for scale的,这样的一个解决方案,是不是能够持续的scale 因为他目前的客户,不得不说,就是你看他的一个,照顾数量的一个风险披露,就是他的客户,还是比较集中的,他现在的几个大客户,就包括像G42啊,这种几个比较大的客户,还是就不像说,像其他的芯片厂商,这么的diversity 所以他需要在他的客户层面上,去有更多的,让他的这个使用的范围,能够被迅速的scale 所以他的这个解决方案呢,是不是能够在一个大规模的情况下,去迅速的scale 我觉得可能是他需要去,关注的一个方向 我觉得他现在有Data Center 然后目前他的这个Wafer的,这个解决方案已经不是问题了,但是就是说,你是不是能够持续的,在一个稳定的环境下去交付 [00:19:35]
程曼祺:运营并且让客户用起来,这个我觉得是他们需要去注意的,这个账号可以补充讲讲,就是他用的这种新方案 WiFi Scale 就一个金元上做的特别大,它去规模化交付的阻碍,或者说难点是什么呀,我们可以讲一讲,就是WiFi Scale Engine的一个,好处跟代价吧,我们现在可以讲讲,就是说这个WiFi Scale
周楠:它跟传统的芯片制造,有什么样的不一样的地方,我尝试用一个比较容易理解的方式来解释一下,因为它真的非常technical 就是传统的芯片制造,其实是在一片晶圆上面做很多很多的小的芯片,然后你把它切开,然后再把它封装,然后再把很多的GPU通过这种PCB NV-Link这种方式给它连起来,但是Cerebrus它是反过来了,它尽量不想把这个晶圆切开,它是在一整片晶圆上,做了一个非常大的一个AR计算引擎,就是它等于说是,八十几个那种芯片,在里面无缝互联了,那么它这么做的一个好处,就是说它的计算单元,内存还有通信网络,都在同一个硅片上,这样的话呢,就是它的数据不用,频繁地从一个芯片,搬到另一个芯片上去,也不用去把外部的这个 HBM 就是高通信概括的这个记忆,搬到计算单元上去,所以这样的话,它就可以非常的加速这个计算,那么就如果打个比方上来讲的话,就是GPU有点像是,很多很多很强大的人类的这种脑袋瓜,但是它需要靠一个高速的网络去写作,而Cerebrus它是一个非常非常巨大的一个大脑,尽量让计算和记忆都发生在同一个规片上,那如果说GPU的优势是,它的生态很成熟,通用性很强,那Cerebrus的优势就是让这个推理,尤其是推理相关的AI workload 减少这种分布式的通信和内存的搬运,这个是我对他们两个不同的一个解读吧,那么他们的挑战在哪呢 [00:20:12]
程曼祺:就是说这个挑战就是涉及到当时的一个风险性问题了,就你指你们投资决策时候的风险性问题,当时你们就担心的问题,对对因为我可能有一个gap点 [00:21:52]
周楠:就是说当时的风险应该现在大多数都已经解决了,就是当时的风险,就是包括你这样的一个,颠覆性的架构里面的风险点,有很多,我们一会儿可以去着重地拆解,讲它的风险点,包括它的这个封装啊,散热啊,凉滤啊等等,它的风险点也非常非常多,那如果你回到现在的这个点上,它已经上市了,你想说它的潜在的这个下限是什么,就是我刚才讲的一个,是它的客户集中度,一个就是说,我觉得英伟达也不会说,做得让它这个市场被Circus拿走,但是我觉得这个市场,还是非常大的,就英伟达可能也会去,推出一个推理,性能非常强的芯片,对,他其实也收了一个 Grok 对他收了Grok LPU 对对对,你的这个点子非常好,因为当时就是 Grok在融资的时候 2019年 20年的时候,我当时也看了Grok 我就觉得这个公司,跟Cerebrus的一个,思路还挺像的,再回到Cerebrus 它的这个架构的一个风险吧,就是我觉得,还要看就是说,这样的一个架构上,能不能就是迅速地,在客户上起规模,我觉得这可能还是,他的一个需要注意的一个点 [00:22:04]
程曼祺:他生产制造会导致,他起规模比较难吗,因为我看到很多评论,就认为这种金元做得特别大的,良率会是一个问题,这个良率确实是一个问题,我们会在风险的时候,可以去拆解当时的一些,这个风险的一个状态,那我们接下来可以回顾一下,你最开始投资SaraBus的过程,那是差不多9到10年前,当时刚加入百度美元的时候,对是的,你前面也提到说,这是你自己去找到的项目吗,可以讲讲为什么当时要去看这个方向吗,包括你怎么接触到这个公司的,当时就是2016年,我刚刚加入百度的时候,那个时候等于是我刚刚开始,我的这个VC的投资生涯嘛 [00:23:11]
周楠:在那之前你是,之前已经工作了一段时间,在之前我在投行做,当时我在Barclays Capital 就是华尔街的一个Boutch Bracket 他收购了Limit Brother 然后那个时候我是,那三年我做投行的时候,我是transfer到香港了,然后当时做了很多,移动互联网公司的上市,当时刚好赶上了,中国那波移动互联网上市的大潮,就像阿里啊,京东啊这些,所以我当时就是说,已经对于这个科技领域的,这个一些公司,已经打下了一些基础吧,那个时候我还做了一个,也是做了一个,关于芯片公司的上市,然后我是在那个节点上 2016年的时候,当时百度全球海选,找这个AI投资人,去加入他的,百度的硅谷的人工智能研究院
程曼祺:和文达一起工作,我是在那个背景下,加入百度的,所以当时商务委员,是从二级转到一级和早期投资,应该说是从投行,从卖方转到了做卖方,做投资 [00:24:31]
周楠:所以那个时候就是说,我觉得我比较幸运的一点就是,可能我跟传统的那些做VC 就是在一个Financial VC里的一些,投资人不太一样,我是一开始就是进入了一个,纯AI的环境,就当时大家都没有在投AI的时候,我是在那样的一个环境下,去开始我的投资生涯的,为什么16年想从,比如说移动互联网的这种
程曼祺:因为投行我理解是做IPO这些,然后来做AI 因为可能当时那个时间点,会觉得移动互联网,还在一个上升期吧,或者说在一个收获期至少,然后AI那个时候是很早期的,对很有意思,就是因为我在投行,当时做了一个搜索公司的上市,那个搜索公司没有成功,我就不说是哪个名字了,但是那个公司就,在他的上市周末书里,讲了一个AI的故事,然后那个时候是我第一次接触到AI 我就感觉哇这个是future 然后再接着我就知道说,百度在2014年的时候,请来了吴文达加入他的百度的美国人工智能研究院,然后我那个时候也到硅谷几次,听了几次吴文达的讲座,我就对百度这个公司产生了深深的崇拜之情,所以在2015年年底,他在全球海险这个AI投资的时候,我就递交了简历,然后就非常幸运的被捞上岸了,所以虽然那个IPO没有成功 但是你从照顾书里面,你从和团队交流,你看到这个新的机会,对,他为我铺了一条,加入百度的道路 OK 那可以继续回答,就是说你当时刚加入 [00:25:09]
周楠:为什么去找这个方向,当时刚刚加入的时候,每天都非常的激动,就是那个时候,百度的美国人工智能研究院,应该说是硅谷,最强大的一个 AI Research Lab 那个时候 Android的号召力非常强,而且那个时候,百度应该是,为数不多的AI Lab 就是给了充足的预算,让你去买GPU 去训练AI模型,而且安卓文也是,应该说是第一个,去昭告天下说 GPU是可以用来,非常好的来训练 AI模型的,这么一个computer system 所以我觉得,安卓文跟英伟达之间,也有一个非常重要的连结,如果没有安卓文,当时的就是给英伟达背书,大家就不会形成这个认知说,原来GPU是要被,大规模可以用于,这个AI的模型的训练的,所以我就是在,当时那样的一个背景下,在百度的这个人工智能研究院,和这些世界上最顶尖的 researcher们一起工作 这些researcher可能也知道,就是很多的包括Dario Anthropic的founder 当时也在百度,我跟他没有overlap 就是先声明一下,但是那个时候,那些研究员们,有相当多的一部分人,是后来OpenAI的早期的,这些researcher 然后基本上那部分研究员,是2022年以后 GPD moment开始以后,最早的那批frontier lab的 co-founder 所以我觉得,那个时候的人才密度,还是非常的这样震撼的,我也就是在,那样的一个环境下,我想说那个时候,可能是一个 AI的1.0时代,就是那个时候,美国百度,那个AI Lab里面,那些研究员,在做不同的事情,有些在做Speech Model 有些在做Vision Model 视觉模型,有些在用Deep Learning 去找各个行业,不同的解决方案,比如说像Retail ThinkTech 然后还有,我记得还有,当时花了很多时间 在做Health Care 然后还有autonomous driving 就是还有这么多不同的一个方向,但是当时有一个很强大的故事,就是也是在那个当时deep speech的那篇论文,百度发展判论文之后,就是我们已经看到了一个事情,就是AI的进步依赖于三件事情,更大的模型,更大的数据和更强的算力,所以在那个情况下,我们形成了一个很朴素的判断,就是如果你想要AI持续进步,那么底层的这个算力基础,就非常重要,而且GPU呢,虽然是当时最好的工具,但是它不是为了深度学习,而从里面去设计的,所以就是我们需要去找到一个,更强大的一个算力系统,我大概经历了,可能有半年的这样一个学习吧,把整个AI的这个从训练到架构,到数据到算力等等,就是一系列的这个,从头到尾的知识 都学习明白了之后呢,我是从2017年开始去,满大街的去找新的,跟这个GTO不同的一个算力系统,我觉得可以把你刚提到的 Deep Speech这个论文展开说一下 [00:26:13]
程曼祺:这篇文章Daryl是一作,然后他在这个文章里,他觉得发现了Scanning Law的雏形,就是在你加入的那个时候,因为这个文章是2015年年底发布的,在你加入百度美颜的那个阶段 [00:29:05]
周楠:就是整个组织里会觉得,这是个很重要的事情吗,我加入的时候 Deep Speech Model的那个论文,已经发出来了,我也跟当时的researcher们,聊过这个发现,就是这个Deep Speech 2的这个model 我觉得是对百度来讲,是非常重要的,就是在那个年代的时候,百度的美国研究院团队,他还没有把Skeleton Law 作为一个非常有数学规律的,一个结论,去用系统化的去表达出来,对吧,但是基于这个Deep Speech的论文的发表,当时已经非常清楚地,感受到一件什么事呢,就是说当模型更大,当数据更多,训练更久,而且计算系统更强的时候,模型的表现就会持续的提升
模型的表现就会持续的提升
周楠:模型的表现就会持续的提升,我想把它说成,这个可能是一个经验性的直觉,就是在后来语言模型的时代,它被更系统的验证和理论化了,也就是说大家今天所知道的 [00:30:00]
程曼祺:Skelling Law 但是如果你去回溯的话,这个Skelling Law的诞生的萌芽,就是当年的这篇Deep Speech的paper 所以当时百度美言的人,就认为这个事很重要,而且认为应该
周楠:沿着这个方向,去找一些,研究和投资的机会是吗,对可以这么说,就当时这个结论出来以后,这个很clear的结论,就是说想要,这个AI的能力继续提升的话,就是需要让它的模型更大,数据更多,然后需要训练更长时间,就这个training需要更长时间,那时候还没有 training post training这个概念,然后也需要计算能力更强,所以就要找到一个,计算能力更强的一个芯片,这个就是当时的,对我来讲的一个投资的启发,那那个时候呢,因为当时百度美研有很多的这种,就它的团队有在做不同的事情,就像我刚才讲的一个语言模型,也有一个团队在做,那么当时做语言模型的时候,那个时候百度训练出来语言模型,就已经是将近300个million parameter了,那是很大很大的,就是你想那个3D的这个参数量级,在10年前是非常非常大的一个参数量级 而且我很清楚的记得,他们跟我说,当时为了要用GPU训练,一个这样的模型,要至少三个多月的时间,我当时就听傻了,我说哇,我说要三个多月才能训练出来,一个模型呢,他说对,那我说那如果你要调餐,要去看这个模型的效果,你要把这个模型,今天迭代怎么办,他说那就是要好几个月的时间,所以基于这个时间的紧迫性,你想要让这个模型的能力,能够迭代提高,那你确实需要找到,一个更强大的芯片,在那个时候,我们用的那个英伟达的一个芯片,就是需要三个多月的时间,然后那个时候,我就在一堆的芯片公司中,当时找到SERIBRUS的时候 SERIBRUS就说,我们当年的架构,能够让这个深度学习的训练,提效1000倍,就是比如说,你要用三个多月去训练那个模型,可能用当时的这个WiFi Scale架构,大概几天几个星期就可以训练出来,所以我觉得当时,这样的一个发现 是非常的具有吸引力的,你当时还看到了哪些公司,我看到挺多的,包括像这个Graphcore 还有那个Wave Computing等等,还有一些做ASIC的公司,就是做ASIC的这个公司呢,其实我当时其实对于ASIC 我是最早就把它怎么说呢,我认为ASIC更多的是,应该算是推理芯片吧,但是因为我觉得,当时要解决的最大的问题,还是去做训练,至少其实当时Deep Speech Model 我认为就是让这个AI能力,不断地去提升,我们先要去解决,这个AI的训练的问题,所以我当时并没有把说,找一个ASIC的这种推理芯片,作为我的一个priority 我当时还是在找一个,能够去提升这个 AI的深度学习训练的模型的,这样一个芯片 [00:31:20]
程曼祺:所以那样的情况下,就是让我去感兴趣,去做尽掉了这个公司,就集中到Graphcore with Computing 还有Cerebus 这三家,对 Graphcore是24年,被软银收购了 5亿美元收购 [00:33:00]
周楠:对对,我现在当然我不太记得,当时Graphcore的一个,跟Cerbaz的对比了,但是就是觉得说,当时Graphcore 我记得当时的结论就是,它可以提速提效,但是它的这个效果,就不如Cerbaz这么好,当然它的架构,也不像Cerbaz 这么的颠覆性,所以就是,我当时作为一个投资人,我的一个直觉就是说,那我要投的话,我就是要投一个,具有这种颠覆性的,这样的一个架构,然后真的能够让,运动学习的训练,能够是这个百倍千倍的,这样提速的一个公司,你刚说的第三家公司是什么,是Wave Computing 这家公司其实它的架构和理念,跟Cerebras还挺像的,可是它的团队我记得是有问题的,所以这家公司当时是被我第一个淘汰掉的,这家公司现在还存在吗,不存在了,它应该很早以前就不行了 OK
程曼祺:所以你当时三选一还是选到了一个,对,从现在的结果来看是最好的选择,我觉得三选一的时候,当时Survice的信号非常明显,因为Survice的团队非常的强,那个时候Andrew Feldman [00:34:06]
周楠:他前一家公司C-Micro 当时是被Andy收购的,然后他几乎是带着这个,他当年C-Micro的一个原班人嘛,然后带着他们对,全新架构的这么一个愿景,去创办了Survice这个公司,然后我记得当时,最吸引我的一个点,就那个时候,我还对技术多不善动的时候,说他们有,当时的团队大概有 80多个人吧,有将近70个人,都是PhD 然后他们的工作经验,加起来有好几百年,所以就是可以见到,这个团队是,多么的有经验,多么的强大,而且是我见过 PhD密度最高的一家公司,所以我当时就想,这个leader这么有号召力,让他的原班人,有这么多的PhD 为他卖命,然后这个公司才成为一年多,就让我感觉这个很不一般,所以就瞬间让我,掉起了我所有的,这个好奇心和兴趣,然后开始对他展开警调
程曼祺:因为他自己并不是做芯片工程和技术出身的,就我指这个创始人Andrew Feldman 这会是你当时投资的一个疑虑吗,对这个问题很好,就是对于正常的芯片公司来讲 [00:35:12]
周楠:基本上创始都是工程师出身对吧,就是那像Cirbus这种系统级的公司,我觉得当时Andrew的强项,可能就是在于他对于产品的定义,他组织团队的能力,还有理解客户,和他坚持长期愿景的这种能力,就我当时可能我是更多的,停在一个我的一种,赤诚之心加直觉去投他的,但是我现在回溯看来,我觉得他当时身边有几个很强的信号,让我觉得如果,用我现在的支持再回头看,我还是会选他,那他这几个信号是什么,就首先,他身边已经有非常强的技术口方的,而且这些技术口方的,都是跟了他很多年的,所以这个东西就肯定不是减分的,而且是很好的一个组合, 因为他已经有两三个很强的co-founder跟他一起了, 然后另外一个呢, 就是我觉得Andrew他是一个非常有经验的创业者, 就他得说是叫做serial entrepreneur, 他在这个行业里面很多年了, 有非常深厚的这种ecosystem的这样一个关系网在里面, 那他的优势他非常的清楚客户的一个痛点, 然后呢他也能够讲得很清楚, 就是说这个系统为什么必须要存在, 还有一点呢就是我印象很深的是, 他的这个conviction 他对他做的这件事,总有很强的conviction 他不是说,非常空洞的去讲一个vision 我现在回忆就是说,我在做deep tech 这么多年投资中,有一些founder 他是给你讲一个很大的vision 讲说我要解决一个很大的问题,但是就是说,具体这样的一个,基础路线,这样的一个风险,该怎么弄,很多founder他是讲不清楚的,但是安卓恰恰相反,就是说,在Circus Bus 这么一个颠覆性,和复杂的基础路线上,他扛住了,我对于风险的所有的警调,因为当时我是带了好几个,爱多AI的researcher去,做了非常深度的精调 把他的风险全部打散了讲,比如说两率怎么办,散热怎么办,电源怎么办,那那个编译器compiler怎么办,客户为什么要买 Andrew对这些问题完全不回避,他一个一个的拆开来,非常耐心的跟我讲,而且当时我作为一个芯片小白,就是他可以不厌其烦的,每天跟我讲两个小时,四个星期,所以这一点上我认为,他是一个非常 decent的一个创业者,就是他可以不但把vision讲清楚,他可以把风险点,从第一性原理一个一个的,讲清楚那对于投资人来讲,就是我们投deep tech 不是说只是投一个,宏大的愿景和一个很大的vision 而是我们要知道我们投的风险到底是什么,我们能不能把这个风险,清清楚楚的给他拆开来,解构开来然后看到这个,去抵消这些风险的,一个mitigation的一个战略是什么 所以我觉得这些整个,这个综合的这一套,就是从这个投资的,这样的一个过程来看,我觉得安助是 [00:36:19]
程曼祺:非常非常重要的一个创业者,你们当时进调这个过程,具体来说是怎样的呀,以及你找百度美研的研究员,来支持你的话,这个在组织上是怎么协调了,是吴文达会直接,帮你调人来支持吗 [00:38:14]
周楠:因为我觉得有些研究员,他不喜欢干这一类事,我觉得当时这个时间点,非常有意思,因为当时像Greg Diemens 他们他就是在,亲自训练那个语言模型,还有包括其他的一些researcher 他们在训练,三翼参数的这个语言模型的时候,就是有这个实打实的痛点,太慢了,用这个历来的芯片,要搞三个月,他们实在是很想找一个,很快的芯片,去帮他们解决,这个训练的这个时间的问题,所以当我把Cerebrus 这样的一个架构,带到他们面前的时候,他们就是眼前一亮,就是觉得,哇这个就是他们,可能期待已久的一个解决方案,他们非常想知道,这个解决方案,到底能不能行,靠不靠谱,然后Greg Diamonds 他本人呢,你知道就是,他是NVIDIA CUDA的key dealer 所以我觉得当时,百度免疫非常强,能够挖来这么厉害的一个人 Greg的这个PhD的期间,就是在帮英伟达,建造他的CUDA的生态系统,就可以毫不夸张地说
程曼祺:Greg就是当时,在给英伟达,构建这个CUDA的,这么一个核心的,几个人中的,特别特别重要的一个,而且他也是 Deep Speech 2 那篇论文的作者之一,对 [00:39:21]
周楠:所以当时 Greg他看到这样的一个架构的时候,他也很兴奋,就是我们那几个researcher 大家都非常的兴奋,就是非常积极地要跟着我,一起去做尽调,然后我也非常的激动,就是我觉得,哇我发现这样一个架构
程曼祺:然后我可以在实战中,去和这些researcher 一起去讨论,一起去实践,我觉得那段经历,是一个非常宝贵的一段经历,而且后来Greg跟文达,一起创业了一段时间,对吧,南顶AI的时候
周楠:对 Greyber和Wanda一起创业了,不仅是这样,而且当时安卓的这个 Cervas当时是,它当时只有一个 simulator你知道吗,它当时的这个,所谓WiFi这个构架,在实物上是没有的,就是这个芯片,还没有柳片,所以它所有的构想,都是在一个simulator上,而能够去验证,这个simulator的公司,就当时只有百度一家,就因为只有百度,当时的语言模型,是世界上最大的语言模型,那个时候Transformer还没有出来,真的就是Pre-Transformer 百度的语言模型,是基于百度当年自己的,研发的一个架构,叫做Pedal Pedal 就是飞桨的一个构架,我们是把这个语言模型,跑在了安住的这个CPU Letter上,然后呢,当时的信号是比较正面的,就是我不能discord太多里的,这个结果,但是真的就是只有百度,能够说在它的架构上,去跑这样的一个模型,然后给出一个尽量的结果,我觉得当时尽量的结果 对于Celerbus来讲,也非常的重要,因为等于说,在某种程度上,你验证了他的想法,验证了他的这么一个,基础的这么一个理念 [00:40:02]
程曼祺:那可以透露一下,当时大家测算是,比如说能把训练时间,压缩到什么量级吗,从以前三个多月,能到多段,当时人家是个Celerbus 所以就是说,只能通过一些数据 [00:41:06]
周楠:去推测一些结果性的东西,就它并不是说,我真的一个语言国线,跑在一个芯片上,它是一个语言模型,在它的simulator上就run 比如说假设你这个芯片的,良率也可以顺利通过,假设你的compiler 也都没有问题,假设你的赛热封状,也都没有问题的情况下,那确实它的结果是非常好的,所以这样的一个过程,对他们来说,对Servas来说,当时也是非常有意义的,我可以透露的就是说,那段时间,一些研究员吧,包括像Greg 也是不只是说,帮助我做投资,做这个金调,也是跟Celerbus 有相当的紧密的合作,然后还有一些研究员,甚至后来都加入了Celerbus
程曼祺:那像Greg这些研究员,我理解他们能去验证的部分,是这套方案,对模型训练提效是否有用,他这个方法的一些,其他的风险点,就你前面提到的,凉绿散热封装等等,这些你要找一些,什么样的专家来支持,你们去判断,这个我就是找到一些,当时比如说像Stanford的一些教授,一些芯片专家
周楠:我觉得这些就是,硬件层面上的一些风险,它其实是理论上,是可以去拆解出来的,比如说如果它,当时的这个量率不好,如果一开始油片失败,那失败到什么程度,我需要多长时间,去重新去进行这个油片,大概total cost多少,我们当时都把,这个最坏情况都演算了一下,那可能就是要多花个,六个月的时间,然后要多花个,五到十个年廉,那公司现金流,能不能支持这样,去重新去跑一遍这个流片,我们当时觉得,这个风险是可控的,所以这个是硬件层面上的,良率风险,然后像散热风险呀,包括它的水冷和系统,这些设计等等,当时这个水冷和系统的设计,它是已经出来了,就是当时我记得,在她办公室里,她整个给我看了,她那个一个,就是夜冷的这么一个系统,特别大的一个夜冷的,一个盒子,这个芯片大概这么大,整个夜冷系统,就是更加大的一个盒子 所以可以推荐的就是说,当时她的这个夜冷,是有一个,非常好的解决方案的,然后包括像,比如说它的这个,因为那么多的芯片,在一个web上,那万一出现一个短路,怎么办,电源风险怎么办,当时他们也有一个,软件层面的一个,去识别哪颗芯片短路以后,他去把它重新,跑到另外一批 redundancy的芯片上,这么一个方案,他全部都有,所以我就觉得说,从这个物理和硬件风险上来讲,他已经做到了,他能够可控的一个,最好的这么一个解决方案,然后回到说像Grab 当时百度理研的这些研究员,给他更多的一个风险测算,是compiler系统层面的一个测算,比如说,就是说模型怎么映射到这个架构上,怎么去和像TensorFlow 就比如说往上跟客户去对接,它的数据中心对接的话,你TensorFlow 然后Casea这些,还有PyTorch 你是怎么去对接的,这个IP怎么去对接的,这部分当时百度理研,应该是花了很多的精力去做进调,然后当时就觉得这个compiler 也是可以去解决的,就是这个当然很多的系统机器,还有这个代码级的这种进调,这个我觉得是,当时也是很重要的一个点,所以我在想说 [00:42:25]
程曼祺:如果没有美研的这些研究员,那这部分的风险,我是没有办法去预测的,所以当时百度美研,并没有纯硬件的人,是比较少的,有的有的,当时在自动驾驶的上面,有很多纯硬件的人,我全部都问了 [00:44:35]
周楠:就是刚时我讲的这个散热风险,电源风险,良率风险,全部都跟这些做硬件的专家们讨论了,当时那批硬件的专家们,有相当一部分,现在也在做ZPO的创业,所以他们当时也给了我很多
所以他们当时也给了我很多
周楠:所以他们当时也给了我很多,很宝贵的这些进调的意见,所以我就觉得说,可能如果你看 Cirrus早期的这些投资人,大量真的就是,是百度做的这个进调,是从技术角度上来讲,是做得最深入的,然后我们给的这个进调的报告,风险的报告也是最全面的,我当时其实把我的这个,当时我们进调的这样的一些,初步的一些结果,就大概的一个结果,我也跟当时的早期投资人,像Banchmark投资人,还有Q2跟他们都说了,他们应该是比百度更早投的嘛,跟他们就是分享,进调的这样一个结果之后,他们也都是觉得 [00:45:02]
程曼祺:心里的石头可能,没有说完全落下,可能也落下了一小半,对你刚说百度出去很多人又创业嘛,美颜出去很多人创业,我觉得挺有意思的,就百度不光在中国互联网,是皇甫军校,看起来百度美颜在硅谷,也是一个皇甫军校,也输送了很多业界人才,我觉得是相当厉害的皇甫军校,因为就是里面的一些researcher 他们是inflection co-founder 是adapt co-founder
周楠:然后也有一部分人,后面是这个 Meta的Fair实验室的,一些founding的member 就不要讲OpenAI和Anthropic了,这个我们后面,也可以展开,关于黄浦军校这个问题,我们可以先把 [00:46:08]
程曼祺:Circleverse的投资过程聊完,你们后来上投决,是一个什么过程,包括当时是哪些人,来一起做决策投不投,对当时在投决会上,是我的老板Jennifer Lee 就是百度的CFO 还有陆奇,还有Robin本人
周楠:我当时觉得,非常欣慰的一点,我觉得作为一个投资者,真的是非常的幸运,就是我当时,把我的investment memo 大概十几页纸吧,就是中文一稿,和英文一稿,在四个星期后,我发给了投决会之后呢,应该就是不到两天的时间,他们就拍板了,就通过了这个投资,这点上,我当时觉得是理所应当,但是现在就是,因为我后面又在高通,这种情况的CDC 包括还有我也知道,其他VC的一些投资会之后,我才知道说,当时多么幸运,有这样一个,有眼光的一个投资会,首先他们是,对这个非共识的投资,他们是有共识的,就是要去投一个,非常具有颠覆性的,一个算力的,这样一个系统,然后百度从上到下,我觉得都是非常支持
程曼祺:对于Cerbas这样一个投资的,所以当时的投决会,我觉得就是无痛秒过,你还记得李彦宏和陆奇,他们有一些什么具体的,评价或者反馈吗,这个具体评价反馈我不太记得,当然我也不太方便透露,但是就是总体来讲,当时他们这个投决会,非常高层就是他支持,吴文达不在这个投决会上,他不参与投资决策 [00:47:15]
周楠:当时在投资的时候,吴文达已经离开百度了,所以他不在这个投决会上。Andrew是2017年的4月离开百度的, 然后我这个投资是2017年的8月份投资完成的,
程曼祺:8月9月的时候投的, 所以那个时候投决会上, 当时投决会就是CFO还有Lucy还有Robin。所以你从接触上这个项目, 因为是17年初就去找去聊吗?然后到最后投, 中间时间还是挺长的,
周楠:有几个月的时间?应该说我17年初的时候还不认识这家公司, 我是到17年的上半年,后期的时候,接触到这家公司,当时也是很巧,就是当时是我把那个 Code 2的funding partner 就是Thomas LaFont 他拉老百度来catch 就是当时这个人现在是大佬的,然后Thomas当时就刚好,也见了一下,就是当时刚好,就是Jennifer也在美国这儿出差,然后他就给我留一个meeting 在meeting的过程中,我也就提到,就是说我们对算费的一个构想,然后因为Thomas LaFont 他本人当年是半导体的研究员,就非常有意思,就这个人他是Code2的 Funding Partner 然后他同时也,花过很长时间研究半导体,所以他当时对我讲的这个topic 就很激动,然后就开始跟我说,他投了一家公司,非常的就颠覆性,叫Cerebras 然后跟我讲一下,然后我当时就眼前一亮,就立刻开始去看这家公司 那个时候我们已经开始,就是说已经看过像 Graphic Core Web Computing这样的,就是处在一个,很灵活的一个状态,就是没有觉得想投这家公司,然后史道瑟尔斯出现,然后我们当时就是眼前一亮 [00:48:08]
程曼祺:当时百度的管理层,比如说像雁红,她有提过,可以等流片之后再投吗,没有,因为你们刚好在流片之前投,没有,我觉得这个时间,不知道你们怎么看,没有没有,就是当时百度的高管们 [00:49:13]
周楠:没有去干涉这件事情,我觉得百度的高管们,你想能够在,那么早就成立,百度美国研究院,像Robin本人,那个时候那么早就参与去,就你知道他们当时,去bid这个 Jeffrey Clinton的这个lab
程曼祺:就是那么有vision的,一个一群leadership 就是我现在想想,他们一定是,对于这样的一个,颠覆性的投资,他们是支持是,我觉得是理所当然的,你还记得当时,你们投进去那会儿,估值是多少吗,包括它对比,你看的其他公司,估值是不便宜的,当时估值差不多,我记得是700多个面链,我现在还回去看,我的这个当时的memo 很有意思的是 700个面链,是个不便宜了
周楠:在当年16年17年的,那个背景下,这种都快要到unicorn了,对不对,所以就是说,这个公司当时是不便宜的,很贵的,然后我测算他的收入,我对于他的收入的测算,是2025年,大概可以达到 [00:50:06]
程曼祺:AI的这个训练的市场,今天市场是22个别链,然后我现在想想,我说错的多离谱 2025年的这个 AI的现在也看到,这个训练市场呢,是比22个别链大了,不知道多少个量级了,所以在我当时在推测 2025年,大概22个别链训练市场的情况下,我对于Service这个投资的回报率,大概的预测是三到五倍,所以就是可见我当时,真的是小看了这个AI的,整个这个腾飞的速度,但是你当时测算的,它的市占率要比较高对吧,我测算市占率应该会有,大概20%左右吧,这样对它的市占率进行的一个测算,就现在的情况是,它的绝对收入提了,包括它签的一些订单是非常大的,但是它的市占率是很小的,因为这整个盘子特别特别大,是的
周楠:因为就是在2017年到2019年的时候,其实Cerberus经过了一段非常艰难的时光,就它确实那个时候,流片有一些推迟,因为这个架构的原因,就是我刚才讲的那几个风险,其实我们当时,对于风险测算的下限,它基本上都发生了,就是它的流片,它有一个延迟,差不多就是可能延迟了一两年,就是当时我们风险测算的下限,它基本上都发生了,所以就是可见,就是我觉得这个团队,的任性团队的这种坚持,是这样非常重要的,也就是说,虽然他现在的,这个施展率还不高,可是他这个架构,他成功了,所以现在成功了以后,就是要在这个推理市场上,进行覆盖,我不认为说,他在训练市场上,却没有市场,我认为是有的,只是说现在大家,对于Frontier Lab来讲,他既然在训练上,已经用了英伟达GPU 他其实已经成了这套体系 你让他去换一个训练芯片,对他们来讲风险也较大,而这个Surprise的解决方案,刚刚好对于推理这个场景来讲,是一个非常好的解决方案 [00:51:07]
程曼祺:所以看现在的大多数的客户,都是一个推理,就是在推理场景下的,这样的一个客户,因为OpenAI的200亿美元的订单,还没有交付,这个阶段能说它推理,这个市场成功了吗,它推理也是需要Infor配合的吗,它的这个算力结构很特别,是不是导致Infor要改动的比较多,就不知道生态上能跟上,我觉得是需要一些定制化的,因为公司已经到这个体量了,我认为他们,就是为了 OpenAI的这样一个订单,去定制化这样一个infra 我觉得是完全必要的,那就是看他们,多快去交付这个解决方案,他们自己团队,就能搞定这个事是吗 [00:52:12]
周楠:我认为可以搞定,他们在当年,刚刚成立的时候,那80多个早期的,这个员工里面,那么多的PhD里面,就有相当多的人,是做infra 就是他的这么多的,他的这个人才解构,是非常全面的,那他们现在,会和一些第三方的
程曼祺:这种infra公司合作吗,比如说像SGLOM这种生态里,也成立了新的公司吗,我认为是有一些合作的,但是我不能确定,我也最近想给他介绍一些,生态系统里的公司,比如说像做 [00:53:05]
周楠:Agenti的AI的一些infra 因为AI agent 当一个推理市场,也是他们一个,非常是符合他们,这个value proposition的一个市场,所以我觉得像AI agent的infra 也可以跟他进行一些合作,这样的话
程曼祺:他整个workload在跑起来,就是更顺畅,你说17年到19年,是这个公司,比较低谷的阶段,非常艰难,对,那个时候很艰难,当时就是,因为我两周前,去参加他的这个
周楠:IPO的庆祝会嘛,在纽约,当时在那个庆祝会上,他的几个早期投资人,都纷纷发言,让我非常感动,他们每个人都讲说,在17年到19年的时候,公司遇到的很大的挑战,就是出片也没出出来,各种风险层出不穷,一会儿是这个 compiler搞不定,或者是这个wifer的这个,油片,一个不让人认识,什么都在delay 但是这个board 就是对于安卓的支持,我觉得是非常大,就是我觉得这个公司,能够成功,它的早期投资人,这三个董事会成员,对他的耐心本贷,也有很大的关系,因为你会发现说
程曼祺:你想让一个计算芯片,取得成功,真的是没有十年的时间,它是很难实现的,它现在三个董事会成员,是benchmark code 2 还有内架机构的人,没有,是Benchmark 还有Foundation Capital 还有Eclipse 它在成长过程中间,算是一个,对主流基金来说,比较抢手的项目吗,我觉得不算,就是在,你看它包括最后,叫两年前的那轮投资的时候 [00:54:24]
周楠:我记得估计是,高头那轮是两个多别联,然后它后面还有,四个别联,八个别联的这种投资,八个别联那个时候,应该有一些,比较大的基金进来了,但是在两三年前的时候,主流的一线VC 是不敢投的,就是他们不知道,这个市场到底能够有多大,他们对于WiFi scale的这种构架,我觉得他们没有这样的一个,这么深的一个insights 然后再加上当时 Chain-GBT moment出来之后,训练芯片就一边倒了,都在用英伟达,所以那段时间,反而是它市场前进,没有那么明朗的时候,就是这个芯片流片出来了,可是好像在训练芯片上,又没有去用,因为他可能出来的比较晚,就是在训练这个场景下,已经大家都在用英雷达了,就是这个迁移成本比较高,那段时间,我觉得也是比较难熬的一个点,然后他那个时候,有一个客户就G42吧
程曼祺:就是记者他的投资人,是他的客户,所以那个时候就是有一个,那种单一客户的一个风险,那如果说他当时流片更快的话,是不是有可能,现在的算力结构还挺不一样,你觉得会吗,我觉得这个问题非常好 [00:55:43]
周楠:我觉得如果他当时流片成功了,或许会不一样很多,就比如说 OpenAI当时在训练卧星的时候,对吧,是老黄拿着这个GPU送过去了,如果那个时候已经有SERVICE
程曼祺:那就是Andrew Feldman 拿着GPU送过去了,是不是,所以我觉得就是确实是,如果它流线更快一些的话,或许这个历史会被更多的改写,那就得特别快,因为其实 17年Transformer发布之后 OpenAI就已经开始探索,这个方向,没错没错,而且你看就是说,现在呢,这个Frontier Lab训练这个模型,你的GPU它都是一个集群,然后这个Data Center 你的基建已经投资了,已经打下去了这个,所以你要在这个时候,去换到其他的芯片上去,它其实是个非常大的系统风险,我觉得这可能确实也跟,半导体行业的周期有关,就是它本身涉及到硬件,迭代周期就比较长,然后大家要去,使用一个产品的时候,还是会非常考虑稳定性,和它的良率能不能规模交付,那英伟达GPU毕竟是一个积累了这么多年的产品,然而硬件都积累了 这么多年,对,其实我刚才那个假设,我觉得回头看它也很难成立,对,就是因为它本来就提了一个比较新的方案,就我说Cyberbus 然后这个新的方案,它成立也没有那么久,就在17年的Transformer 创业时间节点,它成立时间没有那么久,然后这个新的方案,你又要经过物理制造的验证,就反正在历史上,我感觉半导体好像就没有这么快,你总是会出各种问题,对没错 [00:56:08]
周楠:就是假设它流片成功,那你也要能够,规模生产交付对吧,然后你的这个compiler 就是软硬件也得跟上,所以确实比较难,这么快能够达到一个理想状态,如果你不到那个理想状态,那么这些frontier lab 就不会用你 [00:57:28]
程曼祺:我觉得可能这也是和,大模型或者软件公司,不太一样的一个地方,就是它还是挺后期勃发的,这种硬件公司,是的是的,但是我觉得反而是,现在是个好机会
周楠:就是说你看包括它跟OpenAI的合作,包括像Anthropic也在去找这种定制化芯片,对吧,因为你现在的这个对于computer的使用,要一部分是训练,相当大的一部分是推理,而当你的推理变得非常非常大的时候,那Cerebus它的好处和优点就都凸显出来了,所以我觉得Cerebus其实与其去掰扯这个训练,还不如把所有的精力都放在,把这个推理的workload做好上
程曼祺:所以我觉得就是战略角色上来讲,你去吃这个推理的市场,我觉得是个比较正确的一个决定,说到这个周期的问题,这个公司还有一个特点,就是这些创始人,年纪都挺大的,我不知道这个当时 [00:58:19]
周楠:你投资的时候会是一个问题吗,是,但是你知道就是,半导体的创始人,年纪都不小,因为你这个半导体的周期,就是很长,你说就安住他,还是个连续创业者,对吧,但当你前一个公司 Cbreco被IMD收购,那你肯定也是需要一个,相当长的周期,你如果我们要想投连续创业者,经历过这个周期,那你至少是,已经有十几年了,对不对,更不要讲之前的,工作学习经验,而且之前很多半导体的,创业者们都是PhD 那所以这个团队,他年纪就不可能小,而且我觉得,有一定的年纪,那个时候安住,应该已经四十多岁了,反正是个优势,因为你在这个业界,有这么多的积累,然后你可以把你,每一个节点上的风险,都去解决掉,那你就是需要,这么多业界的这些,关系啊,人脉啊,还有一个,我觉得对于这个,整个生态系统,一个非常深的一个知识
程曼祺:对,也是需要的,所以对于半导体创业来讲,这个经验和年纪,我觉得是一个加分项,对我印象表深的是,他们开始创业的时候,他们另一个联创,是他们技术负责人 LotterBatch 那会儿已经60了 [00:59:25]
周楠:但是他现在已经退休了,现在他们有新的CTO了,对年纪都不小了 CTO当时上应该还比较,我觉得他是比较年轻的,就可能跟我们是同龄吧
程曼祺:对就现在新的CTO 对,其实那个CTO上,他也是当时的 founding member之一,他应该是 founding member里,最年轻的了,比较年轻的,但是现在也是,比较有经验了,然后想再回来
然后想再回来
程曼祺:然后想再回来,聊一聊百度的,一些的情况,就是除了在,百度投了Cerebras之外,当时在美颜,做AI投资的时候,还有一些什么公司,以及当时百度的,整个投资主线,会是怎么去布局的 [01:00:02]
周楠:我觉得当时百度,就是很坚定的要拖AI 然后除了AI之外,还有自动驾驶这个方向,所以当时我还有一个,花很多时间的,就是看自动驾驶,那那个时候,对于自动驾驶的这个硬件,像这个激光雷达,还有一些算力,也做了一些布局,当那个时候像百度登,出来做的那个,地平线的创始人,于泰博士,还有一些其他的,做自动驾驶level 2 level 3的这种,芯片公司,我们也去看了,也都做了一些布局和投资,其实当时有一个点很可惜,就是我觉得百度,真的很有前瞻性,就是那个时候,我们当时想要去做一个,当时百度有百度Capital 还有百度的Ventures 然后当时我还参与过一个,百度Growth Fund的一个募资,就是想要去布局,更前沿的一些AI的一些,整个权占的这样一个系统吧,就是并且把这个基金,能够独立出来,因为那个时候,已经有一些地缘政治的原因了,一些风险了 然后那个时候,我看了很多公司,我当时还有一个thesis 就是要投data和data engine 所以当时我还source了,那个databricks 也是很早source来的,然后其实OpenAI 当时也在我们的deal list上,因为那个时候,我记得Sam Altman 就是跟百度的关系,还是不错的,因为当年就是,陆奇应该是他的一个mentor吧,所以像OpenAI 那个时候也是愿意,接受百度的投资的 [01:01:12]
程曼祺:当时都在我们的deal list上面,你说OpenAI愿意,接受百度的投资,是哪一年啊 17年吗 17 18年 18年的时候,那时候他们也比较艰难,那个时候我们就看得非常早,然后那个时候我也是
周楠:在参与在那个基金的融资过程中,融了很长时间,就是非常的可惜,因为那个时候,因为地缘政治的原因,就是很多的LP 本来想要去参与这个基金的,最后都打了退堂鼓,所以最后的最后,这个基金就没有做起来,我觉得如果这个基金做起来了,可能现在百度应该是,全世界最牛的,这个shareholder吧,会是这所有的那些,房地产的这些shareholder 确实是比较可惜
程曼祺:我觉得这可能是我,比较有点一难挺的,一个事情,所以当时,在筹备新基金的,雇人中间,对OpenAI 对DataBricks 这些在List上的,公司的态度,你们的想法就是,募到钱之后,是会投的,这是比较确定的事 [01:02:17]
周楠:那是一定会投的,对那是一定会投,因为当时它已经是,我的Mathematics里面了,就是包括,像DataBricks 这个作为一个 Data Warehouse 而当时还有Data Engine 当时连Skill AI 都在我的,那个备投名单上,因为Alexander Wang
程曼祺:2016年就出来做了,我当时对于 data annotation 它也是我的一个 investment thesis 后来百度复盘过,这个事吗,因为看起来,是错过了很多,投资机会吗,后来我也离开了,就是,我觉得不是百度错过,而是当时
周楠:地缘政治的一些原因,让我们没有办法,去把那个基金,去给它做起来,所以这个也不是说,美加公司的问题,而是当时处在,这样的一个,中美的这样一个状态下,你这件事情,就很难做起来,其实当时,在这个地缘政治,出现问题这个基金,不能做了以后,我身上这个 emessment thesis 就聊了很多,美国一线的VC 我聊过insight partners 聊过Sequoia 聊过挺多的,还聊过benchmark
程曼祺:对我当时就去找 benchmark的Eric 我想你投了,这个Cerebras 你是否能够,白印我的,这个emessment thesis 结果他们,没有一个人白印,都说他们要投SaaS 不投这个,不再投这么,高风险的AI了 17 18年的时候,确实,应该那个时候,已经到18 19年,那个时候我已经快要离开百度了,我当时就想着说,我这个基金做不起来,那我拿了这个thesis 我总能碰一碰,能不能碰到 [01:03:25]
周楠:跟我达成共识的人吧,可惜没有这个命当时,就是聊了这么多的thesis 没有一个人赞同的,对,我就是在那个,比较遗憾的那么一个情况下,当时,我当时就是加入了高通创投
程曼祺:那在硅谷这件事情,开始转向是什么时候,就什么时候大家的,重心从SARS 整老院,我觉得就是 Chad P. Morgan 爆发以后,可能2022年底的时候,还没有完全意识到 [01:04:04]
周楠:我觉得那个时候,也很有意思,因为2022年底的时候,其实是Sequoia 最早写了一篇文章,就是说 Generation AI is here 对吧,就是你如果去看那篇文章,关于Gen AI的一个描述,其实Sequoia的那个,年轻的一个partner 叫宋亚黄他写的,但是我觉得,他当时写的那个文章,可能也没有引起,一个很大的重视,因为你如果看Sequoia 他也是整个错过了这一波,他没有一个frontier lab 它压上对不对,就我这里不是要批判Sequoia 我是觉得Sequoia 它也没有踩上这一波,所以就是说,这些比较顶级的VC 我觉得都是到,二三年后期,二四年才开始意识到说,要去全线压住AI这个战略
程曼祺:所以它其实比中国VC 也没有早很多,就是在硅谷,大家真的把大模型,看作一个很大的投资机会,像Kimi这些公司,它的创始时间是什么时候,我不太记得了
周楠:但是我觉得,像OpenAI 你讲它是 2005年就创办了 Anthropic 2020年创办的,在这两个 Frontier Lab 创办的时候,他们的融资,都不是一般丰盛的,也都是 [01:05:10]
程曼祺:对于美国的VC来讲,就是在,差迹病的爆发之后,他们才意识到,这个事情,可以做成了,对 Anthropic最早的投资人,其实,都不是VC 一位是 Eric Schmidt 就是 Google的陈思诚,然后还有一个是,哈萨比斯蒙,对对对,我这里还跟你讲,一个小故事,就是2020年的夏天,当时OpenAI的,一些百度的前同事,就他们很多,都是WL的好基友们,因为他们当时
周楠:跟我在百度的共事过,而且他们是当时最早,就是很早跟我讲,这个deep speech model 包括早期的这种 scaling到的出行的这些人,然后他们就给我打电话说,那那个给你讲一个,激动人心的事
程曼祺:GPT-3我们快要练出来了,我记得很清楚,他们当时,我就不讲名字了,因为他们都是WL的好基友,就那个时候是 2020年的夏天,那时候我已经在高通了,他们给我打了个电话,他给我发了一篇很长的文章,说GPT-3是怎么回事,说我当年在百度,想干的那件事,快要干成了,然后那个在OpenDA里面干成了,这个模型也练出来了,我说那这个模型,聪明到什么程度啊,因为当时在百度的测算说 [01:06:03]
周楠:如果你想练成一个像 Wikipedia这样程度的一个模型,可能需要将近快十年的时间,需要消耗很多很多的算力,上亿美金的算力,当时这些在百度,都是测算过的,所以我都还记得,我说你们到这个阶段了,到这个程度了吗,而当时那个朋友,就很诚实地跟我说,还没有到,还会胡说八道,那是2020年,距离就是GPT的,当时的发布还有两年,但是GPT-3 当时已经正在,做post-training了,所以他们就跟我讲,这样一个,这样一个阶段性的,一个成果,就很激动,然后他就跟我说,我们现在都想出来,我说为什么呀,他说因为他们,不再信任Sam Altman 因为他们觉得,他对安全这个事情,就是很不重视啊,等等等等,就跟我吐槽了一堆,然后就说他们要出来,出版一个新公司,然后就问我说,有什么意见,能不能给他们做一些advisor 那个时候是在疫情的时候,就那个时候还没有疫苗,我当时就说
程曼祺:我说我能给你什么advisor呢,能给你advisor 跟当年一样,就是要融很多很多的钱,去买算力啊,我说你们觉得自己能融到吗,然后他们就说,好像比较难,也不知道能不能融到,我说那这样的话 [01:07:22]
周楠:这个事情就是一个大挑战,就是你要去找到,能够给你钱买算力的人,而且主流的VC 是不会给你投这个钱的,我当时就是很诚实地,跟他们讲这个事,哪怕在高通,也很难去推动这样的一个投资,所以当时,这个电话,就是以这样的一个结论来结尾的,我其实当时是很想去跟他们见面的,可惜那个时候,在疫情最严重的时候,然后又没有疫苗,所以就导致了,我当时没有那个勇气,去找他们,而你看到后面的Sor 就是Andreason的那个投资人,去跟他们见面,一面又一面去给他们处处,怎么去融资,对,所以我觉得很多时候,这都是命运,然后就出现了,后面的anthropy 所以
程曼祺:这个当时他们想出来,创业的时候,我确实知道,对 HLZ也是他的早期天使,对 HLZ的那个投资人,是他的早期天使,而不是HLZ HLZ应该没有给他投,那个人是叫 ANJ 他的名字是,然后是他Mida 对,对,是那个人,所以也是个人投的,可能他也没说服成,对,他是个人,他的个人去支持的,当时美威西没有这个conviction 因为那个时候你想 [01:08:14]
周楠:GPT-3还在post-training的阶段,然后你离这个,当时的hallucination 是非常严重的,所以你离到那个GPT 出来用的那个moment 你还有两年多的时间,但那个时候,没有人能够想到说,他两年后就能够问世,我觉得那里面,当时的这个generalization 这个效应,就是他的那个 aha moment的出现,应该就是在2022年的时候,你在百度的这几年,百度美研除了
程曼祺:你比较熟悉的投资这部分之外,观察其他团队,他们是怎么运转的,因为当时百度美研,就全部都是研究员 AI researcher 还有一些做自动驾驶的,这些团队,当时是多大的规模呀 [01:09:07]
周楠:一共有多少人啊,当时应该有至少250多个人吧,就是在顶峰时期的时候,研究员们,确实都是全世界,最非常顶尖的那些研究员们,在一起共事,你加入的时候,已经搬到San Luisville了是吧,对我家做事的时候,是在San Luisville总部,对我记得那个时候,就大家每天中午一起吃饭,就你们都在讨论,不同的这些研究的话题和topic 我觉得那个阶段,还是非常难得的,我上个星期,其实还跟Greg开chart 然后他们都很感慨,就是说那个时候,就是一堆神仙打架的年代,那个时候的人才密度,包括在Google Geek Mind 都是没有过的,因为大家都是,我觉得相当一部分人,可能是真的冲着安卓来,还有就是因为,当时百度的创始人像Robin 他们很有这种,去发起了这个研究院,让这些researcher们 能够去实现他们心中的一些,当时的一些,对于AI的一些理想和构想,而且给了非常充足的budget 去买这个GPU 我觉得当时在世界上,是可能找不到第二家研究院,是这样子的,而且当时为了挖人才,我记得真的是,就是安卓来了百度之后,带来了很多deep mind的一些人才,那些人也是愿意跟着安德鲁一起过来,去做一番事情 [01:10:12]
程曼祺:你后来和他们其中的人聊过,包括安德鲁文达为什么要离开 Darrell为什么要离开的原因吗,没有去细问过,我觉得这一号可能也不方便跟我讲吧,那当时的研究员在百度美研,他典型的工作状态和氛围是怎样的,我觉得正好可以澄清一下,因为大家一直有一个段子,就是说Darrell在百度受到了一些不好的对待,导致他对中国很不爽,但是这都是开玩笑了 Darrell当时能够进百度
周楠:其实是一个,他职业生产中,很重要的一个环节,因为当时的Darrell 其实Darrell是Greg找进去的 Greg Diamonds当时,就是认识了Darrell之后,我觉得这个人是个人才,就是他对AI的一些构想,非常的深,而且他就是训练模型,也很强,即使他没有AI的这个背景,因为Darrell当时是,数学和物理,还有生物的一个背景,他不是一个 computer science 或者AI的这种,科班出身的一个研究员,所以当时,把他招进来的时候,可能内部还有一些质疑,但是是Greg 就是发现了这个人才,把他拉进来的,这个故事也是基于,都是美研的一些同事,告诉我的,当然我本人,是不是这样子认可,我不确定,只是说,这个是我听说的一个故事,那那个时候,他们就是可以去,根据自己的一些研究构想,去发表paper 去做一些,做一些AI的一些研究,我觉得那个氛围 [01:11:06]
程曼祺:当时是非常自由,而且是一个,非常鼓励他们去,进行这些发现的,那么一段时间,那这个Dirac的背景,和刚才我们说到,他早期投资,我觉得也有个相关性,就是A16Z 投他的这个合伙人,也是学生物学的,生物科学背景,可能他们以前认识,或者他们比较有,共同话题之类的,对我觉得非常有可能,大家都说就是,百度在AI上,他有一些起了,大早感的晚急的状态,包括他一年就成立了百度美研,然后15年 Deep Speech这篇论文就看到了,去扩大数据和算力,是可以迅速更智能的模型的,那实际上最后这件事情,并不是百度自己做成的,对这点是可能会让人觉得有点可惜,你觉得这是为什么 [01:12:00]
周楠:我感觉还是和,可能和当时的地缘政治有关系,我觉得那个时候,就是说在18年19年之后,因为地缘政治的一些研究员,我觉得他也会离开百度,因为在中美这个AI 在有这么一个 complete的这么一个情况下,就是这些研究员,基于这样的一种压力吧,我觉得可能还是,是会选择离开的,所以这个是我觉得
程曼祺:地缘政治是很重要的一个原因,对比来看,只是在中国公司,适应的中国模型里面,百度现在也不是最靠前的,我对中国的情况不太了解,因为我的整个,在百度的工作期间 [01:13:15]
周楠:都是在百度美国,但是我觉得最早期那批,人工智能的researcher 确实是在美国的,比如说从Hinton Lab里出来,包括文达,这些最有vision 最有远见的这些人
程曼祺:确实是在美国,硅谷这个地方,因为百度美研起步很早,它11年就成立了,今天15年前了,对起步非常早,我觉得可能是在美国这边,开始发展起来之后
周楠:慢慢的大家看到了,创新的这些信号 AI的这些信号,然后在中国,才开始布局的,我觉得,就是中国的这个AI的发展,在我看来,就我从一个,在美国的投资人看来,我觉得美国是,在颠覆性创新上,它更有优势,而中国在这个应用,和追赶上更有优势,因为中国它是一个 AI应用很大很大的,一个场景,它有这么多的摄像头,布在街上,当时computer vision的model 我觉得中国是,非常非常强的,市场也非常的大,那语言模型的话,还是在硅谷这边,先创新开始的,然后再到中国,所以我觉得中国,它一直是呈现的是一种,工程能力非常强,可以迅速追赶,可以在落地场景上,加快应用的这样一个优势,而美国更多的是,在一种就是说,颠覆性的这种架构和,原刃之上的一种创新,其实你刚才讲到
程曼祺:就是11年时候在美国,我本来想到一个反例,就是乌兰亚园院,也有很多AI的人才,但是你会不会说的,我觉得你有说服了我,确实微软亚运那会儿,我觉得更强是在计算机视觉上,而计算机视觉,你要是再往前追溯,那还可能是 [01:14:50]
那还可能是
程曼祺:那还可能是,比如说08年前后,然后发现CNN非常有效,然后到12年 ImageNet AlexNet 那确实也还是从美国这边开始的,然后是语言模型 NLP 这也是从美国开始的,对我觉得至少过去十几年里,你刚刚说的这个模式,肯定是成立的,就是美国的很多AI创新,它是作为一个起点吧,然后它扩散到全球,对是的,我觉得百度倒是有两个,留下来的AI的成果,一个就是自动驾驶,一个也是和你投资 Cerebras相关的,就是昆仑星,昆仑星对是的 [01:15:03]
周楠:我觉得百度对自动驾驶的研究,是非常早的,布局啊包括,它最后坚持下去,确实要给百度点赞的这一点上,然后昆仑星的时候,对昆仑星当时的一个负责人,那个时候我在投Cerebras的时候,也跟他交流过,我觉得那个时候,他就已经有在想要去创办,昆仑星的这么一个雏形了,所以我觉得百度能够把,这个昆仑星做出来,也是很了不起的
程曼祺:你们百度的前同事,在一起有复盘和讨论过,过去每年这15年的一些得失吗,你觉得,错过了什么大的机会啊,对我觉得大家心里还是比较唏嘘 [01:16:07]
周楠:我觉得是有一些很可惜的地方,但是好像感觉,这可能是历史的一个弊害,因为至于作为一个中国的公司,在美国去做这样一个 AI模型的研发,本身就会遇到很多的阻碍,我后来想想,在18年的时候,当时我和我的前老板,我们想要去,做这样一个AI的基金,那个时候可能是已经,因为我们已经预见到,这种地缘政治的一个阻碍,那我就觉得说,要成立一个独立的AI基金,那就去把这些厉害的人都投了,那个时候已经看到很多趋势,就是从百度离开的那些研究员们,就是他们分分都在创业,就觉得非常厉害,就觉得应该要把这些都投了,所以那个时候也是我们去,想要去募集这个基金的一个初衷吧,但是也很可惜,就是这个基金,也是遭到了地缘政治的一些原因,没有办法募起来,我觉得可能如果当时,我更成熟一点,更勇敢一点,可能去扑服陈周的
程曼祺:应该是可以把它搞定的,可惜当时我太年轻了,就是没有管理VC的,一个独立VC的能力,确实如果把百度美颜出去的,这个人都投一遍,包括像Pony小马对吧,当然还有Anthropic [01:17:13]
周楠:也可以算吧,还有Darren 但绝对的,因为当时你想,他们出来春节的时候,是第一个给我打电话的,所以如果当时,把这些人都投了,那应该是非常了不得的,所以我就希望说,如果当年,我再有一些经验就好了,比如说如果当年,我已经做投资,做了可能五年六年,可能很多事情,就会不一样了,可惜我当时,等于说是我第二年,第三年做投资,就是还是太年轻了,没有办法,支援起来,这样一个基金的构架
程曼祺:你后来自己想从百度离开,是一个什么契机,是为什么,也是因为当时这个基金,没有办法运作下去了,百度也就在美国,也就没有投资团队了,所以再加上那个时候,我带着这些,去找这么多美国的一线VC 也没有人去认可这件事情,因为等于说,在共识起来太久了,就推翻共识吧,就是在共识到来,很多很多年前,所以在那个时候,刚好高通泡来了橄榄枝,就是高通他愿意去在端测AI 去寻找一些应用场景,然后我就很自然的情况下,就加入了高通,那最后这部分我们正好可以聊聊,就是你在百度,包括在高通,整个十年的科技投资过程中间,你看中的这个方向,比如说和算力和infra相关的这些领域,看到了些什么机会,尤其我觉得可以重点聊聊 跟半导体和算力相关的,因为这个也是整个AI最重要的一个基础,然后整个市场规模也特别大,我觉得我的投资的这个thesis 就是还一直都还挺清晰的 [01:18:47]
周楠:就是在百度的那几年,我当时就是定的是对于算力的一个投资,然后后来过渡到data engine 就是我觉得要去投跟data warehouse 和data engine相关的一些这种公司,这个时候是在以一个云为基础的,就是说以一个training 这样的一个training大模,比较大的这种大规模的模型,不管是视觉模型还是语言模型,我基调的这样的一个情况下,有这么两个investment thesis 当然还有自动驾驶,还有自动驾驶的这个硬件层面,还有软硬结合的方案,这是我在早年的时候,形成的一些投资理念吧,就是investment thesis投资方向,后来到了高通以后呢,因为高通非常的强调端则AI 那有那么三年的时间,我看了很多了,这种IoT和端册的一些布局,那当然我当时有一个lesson 就是我发现这个端册,在美国 尤其是硬件IoT 它不是那么容易腾飞,因为端册就是,跟硬件相关的这种投资,在美国本土,它的土壤不是特别的好,真正的IoT 可能在中国更能够跑通,相比美国的话,其余这样一个全球性的视角,因为高通它也是一个,全球性的公司,我们就发现说 IoT的这些投资在中国,明显要比较联合成功的,很多的多的多,因为它的应用场景,在中国也更多 [01:19:53]
程曼祺:你说的IoT端测投资,举例来说是一些什么,比如说智能设备吗,对比如说智能的这种,智能家居之类的,对对对,智能在端测的一些设备,比如说早期的一些 [01:20:19]
周楠:机器人的一些投资,会发现这个,当然这个机器人投资,也是在现在所谓的,这种World Model Physical AI之前,我们就发现说,这个场景其实在中国,它更多的有落地的场景,相比在美国的情况下,然后就到了GPT moment 出现了这个时间段 2020的时候,我那个时候有一个觉醒期吧,就是发现说,哇这个大模型的到来,比我们当时在百度测算的时间,要早了好几年,然后那个时候我就,突然就是说觉醒了,就是我要赶快把我投资,再抓回到这个 cloud based的这些infra上来,所以我从那个时候开始,去思考说 OK 我在23年之后在想说,那后面怎么去布局,而你会发现,从23年开始之后,我觉得这个时候,可能是算是个 AI 2.0到3.0的过渡吧,它就整个在加速了,不管是模型的进步也好,还是这个Enterprise的,一个adoption也好,它开始在加速了 我其实在2023年的时候 24年的时候,在高速内部做过一个分享,就是我觉得 Enterprise AI的到来,会比我预想的那么快,我当时给了一些数据,给了一些场景,我当时提出了 Coding AI的一个概念,就是那个时候 Coding AI已经开始,就是在微软的,这个Copilot上面,一开始有些场设,那个时候还是 before这种,所谓的cursor moment 我当时就觉得,这个是一个,会爆发的一个场景,就是起初的一些构想,确实就是,因为有那几年,在百度的基础,然后你在,那个时间点上,往后看的时候,你就看得很清楚说,这个data engine 然后一些 enterprise AI的,这些应用adoption 还有,当然要持续的,加注算力,然后还有一些 AI infra的一些投资,因为在这个,大语言模型的时代的,这个infra 它是完全是一片空白的,所以那个时候 2023年到25年期间,我觉得很多的 infra包括像reg 包括像inferencing的,这种optimization 还有你怎么去deploy 这个模型,这些一系列的infra 都是有很多很多 [01:21:27]
程曼祺:下注的机会的,那你现在有看到,比如说算力层和云层面,什么新的机会吗,就整个大的infra这一层吧,我觉得大的infrastructure 因为今年开始就是推理 [01:22:32]
周楠:它占据了整个算力很大的一个部分,所以我觉得推理成本的一个优化,会是AI产业的一个很大的一个战场,这个推理包括就是说,你去帮助这个模型,在应用层面的deployment influencing的deployment 推理的这种部署,还有多么大的一些推理的优化,因为你想就是说,这个推理成本,它最后会反映到,你的这个profit margin上来,如果你的,不管是模型的应用方也好,还是终端的消费者也好,你的,如果你能够,把你的推理成本降下来,你的token cost降下来,那么你的这个growth profit 一定会有一个,很大的量子的提升,所以这一点上,我觉得是到了 AI的一个 business model 优化的一个下半场,所以我觉得,对于推理成本的,这样的一个优化很重要,这里面就是,有一家公司叫Agon 它被Navius 今年3月份的时候收购了,它这就是一个非常典型的,进行推理优化的一个创业公司,这家公司我是去年8月份,它刚刚成立的时候,当时我就发现了,它也是通过MIT的一个教授,韩松的一个好朋友的一个介绍,它的这个founder就是韩松的学生,所以当时我们对于这个推理的优化,因为可能Qualcomm 它在这种端册推理上,它比较敏感,所以我对于推理优化,这个事情就非常的敏感,我就觉得这个事情,是后面端册爆发了以后,非常重要的一件事情,就是它对于这个整个AI的一个business model [01:23:40]
程曼祺:都会有一个质的一个提升,韩松以前也自己创业做过芯片公司,神剑,是的,他是连创之一,对,所以这是一类对吧,对,这种我理解,它就是第三方的一个infra优化的公司,它是偏软件系统层的,对它是偏系统层的,那你也可以通过这个influencing 就是通过这种influencing optimization [01:24:17]
周楠:或者token optimization这个能力,你也可以延展到去说,做一个这种和Cloud相关的business 所以就是说,其实这一层它跟Cloud结合是最自然的,因为它可以直接帮助你在Cloud上部署的客户
程曼祺:进行一个这样的influencing的一个优化的,这样的一个帮他去部署的更好,对之前黄仁勋滑的时候,就是把云和influencer滑在一层了嘛,是它的五层蛋糕的,中间的第三层,最下面一层是能源,然后再上面一层是,芯片集群,到第三层就是,云和infra这部分,所以这个是你会,重点看的一层,我觉得这个已经在发生了,就是这个现在是一个,很重要的一个事情,因为这个对于,不管是模型厂商,还是对于利用场景来说,都是很重要的一个环节,这个里面除了你刚才说到,你自己投的这家,已经被收购,成功退出的公司之外,有什么你觉得,这个我没投,这个就神奇一下,这家公司没有投上,虽然看了很早很想投,但是卖的太快了,所以也要恭喜这个创始人,就是他后面就没容了是吧,相当于他很快就交易了,没有再容了 所以就是你可以看到,就这个事情的重要性,那这个领域,你觉得还有什么比较好的,有意思的公司吗,你觉得值得关注一下,当然还有了,我可能暂时不提公司的名字 OK 你要投对吧,对因为这个还处在一个,我觉得现在可能是处在一个,共识的初期阶段吧,还是有两三家在做的,之前在Cerebras上市的时候,你写了一个社交媒体的分享,当时你说到伟大的投资,发生在没有形成共识之前,你觉得现在有什么你很相信,但是你认为它还没有形成共识,是一个很好的投资机会的方向,这个问题好难回答呀 [01:25:52]
周楠:我觉得这两年的早期投资,其实非常难,因为就是因为,其实AI已经是一个共识了,当你是一个共识的时候,你所有的投资人,所有这个产业链上的人,都会去想方设法去挖说,我还有没有什么样,一个非共识的机会,所以这个窗口是越来越短的,就你想说,我当时投了Cerberus 到现在它上市,这是一个十年的时间,然后你如果是在,比如说2023年的时候,去投Anthropic 或者是OpenAI 它可能也是一个共识,刚刚要形成,它还没有完全形成共识的一个窗口期,你至少还是有一点窗口期的时间,就可以去做这个投资布局的,但是现在就是,我觉得非常难,越来越难了,包括去年的时候,我当时去年还写了一个,给身边投资人朋友的一个信,把这个信文给我去公开,就当时我在,我记得是2025年的2月份的时候,我当时几个投资的方向 就是包括General Purpose AI Agent 那个时候我列举了 Ninus和GenSpark 然后还有包括像一些 video model multi-model的这些公司,还有包括一些 multi-model的这种infra公司,像File F&L这家公司,还有像一些 physical AI的一些公司,还有一些vertical AI的一些公司,就是那个时候,我觉得应该投的这些公司,其实它给你的,投资机会的窗口期,只有两到一到两个月,就是你看中以后,要立刻下注,这个时间给投资人的窗口,是越来越短了,所以我觉得,想要去把这个早期投资做好,是挺不容易的,就是你必须要有,非常敏锐的一个嗅觉,然后你要有,有非常强的一个,就是picking的能力,就是你能够找到,对的公司,然后你要在这个,它形成共识之前去下注,所以我觉得现在,对于早期的利息的考验,是非常难的,而今年其实,比较容易的投机,是投赶期 就是我认为,现在一些几个方向,跑出来像coding agent 像这个对吧 frontier lab 然后像一些infra 它已经其实,就是有一些,很大的winner 已经跑出来了,包括像V6 model一些,已经有一些,就是明显的winner在那了,所以对于VC来讲,你会发现,现在越来越多的VC 它在投中后期,而且它们在,目比较大的基金,去投中后期,像这个benchmark 刚刚今天,刚刚announce 要去融一个,两个别链的基金,它们是24小时,目思窗口就立刻关闭,就已经一天之内,就把一两个别链,给融完了,其实这些,比较头部的VC 都在募偏后期的基金,去砸这些,已经出圈的这些category winner 所以我觉得,今年的一个投资主题,就是砸这个winner 用大钱去砸winner [01:26:30]
程曼祺:砸已经跑出来的公司,那这还是venture capital吗,这是venture capital的变种,我觉得这个已经,因为就像我讲的 venture capital 就是需要在,没有形成共识之前下注 [01:29:10]
周楠:而现在的共识时间,就是非共识到共识的窗口,实在是太短了,就是短道你可能还没有反应过来,它就已经形成共识,就成了你要去花大价钱,去下注的这么一个局面,所以我觉得现在的VC
程曼祺:就是演变成了,我要去融一个大的基金,去投这个已经跑出来的这些公司,对当然我觉得砸Winner 也不是十拿九稳的,它肯定还是有一些风险在的,但是如果它出了岔子
周楠:那可能就是很大的问题了,我是这么认为的,就是因为现在我们,如果你把这个AI的时间拉长的话,我们可能还处在,这个AI这轮 let's say 可能现在是,第四次,第五次,这个技术变革的,一个早期
一个早期
周楠:一个早期,因为现在,虽然我们已经有,很明显的winner了,然后大家也觉得,是不是五到十年内,都不要五到十年,把现在处在一个 IGI的这个moment 已经到来了,但是它还在处于 adoption的早期,那么在这样的,一个早期的情况下,已经有winner 出现的情况下,这些winner 是会越长越大的,它会形成一个 fail的效应,就比如说,为什么现在大家,都是疯了一样,要去投Anthropic Anthropic现在可能,刚刚到一个 Trillion左右的一个量级吧,就估值上来讲,那么这家公司,未来会到多少,我觉得它变成,如果Trillion 我觉得是不奇怪的一件事情,所以那如果现在,你作为一个,明智的一级市场投资人,要投什么,那你投,我觉得投Anthropic 是No-Brander 那还有一些其他的 Infra跑出来的公司,也是一个,就是说像,比如说有几个,我比较喜欢像Fireworks 还有像File FL 还有像Basetown 这些,一些infra这种公司,那它就是形成了一个,早期的一个绯闻效应,它后面,这个雪球是可以滚得很大,所以就是,这个也是一个共识吧,就是说 [01:30:04]
程曼祺:我去直接bet这些winner 接下来你比较期待,会发生的事情是什么样,我觉得physical AI 就是robotics这个赛道,可能,它,有很多人都说,这个可能就像 [01:31:08]
周楠:十年前的自动驾驶一样,那根据我在语言模型上,学到的这个经验教训,我认为这个 Physical AI的Aha Moment 可能会到来的比自动驾驶,给我们想象中要早一些,虽然它现在还有很多问题,像这个data的这个瓶颈啊,包括软硬件结合的这些瓶颈啊,可是我认为这个Aha Moment 会比我们想象中要早,所以我觉得现在可能是下注这个,硬件的一个好时候,为什么呀,理论上来说 Physical AI不是比自动驾驶更难吗,对,它的很多场景,比自动驾驶,要更加的diversify 但是它对于,正确性的要求,也没有像自动驾驶,这么高,自动驾驶,你必须是做到
程曼祺:99.9%的正确性,对吧,要不然你会出人命的,但是Physical AI这些,我觉得,它对任务的完成度,对于准确度的要求,会比自动驾驶,稍微宽容一些,为什么大语言模型上的经验,会让你觉得 Physical AI的 Aha moment 会更早来了,因为就是,如果还要十年前,当初我们在百度的测算,就觉得说你出现一个像 Vikipedia这样的一个模型,可能需要十年的时间,但是它其实这个模型 [01:32:00]
周楠:它是有一个generalization 应该怎么讲,泛化的能力,就是这个模型泛化的能力的速度,会比你想象的要快,当你的模型越来越大的时候,它的这个进步的程度,它是会呈现一个
程曼祺:我觉得这可能是物理的一个规律吧,它的进步速度,后面会呈现一个陡峭性的一个曲线,可不可以说当时,百度美元十年前,它低估了语言模型进化的速度,但是高估了自动驾驶进化和落地的速度,我觉得自动驾驶这个事情,因为它对正确性的要求非常高,所以我没有觉得它是低估了它的速度,我是说高估了这个速度,但是语言模型它有一定,就是说这个泛化的这种能力,可能是当时没有去预料到的,因为我印象中1718年的时候,或者说更早吧 16年的时候,从美国到中国,都是认为全国人驾驶,会比较快的普及的,对,当时微博包括马斯克,都有很多相关的言论
周楠:对而且当时还有一些,路线的一些辩论吧,比如说到底是,基于视野模型就好 Level 3就好,还是说你需要一个激光雷达,做Level 4 所以这个也是当时,我记得一个辩论之一 [01:33:32]
程曼祺:所以Physical AI也是,你接下来可能会花点精力,去看的方向,对这个我可能会花点精力去看,这个方向因为,它还没有形成共识,所以如果我觉得投资人,就是一定要在没有形成共识的事情上,去形成一个自己的投资的理念和模拟,你觉得Physical AI会有新的,芯片算力和infra层的,需求和机会吗,现在有看到这一类苗头吗
周楠:这个还真不好说,就是我觉得对于芯片层,应该会有一些机会吧,因为就是如果你Face of Air在落地的时候,你身上都挂着一个GPU 那我觉得是很好电的一件事情,就你需要有一个low latency 然后power efficient的一个解决方案,所以我觉得可能会在这个算力解决方案上,会有一些创新的空间,然后其实你刚刚说到芯片层,我还认为就是可能也会有一个新的CPU架构出现,作为推理芯片,因为现在推理芯片上,就是Service是一个,刚刚出圈的一家公司,对吧,那可能还会有一些,其他的基于CPU解决方案的,一些公司出来,我知道有一些创业公司,已经在做了 [01:34:11]
程曼祺:已经在开始,已经在开干了,就是也是很早期,就是我觉得这个也是一个,值得关注的一个点 OK 那今天非常感谢,周南做客玩电聊,分享了过去十年的投资故事,尤其是刚刚上市的Cerebras 这家公司的投资故事,从最开始,他怎么发现了这家公司,和百度美研当时的研究员,一起怎么做了详尽的进调,然后在这家公司的方案,还是一个非共识的时候,很快的就做了投资决策,我们也延展的聊了,现在整个AI领域,尤其是算力和infra层,有什么正在萌芽的新的投资机会,那今天非常感谢大家收听晚点聊,节目就到这里拜拜,在156期与Henry Ng 2026年Q1的AI激报中,以及那之后不久 我和SpaceX的早期投资人 Fusion Fund的创始合伙人张璐,聊马斯克的Terra5 AI基建设想的节目中,我们都讨论了2026年以来的 AI算力的最新趋势,大家都看到的转折是从训练走向推理,也就是算力消耗的重点,会从制造大模型的阶段,走向使用大模型的阶段,这本来没有什么新鲜的,前两年也一直有人在说,不同的是 2025年下半年至今 Coding以及Agent的应用的爆发,让这一条预言真的成了事实,大家看到了Agent的这类,更复杂的任务和应用,带来了推理的,算力和Token消耗量的爆发式增长,而更深入这个趋势,又可以看到两个明显的变化,亦是AI推理有了更多易勾芯片的机会,主要就是指不同于英伟达的通用GPU结构的芯片 Cerebrus上市后的强势上涨表现,就是因为一些人会压住Cerebrus设计的 Wafer Scale Engine这种独特的架构,在推理阶段有它的优势,这包括电池高吞吐高稳定性等等,其实英伟达自己也做了相关的动作,就是我们这期里聊到的,他们在去年12月非常快速的以200亿美元,收购了Grok这家创业公司,并且在今年3月GTC的新方案上,就把Grok整合到了英伟达的整个算力平台上 Grok主打的就是在推理阶段提供AI算力,二是CPU崛起,比如这期我们就聊到了 CPU正在出现一些新的创业机会,这是因为在agent的工作流程中,存在一些调读类型的任务,它们并不适合GPU所擅长的并行计算,周南也提到 他知道有些团队已经开始在这个方向,发力和创业了,这也是他接下来可能会投资的方向,其实这种变化也反映在了二级市场上,我们看到英特尔和AMD 今年以来都有不小的涨幅,回到九年前,周南在百度美研想投资Cerebros的起点,就是研究员们认为,未来的大模型不应该在算力层,只依赖英伟达这一家公司,而现在的情况是,如果不考虑Google的TPU 这种大厂自己训练模型时,主要自己使用的自研芯片,在公开市场,在公共云上,英伟达确实形成了,事实上的AI算力垄断,十年前部分研究员想避免的,这种对单一公司过多的依赖,依然是发生了,这种状态会持续吗,未来的变局,可能会从哪条裂缝开始,这会是我们之后,反复讨论的话题 本期节目就到这里,感谢收听,如果你对今天聊的话题,有观察好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整,你也可以把我们的节目,分享给对这个话题感兴趣的朋友,推荐更多你想听的主题和嘉宾,你可以从小宇宙,苹果Podcast等渠道,关注晚点聊Late Talk 也欢迎关注我们的公众号,晚点Late Post 下期再见 请不吝点赞订阅转发打赏支持明镜与点点栏目 [01:35:01]