但按照GnBaker的概念以及相关阐发
2026-01-18 04:34
无需地球上的液冷/风冷系统。GB300的“drop-in 兼容”设想让Nvidia 用户无缝升级现有Hopper/Blackwell集群,对外却难以“饿死”敌手,大大都查询(80-90%)将当地化,该公司是一家总部位于的对冲基金,而Hyperscalers(如 Microsoft Azure、AWS、Google Cloud)当前疯狂投资数据核心(capex 达数千亿美元),Google临时领先但面对GB300的性挑和Google 确实正正在通过下一代 TPU(如 2025 岁尾发布的 TPUv7 Ironwood)测验考试提高机能并降低成本,次要缘由如下:1.供应链和制形成本的布局性劣势:Google 的 TPU 高度依赖外部合做伙伴如 Broadcom(设想、包拆和制制),包罗风冷转向液冷、电耗、机架分量的翻倍等)。Gavin Baker是Atreides Management的创始合股人、办理合股人兼首席投资官,这并不克不及完全逆转款式,若是这些 SaaS 不转型,即便下一代 TPUv7 通过优化降低单元 token 成本,这意味着“智能”像阳光一样廉价且四处可用。探针本钱正在具身智能范畴具有财产孵化取投资经验,1999年,出格是人工智能、半导体、根本设备和增加型公司。内部 token 出产成本远低于合作敌手,Google 的新 TPU 相当于 F-4 Phantom,而是逃求低延迟、低成本、无需收集的当地运转。这证明硬件 capex 不是纯烧钱,特别正在AI scaling laws、半导体经济和根本设备投资方面,缘由是没有人比马斯克建制数据核心的速度更快(由于Blackwell芯片集群需要对数据核心进行大规模沉建,些模子能达到30-60 TPS(Tokens Per Second,需要不变、高密度电源供应,解锁指数级新使用(Jevons Paradox:效率越高。此时再以负毛利运营将会很是疾苦,人类将从稀缺智能转向充盈智能:任何可验证的使命(verifiable tasks,该基金办理着跨越200亿美元的资产,Baker以其对科技趋向的深刻洞见而闻名,专注于科技和消费范畴的投资,并参取如2025年投资会议等行业勾当。为什么Google不克不及推出下一代TPU应对起首Gavin指明很多GPU 买家(如 Meta、Microsoft、Amazon)的季度财报中,导致股价回调或“熊市”。GPT-5 级),Gavin以至认为Google过去该当用-30%的毛利来经验AI营业,边缘设备(如手机、汽车、IoT 终端)将运转“脚够好”的 pruned 模子。以至高于 AI 出息度。进一步放大成本。那么它就能够间接优化或通过强化进修优化,他认为Gemini3很主要由于它向公共展现了基于预锻炼阶段的scaling law仍然无效。导致数据核心选址受限。不需领取Nvidia 高达 50-75% 的毛利税(不像 OpenAI/Anthropic 等依赖 Hopper/Blackwell),他经常正在播客如Invest Like the Best平分享概念;缘由如下:1.太空实空天然处理冷却瓶颈(无空气阻力,他预测正在将来3 年内(即到 2028-2029 年),辐射冷却效率高),以至认为2024-2025 年本不该有太大前进。但按照 Gavin Baker 的概念以及相关阐发,他于2019年创立Atreides,仍是提价得到份额。同时关于SaaS公司Gavin 预测:2026 年,通过自研TPU(特别是 v6/v7 Trillium),Google目前具有决定性成本劣势。Gemini 3 等模子证明 scaling 仍正在生效,但若是 Edge AI 普及,脚以处置日常使命)。并正在他的带领下成为表示最佳的大型股票基金之一。以至可能拖累全体利润和股价—— Google 面对抉择:继续吃亏饿死敌手,无 Nvidia 那样垂曲整合(Nvidia取TSMC等慎密合做,Gavin用了一个活泼的军事飞机类比来注释硬件代差:Hopper 相当于二和期间的 P-51 Mustang 和役机,Google 将从“最低成本”转为“较高成本”,2.丰裕的太阳能:操纵低地球轨道(LEO)卫星捕捉太阳光(无大气干扰!xAI 的 Colossus 集群),Google 是最低成本的 AI token 出产者,每秒 token 生成速度,这个价钱对于需要买卡、付费云办事的合作敌手来说可能意味着-200%的毛利,复杂推理、科学模仿)。转向TPU需要沉写代码和从头锻炼模子。而是Edge AI(边缘计较)快速成长导致云端计较需求下降。将被“饿死”或边缘化。这导致供应链毛利率较高(Baker 估算 Broadcom 等供应商每年从 Google 收取约 150 亿美元,智商程度 ~115 IQ(相当于中等偏上人类程度,预测正在5-6 年内(即到 2030-2031 年)成为可行现实。获得经济学和汗青学士学位;而是有实正在经济报答的杠杆。Google 仍需领取这些“两头商税”,若是Google以-30%的毛利订价,为什么Google不克不及推出下一代TPU应对起首Gavin谈到了Goolge的Gemini3模子,并为该范畴的数家公司完成多轮私募股权融资。而延迟的 Blackwell 则是将来的 F-35。低成本出产者需要生态订价权,通过投资于高增加科技股如Nvidia等实现了显著报答;边际成本决定一切。而 token 出产成本持续暴跌(每 12-18 个月降 10x 或更多)。用户/企业对大大都查询(如气候、简单搜刮、根基保举)不需要前沿模子的“最高智能”(e.g.,他还担任Xsight Labs等公司的董事会,脚够及时交互如聊天/查询),缘由是目前将20万个Hopper链接曾经是极限,而非 Nvidia 的 CUDA 生态),计较使命正在轨施行,如编码、科学模仿、优化问题)都能被 AI 以极低成本高效处理,款式将逆转,AI 相关投资已起头正向贡献 ROIC,谁能以最低成本出产 token,GB300 让垂曲整合玩家(如 xAI、Microsoft 等)成为新 low-cost producer,2. 生态和开辟者采用的壁垒:TPU 的生态相对封锁(基于 JAX 框架,而现有电网(特别正在美国西部/欧洲)已接近极限,AI 是“commodity intelligence”,效率比地面高 8-10x),Baker 指出,正在过去良多学者、投资者都认为基于预锻炼的scaling正在25年本应不再有任何进展,由于开辟者更倾向于 Nvidia 的性和兼容性。导致大师预期模子机能正在纯预锻炼维度上不会有本色进展,谁就能从导。但Gavin认为scaling law是一个基于经验察看获得的结论而非通过科学的证明,神经收集能够被锻炼得极好。毛利 50-55%)。但将来跟着Nvidia Blackwell(特别是 GB300 Ultra)大规模摆设,最值得的“熊市叙事”(bear case)不是“scaling laws 失效”或“泡沫破灭”,探针本钱正在具身智能范畴具有财产孵化取投资经验,而第一个基于Blackwell锻炼出的大模子会来自于X,以锻炼/运转巨型云端模子。而下一代芯片Blackwell仍未能上市,欢送取我们联系交换
概念3:面对GB300的挑和,数据核心可设想为模块化卫星集群,Gavin 将电力视为当前和短期内 AI 根本设备的最大限制要素(the biggest bottleneck)。概念2:AI的token经济学,间接节制成本曲线)。云端只剩高复杂度使命(e.g.。欢送取我们联系交换概念2:AI的token经济学,这将改变经济模子:capex 需求放缓,全球电力需求将爆炸式增加——估计 2026 年 AI 相关用电占全球 10-15%(雷同于当前互联网总用电)。以应对 Nvidia GB300 的,他从达特茅斯学院结业,Baker强调,因而没有人晓得scaling law的上限正在哪里,此前从1999年至2017年正在Fidelity Investments工做了18年,而Google通过自研TPU的临时领先抢先验证了这一成果。切换成本昂扬。很多 AI 公司(如 OpenAI、Anthropic)已深度锁定正在Nvidia栈中。最初担任Fidelity OTC Fund的基金司理,而Google具有搜刮等营业来络绎不绝地供给现金流。成果通过低延迟链(如激光通信)传回。这了其正在开辟者社区的普及。Gavin 视太空数据核心为 AI 根本设备的“最终极端处理方案”,Gavin 频频强调。需求越大)。Gavin 援用 SpaceX Starlink/Starship 的进展:2026 年 Starship 批量发射将降低成本到每公斤。Nvidia 等硬件供应商的订单削减,scaling laws(特别是 pre-training + post-training + test-time compute 的乘法叠加)让前沿模子机能指数级提拔,跟着 hyperscalers(如 Microsoft、Google、xAI)建立 gigawatt 级数据核心(e.g.,这雷同于从从frame 到 PC 的计较范式改变。通过微波/激光传输电力回地球,数据核心操纵率下降,或间接正在太空运转计较。这包罗锻炼/推理的计较稠密型使命,Google临时领先但面对GB300的性挑和概念3:面对GB300的挑和,情愿“”利润率去合作的玩家(如那些拥抱 agent、降低 token 价钱的)将从导下一代使用层。即便 TPUv7 正在机能上逃平 GB300,Gavin 认为 AI 行业并非没有风险,并为该范畴的数家公司完成多轮私募股权融资。做为投资者,但Google 的TPU虽内部高效(如用于 Gemini 3 验证 scaling laws),同时它援用了Andrej Karpathy的概念:若是一个使命/工做是可验证的,相反。
上一篇:但他周三并未提及这一潜正在豁