随着AI中GPU含量的加大,25年美国早已寡头的云服务行业,开始冒出一堆新兴云公司。本篇,海豚君以新云之一CoreWeave来作为研究对象,来尝试理解一下AI时代,基础云服务的生意模式、要素变化,以及CoreWeave是不是一个有长期价值,从事好生意的好公司。,而在下篇中展开定量角度,对公司的收入空间、成本结构、资金的投入产出等问题来判断目前节点,公司的投资性价比如何。,首先,CoreWeave所属IaaS行业的商业模式——主要价值体现在整合上游供给,匹配下游需求,用大规模的需求来分摊机房建设和研发成本上。,1.1、需求的整合,这部分简单来说,就是共享机房。原本每个企业都需要IT搞一个机房,但单独建机房不仅成本高,而且利用率不高,比如电商用云高峰是在双十一,游戏云用量暑假;视频用云是在下班后,而钉钉用云是在上班时。,一个公共机房,可以把使用云服务的谷峰和谷底都平滑掉,从而提高机房的产能利用率。并且,对
云服务而言,客户数量越多,同时他们的需求曲线越多样化(例如属于不同行业、处在不同时区等)
就越好。(微软CEO Nadella在近期的电话会中,明确表述过类似的观点),,1.2、供给的整合,一个完整、可投入运营的IaaS云计算中心,是建立在三个层级的软硬件基础设施上,包括
第一层的土建和能源供应,第二层的各类IT和非IT类硬件设备,以及第三层的各类软件和工程能力。第三层以研发人员投入为主,不太涉及Capex投入,接下来重点谈论“看得见摸得着”的前两层:,1)第一层——土建 & 能源:简单来说,找到土地,建设厂房,创造一个能放服务器的地方。
取决于其面积/规模大小,建设一个全新数据中心(空建筑)所需的时间大约在1~3年不等。,云服务商可自建这些不动产,也可以给外包来建设和管理,如Equinix,Digital Realty等直接租赁现成库房。,除了土地和库房建筑外,数据中心还需有电力、水源和网络链接等外部
能源的稳定供应,也是目前云服务扩张产能的主要卡点之一。不过能源供应主要是运营开始后产生的持续成本,并不需要太多前置投入。,根据调研,第一层级的
土地和库房建设,大约会占到数据中心建设总投入(不包含软件)的约5%~10%。,2) 第二层——IT类设备:在土地&库房的基础上,支撑起一个数据中心的第二层是
各类的硬件设备,首先是与提供算力直接相关的各类IT设备,包括:,a. 服务器:数据中心中最重要的部分,基本可以理解为更大块头的电脑,同样由高性能芯片(GPU/CPU),主板,内存等主要组件构成。目前
高性能芯片和内存也是云计算中心供应链上的另一主要卡点。,在这个核心组件上,云服务商们同样可以 “自行设计+ODM代工”,或者直接向Dell等供应商采买。目前来看
Azure,AWS等头部服务商会更常使用自行设计的服务器,而
CoreWeave则是以直接向上游供应商采买/租赁装配完成的整机为主。,b. 网络设备:在传统云计算中心内,主要包括各种交换机设备——实现服务器之间的数据传输;路由设备——负责将数据中心与外部网络的链接;以及各类链接组件,如光模块、光纤线缆或铜缆。,在AI时代,由于各服务器之间传输数据速度要求的大幅提升,
需要更高性能的AI专用交换设备,如英伟达 Quantum等。,c. 存储设备:为了存储运营过程中产生的大量数据,云计算中心中也需配置大量机械或固态硬盘构成的集群。,根据调研和行业惯例,
IT类设备占数据中心硬件投入的绝对大头,占比可达60%~70%。其中服务器是最核心的部分,能达到总投入的约40%~50%。,且在AI时代,由于算力芯片、内存、高性能交换设备的单价普遍更高,AI计算中心的IT类设备占总投入的比重会更高些。,3)第二层—非IT类设备:除了上述和云计算直接相关的IT类设备外,计算中心也需要配置大量的
非IT类设备以维持运营,主要包括:,a. 供电设备:包括
变压设备将外部高压电力转化为内用;备用发电机组,在外部停电时,能继续维持供电较长时间;
UPS不间断电源,在意外情况下在短时间维持平稳供电,保持服务器等设备正常运营且不被损坏;
储能系统,帮助平衡耗电的波峰波谷,或外部断电的情况。,b. 冷却设备:为服务器集群或者整个数据中心进行散热的系统,大体可分为风冷和液冷散热。随着AI时代
单卡算力/发热的大幅提升,对液冷散热的采用率越来越多。,c. 机柜:即用以承载其他设备的各类物理框架,虽然这些“铁架”并没有任何技术含量,但如何进行布局并和其他系统整合,以实现更高效地帮助散热、数据传输等仍是存在一定行业“know-how”。,d. 监控 & 备灾:实时检测各设备运转情况,还有电力供应,散热,网络状况的各类设备,帮助监控并解决死机、断电、断网、火灾等各类异常情况。,根据一些调研,
能源和冷却等非IT设备则占据总投入剩下的约20%~30%。在AI数据中心中的比重则更少些。,,由上文可见,IaaS云服务的商业模式的核心价值来源于对算力的需求和算力生产要素的整合,以在更大的规模下实现更高效的匹配和更低的运营成本。,那么自然的,
对一个云服务商,其向下整合需求,以及向上整合供应链的能力(解决产业链卡点,对供应商的掌控和议价能力)是其核心竞争力之一。而在上述“硬实力”之外,云服务商的“软实力”(如软件和工程能力)也是构成差异化竞争优势的重要因素之一,此在后文会单独讨论。,2.1、高度依赖少数巨头的客户结构,首先从整合需求能力的角度,“旧时代”传统云巨头的
客户结构高度分散,由数量众多的不同类型企业汇聚而成,任何单一客户占总收入的比重都不高。,CoreWeave
客户结构高度集中,
目前基本只由AI模型独角兽,和有能力独自研发/优化AI模型的大型科技公司构成。,在
2024财年CoreWeave约$19亿的总营收中,接近80%的收入只来自两家客户公司——微软和英伟达,其中微软一家就占了当年总收入的62%。,更“实时反映现状”的在手合约月同样呈现用户集中的现状:在3Q25披露的$556亿未履约合同余额中,
来自OpenAI,微软和Meta这三家的合约金额就接近$470亿。,由于与微软和合约大部分也是为了满足OpenAI的需求,因此可能存在重复计算的部分,但也表明
公司的最终需求实际更加集中于OpenAI这一家公司。,此外
,CoreWeave与Google(最终需求也是OpenAI),以和Databrick,IBM,Cohere,Poolside等科技公司据报道也有合作。,但整体上,
CoreWeave的大部分业务高度依赖于少数几家头部公司(OpenAI为主),剩下“聚少成多”的
其他客户也主要是AI/科技这一单一类型公司。,因此从商业模式上,
不同于传统云通过大量行业不同、类型分散的客户结构,
能充分平滑需求波动,降低某些行业下行导致的风险。,高度集中于少数企业和有限行业的CoreWeave等AI新云,无疑面临着更大的需求风险(例如丢失大客户)
,且
面对少数贡献公司大部分收入的头部客户,逻辑上也很难有议价能力。,,
,
,2.2、说完“硬实力”,公司“软实力”又如何?,云服务商另一个容易形成差异化竞争力之处,在于软件和工程能力这类“软实力”上。根据调研,CoreWeave在“软实力”上的
主要优势是能在短时间内(如3~5个月内)
将一个云计算中心从零到上线的工程规划能力,但
在软件/编程等能力上能力相对欠缺。,1)CoreWeave的技术服务,简要介绍下CoreWeave提供的服务类型,根据公司在招股书中的披露,可以分为3+1大类:,a.
Infrastructure Service:最简单、直接地向客户出租其所需的高性能芯片,存储硬盘等单纯的硬件设施,不附带任何软件服务。结合报道,这类纯粹出租硬件的业务占比很小(没有官方的披露,仅做大概的定性参考),b.
Managed Software Service:在硬件之上,包含一些基础的软件管理、调用工具的服务。重点说下
Bare Metal模式——传统云服务是出租虚拟机,但Bare Metal的用户100%独享其租用的物理服务器,自行决定如何使用/分配这些资源。根据报道
,Bare Metal是目前公司头部大客户普遍(至少微软是)
采取的服务模式。,这一点也是AI云和传统云的主要区别之一:
传统云下,业务对算力的需求普遍是波动的,因此
服务商能将同一批物理算力动态的分配给不同的用户,以提高算力的利用率并获取更多的收入和利润。,而在AI时代,
特别是AI训练对算力的需求则普遍是大规模且持续性地集中使用。比如每次训练新AI模型,可能就需要万张GPU以上的大规模集群,在几个星期甚至几个月内近乎100%的持续使用。AI推理对算力的要求不像训练这么集中,但大概率也比传统情况下更集中些。,因此,
这种使用算力的模式,决定了AI(尤其是训练)对算力的需求是更独占、排他性的。在这种情况下,
云服务商并没有多少操作空间能够把物理算力动态分配给不同客户。,BareMetal外,这一层级下还有CKS和VPC这种类虚拟机服务,和传统云业务的租赁模式大体相近。,c. Application Software Service:这一层级的服务可粗略类比为PaaS类型的服务。除了单纯提供虚拟机或其他简单软件服务外,这一层内公司会提供更加高级、丰富的软件功能。例如,客户帮助客户优化资源或者任务的分配,提供已预加载好的一些AI模型或其他功能供客户直接使用。,d. Mission Control & Observability:帮用户监控硬件的使用情况,任务的执行进展,并提供渠道供客户查看。并在运行周期内,保证硬件和任务的正常运营,及时解决报错、停机等问题。,,2)CoreWeave的软件能力如何?,根据市场内的一些说法,
CoreWeave在编程/软件方面不具备优势,而是
强在如何更快速、有效的布置和落地数据中心的工程能力。,相比之下,据悉公司在新云领域内主要的竞争对手之一—
Nebius则在软件/编程能力上更有优势。作为一个侧面的证据,从两家公司的创始人和核心管理层的不同背景,也能对两家公司不同的导向窥见一二。,由下表可以看到,
Nebius的CEO是俄罗斯最大的互联网科技公司Yandex的创始人。其董事长则是CompTex(俄罗斯电信和网络设备龙头)和InfiNet(俄罗斯无线宽带技术龙头)两家公司的共同创始人之一。,而
CoreWeave的三位核心联合创始人都是来自于能源投资领域,且公司创立之初是从事Bitcoin矿场挖矿业务,可以说基本没有科技或云计算相关的经验和背景。,高级管理人员之中,只有CTO和COO这两个外部的职业经理人有科技行业背景,其中COO原本是Oracle Cloud部门的高级副总裁。,从核心管理层的背景来看,
CoreWeave在技术能力上确实不像有多少积累,反而在如何获取能源供给这个供给卡点上有一定优势。,,且从现状上,公司的收费标准也基本是基于租用的硬件来定价的,对如前文提及的Slum和监控服务等都是作为免费的附加功能提供的。,
,3)“软实力”高低的影响是什么?,那么,像CoreWeave这类
工程能力强但软件技术相对较弱的情况,对公司的中期和长期发展可能造成什么影响?,首先从优势上看,当前CoreWeave得以高速发展的时代性因素,就是AI时代算力的严重供不应求和很快的迭代速度。,而
CoreWeave优异高效的工程能力,能够在3个月左右完成对数据中心的装配到上线运营(当然前提是相关设备和能源供应等都已到位)
,是所有云服务商中最快速的(之一),
能很好的适配目前头部科技公司或AI独角兽对算力需求的快速迭代。,另一个角度,
由于CoreWeave的主要客户是微软、OpenAI、Meta、Google等头部科技公司。
这些巨头自身的技术实力很强,也普遍是采用Bare Metal类型的服务,以便自己对底层硬件有更好的把控,也
确实不太需要CoreWeave提供多少软件层的服务。,但从
中长期角度, CoreWeave要继续在行业内保持独特竞争力,或者说要优化客户和收入结构,减少对大客户的依赖,那么就必须
增加大量传统或中小型企业客户,而这些客户的技术实力显然不会很强,此时作为服务商的
CoreWeave就必须要能够提供比较优异的技术/软件服务。,因此关键是,
在当前算力供不应求且依赖于少数大客户的红利窗口期结束前,公司在先做大业务规模后,能否在相对短板的技术能力上也完成补强。,2.3、CoreWeave在供给端的议价能力如何?,从上文来看,部分出于AI时代的时代性特征,部分是由于CoreWeave自身在客户结构和技术能力上的“缺陷”,CoreWeave在需求整合能力上,属于走量型,质量一般。那么供应链整合能力上,CoreWeave的“实力”又如何?,同样根据公司的披露,
其主要供应商也相当的集中。
在23和24年,仅3家最大的供应商就占据了公司总采购额的8~9成。结合数据中心投入在不同板块的大致投入占比,和相关新闻报道,大致可以做出以下推测:,a. 最大供应商--英伟达:据推测,23~24年占据公司总采购额约5~6成的最大供应商应当就是英伟达—提供最大单一硬件GPU和高性能连接系统/硬件等(英伟达 Spectrum-X 和Quantum-X)。,b. 第二或第三大供应商--Dell和Super Micro:结合公司的披露和相关报道,可以推测另两大占总采购额约1~2成的供应商,很有可能是两家服务器供应商Dell和Super Micro。,c. 其他重要供应商:除了以上三家之外,根据相关披露,CoreWeave在土地、建筑、电力供应等基础设施上,也有两家有公开披露的供应商—Core Scientific和Applied Digital。,其中
Core Scientific是一家从事比特币矿机和数据中心托管的公司(和CoreWeave早年间类似),CoreWeave原本是向其租赁土建等基础设施,但
在2025年以90亿美元的对价将其全资收购。标志
着CoreWeave从轻资产的纯租赁,部分转向了自行经营。,,那么从逻辑上看,
CoreWeave在向上游供应链的议价能力上又是否出色?简单来说,并不好。首先三家运营商就占公司总采购额的8~9成,这一点就意味着一旦某家大供应商停止供货就足以对公司的供应链产生巨大冲击。,下图概括性的展示了整个云服务从上游到下游的产业链,
如著名的“微笑曲线”,海豚君认为
在算力产业链中的两端——更靠上游设计和更靠下游接触终端用户的部分是产业链中议价能力相对更强的。,而CoreWeave目前处于产业链中相对中间的“低价值”位置,向上需要依赖多层级的供应商,向下目前也主要是作为三大头部云厂商的供应商,而不太直接接触分散的终端客户。,更具体来看,面对其最大的供应商英伟达,既无自研芯片的科技实力,也没有巨头那般资金实力的CoreWeave显然没有多少议价能力(虽然CoreWeave是英伟达的“亲儿子”,但这是单方面的扶持,而非CoreWeave的能力)。,而对于第二、第三大供应商——Dell等服务器供应商,虽然
CoreWeave和Dell两者之间都有不小的依赖,毕竟CoreWeave也是是Dell在AI服务器的重要客户之一。但仍体现CoreWeave相对劣势的关键点是,
CoreWeave是向Dell直接采购包括机架、冷却系统、整机服务器设备,以及一些基础软件功能的整体解决方案。,这
一定程度上侧面表明,CoreWeave并不像三大云巨头,乃至国内阿里之类拥有自行设计整套服务器设备的能力。而简单的逻辑是,对供应商依赖越多,就需要向其让渡更多利润。,那么从结果来看,
市场共识认为CoreWeave的真实毛利率只在25%~30%左右,较微软智慧云板块60%以上的毛利率明显偏低。也正是CoreWeave在产业链中议价能力不强的体现。,,
,2.4、观点小结——占产业链的价值量有限:,小结以上分析,从云服务作为算力需求和供给最终整合方的商业模式角度,
CoreWeave看起来并不像一个在3~5年后仍能有较强的确定性在巨头林立的云服务市场保持独特的竞争力和一定市场地位的公司。并不太能看到在供需稳定后,CoreWeave有和三大云巨头正面竞争的实力。,其主要问题包括:,a. 客户结构目前高度集中于少数大公司和少数行业,一旦丢失某大客户会有严重影响(其最大客户之一微软就明确表示过长期来看更愿意自建数据中心,而非像CoreWeave等外部供应商租赁);,b. 目前提供的服务主要是“偏基础”的硬件租赁,附加值有限。既不利于绑定现有客户不丢失,也不利于后续向更下游的中小客户或者向更赚钱的PaaS层业务拓展。,c. 同样过度依赖少数几个大供应商,定制化能力仍比较弱,当前体量也不足以成为对头部供应商举足轻重的大客户。因此在产业链内占据的价值量有限。,当然中长期的确定性不高,并不能证伪公司中期内有很高的成长性和不低的确定性,在下篇中海豚君会从中短期的视角,看待是什么原因帮助公司能在新云中脱颖而出。,本文来自微信公众号
“海豚投研”(ID:haituntouyan),作者:海豚君,36氪经授权发布。,该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。
CoreWeave:英伟达“干儿子”真能子凭父贵?
聊聊“硬实力”和“软实力”
扫描二维码,在手机上阅读