12月9日,国家市场监管总局发布消息称,因英伟达涉嫌违反反垄断法,开始对这个全球GPU巨头展开反垄断调查。
在该调查之前的一周,包括中国半导体行业协会在内的四大行业组织,罕见地发布公告,警告美国芯片产品的安全性和供应稳定性问题,建议国内企业在采购时保持高度警惕。
在懂王即将再次上台的前夜,人们很容易将这两件高敏感度事情联系在一起。很显然,在中美科技竞争日益激烈的前提下,中国在以一种壮士断腕的决心,减少对以英伟达GPU产品为代表的西方高端芯片的依赖,避免在很多关键领域被人一直卡脖子的命运。
根据TechInsights的统计,英伟达在GPU整体市场上占有超80%的市场份额,在数据中心GPU更是占有98%的市场,这也意味着在AI训练市场的绝对垄断地位,尤其是在如今炙手可热的AI大模型、自动驾驶、机器人等等AI前沿领域,英伟达都是最顶级的存在。
在这样的绝对实力面前,很多人的担心是,以我们现在在高端芯片领域的能力,是否能够应对最坏的结果?
本文也并不是探讨此次调查的影响以及会以怎样的方式终结。作为一个商业化的公司,英伟达一定不想放弃这个占其总营收近三成份额的中国市场,最后也一定会有各方平衡后的方案。
在中国宣布对英伟达展开调查后的第二天,首部由黄仁勋亲自授权采访的重磅新书——《英伟达之道:黄仁勋和他的科技帝国》开始发售(以下称新书),书中提到英伟达多次站在命运十字口,也曾数次濒临破产,但最终都能奇迹般逆转局势必一体育,在三十年的时间里,从一个小图形处理公司一步步成长为三万亿的AI计算巨头和科技帝国。
从中我们可以窥见英伟达成功背后的很多不为人知的事情,也可以在一定程度上看到英伟达所洞悉的未来,或许也能够回答我们所疑惑的很多问题。
如今英伟达已是全球市值最高的企业之一,回望过往三十年,英伟达似乎能看到未来一般,每次都选择了正确的发展方向,从一众显卡商中厮杀出来,开辟一条全新的道路,成功转型人工智能公司,成为全球难以撼动的存在。
一家成功企业背后的故事总是令人神往。显然英伟达与黄仁勋已经是紧密绑定,新书中将英伟达的成功主要归结于黄仁勋个人的能力和努力,虽然他是被另外两位联合创始人拉进来一起创立英伟达的,但英伟达成立的资金是黄仁勋游说投资人而来,并且在公司后来再次面临资金危机时,还是他找到新的投资。
同时,他获得了VGA的授权,保证了RIVA128的按时发售;在决定押注CUDA时,也是他顶住了华尔街的压力,尽管当时所有人都希望他能为短期利润牺牲长期愿景。时至今日,英伟达依旧是全球领先的独立图形芯片公司,黄仁勋本人也是所有科技公司中任职时间最长的CEO。
不过,英伟达的三十年并非一帆风顺,而是多次站在十字路口,等待命运的生死抉择。比如公司成立之初,三位天才级的联合创始人,凭借个人意愿和直觉做出的第一款芯片 NV1,在推向市场后全面失败。NV1 的失败直接危及了英伟达与世嘉的关系,世嘉终止了英伟达为其下一代游戏主机开发 NV2 的合同。英伟达第一次面临绝境。
此时黄仁勋开始重新思考芯片开发的方式,最后决定赌一把物理极限。在所剩无几的账户中,黄仁勋拿出公司三个月的资金购买了一台芯片仿真器用来测试数字芯片原型,由此诞生了后来获得巨大成功的RIVA128,此后英伟达开始横扫千军,并由此扭转行业竞争格局。
这中间还有个小插曲必一体育,在NV1 和 NV2 失败的时候,其最大对手公司 3dfx没有乘胜追击,却是想等到英伟达破产后,用更便宜的价格抄底,这也给了英伟达喘息的机会。后来3dfx破产,英伟达反过来收购了3dfx专利和资产,以及其优秀的工程师团队。
英伟达面临的另一个决定性的十字路口,是黄仁勋决定押注CUDA。虽然如今CUDA成为了英伟达生态护城河,但当时英伟达为CUDA花费了大量的时间和资金,比如用于GeForce系列显卡的G80,在四年的开发时间里花费了4.75亿美元,占据了这四年英伟达全部成本的三分之一。
而G80还只是能兼容CUDA的其中一款GPU芯片而已,并且当时的GPU市场几乎为零。这种看不到回报的巨大投入,极大拖累了英伟达的财务状况,这也导致当时英伟达的股价暴跌了80%以上,让整个华尔街都几乎失去了对英伟达及其CUDA的信心必一体育。华尔街有五十名金融分析师跑到英伟达,指责黄仁勋选择了一条错误的道路。
但黄仁勋依旧坚持自己的选择,即CUDA要成为基础性技术,对所有人可用,并适用于一切领域,让CUDA与GPU划等号。
在CUDA领域不计成本的投入,为英伟达赢得了后来里程碑式的营收。2001年英伟达年销售10亿美元,是美国历史上最快实现这一里程碑的半导体公司,2001年底,其股票价格在三个季度实现翻倍,当时市值是IPO时的20倍。
当然,英伟达还遭遇了很多大大小小挫折和错误,比如被黄仁勋称为垃圾的NV30,意法半导体的交付问题等等,但最终英伟达都逐一化解了这些危机,把公司从崩溃的边缘重新拉回来。
而眼下英伟达又面临Blackwell设计缺陷所导致的良品率问题,由此带来的量产挑战也不容小觑。
关于中国此次发起对英伟达的反垄断调查,官方原因是在2019年,英伟达以69亿美元收购完以色列芯片厂商迈络思后,涉嫌未履行4年前通过中国国家市场监管总局批准时的附加限制性条件,包括不能捆绑销售强迫购买;以及此后六年内,必须公平地为中国企业提供显卡以及配套设备等。
新书中也将此次收购称为英伟达发展史上最好的收购,不过书中并没有提及此次收购背后各国政府决策的背景。但此次收购的确让英伟达如虎添翼,在此后的四年时间里,迈络思为英伟达每年创造了120亿美元的收入,且还保持着三位数的增长。
就在英伟达完成收购的2020年之后,英伟达股价开始急剧上涨,到2023年已经上涨239.60%;2024财年(2023年自然年),英伟达的营收同比增长126%,来到了609亿美元。其运营利润更是同比上涨681%,达到329.72亿美元。
三个月内,英伟达市值从2万亿美元到3万亿美元,而实现这一目标,微软用了945天,苹果用了1044天。
实际上迈络思对英伟达而言是个意外收获。在迈络思成为可收购对象时,黄仁勋并没有考虑收购。但当认识到未来数据中心级别的计算需求的增长,只能依靠GPU加速计算以及高性能网络,而迈络思拥有全球最好的网络技术和解决方案后,黄仁勋才开始加入竞购,并最终以略高于英特尔和赛灵思的价格,将迈络思收入囊中。
这也是能避免将英伟达和黄仁勋神话的重要事件之一,英伟达能够保持领先的原因,并非能够看到所有的未来。书中也Bsports必一提到黄仁勋并不具备特殊的远见能力,比如他也并不能准确预计AI爆发的时间,而且开始的投入也是很谨慎的,直到看到AI爆发的重大信号。
但英伟达和黄仁勋凭借自身对技术和商业的敏感度,能够自己打造一个由伟大事物构建的未来,并以无比的耐心和坚持不懈,从零开始建立新市场。
比如在GPU和CUDA刚刚推出的时候,在很长一段时间都是无人问津的。为了破局,英伟达首先和很多顶级高校合作,通过捐赠芯片的方式,在高校教授并行计算和 CUDA 编程课,建立学术培训渠道,吸引更多研究人员学习和使用。这就有了后来在李飞飞举办的 ImageNext 视觉识别比赛中,让英伟达GPU一举成名的深度学习神经网络 AlexNetAI。
英伟达也在科研圈赠送 GPU,希望以此看到更多 GPU 的应用案例,其中让人耳熟能详的黄仁勋亲自给初创时的OpenAI和马斯克赠送GPU的故事。
同时,英伟达投入大量资源支持CUDA框架和工具,在很早的时候,英伟达就已经非常迅速把重要的AI软件库集成在CUDA,使开发者可以非常轻松使用该领域的最新创新,而不用浪费时间构建自己的软件工具。
如今CUDA已经有500万+开发者,600+AI模型,3700+CUDA GPU 加速器。市场上约有5亿+与CUDA兼容的英伟达GPU。该平台还支持后向兼容,这也意味着,开发者可以确信,他们在编写软件的任何投入,都可以在未来的芯片发挥作用。这种主动的做法,后来也让英伟达成为全球AI开发者的首选。
正因为提前捕捉到AI的早期信号,并以硬件和软件加速的形式将其产品化,在2023 年生成式人工智能的需求激增时,英伟达是唯一一家准备好全面支持这一浪潮的硬件制造商。
这种自己开创的新市场,也让英伟达拥有了绝对的市场份额和地位,目前其领先优势体现在多个方面,包括芯片架构的快速迭代能力;CUDA软硬协同与开发生态;以及在AI、机器人、自动驾驶、矿机等垂直领域的全栈解决方案能力等等。书中将这些优势统一概括为类似于iPhone制造的全栈模式,且行动速度超越对手。
现在虽然只是AI计算浪潮的开端,但英伟达已经在寻找下一个可能的大趋势和方向,以及英伟达可以做些什么才能充分利用这些趋势。
去年有人问黄仁勋AI后续的发展趋势时,黄仁勋的答案是数字生物学。因为数字生物学是最复杂的系统之一,目前是人类历史上首次可以利用AI对生物学进行数字化设计,促进AI辅助药物的研发和创新,而英伟达已经处于其中的核心。
但英伟达本质上还是一家商业化的公司。新书中提到英伟达的另一大优势,是被很多人忽略的定价优势。从一开始,英伟达的定价策略,就是涨价。
和其他大宗商品类产品定价会不断下调不同,英伟达是唯一一家平均售价会上涨的公司。原因在于,人们对于AI计算能力的需求是在不断增加的,虽然每一代新的AI模型有跨越式的提升,但真正的通用AI还有很多工作。通过维持技术前沿地位,定位在一个性能显著提升的高可见度领域,英伟达可以获得定价权并不断提高其售价。
就在上周蔚来的发布会上,在面对供应商盈利空间被车企不断挤压的话题时,李斌笑着说,有些供应链合作伙伴都很强势的,比如英伟达,希望他们能给我们多一点盈利空间。
从这句看似玩笑的话中不难看出,即便只是在自动驾驶领域这样一个对英伟达而言微乎其微的赛道,英伟达也拥有绝对的话语权和定价权。
如今英伟达消费级显卡每张都达到2000美元,更不用说需要海量GPU训练的AI公司,比如像OpenAI、特斯拉等等。如果有一天连他们都觉得觉得英伟达GPU定价太高,也不想再依赖CUDA,有没有可能找其他的替代方案,或者干脆自己做,就像GPU替代CPU一样?
的确有人在这么干了。Google、亚马逊、微软、Meta等4大云端服务供应商都积极投入自研芯片,通过“IC设计服务商”协助打造AI ASIC,以此降低对英伟达的依赖。
目前,主流AI芯片主要有以GPU为代表的通用芯片、以ASIC定制化为代表的专用芯片以及以FPGA为代表的半定制化芯片。GPU的代表玩家自然是英伟达,ASIC则以博通和Marvell为代表。
几天前谷歌发布的AI大模型Gemini 2.0,背后的核心硬件为AI ASIC芯片Trillium TPU;以及亚马逊AWS发布的基于ASIC的AI芯片Trn2 UltraServer和Amazon EC2 Trn2实例。此外,还消息称苹果也正与博通合作开发AI ASIC芯片。
这些ASIC芯片在AI训练、性能、推理的性价比普遍高于GPU,对于企业来说具有极大的吸引力。
根据研究机构Rosenblatt预计,随着其他科技巨头的突破,客户定制化的AI ASIC的增速预计将超过GPU计算。博通CEO陈福阳表示,2027年,AI ASIC市场规模将达到600-900亿,未来50%的AI算力是ASIC。
上周博通发布的财报显示,2024财年公司的人工智能收入增长220%,达到122亿美元;预计AI产品收入将在2025财年第一财季同比增长65%。目前其市值破万亿美元大关,成为华尔街炙手可热的新宠。
博通将其定制 AI 加速器称为 XPU,目前为三家超大型客户交付的XPU出货已经翻倍,预计明年公司AI芯片的市场规模为150亿-200亿美元。虽然博通公司未公开客户名单,但分析师认为这三家公司是 Meta、Google以及字节跳动,很显然它们对算力的需求是巨大的。陈福阳还表示,未来超大云计算厂商内部使用100%都是ASIC。
Marvell上周也公布了2025 财年第三季度财报,其增长也同样超市场预期,对此Marvell解释是,得益于亚马逊及其他数据中心公司的定制AI芯片销售的增长。
虽然英伟达在GPU市场一家独大并拥有生态护城河,但天下也苦之久矣。尤其是对于算力需求巨大的企业,从更长远的角度,为了不被英伟达卡脖子,也为了给供应链增加多样性,便转而向博通、Marvell这样的芯片开发公司提出需求,定制属于自己的芯片,虽然牺牲了一部分算力,但在成本和性能等其他方面获得平衡,也算不错的结果,也就推动了AI ASIC的火爆。
这也意味着,既然都知道在GPU赛道无法追赶,那么未来能替代英伟达的,就一定不是追随者、模仿者,而是另起炉灶的创新者。
在新书中作者引用黄仁勋最喜欢的《创新者的窘境》一书的观点,创新者所推出的产品,开始能力不及当前领先的产品,且定价更低。但颠覆性创新最终会创造出新的应用场景,并能更快地迭代和创新,最终,此前领先的公司就会陷入困境。
英伟达曾颠覆了英特尔,如今尽管黄仁勋在努力避免英伟达重蹈英特尔覆辙,但在眼下的高端算力时代,英伟达似乎还是又走到了命运的十字路口。当然这一次不仅仅是技术的选择,还有更多其他的难题。
在汽车领域,原本计划今年量产的英伟达高阶智驾芯片Thor,生产和交付再次发生延期,预计将在2025年年中量产并交付,而且只有入门版。至于单片算力能够达到 2,000 TOPS 的性能怪兽的L3级、L4级高阶版本,并不会给到车企。
在国内智能驾驶严重内卷的当下,代表最高性能的新一代产品Thor,成为各家车企竞争的核心之一。在今年北京车展期间,十多家车企争相宣布了与Thor的合作,似乎有Thor的加持就代表在未来的竞争中先人一步。市场也因此对Thor寄予厚望,期待它能帮助提升汽车业务在英伟达整体营收的份额。
但Thor的再次跳票很明显打乱了这些车企的计划,从目前的消息来看,已经有不少车企计划放弃Thor,改用国产替代或是自研芯片。
另一方面,就算有车企愿意等到明年年中,但对于迭代日新月异的智驾领域而已,届时恐怕又是全然不同的景象,这于这些车企与英伟达而言都将是另一次大考。