这篇只统计两条线:
- 全球数据中心训练/推理主线:A100 作为对照基线,H100、H200、B200、B300。
- 中国特供线:A800、H800、H20。
我没有把 L4、L40、L40S、L2 这些也塞进正文。不是它们不重要,而是它们更多是视频推理、通用推理、图形和虚拟化那条线,和 A100/H100/H200/B200 这种大模型训练主线混在一起,价格和性能口径会乱掉。
先看主线
先给结论:如果只看 2022 年 11 月 30 日之后的发布节奏,H100 是生成式 AI 爆发初期的真正起点,H200 是一张“补内存短板”的刷新卡,B200 才是一次真正意义上的平台级换代,B300 则把 Blackwell 往推理和 reasoning 时代再推了一步。
| 型号 | 发布时间 | 架构 | 显存 | 显存带宽 | 互连 | 官方性能口径 |
|---|---|---|---|---|---|---|
| A100 80GB | 2020-11,作为对照基线 | Ampere | 80GB HBM2e | 2.039 TB/s | NVLink 600 GB/s | BF16/FP16 Tensor Core 312 TFLOPS,INT8 624 TOPS [2] |
| H100 SXM | 2022-03-22 | Hopper | 80GB HBM3 | 3.35 TB/s | NVLink 900 GB/s | BF16/FP16 1,979 TFLOPS,FP8 3,958 TFLOPS;DGX H100 单机 32 PFLOPS FP8,较 DGX A100 提升 6 倍 [3][4] |
| H200 SXM | 2023-11-13 | Hopper 刷新版 | 141GB HBM3e | 4.8 TB/s | NVLink 900 GB/s | 官方给出的重点不是 core 算力翻倍,而是 Llama2 70B 推理 1.9 倍、GPT-3 175B 推理 1.6 倍;相对 H100 是更大更快的显存 [5][6] |
| B200 SXM | 2024-03-18 | Blackwell | 180GB HBM3e | 最高 8 TB/s | 单 GPU NVLink 1.8 TB/s;8 GPU 节点总带宽最高 64 TB/s | DGX B200 8 GPU 总显存 1.44TB,FP8 72 PFLOPS;Blackwell 平台主打大模型推理成本和能耗大降 [7][8][9] |
| B300 SXM | 2025-03-18 | Blackwell Ultra | 288GB HBM3e | 最高 8 TB/s | 8 GPU 节点总带宽最高 64 TB/s;DGX B300 NVLink 汇聚带宽 14.4 TB/s | DGX B300 为 144 PFLOPS FP4、72 PFLOPS FP8;官方口径是 dense FP4 较 DGX B200 提升 1.5 倍,attention 提升 2 倍 [10][11][12] |
这里最容易看错的一点是:H200 不是“算力暴力翻倍卡”,它更像是 Hopper 时代补课。大模型训练和推理一旦进入超长上下文、巨型 KV cache、MoE 和更大 batch 的阶段,瓶颈早就不是单纯的 BF16 峰值数字了,而是显存容量和显存带宽。H200 把这个短板补上了。
真正的代际断层发生在 Blackwell。Blackwell 不再只卖一张卡,而是在卖一整套平台能力:新精度、互连、整机级带宽、推理成本、功耗效率、rack-scale 组织方式。这就是为什么很多资料在讲 B200 时,单卡指标反而没 H100 那么容易一眼看懂,因为英伟达的叙事重心已经从“这张卡多少 TFLOPS”转到“这套系统能把多大的模型以什么成本跑起来”。
再看中国特供线
中国特供线要单独看。因为它的目标不是击败全球旗舰卡,而是卡在出口管制红线之下,还尽量保留商业可用性。
| 型号 | 首次公开时间 | 对应母体 | 公开可确认参数 | 主要削减点 | 备注 |
|---|---|---|---|---|---|
| A800 | 2022-11-08,Reuters 报道并获 NVIDIA 确认 | A100 | 80GB HBM2e,约 2.039 TB/s;公开报道显示互连从 A100 的 600 GB/s 降到 400 GB/s [2][13][14] | 互连能力 | 本地算力口径仍接近 A100,但大规模多卡扩展被压制 |
| H800 | 2023-03-21,Reuters 报道 | H100 | 公开报道普遍认为本地 HBM 能力接近 H100 级别;可确认的主变化是 chip-to-chip 传输速率约为 H100 的一半,公开报道常见写法在 300-400 GB/s 区间 [3][15][16] | 互连能力 | 这是典型的“单卡不至于太差,但横向扩展受限” |
| H20 | 2024-02 开始预售,原计划 2023-11 上线后延期 | Hopper 中国合规版 | 96GB HBM3,约 4.0 TB/s;Reuters 报道预售价格 1.2 万到 1.5 万美元/卡,8 卡服务器约 140 万元人民币 [17][18] | 计算能力被进一步压低 | H20 不是 H800 的直接性能升级版,而是更严格规则下的合规产物 |
这条线最值得记住的一句话是:A800 和 H800 更像“削互连”,H20 则是“连计算能力都得继续压”。
所以如果有人只看显存数字,得出“H20 比 H800 更新,所以更强”,这个判断不对劲。H20 的 96GB HBM3 和 4.0 TB/s 带宽看起来不差,但它出现的前提,是要满足更严的出口限制。它的商业目标首先是能卖,其次才是尽量能用。
前一代比上一代,到底升级了多少
先说计算方法:
\[ \text{升级率}=\frac{\text{新一代指标}-\text{上一代指标}}{\text{上一代指标}} \]但这个公式只适合口径一致的指标。显存、显存带宽、NVLink 带宽可以直接算;平台级推理成本和整机吞吐,不能硬塞回单卡 TFLOPS 那套口径里。
全球主线
| 代际 | 变化最大的地方 | 可直接计算的升级幅度 |
|---|---|---|
| A100 80GB -> H100 SXM | Tensor Core 与显存带宽一起抬升 | 显存容量 0%;显存带宽从 2.039 到 3.35 TB/s,约 +64.3%;NVLink 从 600 到 900 GB/s,约 +50%;BF16/FP16 从 312 到 1,979 TFLOPS,约 +534.3% [2][3] |
| H100 SXM -> H200 SXM | 重点改成“更大更快的显存” | 显存从 80GB 到 141GB,约 +76.3%;显存带宽从 3.35 到 4.8 TB/s,约 +43.3%;NVLink 基本不变;BF16/FP8 峰值口径基本不变 [3][6] |
| H200 SXM -> B200 SXM | Hopper 到 Blackwell 的平台级跃迁 | 显存从 141GB 到 180GB,约 +27.7%;显存带宽从 4.8 到最高 8 TB/s,约 +66.7%;但真正的大变化是 FP4、1.8 TB/s NVLink、整机与 rack-scale 推理效率 [8][9] |
| B200 SXM -> B300 SXM | Blackwell Ultra 把大显存和 reasoning 再往前推 | 显存从 180GB 到 288GB,约 +60.0%;显存带宽公开口径仍为最高 8 TB/s;DGX B300 dense FP4 相对 DGX B200 提升 1.5 倍,attention 提升 2 倍 [10][11] |
读下来会发现一个规律:
- H100 是暴力拉升单卡张量算力的一代。
- H200 是补显存的一代。
- B200 是把“训练卡”变成“AI 工厂基础设施”的一代。
- B300 是把 Blackwell 更明确地推向 reasoning 和大规模推理的一代。
中国特供线
| 代际 | 直观看上去像升级,实际上要分开看 | 我的判断 |
|---|---|---|
| A800 -> H800 | 如果只看本地 HBM 带宽,A100 级到 H100 级,约可理解为 +64% 的代际推进 | 但核心约束仍然是互连,不是单卡本地显存 |
| H800 -> H20 | 显存从 80GB 到 96GB,约 +20%;如果按常见公开参数,带宽从 3.35 到 4.0 TB/s,约 +19.4% | 这不是纯粹升级。H20 是合规压力更大后的折中品,不能简单当成“H800 Plus” |
这也是为什么中国特供线不太适合写成“每一代都全面提升多少”。这条线先天带着合规约束,设计目标不是技术最优,而是规则约束下的商业可交付。
售价到底涨了多少
这一段最容易被写假。因为英伟达很少公开数据中心 GPU 单卡 MSRP,公开世界里更常见的是:
- DGX 整机价格或第三方整机挂牌价。
- 中国特供卡的渠道报价。
- 媒体、券商或供应链消息。
所以这里我只给“公开可追溯价格样本”,不伪造一张看起来完整、其实口径混乱的官方价格表。
| 对象 | 公开价格样本 | 和上一代相比怎么理解 |
|---|---|---|
| DGX H100 | 2022-03-22 发布时官方起售价 19.9 万美元 [4] | 这是最干净的官方锚点 |
| DGX H100 | 2024-10 市场挂牌价约 35.84 万美元 [19] | 这是后期渠道价,不适合直接和 2022 年首发价混成一条线 |
| DGX B200 | 2024-10 Broadberry 挂牌 51.541 万美元 [19] | 相对同一时期的 DGX H100 挂牌价,约 +43.8%;这也是 Wells Fargo 提到的 40%-50% 区间 |
| H20 单卡 | 2024-02 Reuters 报道为 1.2 万到 1.5 万美元 [17] | 这是中国特供卡渠道价,不是全球旗舰线价格 |
| H20 八卡服务器 | 约 140 万元人民币 [17] | 对比 Reuters 提到 H800 八卡服务器首发约 200 万元人民币,反而约便宜 30% |
所以“整体售价提升了多少”,我给两个结论:
第一,全球旗舰主线确实在涨,而且涨幅不小。能公开对齐的样本里,DGX B200 相对同一时期挂牌的 DGX H100,大概贵了 40% 到 50%。[19]
第二,中国特供线不是一路涨价,反而可能出现“更晚出的卡更便宜”的情况。H20 的八卡服务器公开报价大约比 H800 八卡服务器低 30%,原因不是良心,而是性能能力被进一步压缩了。[17]
最后做个收口
如果把 ChatGPT 发布后的英伟达数据中心 GPU 变化压成一句话,我的判断是:
H100 是生成式 AI 爆发时点的起跑枪,H200 是一次内存导向的续命,B200 才是 AI 工厂时代真正的平台换代,B300 则开始明显为 reasoning 时代铺路。中国特供线则完全是另一套逻辑,它不是在追旗舰,而是在规则缝隙里尽量保住可用性。
这两条线不要混着看。混着看,很容易得出“新卡显存更大,所以代际更强”“价格更低,所以性价比更高”这种大差不差、但方向不对的结论。
参考资料
- OpenAI, Introducing ChatGPT, 2022-11-30: https://openai.com/index/chatgpt/
- NVIDIA A100 official datasheet/search snippet: https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/a100/pdf/a100-80gb-datasheet-update-nvidia-us-1521051-r2-web.pdf
- NVIDIA H100 product page: https://www.nvidia.com/en-us/data-center/h100/
- NVIDIA Newsroom, NVIDIA Announces DGX H100 Systems, 2022-03-22: https://nvidianews.nvidia.com/news/nvidia-announces-dgx-h100-systems-worlds-most-advanced-enterprise-ai-infrastructure
- NVIDIA Newsroom, NVIDIA Supercharges Hopper With H200, 2023-11-13: https://nvidianews.nvidia.com/news/nvidia-supercharges-hopper-the-worlds-leading-ai-computing-platform
- NVIDIA H200 product page: https://www.nvidia.com/en-gb/data-center/h200/
- NVIDIA Newsroom, NVIDIA Blackwell Platform Arrives, 2024-03-18: https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing
- NVIDIA Enterprise Reference Architectures, HGX AI Factory components: https://docs.nvidia.com/enterprise-reference-architectures/hgx-ai-factory/latest/components.html
- NVIDIA DGX B200 user guide / specs: https://docs.nvidia.com/dgx/dgxb200-user-guide/introduction-to-dgxb200.html
- NVIDIA Newsroom, NVIDIA Blackwell Ultra AI Factory Platform, 2025-03-18: https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-ai-factory-platform-paves-way-for-age-of-ai-reasoning
- NVIDIA DGX B300 product page: https://www.nvidia.com/en-us/data-center/dgx-b300/
- NVIDIA Data Center Platform Line Card, 2025: https://docs.nvidia.com/data-center-gpu/line-card.pdf
- Reuters/Investing, NVIDIA starts making new chips for China, 2022-11-08: https://www.investing.com/news/stock-market-news/nvidia-starts-making-new-chips-for-china-to-comply-with-new-us-limits-432SI-2935683
- Tom’s Hardware, Reuters 转述 A800 互连降到 400 GB/s: https://www.tomshardware.com/news/nvidia-creates-new-supercomputer-chip-for-chinese-market
- Yahoo Finance / Reuters, H800 public report, 2023-03-21: https://finance.yahoo.com/news/nvidia-tweaks-flagship-h100-chip-161500447.html
- Data Center Dynamics, Reuters 转述 H800 互连约 300 GB/s: https://www.datacenterdynamics.com/en/news/nvidia-creates-pared-back-h100-gpu-for-export-to-china-called-h800/
- Reuters/Investing, H20 preorder pricing, 2024-02-01: https://m.uk.investing.com/news/stock-market-news/exclusivenvidias-new-chinafocused-ai-chip-set-to-be-sold-at-similar-price-to-huawei-product-3319402?ampMode=1
- Tom’s Hardware, H20 public-spec summary: https://www.tomshardware.com/news/no-nvidia-isnt-breaking-gpu-sanctions-analyst
- Investing, Wells Fargo on DGX B200 pricing, 2024-10-14: https://www.investing.com/news/stock-market-news/reports-on-blackwell-pricing-a-positive-for-nvidia-wells-fargo-3662086
写作附记
原始提示词
整理自从 ChatGPT 发布以来,英伟达发布的显卡型号和对应的性能参数,前一代对比上一代升级了多少,整体售价提升了多少,我要的是数据中心用的显卡,包含给中国的特供版本。
写作思路摘要
- 先把 ChatGPT 的真实发布日期固定为 2022 年 11 月 30 日,避免时间口径一开始就错位。
- 把英伟达数据中心 GPU 拆成“全球旗舰主线”和“中国特供线”,不把两条线硬写成一条代际升级史。
- 升级幅度只对能直接对齐的指标做百分比计算,主要是显存、显存带宽和互连。
- 价格部分不伪造单卡 MSRP,而是只采纳官方起售价、整机挂牌价和 Reuters 渠道报价。
- L4、L40S、L2 没展开,因为它们会把训练主线和通用推理/图形线混在一起。
拓展脑暴
| 方向 | 是否纳入正文 | 处理理由 |
|---|---|---|
| A100 作为基线 | 纳入 | 用户问“前一代比上一代”,没有 A100 就没法算 H100 的升级幅度 |
| L4、L40、L40S、L2 | 否决 | 属于数据中心产品,但更偏视频推理、图形和通用推理,和训练主线价格口径不一致 |
| GB200、GB300 整机架构 | 部分纳入 | 用来解释为什么 Blackwell 开始更强调平台级性能,而不是只看单卡 TFLOPS |
| H20 详细官方规格页 | 否决 | NVIDIA 官方公开资料不足,公开可追溯信息主要来自 Reuters 和二手硬件媒体,正文已明确标注 |
| 中国后续 Blackwell 合规版 | 否决 | 截至写作时公开信息更多是供应链和媒体报道,官方产品化口径不够稳定,不纳入正文结论 |