<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>中国特供版 on 向叔记事簿</title>
        <link>https://ttf248.life/tags/china-exclusive-edition/</link>
        <description>Recent content in 中国特供版 on 向叔记事簿</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language><atom:link href="https://ttf248.life/tags/china-exclusive-edition/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>ChatGPT 之后，英伟达数据中心 GPU 分成两条路线</title>
        <link>https://ttf248.life/p/nvidia-data-center-gpu-since-chatgpt/</link>
        <pubDate>Fri, 15 May 2026 19:58:51 +0800</pubDate>
        
        <guid>https://ttf248.life/p/nvidia-data-center-gpu-since-chatgpt/</guid>
        <description>&lt;p&gt;整理 ChatGPT 以来的英伟达数据中心 GPU，不能只做型号清单。真正的变化是两条路线同时加速：一条追最高训练性能，一条追可卖、可交付、可合规的市场覆盖。&lt;/p&gt;
&lt;p&gt;训练路线看的是 H100、H200、B200、GB200 这类旗舰产品。它们不断把算力、显存、带宽、互联和整柜方案往上推。大模型越大，单卡性能已经不够，系统级连接、集群效率和能耗控制变得更重要。&lt;/p&gt;
&lt;p&gt;另一条路线是特供和区域合规版本。给中国市场的产品，不只是简单“阉割版”，而是在出口管制限制下，重新平衡性能、带宽、互联和可销售性。它们的意义不是代表最高技术，而是说明英伟达要在规则缝隙里保住客户和生态。&lt;/p&gt;
&lt;h2 id=&#34;先看全球主线h100-起跑h200-补课b200-开始卖平台&#34;&gt;先看全球主线：H100 起跑，H200 补课，B200 开始卖平台
&lt;/h2&gt;&lt;p&gt;这条线只看大模型训练和核心推理主线：A100 作为基线，H100、H200、B200、B300 依次往后排。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;型号&lt;/th&gt;
          &lt;th&gt;发布时间&lt;/th&gt;
          &lt;th&gt;架构&lt;/th&gt;
          &lt;th&gt;显存&lt;/th&gt;
          &lt;th&gt;显存带宽&lt;/th&gt;
          &lt;th&gt;互连&lt;/th&gt;
          &lt;th&gt;最该记住的点&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;A100 80GB&lt;/td&gt;
          &lt;td&gt;2020，作为基线&lt;/td&gt;
          &lt;td&gt;Ampere&lt;/td&gt;
          &lt;td&gt;80GB HBM2e&lt;/td&gt;
          &lt;td&gt;2.039 TB/s&lt;/td&gt;
          &lt;td&gt;NVLink 600 GB/s&lt;/td&gt;
          &lt;td&gt;ChatGPT 前的大模型基准卡&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H100 SXM&lt;/td&gt;
          &lt;td&gt;2022-03-22&lt;/td&gt;
          &lt;td&gt;Hopper&lt;/td&gt;
          &lt;td&gt;80GB HBM3&lt;/td&gt;
          &lt;td&gt;3.35 TB/s&lt;/td&gt;
          &lt;td&gt;NVLink 900 GB/s&lt;/td&gt;
          &lt;td&gt;真正把生成式 AI 训练卡时代推开的产品&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H200 SXM&lt;/td&gt;
          &lt;td&gt;2023-11-13&lt;/td&gt;
          &lt;td&gt;Hopper 刷新版&lt;/td&gt;
          &lt;td&gt;141GB HBM3e&lt;/td&gt;
          &lt;td&gt;4.8 TB/s&lt;/td&gt;
          &lt;td&gt;NVLink 900 GB/s&lt;/td&gt;
          &lt;td&gt;重点不是 core 大跃迁，而是显存容量和带宽补课&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;B200 SXM&lt;/td&gt;
          &lt;td&gt;2024-03-18&lt;/td&gt;
          &lt;td&gt;Blackwell&lt;/td&gt;
          &lt;td&gt;180GB HBM3e&lt;/td&gt;
          &lt;td&gt;最高 8 TB/s&lt;/td&gt;
          &lt;td&gt;单 GPU NVLink 1.8 TB/s&lt;/td&gt;
          &lt;td&gt;重点转向平台级训练与推理吞吐&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;B300 / Blackwell Ultra&lt;/td&gt;
          &lt;td&gt;2025-03-18&lt;/td&gt;
          &lt;td&gt;Blackwell Ultra&lt;/td&gt;
          &lt;td&gt;288GB HBM3e&lt;/td&gt;
          &lt;td&gt;最高 8 TB/s&lt;/td&gt;
          &lt;td&gt;延续 rack-scale 互连路线&lt;/td&gt;
          &lt;td&gt;更明确地往 reasoning 和 test-time scaling 推进&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;如果只想记一个判断，大概可以这么压缩：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;H100 是“训练卡暴力拉升”的一代。&lt;/li&gt;
&lt;li&gt;H200 是“显存补课”的一代。&lt;/li&gt;
&lt;li&gt;B200 是“AI 工厂平台化”的一代。&lt;/li&gt;
&lt;li&gt;B300 是把 Blackwell 更明确推向 reasoning 时代的一代。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;也就是说，英伟达卖的东西其实在变。&lt;/p&gt;
&lt;p&gt;H100 还很像“这张卡有多猛”。到了 Blackwell，英伟达卖的已经越来越像“这套平台能把多大的模型，以什么吞吐和什么功耗跑起来”。这就是为什么 B200、B300 的叙事里，单卡 TFLOPS 反而没以前那么像绝对主角。&lt;/p&gt;
&lt;h2 id=&#34;h200-为什么不是算力暴力翻倍卡&#34;&gt;H200 为什么不是“算力暴力翻倍卡”
&lt;/h2&gt;&lt;p&gt;很多人第一次看 H200，会本能地去找“它比 H100 快了多少”。&lt;/p&gt;
&lt;p&gt;但 H200 真正要解决的，不是 dense 算力数字不够好看，而是大模型一旦进入超长上下文、巨型 KV cache、MoE 和更大 batch 之后，瓶颈越来越像显存和显存带宽，而不是单纯的 BF16 峰值。&lt;/p&gt;
&lt;p&gt;所以 H200 的升级重点是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;显存从 80GB 拉到 141GB；&lt;/li&gt;
&lt;li&gt;带宽从 3.35 TB/s 提到 4.8 TB/s；&lt;/li&gt;
&lt;li&gt;官方直接用 Llama 2 70B、GPT-3 175B 这类推理 workload 去强调收益。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它更像 Hopper 时代的一次补课，而不是全维度换代。&lt;/p&gt;
&lt;h2 id=&#34;再看中国特供线它的目标函数从来不是旗舰最强&#34;&gt;再看中国特供线：它的目标函数从来不是“旗舰最强”
&lt;/h2&gt;&lt;p&gt;中国特供线一定要单独看。&lt;/p&gt;
&lt;p&gt;因为这条线不是在和全球旗舰卡同场赛跑，它首先是在美国出口限制框架里争取“还能卖、还能用”。这就决定了它的设计目标，不是技术最优，而是合规边界内的商业可交付。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;型号&lt;/th&gt;
          &lt;th&gt;首次公开时间&lt;/th&gt;
          &lt;th&gt;对应母体&lt;/th&gt;
          &lt;th&gt;公开可确认参数&lt;/th&gt;
          &lt;th&gt;主要削减点&lt;/th&gt;
          &lt;th&gt;最该怎么理解&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;A800&lt;/td&gt;
          &lt;td&gt;2022-11&lt;/td&gt;
          &lt;td&gt;A100&lt;/td&gt;
          &lt;td&gt;80GB HBM2e；公开报道称互连较 A100 下调&lt;/td&gt;
          &lt;td&gt;互连&lt;/td&gt;
          &lt;td&gt;本地算力接近，但大规模扩展能力被压&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H800&lt;/td&gt;
          &lt;td&gt;2023-03&lt;/td&gt;
          &lt;td&gt;H100&lt;/td&gt;
          &lt;td&gt;公开报道普遍认为本地 HBM 能力仍接近 H100 级别&lt;/td&gt;
          &lt;td&gt;互连&lt;/td&gt;
          &lt;td&gt;典型的“单卡不至于太差，横向扩展受限”&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H20&lt;/td&gt;
          &lt;td&gt;2024-02 预售&lt;/td&gt;
          &lt;td&gt;Hopper 中国合规版&lt;/td&gt;
          &lt;td&gt;96GB HBM3、约 4.0 TB/s；公开渠道价约 1.2-1.5 万美元/卡&lt;/td&gt;
          &lt;td&gt;计算能力与其他受限项继续压低&lt;/td&gt;
          &lt;td&gt;不是 H800 的自然升级版，而是更严规则下的折中产物&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;这张表里最值得记住的一句话是：&lt;/p&gt;
&lt;p&gt;A800 和 H800 更像“削互连”，H20 则连计算能力都继续往下压。&lt;/p&gt;
&lt;p&gt;所以如果只看显存，会很容易误判。H20 比 H800 更新，不代表它按全球旗舰口径一定更强；它的商业意义首先是满足更严格规则之后还能卖，其次才是尽量保留一些可用性。&lt;/p&gt;
&lt;h2 id=&#34;哪些升级可以直接算哪些不能硬算&#34;&gt;哪些升级可以直接算，哪些不能硬算
&lt;/h2&gt;&lt;p&gt;这一点最好先讲清楚，不然后面的百分比都容易变成假精确。&lt;/p&gt;
&lt;p&gt;最稳的计算方式是：&lt;/p&gt;
\[
\text{升级率}=\frac{\text{新指标}-\text{旧指标}}{\text{旧指标}}
\]&lt;p&gt;但这个公式只适合口径一致的指标，比如显存容量、显存带宽、NVLink 带宽。它不适合把平台级推理吞吐、整机 token 产出和单卡 TFLOPS 粗暴揉成一条线。&lt;/p&gt;
&lt;h3 id=&#34;全球主线里能直接算的几组数字&#34;&gt;全球主线里，能直接算的几组数字
&lt;/h3&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;代际&lt;/th&gt;
          &lt;th&gt;最适合直接算的指标&lt;/th&gt;
          &lt;th&gt;大致变化&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;A100 80GB -&amp;gt; H100 SXM&lt;/td&gt;
          &lt;td&gt;带宽、互连、Tensor Core 峰值&lt;/td&gt;
          &lt;td&gt;显存带宽约 +64%，NVLink 约 +50%，BF16/FP16 Tensor Core 峰值约 +534%&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H100 SXM -&amp;gt; H200 SXM&lt;/td&gt;
          &lt;td&gt;显存、带宽&lt;/td&gt;
          &lt;td&gt;显存约 +76%，带宽约 +43%，NVLink 基本不变&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H200 SXM -&amp;gt; B200 SXM&lt;/td&gt;
          &lt;td&gt;显存、带宽、互连&lt;/td&gt;
          &lt;td&gt;显存约 +28%，带宽约 +67%，单 GPU NVLink 翻倍到 1.8 TB/s&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;B200 -&amp;gt; B300&lt;/td&gt;
          &lt;td&gt;显存、平台级推理能力&lt;/td&gt;
          &lt;td&gt;显存约 +60%；平台能力更强调 FP4、reasoning 和 attention 吞吐&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;从这个角度看，代际节奏也很清楚：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;H100 主要把训练卡拉到一个新高度。&lt;/li&gt;
&lt;li&gt;H200 把显存短板补齐。&lt;/li&gt;
&lt;li&gt;B200 开始把“单卡升级”转成“平台升级”。&lt;/li&gt;
&lt;li&gt;B300 再往大规模推理和 reasoning 方向加码。&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id=&#34;中国特供线里只能谨慎算一部分&#34;&gt;中国特供线里，只能谨慎算一部分
&lt;/h3&gt;&lt;p&gt;这里更要保守。&lt;/p&gt;
&lt;p&gt;因为 A800、H800、H20 的完整官方公开规格并不像全球主线那样整齐，很多关键参数主要来自 Reuters 报道和可追溯硬件媒体转述。&lt;/p&gt;
&lt;p&gt;能比较稳地说的是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;A800、H800 的主要削减方向都集中在互连；&lt;/li&gt;
&lt;li&gt;H20 显存比 H800 更大，但这不等于它在全球旗舰意义上“自然升级”；&lt;/li&gt;
&lt;li&gt;中国特供线每一代首先是在适应规则，而不是按性能最大化去延续旗舰路线。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以这条线最好不要硬写成“每一代全面提升多少”。它不是那种代际关系。&lt;/p&gt;
&lt;h2 id=&#34;价格部分只能保留公开可追溯样本&#34;&gt;价格部分，只能保留公开可追溯样本
&lt;/h2&gt;&lt;p&gt;数据中心 GPU 最容易写假的，就是价格。&lt;/p&gt;
&lt;p&gt;因为英伟达并不总是公开单卡 MSRP，公开世界里更常见的是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;DGX 整机官方起售价；&lt;/li&gt;
&lt;li&gt;第三方整机挂牌价；&lt;/li&gt;
&lt;li&gt;Reuters 或供应链转述的特供版渠道价。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以价格这里我只保留几个样本，不伪造一张看上去很完整、实际口径乱掉的价目表。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;对象&lt;/th&gt;
          &lt;th&gt;公开价格样本&lt;/th&gt;
          &lt;th&gt;怎么理解&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;DGX H100&lt;/td&gt;
          &lt;td&gt;2022 年发布时官方起售价 19.9 万美元&lt;/td&gt;
          &lt;td&gt;这是最干净的官方锚点&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;DGX B200&lt;/td&gt;
          &lt;td&gt;公开挂牌价大约比同阶段 DGX H100 高 40%-50%&lt;/td&gt;
          &lt;td&gt;说明全球旗舰平台确实继续涨价&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H20 单卡&lt;/td&gt;
          &lt;td&gt;Reuters 报道约 1.2 万到 1.5 万美元&lt;/td&gt;
          &lt;td&gt;这是渠道样本，不是全球旗舰口径&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;H20 八卡服务器&lt;/td&gt;
          &lt;td&gt;公开报道约 140 万元人民币&lt;/td&gt;
          &lt;td&gt;不能拿来和 DGX 体系直接硬比，只能说明合规线的商业定位&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;所以“整体售价提升了多少”这个问题，最稳的回答是两句：&lt;/p&gt;
&lt;p&gt;第一，全球旗舰主线确实在涨，而且涨得不小。&lt;/p&gt;
&lt;p&gt;第二，中国特供线未必一路更贵，甚至可能出现“更晚出的卡更便宜”的情况，因为它首先在追求合规可卖，而不是旗舰性能和定价不断上探。&lt;/p&gt;
&lt;h2 id=&#34;最后收一下&#34;&gt;最后收一下
&lt;/h2&gt;&lt;p&gt;如果把 ChatGPT 发布之后的数据中心 GPU 变化压成一句话，我现在会这么写：&lt;/p&gt;
&lt;p&gt;全球主线是 H100 起跑、H200 补显存、B200 平台化、B300 往 reasoning 时代再推一步；中国特供线则是 A800、H800、H20 在越来越严的规则里尽量保住可用性。&lt;/p&gt;
&lt;p&gt;这两条线不要混着看。&lt;/p&gt;
&lt;p&gt;混着看，最后很容易得出几个大差不差、但方向不对的结论。英伟达在全球卖的是训练与推理平台，在中国特供线卖的则首先是“还能交付、还能部署”的折中产品。目标函数不一样，升级逻辑当然也不一样。&lt;/p&gt;
&lt;h2 id=&#34;参考资料&#34;&gt;参考资料
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://openai.com/index/chatgpt/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;OpenAI：Introducing ChatGPT&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.nvidia.com/en-us/data-center/h100/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA H100 GPU&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://nvidianews.nvidia.com/news/nvidia-announces-dgx-h100-systems-worlds-most-advanced-enterprise-ai-infrastructure&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA Announces DGX H100 Systems&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://nvidianews.nvidia.com/news/nvidia-supercharges-hopper-the-worlds-leading-ai-computing-platform&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA Supercharges Hopper With H200&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.nvidia.com/en-us/data-center/h200/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA H200 GPU&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA Blackwell Platform Arrives&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.nvidia.com/dgx/dgxb200-user-guide/introduction-to-dgxb200.html&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA DGX B200 User Guide&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-ai-factory-platform-paves-way-for-age-of-ai-reasoning&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA Blackwell Ultra AI Factory Platform Paves Way for Age of AI Reasoning&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.nvidia.com/en-us/data-center/dgx-b300/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NVIDIA DGX B300&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.reuters.com/technology/nvidia-starts-making-new-chips-china-comply-with-new-us-limits-2022-11-08/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Reuters：Nvidia starts making new chips for China to comply with new U.S. limits&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.reuters.com/technology/nvidia-tweaks-flagship-h100-chip-export-china-2023-03-21/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Reuters：Nvidia tweaks flagship H100 chip for export to China&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.reuters.com/technology/nvidias-new-china-focused-ai-chip-set-be-sold-similar-price-huawei-product-2024-02-01/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Reuters：Nvidia’s new China-focused AI chip set to be sold at similar price to Huawei product&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;写作附记&#34;&gt;写作附记
&lt;/h2&gt;&lt;h3 id=&#34;原始提示词&#34;&gt;原始提示词
&lt;/h3&gt;&lt;pre&gt;&lt;code class=&#34;language-text&#34;&gt;整理自从 ChatGPT 发布以来，英伟达发布的显卡型号和对应的性能参数，前一代对比上一代升级了多少，整体售价提升了多少，我要的是数据中心用的显卡，包含给中国的特供版本。
&lt;/code&gt;&lt;/pre&gt;
&lt;p&gt;这篇从上面的原始提示词出发，按第一次写稿的方式确定主线、材料密度和结构。&lt;code&gt;date&lt;/code&gt; 字段沿用原发布时间，其他内容只服务当前文章承诺。&lt;/p&gt;</description>
        </item>
        
    </channel>
</rss>
