现代计算架构(Tesla 及以后)

这个时期的架构不仅是图形处理器,更是并行计算平台,支持 CUDA,是 AI 和科学计算的基石。

架构代际名称 发布年份 代表显卡 (核心代号) 关键创新与特点 主要应用与意义
Tesla 2006-2008 GeForce 8800 GTX (G80)
GeForce GTX 280 (GT200)
首款支持 CUDA 的架构,引入了统一着色器架构,将GPU转变为通用并行处理器。 科学计算、早期GPGPU应用。
Fermi 2010 GeForce GTX 480 (GF100)
GeForce GTX 580 (GF110)
第一代真正的GPU计算架构。引入L1/L2缓存、ECC内存支持。计算可靠性大幅提升。 HPC(高性能计算)的入门。
Kepler 2012-2013 GeForce GTX 680 (GK104)
GeForce GTX TITAN (GK110)
能效比重大提升。引入 SMX 流多处理器、GPU动态并行。GK110核心拥有强大的双精度性能。 广泛应用于数据中心,如Titan超级计算机。
Maxwell 2014-2015 GeForce GTX 980 Ti (GM200)
GeForce GTX 970 (GM204)
能效比再次巨大飞跃。引入 SMM 流多处理器,大幅提高了每瓦特性能。 游戏笔记本、台式显卡的能效标杆。
Pascal 2016 GeForce GTX 1080 Ti (GP102)
NVIDIA TITAN Xp (GP102)
Tesla P100 (GP100)
16nm FinFET工艺,GDDR5X内存。引入 NVLink。为AI加入半精度(FP16)计算单元。 AI训练和推理开始爆发(如DGX-1)。
Volta 2017 TITAN V (GV100)
Tesla V100 (GV100)
专为AI和HPC设计。革命性的 Tensor Core 核心,极大加速深度学习。HBM2内存,NVLink 2.0 科学计算和AI研究的标杆。
Turing 2018 GeForce RTX 2080 Ti (TU102)
GeForce RTX 2060 (TU106)
Tesla T4 (TU104)
革命性的图形和AI架构。引入用于光追的 RT Core 和用于AI的下一代 Tensor Core(支持INT4/INT8精度)。 消费级市场引入实时光追,AI推理(T4)。
Ampere 2020 GeForce RTX 3090 (GA102)
GeForce RTX 3080 (GA102)
Tesla A100 (GA100)
大幅提升的通用计算和AI性能。第二代 RT Core,第三代 Tensor Core(支持TF32, FP64)。GA100支持多实例GPU(MIG) 技术。 当前AI训练和HPC的绝对主力(A100)。
Hopper 2022 (无消费级卡)
Tesla H100 (GH100)
H200 (GH100)
专为超大规模AI和HPC设计。第四代 Tensor Core,支持Transformer引擎(FP8精度)。HBM3内存。与Grace CPU组成超级芯片。 用于训练超大规模模型(如LLaMA, ChatGPT)。
Blackwell 2024 RTX5060
RTX5070
RTX5090
Tesla B100/B200 (GB100)
GB200 NVL72
下一代平台。第二代Transformer引擎,支持FP4精度。通过NVLink 5.0将多个Die连接成一个巨大的统一GPU 旨在支撑万亿参数规模的生成式AI和LLM的实时推理和训练。

早期经典图形架构(Pre-Tesla)

这些架构主要专注于图形渲染,是现代GPU的雏形。

架构代际名称 发布年份 代表显卡 (核心代号) 关键创新与特点
Curie 2004-2006 GeForce 7800 GTX (G70) 支持Shader Model 3.0,图形渲染管线更加灵活。
Tesla
(图形架构)
2006-2007 GeForce 8800 GTX (G80) 首次采用统一着色器架构,颠覆了传统的分离式渲染管线。这也是计算架构的开端。
更多早期架构 1995-2003 GeForce 256 (NV10) - 世界上第一款GPU
GeForce 4 Ti 4600 (NV25)
GeForce FX 5950 Ultra (NV38)
从固定的3D渲染管线,到引入可编程着色器的概念,奠定了现代图形技术的基础。

总结与快速记忆点:

  • Fermi (费米):第一个“真正”的计算架构,有缓存和ECC。
  • Kepler (开普勒):能效很好,经典“战术核显卡”GTX 690就基于此。
  • Maxwell (麦克斯韦):能效极致,神卡GTX 970/980。
  • Pascal (帕斯卡):一代经典,游戏神卡GTX 1080 Ti。
  • Volta (伏打):AI先驱,首代Tensor Core,只有TITAN V和计算卡。
  • Turing (图灵):光影革命,首代RT Core,开启RTX时代。
  • Ampere (安培):性能猛兽,RTX 30系,当前AI/HPC主力。
  • Hopper (霍珀):AI巨头,专为超大模型设计,只有计算卡。
  • Blackwell (布莱克威尔):未来之王,万亿参数模型的基石。

更多推荐