目录

CUDA学习笔记——GPU相关指标

GPU 架构的设计目标

GPU 架构的设计目标,主要从三个方面来衡量:

  • 减少延迟(latency)
  • 增加带宽(bandwidth)
  • 增加吞吐量(throughput)

延迟是指一个操作从启动到结束所用的时间,通常用微妙来表达。

带宽是指单位时间内能够处理的数据量,通常用 MB/s 或 GB/s 来表达。

吞吐量是指单位时间能够处理的某种操作,对于 GPU 而言,通常用 gflops 来表达,意思是每秒能进行多少十亿次(giga)浮点数运算。吞吐量通常用于衡量那些需要大量浮点数运算的科学计算能力。

带宽和吞吐量这两个指标经常会搞混,因为他们意思相近,都是指单位时间能做的操作,都是衡量性能的速率指标。带宽通常是指理论上的峰值,而吞吐量一般是指实际能达到的值;带宽一般仅能用来描述单位时间内可能达到的数据传输量,而吞吐量能描述单位时间内任何类型的操作,比如:每个指令周期内执行的指令数,每秒执行的浮点数操作等。

 

GPU 的计算能力

两个比较重要的属性来描述 GPU 的计算能力:

  • CUDA 核数
  • 内存

对应这两个属性,可以用两个指标来描述:

  • 计算力峰值
  • 内存带宽

计算力峰值用来度量 GPU 的计算能力,通常表示为每秒能够处理的单精度或双精度浮点数计算数量,单位是 gflops 或者 tflops 。内存带宽用来度量内存的读写速度,通常表示为每秒多少GB,单位是 GB/s 。

下图是 Nvidia FERMI 和 KEPLER 两种架构的计算能力指标。

image-20240614113122322

Nvidia 用一个特殊的术语来综合地描述 GPU 的性能——计算能力(compute capability)。官网上列出了所有 GPU 产品的计算能力:

https://developer.nvidia.com/cuda-gpus


- 全文完 -

相关文章

「 您的赞赏是激励我创作和分享的最大动力! 」