CUDA学习笔记——GPU相关指标
目录
GPU 架构的设计目标
GPU 架构的设计目标,主要从三个方面来衡量:
- 减少
延迟
(latency) - 增加
带宽
(bandwidth) - 增加
吞吐量
(throughput)
延迟
是指一个操作从启动到结束所用的时间,通常用微妙来表达。
带宽
是指单位时间内能够处理的数据量,通常用 MB/s 或 GB/s 来表达。
吞吐量
是指单位时间能够处理的某种操作,对于 GPU 而言,通常用 gflops 来表达,意思是每秒能进行多少十亿次(giga)浮点数运算。吞吐量
通常用于衡量那些需要大量浮点数运算的科学计算能力。
带宽和吞吐量这两个指标经常会搞混,因为他们意思相近,都是指单位时间能做的操作,都是衡量性能的速率指标。带宽通常是指理论上的峰值,而吞吐量一般是指实际能达到的值;带宽一般仅能用来描述单位时间内可能达到的数据传输量,而吞吐量能描述单位时间内任何类型的操作,比如:每个指令周期内执行的指令数,每秒执行的浮点数操作等。
GPU 的计算能力
两个比较重要的属性来描述 GPU 的计算能力:
- CUDA 核数
- 内存
对应这两个属性,可以用两个指标来描述:
- 计算力峰值
- 内存带宽
计算力峰值用来度量 GPU 的计算能力,通常表示为每秒能够处理的单精度或双精度浮点数计算数量,单位是 gflops 或者 tflops 。内存带宽用来度量内存的读写速度,通常表示为每秒多少GB,单位是 GB/s 。
下图是 Nvidia FERMI 和 KEPLER 两种架构的计算能力指标。
Nvidia 用一个特殊的术语来综合地描述 GPU 的性能——计算能力(compute capability)。官网上列出了所有 GPU 产品的计算能力:
https://developer.nvidia.com/cuda-gpus
「 您的赞赏是激励我创作和分享的最大动力! 」
- 原文链接:https://zhuyinjun.me/2021/cuda_learning_2/
- 版权声明:本创作采用 CC BY-NC 4.0 国际许可协议,非商业性使用可以转载,但请注明出处(作者、链接),商业性使用请联系作者获得授权。