1. FLOPS
FLOPS是Floating-point Operations Per Second的缩写,代表每秒所执行的浮点运算次数。现在衡量计算能力的标准是TFLOPS(每秒万亿次浮点运算)
NVIDIA显卡算力表:CUDA GPUs - Compute Capability | NVIDIA Developer
例如: 以GTX680为例, 单核一个时钟周期单精度计算次数为两次,处理核个数 为1536, 主频为1006MHZ,那他的计算能力的峰值P 为:P = 2 × 1536 × 1006MHZ = 3.09TFLOPS,1T为1兆,也就是说,GTX680每秒可以进行超过3兆次的单精度运算。
各种FLOPS的含义
MFLOPS (megaFLOPS):每秒一百万 (=10^6) 次的浮点运算
GFLOPS (gigaFLOPS) :每秒十亿 (=10^9) 次的浮点运算
TFLOPS (teraFLOPS) :每秒一万亿 (=10^12) 次的浮点运算
PFLOPS (petaFLOPS) :每秒一千万亿 (=10^15) 次的浮点运算
2. TOPS
TOPS(Tera Operations Per Second)表示”每秒操作一兆次数“,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。
一般的默认TOPS的操作是以int8为基准,FLOPS此时如果是以半精度浮点数FP16的话,则有个大致的换算关系为:1TFLOPS=2TOPS。
3. OPS与FLOPS
OPS是操作数量,FLOPS特指浮点型操作数量,通常情况下,FLOPS比OPS稍大。如果按照FP16衡量标准,两者可近似于相等。
传统的GPU采用GFLOPS,NPU的时代为了支持AI计算,采用TOPS。
4. 算力与AI芯片算力
算力是芯片单


2417

被折叠的 条评论
为什么被折叠?



