Definition

하드웨어 시스템(CPU, GPU, 슈퍼컴퓨터 등)이 낼 수 있는 이론적 최대 성능으로, FLOPS(초당 부동소수점 연산)으로 측정된다.

계산 방식

CPU의 경우

이론적 최대 성능 = 클럭 속도 × 코어 수 × FLOP/사이클

예를 들어, 클럭 속도가 3.0GHz이고, 8개 코어를 가지고 있으며, 각 코어가 한 클럭 주기당 16개의 부동소수점 연산을 수행할 수 있는 CPU의 경우, 이론적으로 3.0G * 8 * 16 으로 총 384 GFLOPS의 성능을 달성할 수 있다.

GPU의 경우

GPU의 경우 코어 수 부분에 CUDA 코어, 즉 SM 내의 ALU 수를 적는다(예를 들어 SM이 4개이고 ALU가 512개 있으면 총 2048). 따라서 1.5GHz의 클럭 속도, CUDA 코어 2048개, 각 코어가 한 클럭 주기당 2개의 FLOP을 수행하는 GPU라면, 이론적으로 1.5G * 2048 * 2 = 6144 GFLOPS 의 이론적 성능을 달성할 수 있다.