TECH 으로 돌아가기
TECH HACKER NEWS 오늘 2분 읽기 22 READS

AMD MI355X, GPU 점유율(Occupancy)을 제1원리부터 계산하기

엔비디아 CUDA에 익숙한 개발자라면 AMD GPU 커널 최적화는 낯설다. 이 글은 AMD의 최신 데이터센터 GPU MI355X(CDNA 아키텍처)에서 '점유율(Occupancy)'이 어떻게 결정되는지를 공식 암기가 아닌 제1원리부터 풀어낸다. 핵심은 단순하다. 하나의 연산 유닛(CU)은 레지스터(VGPR), LDS(공유 메모리), 동시 실행 가능한 wavefront 수라는 한정된 자원을 가지며, 커널이 스레드당 자원을 많이 쓸수록 동시에 올릴 수 있는 wavefront가 줄어든다. 즉 점유율은 이 세 자원 중 가장 먼저 고갈되는 병목으로 결정된다. 저자는 레지스터 64개를 쓰면 몇 개의 wavefront가 살아남는지를 손으로 계산하며, 점유율이 높다고 무조건 빠른 게 아니라 메모리 지연을 숨길 만큼만 충분하면 된다는 점을 강조한다. AMD ROCm 환경에서 커널 성능을 튜닝하려는 한국 개발자에게, GPU가 실제로 자원을 어떻게 배분하는지 직관을 길러주는 실전 안내서다.

SOURCE · HACKER NEWS
원문 전체 보기 → https://indianspeedster.github.io/blog/occupancy-math-mi355x...
SHARE
처리 중...