처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
Hacker News 2026.06.22 33

AMD MI355X, GPU 점유율(Occupancy)을 제1원리부터 계산하기

Hacker News 원문 보기

엔비디아 CUDA에 익숙한 개발자라면 AMD GPU 커널 최적화는 낯설다. 이 글은 AMD의 최신 데이터센터 GPU MI355X(CDNA 아키텍처)에서 '점유율(Occupancy)'이 어떻게 결정되는지를 공식 암기가 아닌 제1원리부터 풀어낸다. 핵심은 단순하다. 하나의 연산 유닛(CU)은 레지스터(VGPR), LDS(공유 메모리), 동시 실행 가능한 wavefront 수라는 한정된 자원을 가지며, 커널이 스레드당 자원을 많이 쓸수록 동시에 올릴 수 있는 wavefront가 줄어든다. 즉 점유율은 이 세 자원 중 가장 먼저 고갈되는 병목으로 결정된다. 저자는 레지스터 64개를 쓰면 몇 개의 wavefront가 살아남는지를 손으로 계산하며, 점유율이 높다고 무조건 빠른 게 아니라 메모리 지연을 숨길 만큼만 충분하면 된다는 점을 강조한다. AMD ROCm 환경에서 커널 성능을 튜닝하려는 한국 개발자에게, GPU가 실제로 자원을 어떻게 배분하는지 직관을 길러주는 실전 안내서다.

이 뉴스가 유용했나요?

TTJ 코딩클래스 정규반

월급 외 수입,
코딩으로 만들 수 있습니다

17가지 수익 모델을 직접 실습하고, 1,300만원 상당의 자동화 도구와 소스코드를 받아가세요.

144+실전 강의
17개수익 모델
4.9수강생 평점
정규반 자세히 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.