메타의 PyTorch팀이 만든 TorchCodec은 영상·오디오를 곧장 텐서로 디코딩해 ML 파이프라인에 바로 넣어주는 라이브러리입니다. 0.14의 핵심은 두 가지. 첫째, HDR 영상 디코딩을 CPU와 CUDA(NVDEC) 양쪽에서 지원합니다. 기존엔 10비트 HDR 콘텐츠가 SDR로 깎여 색·밝기 정보가 손실됐는데, 이제 넓은 다이내믹 레인지를 그대로 살려 학습 데이터로 쓸 수 있습니다. 영상 생성·이해 모델을 다룬다면 데이터 품질이 달라지는 지점입니다. 둘째, 새 WAV 디코더가 추가돼 오디오 로딩 속도가 크게 빨라졌습니다. 음성·오디오 모델 학습에서 I/O 병목이 줄어든다는 의미죠. 핵심 인사이트는 전처리를 별도 도구 없이 GPU 가속으로 텐서까지 일관되게 처리한다는 점. ffmpeg 호출과 변환 단계를 줄여 데이터 파이프라인을 단순화하려는 분들이 주목할 만합니다.
이 글도 읽어보세요
이 뉴스가 유용했나요?
TTJ 코딩클래스 정규반
월급 외 수입,
코딩으로 만들 수 있습니다
17가지 수익 모델을 직접 실습하고, 1,300만원 상당의 자동화 도구와 소스코드를 받아가세요.
144+실전 강의
17개수익 모델
4.9수강생 평점
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공