TECH 으로 돌아가기
TECH HACKER NEWS 오늘 5분 읽기 27 READS

FFmpeg 9.1, 드디어 '쓸 만한' 내장 AAC 인코더가 왔어요

영상이나 음성을 다뤄본 사람이라면 FFmpeg를 안 거쳐갈 수가 없죠. 포맷 변환, 압축, 자르기, 스트리밍까지 미디어 처리의 만능 칼 같은 오픈소스인데요. 이번에 나온 9.1 버전에서 내장 AAC 오디오 인코더가 큰 폭으로 개선됐어요. 별거 아닌 것 같지만, 오디오·영상 파이프라인을 돌리는 사람들에겐 은근히 반가운 소식이에요. 왜 그런지 풀어볼게요.

AAC가 뭐고, 왜 인코더가 중요할까

먼저 AAC부터요. AAC(Advanced Audio Coding)는 우리가 매일 듣는 음악·영상의 소리를 압축하는 대표적인 코덱이에요. MP3의 사실상 후계자라고 보면 되고, 유튜브·아이폰·대부분의 mp4 영상 소리가 이걸로 압축돼 있어요. 그런데 같은 코덱이라도 '인코더'(압축하는 프로그램)에 따라 음질 차이가 꽤 나요. 똑같은 128kbps로 뽑아도 잘 만든 인코더는 소리가 깨끗한데, 못 만든 인코더는 고음이 지글거리거나 답답하게 들리거든요. 요리로 치면 같은 재료라도 요리사 실력에 따라 맛이 다른 것과 비슷해요.

그동안 뭐가 아쉬웠냐면

문제는 여기 라이선스 함정이 껴 있었다는 거예요. 음질 좋기로 유명한 인코더는 프라운호퍼의 FDK-AAC인데, 이건 라이선스가 까다로워서 FFmpeg에 기본으로 넣어 배포하기가 어려웠어요. 그래서 많은 사람들이 별도로 컴파일해 붙이거나, 애플의 AAC 인코더를 우회해서 쓰곤 했죠. 반대로 FFmpeg에 원래 들어있던 내장 AAC 인코더는 라이선스 걱정은 없지만 음질이 한 수 아래라는 평이 오래 굳어 있었어요. 그래서 '제대로 된 AAC 뽑으려면 내장 말고 딴 걸 써라'가 거의 상식이었죠.

9.1이 바꾼 것

이번 개선의 핵심은 이 내장 인코더의 두뇌에 해당하는 심리음향 모델과 비트 배분 로직을 손봤다는 거예요. 심리음향 모델이 뭐냐면, 사람 귀가 실제로 잘 못 듣는 소리(큰 소리에 묻히는 작은 소리 같은 것)를 골라내서 과감히 버리고, 잘 들리는 부분에 데이터를 몰아주는 똑똑한 판단 장치예요. 이 판단이 정교해질수록 같은 용량으로 더 좋은 소리를 낼 수 있어요. 새 인코더는 이 부분을 다듬어서, 같은 비트레이트에서 체감 음질이 눈에 띄게 좋아졌다는 게 요점이에요. 라이선스 자유로운 내장 인코더가 이제 상용급에 가까워졌다는 얘기죠.

업계 흐름에서 보면

물론 오디오 코덱 판이 AAC만 있는 건 아니에요. 요즘은 Opus라는, 저비트레이트에서 특히 강한 오픈 코덱이 통화·스트리밍에서 많이 쓰이거든요. 하지만 호환성 면에선 AAC가 여전히 압도적이에요. 아이폰이든 구형 TV든 거의 다 재생되니까요. 그래서 '웬만한 데서 다 돌아가면서, 라이선스 깨끗하고, 음질도 괜찮은 AAC'라는 조합의 가치가 큰 거고, 이번 개선이 딱 그 지점을 채워준 셈이에요.

한국 개발자에게

미디어 서비스나 스트리밍, UGC(사용자 업로드 콘텐츠) 처리하는 백엔드를 다룬다면 실질적인 이득이 있어요. 서버에서 대량으로 영상을 트랜스코딩할 때, 별도 라이선스 붙은 인코더 없이 -c:a aac 한 줄로 괜찮은 음질을 뽑을 수 있으면 배포·법무 리스크가 확 줄거든요. 이미 FFmpeg를 쓰고 있다면 9.1로 올리고 예전 결과물과 음질을 A/B로 비교해보는 걸 추천해요. 특히 128~160kbps 대역에서 차이를 체감하기 쉬워요.

마무리

한 줄 정리하면 '라이선스 걱정 없는 FFmpeg 내장 AAC가 이제 진짜 실무에 써도 될 만큼 좋아졌다'예요. 여러분은 영상 인코딩할 때 오디오 코덱, 뭘 기본으로 쓰고 계세요? AAC와 Opus 사이에서 고민해본 적 있다면 어떤 기준으로 골랐는지 궁금하네요.


🔗 출처: Hacker News

SOURCE · HACKER NEWS
원문 전체 보기 → https://hydrogenaudio.org/index.php/topic,129691.0.html
SHARE
처리 중...