오픈소스 TTS(Text-to-Speech) 프로젝트 KittenTTS가 공개되었습니다. 가장 작은 모델이 25MB 미만이라는 놀라운 경량화를 달성한 것이 핵심입니다.
왜 주목할만한가
최근 TTS 기술은 품질 면에서 큰 발전을 이뤘지만, 대부분의 고품질 모델은 수백 MB에서 수 GB에 달하는 크기를 가지고 있습니다. KittenTTS는 이와 정반대의 접근을 취합니다. 세 가지 크기의 모델을 제공하며, 가장 작은 모델은 25MB 미만으로 모바일 기기나 엣지 디바이스에서도 충분히 구동할 수 있는 수준입니다.
- 초경량 모델임에도 자연스러운 음성 합성 품질을 목표로 함
- 로컬 환경에서 API 호출 없이 TTS를 실행할 수 있어 프라이버시와 레이턴시 면에서 유리
- GitHub에 오픈소스로 공개되어 누구나 실험 가능
한국 개발자에게 어떤 의미가 있나
한국어 TTS는 여전히 네이버 클로바, 카카오 등 대형 플랫폼의 API에 의존하는 경우가 많습니다. 이런 초경량 모델이 다국어로 확장된다면, 오프라인 환경의 키오스크, IoT 기기, 개인 프로젝트 등에서 클라우드 의존 없이 TTS를 구현할 수 있는 가능성이 열립니다. 특히 라즈베리파이 같은 소형 보드에서의 활용이 기대됩니다.
Hacker News에서 281점, 86개의 댓글을 받으며 뜨거운 반응을 얻고 있습니다. 직접 모델을 돌려보신 분 계신가요? 한국어 지원 가능성도 궁금하네요.
🔗 출처: Hacker News
TTJ 코딩클래스 정규반
월급 외 수입,
코딩으로 만들 수 있습니다
17가지 수익 모델을 직접 실습하고, 1,300만원 상당의 자동화 도구와 소스코드를 받아가세요.
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공