
키보드 대신 말로 코딩하는 시대
개발하다 보면 타이핑이 귀찮을 때가 있잖아요. 특히 긴 커밋 메시지를 쓴다거나, 이슈 코멘트를 남긴다거나, 문서를 작성할 때 말이죠. Ghost Pepper는 macOS에서 키 하나를 꾹 누르고 있는 동안 말하면, 그 음성을 텍스트로 변환해주는 도구예요. 가장 핵심적인 특징은 "100% 로컬"이라는 점이에요. 내 음성 데이터가 외부 서버로 전혀 나가지 않아요.
어떻게 동작하나요
Ghost Pepper는 "hold-to-talk" 방식으로 동작해요. 이게 뭐냐면, 무전기처럼 특정 키를 누르고 있는 동안만 녹음이 되고, 키를 놓으면 바로 텍스트로 변환되는 거예요. 기존의 음성 인식 앱들이 항상 마이크를 켜놓고 "시리야" 같은 웨이크 워드를 기다리는 방식과는 다르죠. 필요할 때만 정확하게 녹음하니까 프라이버시 면에서도 낫고, 의도하지 않은 소리가 텍스트로 변환되는 일도 없어요.
내부적으로는 OpenAI의 Whisper 모델을 로컬에서 돌리는 구조예요. Whisper가 뭐냐면, OpenAI가 공개한 오픈소스 음성 인식 AI 모델인데, 성능이 꽤 좋아서 여러 언어를 잘 인식하고 정확도도 높아요. 클라우드 API를 쓰는 게 아니라 모델 파일을 맥에 다운로드해서 직접 돌리는 거라, 인터넷 연결 없이도 동작한다는 게 큰 장점이에요.
macOS 네이티브 앱으로 만들어져 있고, 시스템 전역에서 동작하기 때문에 어떤 앱에서든 사용할 수 있어요. 에디터에서 코드를 짜다가도, 슬랙에서 메시지를 보내다가도, 브라우저에서 글을 쓰다가도 단축키 하나로 음성 입력을 할 수 있는 거죠.
기존 도구들과 뭐가 다를까
macOS에는 이미 받아쓰기 기능이 내장되어 있잖아요. 시스템 설정에서 켤 수 있는 그 기능이요. 하지만 이건 Apple 서버로 음성을 보내서 처리하는 방식이에요. (최신 macOS에서는 온디바이스 처리도 지원하긴 하지만, 언어에 따라 차이가 있죠.)
그 외에도 Whisper 기반의 도구들이 여러 개 있어요. 예를 들어 MacWhisper 같은 앱은 녹음된 파일을 변환하는 데 특화되어 있고, Superwhisper는 Ghost Pepper와 비슷하게 실시간 음성 입력을 지원하지만 유료 앱이에요. Ghost Pepper는 완전 오픈소스에 무료라는 점에서 차별화돼요.
또 하나 주목할 점은, 최근 AI 코딩 도구들이 자연어 입력을 많이 받아들이는 추세잖아요. Cursor나 Copilot Chat 같은 도구에 프롬프트를 입력할 때, 타이핑 대신 음성으로 자연스럽게 설명할 수 있다면 워크플로우가 훨씬 빨라질 수 있어요. Ghost Pepper가 딱 이런 시나리오에 잘 맞는 도구인 거죠.
로컬 AI의 흐름
이 프로젝트가 보여주는 더 큰 흐름은 "로컬 AI"예요. 클라우드에 데이터를 보내지 않고, 내 컴퓨터에서 직접 AI를 돌리겠다는 움직임이 점점 강해지고 있거든요. Apple Silicon(M1, M2, M3, M4)이 나오면서 맥의 온디바이스 AI 성능이 크게 좋아졌고, 덕분에 Whisper 같은 모델도 맥에서 충분히 실시간으로 돌릴 수 있게 됐어요.
비슷한 맥락에서 llama.cpp (LLM을 로컬에서 돌리는 도구), Stable Diffusion on Mac 같은 프로젝트들도 활발하고요. 개인 정보 보호와 오프라인 사용이라는 두 마리 토끼를 잡을 수 있다 보니, 이 분야는 앞으로도 계속 성장할 거예요.
한국 개발자에게 주는 시사점
한 가지 궁금한 점은 한국어 인식 성능일 텐데요. Whisper 모델 자체가 다국어를 지원하고 한국어 성능도 나쁘지 않은 편이에요. 다만 로컬에서 돌리는 모델 사이즈에 따라 성능 차이가 있을 수 있어요. 작은 모델(tiny, base)은 빠르지만 한국어 정확도가 떨어지고, 큰 모델(large)은 정확하지만 변환 속도가 느려질 수 있거든요. 직접 써보면서 자기 맥 성능에 맞는 모델을 찾아보는 게 좋을 것 같아요.
오픈소스 프로젝트라 직접 기여하거나 포크해서 한국어에 최적화된 설정을 만들어볼 수도 있고요. 예를 들어 한국어 모드일 때 자동으로 큰 모델을 사용하도록 한다거나, 개발 용어 사전을 추가하는 식으로요.
정리
"내 목소리는 내 맥 안에서만" — 프라이버시를 지키면서도 편리한 음성 입력을 원했다면 Ghost Pepper를 한번 시도해 볼 만해요. 여러분은 코딩할 때 음성 입력을 써보신 적 있나요? 실제로 생산성에 도움이 됐는지, 아니면 오히려 방해가 됐는지 경험을 나눠주세요!
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공