회사 회의, 아직도 통째로 남의 서버에 올리고 있나요?
여러분 회사에서 화상 회의하면 기록 어떻게 하세요? 요즘은 Otter.ai, 클로바노트, 아니면 줌(Zoom)에 내장된 AI 요약 기능 쓰는 분들 정말 많죠. 자동으로 받아 적어주고 요약까지 해주니까 편하긴 정말 편하거든요.
그런데 여기 한 가지 찜찜한 게 있어요. 우리 회의 내용이 통째로 그 서비스 회사의 서버로 올라간다는 점이에요. 계약 협상, 채용 면접, 신제품 기획, 인사 평가... 회사에서 오가는 얘기 중에는 밖으로 새면 안 되는 게 한둘이 아니잖아요. 이런 민감한 대화가 전부 남의 클라우드에 저장된다고 생각하면 좀 아찔하죠. 실제로 금융권이나 병원, 공공기관처럼 규정이 빡빡한 곳은 이런 클라우드 회의툴을 아예 못 쓰게 막아둔 경우도 많아요.
그래서 최근 개발자 커뮤니티에서 조용히, 그러나 꾸준히 관심을 받고 있는 프로젝트가 바로 오늘 소개할 Meetily(미틸리) 예요. 한마디로 정리하면 이래요. 인터넷 연결도, 클라우드도 필요 없이 내 컴퓨터 안에서만 돌아가는 AI 회의 비서. 회의 소리를 듣고, 실시간으로 글자로 바꾸고, 요약까지 해주는데 그 모든 처리가 100% 내 노트북 안에서 끝나요. 데이터가 밖으로 한 발짝도 안 나가는 거죠.
요즘 AI 업계의 큰 흐름 중 하나가 바로 이 '로컬 AI(on-device AI)' 예요. 몇 년 전만 해도 쓸 만한 AI는 무조건 거대한 클라우드 서버에서만 돌릴 수 있었는데, 이제는 개인 노트북에서도 꽤 똑똑한 AI를 돌릴 수 있게 됐거든요. Meetily는 이 흐름을 회의록이라는 아주 현실적인 문제에 딱 붙여놓은 사례예요. 그래서 한번 뜯어볼 만합니다.
이게 대체 어떻게 돌아가는 걸까요?
Meetily가 하는 일은 크게 세 단계로 나눌 수 있어요.
1. 회의 소리를 듣고 (오디오 캡처)
2. 그 소리를 글자로 바꾸고 (전사, transcription)
3. 글자를 요약해주는 것 (요약, summarization)
하나씩 쉽게 풀어볼게요.
1단계: 말을 글자로 바꾸기 — Whisper와 Parakeet
사람 말소리를 텍스트로 바꿔주는 걸 전문 용어로 STT(Speech-to-Text) 또는 '전사'라고 해요. 쉽게 말해서 받아쓰기예요. 사람이 귀로 듣고 손으로 받아 적던 걸 AI가 대신 해주는 거죠.
Meetily는 여기에 두 가지 AI 모델을 써요.
- Whisper(위스퍼): OpenAI가 만들어서 무료로 공개한 받아쓰기 AI예요. 워낙 성능이 좋아서 지금 오픈소스 STT의 사실상 표준처럼 쓰이고 있어요. 여러 언어를 알아듣고 정확도도 높아요.
- Parakeet(패러킷): NVIDIA가 만든 받아쓰기 AI인데, Meetily 설명에 따르면 최대 4배까지 빠르다고 해요. 회의는 실시간으로 진행되잖아요? 말이 끝나기 무섭게 글자가 착착 떠야 하는데, 이때 속도가 정말 중요하거든요. 그래서 빠른 Parakeet을 대안으로 넣어둔 거예요.
2단계: 누가 말했는지 구분하기 — 화자 분리
회의록에서 제일 중요한 게 뭘까요? 사실 '누가 무슨 말을 했는지'예요. 그냥 텍스트만 쭉 나오면 '이 결정 누가 한 거야?' 하고 다시 헤매게 되거든요.
그래서 나오는 개념이 화자 분리(Speaker Diarization) 예요. 이게 뭐냐면, 여러 사람 목소리가 섞인 녹음에서 '이 부분은 A씨, 저 부분은 B씨' 하고 목소리마다 이름표를 붙여주는 기술이에요. 마치 여러 색깔 형광펜으로 발언자별로 밑줄 쳐주는 거라고 생각하면 돼요. Meetily는 이 기능을 내장해서 '누가 말했는가'까지 정리해줘요.
3단계: 요약하기 — Ollama
한 시간짜리 회의를 통글자로 받아 적으면 수천 줄이 나와요. 이걸 다 읽을 사람은 없죠. 그래서 핵심만 뽑아 요약해줘야 하는데, 이 일을 Ollama(올라마) 가 맡아요.
Ollama가 뭐냐면, ChatGPT 같은 대형 언어모델(LLM)을 내 컴퓨터에 직접 설치해서 인터넷 없이 돌리게 해주는 도구예요. 보통 ChatGPT를 쓰면 내 질문이 OpenAI 서버로 날아가지만, Ollama는 모델 자체를 내 컴퓨터에 다운받아서 로컬에서 돌려요. 그래서 회의 내용이 밖으로 안 나가고도 'AI 요약'이 가능해지는 거예요. Meetily가 '프라이버시 우선'을 내세울 수 있는 핵심 비결이 바로 여기 있어요.
왜 하필 Rust로 만들었을까?
Meetily는 Rust(러스트) 라는 언어로 만들어졌어요. Rust는 요즘 뜨는 시스템 프로그래밍 언어인데, 특징을 한 줄로 요약하면 'C/C++만큼 빠른데 메모리 버그는 훨씬 적은 언어' 예요.
실시간 오디오 처리는 1초에도 엄청난 양의 소리 데이터를 쉼 없이 다뤄야 하거든요. 조금만 느리거나 삐끗해도 소리가 끊기고 글자가 밀려요. 이렇게 속도와 안정성이 둘 다 중요한 작업에 Rust가 딱이에요. 파이썬으로 짰으면 무거워서 실시간 처리가 버거웠을 텐데, Rust를 골라서 가볍고 빠르게 돌아가게 만든 거죠.
클라우드 회의툴이랑 뭐가 다를까?
그럼 우리가 흔히 쓰는 Otter.ai, 클로바노트, Zoom AI랑 비교하면 어떻게 다를까요? 표로 정리해볼게요.
| 항목 | Meetily (로컬) | 일반 클라우드 툴 |
|---|---|---|
| 데이터 저장 위치 | 내 컴퓨터 안 | 서비스 회사 서버 |
| 비용 | 오픈소스, 기본 무료 | 대부분 월 구독료 |
| 인터넷 | 없어도 됨 | 반드시 필요 |
| 커스터마이징 | 코드 수정 자유 | 회사가 정한 만큼만 |
| 편의성 | 직접 설치 필요 | 가입하면 바로 |
핵심 차이를 비유로 설명하면 이래요. 클라우드 툴은 '맛집에 가서 사 먹는 것' 이에요. 편하고 맛도 보장되지만, 주방을 내가 못 보고 재료도 내가 못 골라요. 반면 Meetily는 '재료 사다가 내 집 부엌에서 직접 해 먹는 것' 이에요. 손은 좀 가지만 뭐가 들어가는지 내가 다 알고, 남한테 레시피가 새어 나갈 걱정이 없죠.
물론 단점도 솔직하게 짚어야 해요. 직접 설치하고 모델을 내려받아야 하니까 처음 세팅이 클라우드 서비스보다 번거로워요. 또 AI 모델을 내 컴퓨터에서 돌리니까 어느 정도 사양이 받쳐줘야 하고요. 편의성만 놓고 보면 가입 한 번으로 끝나는 클라우드 툴이 아직 앞서요. Meetily는 '편함'보다 '통제권과 프라이버시'를 선택한 도구인 거죠. PRO 유료 버전으로 더 정교한 정확도나 팀 기능을 제공하는 건, 오픈소스로 신뢰를 쌓고 필요한 사람에겐 유료로 파는 요즘 흔한 사업 모델이에요.
한국 개발자에게 주는 시사점
그럼 우리나라 개발자 입장에서 이걸 어떻게 써먹을 수 있을까요? 구체적인 시나리오로 볼게요.
시나리오 1 — 규제 산업. 금융, 의료, 법률처럼 고객 정보나 계약 내용이 절대 밖으로 나가면 안 되는 곳이 있죠. 이런 데서 클라우드 회의툴은 보안팀이 절대 승인 안 해줘요. 이럴 때 Meetily처럼 전부 로컬에서 도는 도구가 현실적인 대안이 돼요. 우리 개인정보보호법 관점에서도 '데이터가 아예 외부로 전송되지 않는다'는 건 컴플라이언스(규정 준수) 부담을 확 줄여주거든요.
시나리오 2 — 사내 도구로 커스터마이징. 오픈소스라서 코드를 뜯어고칠 수 있어요. 우리 회사 용어 사전을 붙이거나, 요약 결과를 사내 노션·슬랙으로 자동으로 쏘거나, 우리만의 회의록 양식에 맞게 뽑아내는 것도 다 가능해요. 클라우드 툴은 회사가 열어준 기능만 써야 하지만, 이건 내가 원하는 대로 주무를 수 있어요.
시나리오 3 — 학습 교재로 활용. 사실 Meetily는 요즘 로컬 AI 앱의 좋은 표본이에요. 오디오 캡처 → STT → 화자 분리 → LLM 요약으로 이어지는 파이프라인이 한 프로젝트에 다 들어 있거든요.
혹시 이 분야를 공부하고 싶다면 이런 로드맵을 추천해요.
1. Whisper 먼저 만져보기 — 오디오 파일 하나 넣어서 텍스트로 바꿔보는 것부터. 받아쓰기 AI가 어떤 건지 감이 와요.
2. Ollama 설치해보기 — 내 컴퓨터에 작은 LLM 하나 깔아서 인터넷 없이 대화해보세요. '로컬에서 AI가 돈다'는 게 신기할 거예요.
3. 둘을 이어붙이기 — 받아쓴 텍스트를 Ollama에 넣어서 요약시키는 작은 스크립트를 짜보면, Meetily의 뼈대를 직접 만들어본 셈이 돼요.
4. Rust와 Tauri 구경하기 — 데스크톱 앱을 어떻게 가볍게 만드는지 궁금하면 그때 코드를 열어보면 돼요.
이 순서로 가면 거창한 이론 없이도 '로컬 AI 앱'이 어떻게 조립되는지 몸으로 익힐 수 있어요.
마무리 — 이제 AI는 '내 손 안'으로 돌아오고 있어요
Meetily가 던지는 진짜 메시지는 회의록 그 자체가 아니라 방향성이에요. 그동안 우리는 좋은 AI를 쓰려면 무조건 내 데이터를 클라우드에 갖다 바쳐야 한다고 여겼어요. 그런데 노트북 성능이 좋아지고, Whisper·Ollama 같은 오픈소스 도구가 쏟아지면서 이제는 '내 데이터를 내 손 안에 둔 채로도 충분히 똑똑한 AI를 쓸 수 있는 시대' 가 열리고 있어요. Meetily는 그 변화를 회의라는 아주 일상적인 장면에서 보여준 거죠.
앞으로는 회의록뿐 아니라 이메일 정리, 문서 요약, 코드 리뷰 같은 것도 '내 기기 안에서 도는 AI'로 옮겨가는 흐름이 점점 빨라질 거예요. 프라이버시가 곧 경쟁력이 되는 시대가 오고 있거든요.
자, 여러분께 질문을 던지며 마칠게요. 편리한 클라우드 회의툴과, 조금 손이 가더라도 데이터가 밖으로 안 나가는 로컬 도구. 여러분 회사라면 어떤 걸 고르시겠어요? 그리고 혹시 로컬 AI를 직접 세팅해서 써본 경험이 있다면, 성능이나 세팅 난이도가 실제로 어땠는지 댓글로 나눠주세요. 서로의 경험이 제일 좋은 참고서가 되거든요.
🔗 출처: GitHub
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공