처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
GitHub 2026.06.06 103

[심층분석] 구글 노트북LM이 부럽지만 내 데이터는 지키고 싶다면? 오픈소스 'Open Notebook' 파헤치기

GitHub 원문 보기
[심층분석] 구글 노트북LM이 부럽지만 내 데이터는 지키고 싶다면? 오픈소스 'Open Notebook' 파헤치기

들어가며: "AI한테 내 자료 다 줘도 괜찮은 걸까?"

혹시 구글의 NotebookLM 써보셨어요? PDF나 웹페이지, 영상 자료를 잔뜩 넣어두면 AI가 그 내용을 바탕으로 질문에 답해주고, 심지어 두 명의 진행자가 대화하는 팟캐스트까지 만들어주는 그 서비스 말이에요. 처음 써보면 정말 신기하거든요. "오, 이거 공부할 때 진짜 편하겠다" 싶죠.

그런데 막상 회사 내부 문서나 민감한 연구 자료를 넣으려고 하면 손이 멈칫합니다. 왜냐면 그 자료가 전부 구글 서버로 올라가거든요. "이거 어디 저장되는 거지? 학습에 쓰이는 건 아닐까?" 하는 찜찜함이 남죠. 특히 회사 보안 규정상 외부 클라우드에 자료를 올리면 안 되는 분들은 아예 그림의 떡이고요.

오늘 소개할 Open Notebook(lfnovo/open-notebook)은 바로 이 지점을 정확히 파고든 프로젝트예요. 한마디로 "NotebookLM을 내 컴퓨터, 내 서버에서 직접 돌리자"는 오픈소스 프로젝트입니다. 데이터는 100% 내 손안에 두면서, 기능은 오히려 원조보다 더 풍부하게 가져가겠다는 야심찬 도전이거든요.

최근 AI 업계의 큰 흐름 중 하나가 바로 이 '주권(sovereignty)' 이라는 키워드예요. 쉽게 말하면 "내 데이터, 내 AI는 내가 통제한다"는 거죠. 거대 빅테크 한 곳에 모든 걸 맡기는 대신, 내가 원하는 AI 모델을 골라 쓰고 내 데이터는 밖으로 안 내보내겠다는 흐름인데요. Open Notebook은 이 흐름을 정확히 타고 있는 프로젝트라 한번 제대로 뜯어볼 만합니다.

핵심 분석: Open Notebook은 뭐가 다른가

1) "AI 모델을 골라 쓴다"는 게 무슨 뜻일까

Open Notebook의 가장 큰 특징부터 볼게요. 무려 18개 이상의 AI 제공자를 지원합니다. OpenAI(챗GPT), Anthropic(클로드), 그리고 OllamaLM Studio 같은 것들까지요.

여기서 Ollama랑 LM Studio가 뭔지 모르는 분들을 위해 설명하자면요. 이건 AI 모델을 내 컴퓨터에 직접 깔아서 돌리게 해주는 도구예요. 보통 챗GPT를 쓰면 내 질문이 OpenAI 서버로 갔다가 답이 돌아오잖아요? 그런데 Ollama를 쓰면 AI 모델 자체가 내 노트북 안에서 돌아가요. 인터넷이 끊겨도 작동하고, 내 질문이 외부로 한 글자도 안 나갑니다. 바로 이게 "100% 로컬"이라는 말의 정체거든요.

비유하자면 이래요. NotebookLM이 "구글이 운영하는 멋진 도서관에 가서 자료를 맡기고 사서한테 물어보는 것"이라면, Open Notebook은 "내 집 서재에 사서를 직접 고용하는 것"이에요. 사서도 내가 원하는 사람으로 고를 수 있고(모델 선택), 자료는 집 밖으로 한 발짝도 안 나가는 거죠.

2) 멀티모달 콘텐츠 처리

Open Notebook은 PDF뿐 아니라 영상, 오디오, 웹페이지 등 다양한 형태의 자료를 다 넣을 수 있어요. 이걸 어려운 말로 '멀티모달(multi-modal)' 이라고 하는데요. 이게 뭐냐면, 글자만이 아니라 소리, 그림, 영상 등 여러 종류(modal=양식)의 데이터를 한꺼번에 다룬다는 뜻이에요. 영상을 넣으면 그 안의 말을 글로 바꿔서 분석하고, 오디오 파일도 마찬가지로 처리하는 거죠.

3) 검색 방식: 전문 검색 + 벡터 검색

자료를 잔뜩 넣어두면 결국 "내가 찾는 내용이 어디 있더라"가 중요해지잖아요. Open Notebook은 두 가지 검색을 함께 씁니다.

  • 전문 검색(Full-text search): 우리가 흔히 아는 키워드 검색이에요. "매출"이라고 치면 '매출'이라는 단어가 들어간 문서를 찾아주는 방식이죠.
  • 벡터 검색(Vector search): 이게 조금 신기한 건데요. 단어가 정확히 일치하지 않아도 의미가 비슷한 내용을 찾아줍니다. 예를 들어 "돈 많이 벌었어?"라고 물으면 '매출'이나 '수익'이 들어간 문서를 알아서 찾아주는 거예요.
  • 벡터 검색을 쉽게 비유하면, 단어를 그냥 글자로 보는 게 아니라 '의미의 좌표' 로 바꿔서 지도 위에 점으로 찍어두는 거예요. 그러면 '강아지'와 '반려견'은 지도상에서 가까운 곳에 찍히겠죠. 검색할 때 가까운 점들을 찾아주니까 단어가 달라도 의미가 통하는 걸 찾아내는 거죠.

    4) 진짜 매력 포인트: 팟캐스트 생성

    개인적으로 가장 재밌는 기능이 이거예요. 자료를 넣으면 여러 명의 진행자가 대화하는 팟캐스트를 만들어줍니다. NotebookLM의 그 유명한 '오디오 개요' 기능을 오픈소스로 구현한 건데, Open Notebook은 여기서 한 발 더 나가서 다중 화자(multi-speaker), 즉 진행자를 여러 명으로 세밀하게 설정할 수 있다고 해요. 공부한 내용을 출퇴근길에 팟캐스트로 들으면서 복습한다고 생각하면 꽤 실용적이죠.

    업계 맥락과 비교: 왜 지금 이런 게 나올까

    Open Notebook vs Google NotebookLM

    둘을 표로 비교해 볼게요.

    | 항목 | Open Notebook | Google NotebookLM |
    |------|---------------|-------------------|
    | 데이터 보관 | 내 서버/내 컴퓨터 | 구글 클라우드 |
    | AI 모델 | 18종 이상 선택 가능 | 구글 모델 고정 |
    | 비용 | 무료(오픈소스) + API 비용 | 무료/유료 플랜 |
    | 설치 | 직접 설치 필요 | 가입만 하면 끝 |
    | 커스터마이징 | 자유롭게 수정 가능 | 불가 |

    핵심 차이를 한 문장으로 정리하면요. NotebookLM은 '편하지만 통제권이 없고', Open Notebook은 '손이 좀 가지만 모든 걸 내가 쥔다' 는 거예요.

    이건 마치 '배달 음식 vs 집밥' 같은 거예요. 배달 음식(NotebookLM)은 주문만 하면 알아서 척척 나오니까 편하죠. 대신 재료가 뭔지, 어떻게 만들었는지는 내가 몰라요. 집밥(Open Notebook)은 장 보고 요리하는 수고가 있지만, 재료부터 간까지 전부 내 마음대로 할 수 있고 내 부엌을 벗어나지 않죠.

    오픈소스라는 점의 무게

    비슷한 콘셉트의 다른 오픈소스들도 있어요. 하지만 Open Notebook이 주목받는 이유는 '개인정보 보호'를 정면에 내세운 설계 철학과, 18개가 넘는 모델 제공자를 폭넓게 받아준다는 유연함이에요. 특정 회사에 묶이지 않는다는 건, 나중에 더 좋고 싼 모델이 나오면 그쪽으로 갈아탈 수 있다는 뜻이거든요. 이걸 '벤더 종속(vendor lock-in) 회피' 라고 하는데, 쉽게 말해 "한 회사에 발목 잡히지 않는다"는 거예요.

    또 하나, Docker(도커)로 손쉽게 설치할 수 있게 해둔 점도 중요해요. 도커가 뭐냐면, 프로그램 실행에 필요한 환경을 통째로 상자에 담아두는 기술이에요. 이거 덕분에 "내 컴퓨터에선 되는데 네 컴퓨터에선 안 되는" 골치 아픈 문제를 크게 줄일 수 있죠. 자체 호스팅 도구에서 도커 지원은 거의 필수인데, 잘 갖춰져 있다는 건 그만큼 진입 장벽을 낮춰준다는 의미예요.

    한국 개발자에게 주는 시사점

    이런 분들께 특히 유용해요

    1. 사내 문서를 AI로 다루고 싶은데 보안 때문에 막힌 분 금융, 의료, 공공기관처럼 데이터 반출이 엄격한 곳이라면 Open Notebook이 현실적인 대안이 될 수 있어요. 사내 서버에 올려두고 Ollama로 로컬 모델까지 붙이면, 외부로 데이터가 한 줄도 안 나가는 사내 전용 리서치 AI를 만들 수 있거든요.

    2. 여러 자료를 묶어서 공부/연구하는 분 논문, 기술 문서, 영상 강의를 한곳에 모아두고 질문하고, 팟캐스트로 만들어 듣는 학습 워크플로우를 짤 수 있어요.

    3. AI 앱 구조를 공부하고 싶은 주니어 개발자 이 프로젝트 자체가 좋은 교재예요. 벡터 검색, 멀티모달 처리, 여러 LLM 연동 같은 요즘 핵심 기술이 한 코드베이스에 다 들어있거든요. 코드를 뜯어보면서 "아, 실제 RAG 앱은 이렇게 만드는구나" 하고 배울 수 있어요.

    도입할 때 고려할 점

    솔직하게 말하면, 공짜라고 완전 공짜는 아니에요. 로컬 모델을 제대로 돌리려면 GPU 같은 하드웨어 사양이 어느 정도 받쳐줘야 하고, OpenAI나 클로드 같은 외부 모델을 붙이면 그 API 사용료는 따로 나가거든요. "데이터는 내가 통제하되 모델만 외부 걸 쓴다"는 절충안도 가능하니, 자기 상황에 맞게 고르면 돼요.

    학습 로드맵 제안

  • 1단계: 도커로 일단 설치해서 PDF 몇 개 넣고 질문해보기 (반나절)
  • 2단계: Ollama 깔아서 로컬 모델로 돌려보기 — 완전 로컬의 맛을 경험
  • 3단계: 코드를 열어서 벡터 검색과 RAG 파이프라인이 어떻게 구현됐는지 분석
  • 4단계: 내 업무에 맞게 프롬프트나 기능 일부 커스터마이징

마무리: 'AI 주권'의 시대로

Open Notebook이 던지는 메시지는 분명해요. "편리함을 위해 내 데이터의 통제권까지 넘길 필요는 없다" 는 거죠. 빅테크가 만든 멋진 서비스를 그냥 쓰는 시대에서, 이제는 그 기능을 내 손으로 가져와 내 환경에서 돌리는 시대로 넘어가고 있어요. 모델 가격이 계속 떨어지고 로컬에서 돌릴 만한 작은 모델들이 똑똑해질수록, 이런 '자체 호스팅 AI'의 매력은 점점 커질 거예요.

물론 모두가 직접 서버를 돌릴 필요는 없어요. 편한 게 최고인 사람도 있죠. 하지만 적어도 '선택지가 있다' 는 것 자체가 건강한 거예요. 한쪽엔 편한 클라우드 서비스, 다른 한쪽엔 내가 통제하는 오픈소스. 이 균형이 결국 우리 모두에게 더 좋은 도구를 가져다줄 거라고 봐요.

자, 그럼 여러분께 질문 하나 던지고 마칠게요. 여러분은 AI 도구를 쓸 때 '편리함'과 '데이터 통제권' 중 무엇을 더 중요하게 생각하시나요? 그리고 혹시 사내에서 자체 호스팅 AI를 도입해보신 분 있다면, 실제로 어떤 어려움이 있었는지 댓글로 경험을 나눠주세요. 다른 분들께 큰 도움이 될 거예요!


🔗 출처: GitHub

이 뉴스가 유용했나요?

이 기술을 직접 배워보세요

AI 도구, 직접 활용해보세요

AI 시대, 코딩으로 수익을 만드는 방법을 배울 수 있습니다.

AI 활용 강의 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.