TECH 으로 돌아가기
TECH GITHUB 2주 전 13분 읽기 125 READS

[심층분석] 구글 노트북LM이 부럽지만 내 데이터는 지키고 싶다면? 오픈소스 'Open Notebook' 파헤치기

[심층분석] 구글 노트북LM이 부럽지만 내 데이터는 지키고 싶다면? 오픈소스 'Open Notebook' 파헤치기

들어가며: "AI한테 내 자료 다 줘도 괜찮은 걸까?"

혹시 구글의 NotebookLM 써보셨어요? PDF나 웹페이지, 영상 자료를 잔뜩 넣어두면 AI가 그 내용을 바탕으로 질문에 답해주고, 심지어 두 명의 진행자가 대화하는 팟캐스트까지 만들어주는 그 서비스 말이에요. 처음 써보면 정말 신기하거든요. "오, 이거 공부할 때 진짜 편하겠다" 싶죠.

그런데 막상 회사 내부 문서나 민감한 연구 자료를 넣으려고 하면 손이 멈칫합니다. 왜냐면 그 자료가 전부 구글 서버로 올라가거든요. "이거 어디 저장되는 거지? 학습에 쓰이는 건 아닐까?" 하는 찜찜함이 남죠. 특히 회사 보안 규정상 외부 클라우드에 자료를 올리면 안 되는 분들은 아예 그림의 떡이고요.

오늘 소개할 Open Notebook(lfnovo/open-notebook)은 바로 이 지점을 정확히 파고든 프로젝트예요. 한마디로 "NotebookLM을 내 컴퓨터, 내 서버에서 직접 돌리자"는 오픈소스 프로젝트입니다. 데이터는 100% 내 손안에 두면서, 기능은 오히려 원조보다 더 풍부하게 가져가겠다는 야심찬 도전이거든요.

최근 AI 업계의 큰 흐름 중 하나가 바로 이 '주권(sovereignty)' 이라는 키워드예요. 쉽게 말하면 "내 데이터, 내 AI는 내가 통제한다"는 거죠. 거대 빅테크 한 곳에 모든 걸 맡기는 대신, 내가 원하는 AI 모델을 골라 쓰고 내 데이터는 밖으로 안 내보내겠다는 흐름인데요. Open Notebook은 이 흐름을 정확히 타고 있는 프로젝트라 한번 제대로 뜯어볼 만합니다.

핵심 분석: Open Notebook은 뭐가 다른가

1) "AI 모델을 골라 쓴다"는 게 무슨 뜻일까

Open Notebook의 가장 큰 특징부터 볼게요. 무려 18개 이상의 AI 제공자를 지원합니다. OpenAI(챗GPT), Anthropic(클로드), 그리고 OllamaLM Studio 같은 것들까지요.

여기서 Ollama랑 LM Studio가 뭔지 모르는 분들을 위해 설명하자면요. 이건 AI 모델을 내 컴퓨터에 직접 깔아서 돌리게 해주는 도구예요. 보통 챗GPT를 쓰면 내 질문이 OpenAI 서버로 갔다가 답이 돌아오잖아요? 그런데 Ollama를 쓰면 AI 모델 자체가 내 노트북 안에서 돌아가요. 인터넷이 끊겨도 작동하고, 내 질문이 외부로 한 글자도 안 나갑니다. 바로 이게 "100% 로컬"이라는 말의 정체거든요.

비유하자면 이래요. NotebookLM이 "구글이 운영하는 멋진 도서관에 가서 자료를 맡기고 사서한테 물어보는 것"이라면, Open Notebook은 "내 집 서재에 사서를 직접 고용하는 것"이에요. 사서도 내가 원하는 사람으로 고를 수 있고(모델 선택), 자료는 집 밖으로 한 발짝도 안 나가는 거죠.

2) 멀티모달 콘텐츠 처리

Open Notebook은 PDF뿐 아니라 영상, 오디오, 웹페이지 등 다양한 형태의 자료를 다 넣을 수 있어요. 이걸 어려운 말로 '멀티모달(multi-modal)' 이라고 하는데요. 이게 뭐냐면, 글자만이 아니라 소리, 그림, 영상 등 여러 종류(modal=양식)의 데이터를 한꺼번에 다룬다는 뜻이에요. 영상을 넣으면 그 안의 말을 글로 바꿔서 분석하고, 오디오 파일도 마찬가지로 처리하는 거죠.

3) 검색 방식: 전문 검색 + 벡터 검색

자료를 잔뜩 넣어두면 결국 "내가 찾는 내용이 어디 있더라"가 중요해지잖아요. Open Notebook은 두 가지 검색을 함께 씁니다.

마무리: 'AI 주권'의 시대로

Open Notebook이 던지는 메시지는 분명해요. "편리함을 위해 내 데이터의 통제권까지 넘길 필요는 없다" 는 거죠. 빅테크가 만든 멋진 서비스를 그냥 쓰는 시대에서, 이제는 그 기능을 내 손으로 가져와 내 환경에서 돌리는 시대로 넘어가고 있어요. 모델 가격이 계속 떨어지고 로컬에서 돌릴 만한 작은 모델들이 똑똑해질수록, 이런 '자체 호스팅 AI'의 매력은 점점 커질 거예요.

물론 모두가 직접 서버를 돌릴 필요는 없어요. 편한 게 최고인 사람도 있죠. 하지만 적어도 '선택지가 있다' 는 것 자체가 건강한 거예요. 한쪽엔 편한 클라우드 서비스, 다른 한쪽엔 내가 통제하는 오픈소스. 이 균형이 결국 우리 모두에게 더 좋은 도구를 가져다줄 거라고 봐요.

자, 그럼 여러분께 질문 하나 던지고 마칠게요. 여러분은 AI 도구를 쓸 때 '편리함'과 '데이터 통제권' 중 무엇을 더 중요하게 생각하시나요? 그리고 혹시 사내에서 자체 호스팅 AI를 도입해보신 분 있다면, 실제로 어떤 어려움이 있었는지 댓글로 경험을 나눠주세요. 다른 분들께 큰 도움이 될 거예요!


🔗 출처: GitHub

SOURCE · GITHUB
원문 전체 보기 → https://github.com/lfnovo/open-notebook
SHARE
처리 중...