법률 AI, 이제 오픈소스로도 만나봅니다
요즘 법률 분야에 AI를 접목하는 시도가 정말 활발하잖아요. 미국에서는 이미 Harvey 같은 스타트업이 대형 로펌과 손잡고 수천억 원 규모의 투자를 받고 있고, 우리나라에서도 로앤컴퍼니나 인텔리콘 같은 곳들이 리걸테크 시장을 키워가고 있죠. 그런데 이런 서비스들의 공통점이 하나 있어요. 전부 클로즈드 소스라는 거예요. 비싼 구독료를 내야 하고, 내부에서 어떤 모델이 어떤 데이터로 돌아가는지 사용자가 알 수가 없죠.
Mike(mikeoss.com)는 바로 이 지점에 도전장을 내민 프로젝트예요. 'Open-source legal AI'를 표방하는 도구로, 변호사나 법무팀이 직접 코드를 들여다보고 자기 환경에 맞게 고쳐 쓸 수 있도록 만들었거든요. 라이선스 비용 부담 없이 자체 인프라에 올려서 돌릴 수 있다는 점이 가장 큰 차별점이에요.
왜 법률 분야에서 오픈소스가 중요할까요
법률 데이터는 굉장히 민감해요. 의뢰인의 개인정보부터 기업의 기밀 계약서, 진행 중인 소송 자료까지, 외부 클라우드에 함부로 올릴 수 없는 자료들이 많거든요. 그런데 ChatGPT나 Claude 같은 일반 LLM API에 그대로 던져 넣으면 데이터가 어디로 흘러갈지 보장하기 어렵잖아요. 미국 일부 주 변호사회에서는 이미 윤리 규정 차원에서 "클라이언트 동의 없이 외부 AI 서비스에 사건 자료를 입력하는 것"에 대한 가이드라인이 나오고 있어요.
오픈소스 법률 AI는 이 문제를 깔끔하게 풀 수 있어요. 사내 서버에 올려서 돌리면 데이터가 외부로 나갈 일이 없고, 어떤 프롬프트가 어떻게 처리되는지 전부 감사(audit)할 수 있죠. 모델을 갈아끼우는 것도 자유롭고요. 오픈소스 LLM인 Llama나 Qwen, Gemma 같은 모델을 백엔드로 붙일 수도 있고, 보안이 중요한 부분만 로컬로 돌리고 일반적인 검색은 외부 API를 쓰는 하이브리드 구성도 가능해요.
리걸테크 도구는 보통 어떻게 동작할까요
법률 AI 도구들이 흔히 제공하는 핵심 기능은 크게 세 가지로 나눌 수 있어요. 첫 번째는 계약서 검토예요. 긴 계약서를 읽으면서 독소조항이나 위험 요소를 찾아내고, 표준 계약 대비 누락된 부분이 있는지 짚어주는 거죠. 두 번째는 판례·법령 검색이에요. "이런 상황에서 손해배상이 인정된 판례가 있나?" 같은 자연어 질문을 던지면 관련 판례를 찾아서 요약해주는데, 이건 보통 RAG(Retrieval-Augmented Generation) 구조로 만들어요. 이게 뭐냐면, 질문을 임베딩으로 바꿔서 미리 색인해둔 법률 문서 DB에서 가까운 문서들을 찾아내고, LLM이 그걸 근거로 답변을 생성하는 방식이에요. 그래야 모델이 판례를 지어내는 환각(hallucination)을 줄일 수 있거든요. 세 번째는 문서 초안 작성이에요. 의뢰인 정보와 사건 개요를 넣으면 소장, 답변서, 의견서 같은 문서의 뼈대를 뽑아주는 거예요.
한국 개발자에게는 어떤 의미가 있을까요
당장 영문 법률 AI를 한국 법체계에 그대로 가져다 쓰는 건 어려워요. 우리나라는 대륙법 계열이라 미국 판례법 시스템과 구조가 다르고, 법률 용어와 문체도 완전히 다르거든요. 그렇지만 아키텍처 설계, 문서 청킹 전략, RAG 파이프라인, 프롬프트 템플릿 같은 부분은 충분히 참고할 만해요. 특히 한국어 법률 코퍼스로 파인튜닝한 임베딩 모델과 결합하면 한국형 리걸테크 도구의 베이스로 충분히 활용할 수 있죠.
리걸테크는 시장이 커지는 만큼 진입 장벽도 높은 영역이에요. 법률 도메인 지식과 AI 엔지니어링 둘 다 필요하거든요. 이런 오픈소스가 늘어나면 도메인 전문가(변호사)와 엔지니어가 협업하는 좋은 출발점이 될 수 있어요. 회사 법무팀에서 "우리 사내 계약서만 학습한 챗봇 만들어볼래요?" 같은 요청이 들어왔을 때, 처음부터 짜기보다는 이런 프로젝트를 포크해서 시작하는 게 훨씬 빠르거든요.
마무리
폐쇄적이고 비싸던 리걸테크 영역에 오픈소스의 바람이 불기 시작했어요. 데이터 주권과 검증 가능성이라는 측면에서 의미가 큰 흐름이라고 봅니다.
여러분은 한국에서 법률 AI가 변호사 업무를 보조하는 수준을 넘어 일부 영역을 대체할 수 있다고 보시나요? 어떤 영역부터 가장 먼저 자동화될 것 같으신가요?
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공