"1995년 그 시절 문서처럼 써줘" — LLM을 직접 파인튜닝해본 실험 이야기

챗봇한테 시키는 거랑 뭐가 다른데요?

요즘은 문서 쓰는 일도 챗GPT한테 부탁하면 뚝딱 나오잖아요. 그런데 한 기술 문서 작성자(테크니컬 라이터)가 좀 다른 실험을 했어요. 그냥 프롬프트로 부탁하는 게 아니라, LLM(거대 언어 모델)을 직접 파인튜닝해서 "1995년 스타일의 옛날 문서처럼 글을 쓰는 모델"을 만들어본 거예요. 결과만 재미있는 게 아니라, 그 과정에서 배운 점들이 우리한테 꽤 쓸모가 있어요.

파인튜닝이 뭐길래

이게 뭐냐면요, 이미 똑똑하게 학습된 AI 모델한테 "너 특정 분야 말투랑 스타일을 좀 더 집중적으로 익혀봐" 하고 추가 훈련을 시키는 거예요. 비유하자면, 외국어를 유창하게 하는 사람한테 "이제 우리 회사 사내 용어랑 보고서 말투를 익혀줘" 하고 며칠 더 교육시키는 셈이죠.

문제는 사람들이 보통 세 가지 방법을 헷갈려 한다는 거예요. 첫째는 그냥 프롬프트로 잘 부탁하기, 둘째는 RAG(외부 문서를 그때그때 참고하게 하는 방식), 셋째가 바로 파인튜닝이에요. 글쓴이가 강조한 핵심은 이거예요. 단순히 "이런 내용을 답해줘"가 목적이면 RAG가 낫지만, "이런 말투, 이런 형식, 이런 일관된 스타일로 써줘"가 목적이면 파인튜닝이 진가를 발휘한다는 거죠. 스타일은 예시를 잔뜩 보여주며 몸에 배게 하는 게 효과적이거든요.

실제로 어떻게 했을까

과정을 단순화하면 이래요. 먼저 1995년 무렵의 옛날 기술 문서들을 모아서 학습 데이터셋을 만들어요. "이런 질문/지시에는 이런 옛날 스타일 답변"이라는 짝을 잔뜩 준비하는 거죠. 데이터의 품질과 일관성이 결과를 좌우하기 때문에 이 정제 작업이 사실상 제일 중요해요. 그다음 LoRA 같은 경량 파인튜닝 기법을 써요. 이게 뭐냐면, 모델 전체를 통째로 다시 훈련하면 GPU 비용이 어마어마하게 드는데, LoRA는 모델의 아주 작은 일부만 살짝 조정해서 비슷한 효과를 내는 똑똑한 방법이에요. 덕분에 개인 개발자도 적은 자원으로 시도해볼 수 있게 됐죠.

결과적으로 모델은 정말 그 시절 특유의 건조하고 격식 있는 문서 말투를 흉내 내기 시작했어요. 다만 글쓴이는 한계도 솔직하게 짚어요. 데이터가 적으면 스타일은 흉내 내도 내용이 빈약해지거나, 엉뚱한 소리를 지어내는(환각) 문제가 여전히 남는다고요.

업계 맥락

요즘 "문서를 코드처럼 관리하자"는 Docs as Code 흐름이 강해요. 여기에 AI가 결합되면서, 회사마다 자기 제품 톤에 맞는 문서를 자동 생성하려는 시도가 늘고 있어요. 그런데 대부분은 프롬프트나 RAG에서 멈추는데, 이 실험은 "브랜드 고유의 글 스타일"이라는 더 까다로운 영역을 파인튜닝으로 정조준했다는 점이 흥미로워요.

한국 개발자에게

실무에서 바로 떠오르는 쓸모가 많아요. 사내 위키나 API 문서를 항상 일관된 톤으로 유지하고 싶을 때, 또는 우리 회사만의 용어 규칙을 지키게 하고 싶을 때 파인튜닝이 답이 될 수 있어요. 무엇보다 "AI한테 일을 시킨다 = 프롬프트만 잘 쓴다"는 고정관념에서 벗어나, 목적에 따라 RAG와 파인튜닝을 구분해 쓰는 안목을 길러두면 좋아요. LoRA 덕분에 진입 장벽도 많이 낮아졌고요.