무슨 일이 있었나
자유소프트웨어재단(FSF)이 Anthropic을 상대로 GPL 라이선스 코드의 LLM 학습 데이터 사용에 대한 저작권 침해 합의를 요구했습니다. FSF는 Anthropic의 모델이 GPL 라이선스 코드를 학습에 활용했다면, 그 결과물인 모델 가중치도 GPL 조건에 따라 공개해야 한다는 입장입니다.
핵심 쟁점
이 사안의 핵심은 "LLM이 GPL 코드를 학습하면, 그 모델은 GPL의 파생 저작물인가?"라는 법적·철학적 질문입니다.
- FSF 측 논리: GPL 코드가 학습 데이터에 포함되었고, 모델이 해당 코드와 유사한 출력을 생성할 수 있으므로 파생 저작물에 해당
- 반론 가능성: 학습은 통계적 패턴 추출이지 코드 복제가 아니며, 모델 가중치는 소스코드의 파생물이 아님
한국 개발자에게 주는 시사점
이 분쟁은 Anthropic만의 문제가 아닙니다. 오픈소스 라이선스와 AI 학습 데이터의 관계는 모든 LLM 개발사가 직면한 미해결 과제입니다. 한국에서도 네이버, 카카오 등이 자체 LLM을 개발하고 있는 만큼, 이 판례가 어떻게 형성되느냐에 따라 국내 AI 개발 환경에도 직접적인 영향을 미칠 수 있습니다.
오픈소스 코드로 학습한 AI의 결과물은 오픈소스여야 할까요? 여러분의 생각은 어떠신가요?
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공