2019년 "GPT-2는 너무 위험해서 공개 못 한다"던 OpenAI, 그 후 7년이 지났다

되돌아보는 AI 역사의 한 장면

2019년 2월, OpenAI가 흥미로운 발표를 했어요. 자신들이 만든 텍스트 생성 AI 모델 GPT-2가 "너무 위험해서" 전체 모델을 공개할 수 없다는 거였죠. 당시 GPT-2는 15억 개의 파라미터를 가진 언어 모델이었는데, 사람이 쓴 것과 구분하기 어려운 수준의 글을 생성할 수 있다는 이유로 가짜 뉴스, 스팸, 사기 등에 악용될 우려가 있다고 판단한 거예요. 그래서 OpenAI는 작은 버전만 공개하고, 풀 모델은 비공개로 유지하겠다고 했어요.

지금 시점에서 이 이야기를 다시 보면 정말 감회가 새로울 수밖에 없어요. 2026년 현재, GPT-2의 15억 파라미터는 최신 대형 언어 모델(LLM)들의 수천억~수조 파라미터에 비하면 아주 작은 규모거든요. GPT-4, Claude, Gemini 같은 모델들이 이미 전 세계적으로 널리 쓰이고 있고, 오픈소스 모델인 Llama나 Mistral도 누구나 다운로드해서 쓸 수 있는 시대가 됐잖아요.

당시에는 왜 그랬을까?

2019년의 맥락을 이해하려면, 그때의 AI 생태계가 지금과 얼마나 달랐는지 알아야 해요. 당시에는 GPT라는 이름 자체가 대중에게 거의 알려지지 않았어요. 딥러닝이 이미지 인식이나 게임(알파고)에서 성과를 내고 있었지만, "AI가 사람처럼 글을 쓴다"는 건 대부분의 사람들에게 SF 영화 같은 이야기였거든요.

OpenAI가 GPT-2의 공개를 미룬 결정은 당시 큰 논쟁을 불러일으켰어요. 한쪽에서는 "AI 안전을 위해 책임 있는 결정"이라고 평가했고, 다른 쪽에서는 "과대 마케팅 전략"이라고 비판했어요. 실제로 "너무 위험해서 공개 못 한다"는 표현은 엄청난 홍보 효과를 가져왔거든요. 모든 미디어가 이 이야기를 다뤘고, GPT-2는 단숨에 가장 유명한 AI 모델이 됐죠.

결국 OpenAI는 단계적으로 모델을 공개했어요. 처음에는 작은 버전(124M 파라미터)만 내놓고, 몇 달에 걸쳐 중간 크기(355M, 774M), 마지막으로 2019년 11월에 풀 모델(1.5B)을 공개했어요. 이 기간 동안 실제로 악용 사례가 대규모로 발생하지 않았다는 점도 흥미로워요.

"위험한 AI"의 기준은 어떻게 변했나

이 사건이 재미있는 이유는, AI 안전(safety)에 대한 업계의 접근 방식이 그 후 어떻게 변했는지를 보여주기 때문이에요. GPT-2 때는 "모델 자체를 공개하지 않는 것"이 안전 전략이었어요. 하지만 이 접근법은 금방 한계에 부딪혔죠.

첫째, 비슷한 수준의 모델을 다른 곳에서도 만들 수 있게 됐어요. 한 곳이 공개하지 않아도, 다른 연구실이나 기업이 비슷한 걸 만들어서 공개하면 의미가 없어지는 거예요. 실제로 GPT-2 이후 수많은 오픈소스 언어 모델이 등장했고, 이제는 개인 노트북에서도 GPT-2보다 훨씬 뛰어난 모델을 돌릴 수 있어요.

둘째, "위험"의 정의 자체가 계속 움직이는 과녁이 됐어요. GPT-2가 위험하다고 했던 그 수준의 텍스트 생성 능력이, 지금은 무료 챗봇 앱에서도 제공되고 있으니까요. 그렇다면 지금의 최신 모델이 가진 능력 중에서 미래에는 "별것 아닌 것"이 될 것들이 분명히 있을 거예요.

셋째, AI 안전의 초점이 "공개 여부"에서 "어떻게 안전하게 공개하느냐"로 옮겨갔어요. RLHF(인간 피드백을 통한 강화학습)라는 기술이 대표적인데요, 이게 뭐냐면 AI가 생성한 답변을 사람이 평가하고, 그 피드백으로 AI를 다시 학습시켜서 유해한 출력을 줄이는 방법이에요. 지금 대부분의 상용 LLM이 이 기법을 쓰고 있죠. 모델을 숨기는 대신, 모델의 행동을 조절하는 쪽으로 발전한 거예요.

한국 개발자에게 주는 시사점

이 7년 전의 사건이 지금의 한국 개발자에게 의미 있는 이유는 몇 가지가 있어요.

먼저, 기술 발전 속도에 대한 감각이에요. GPT-2의 15억 파라미터가 "충격적"이던 시절에서, 불과 몇 년 만에 수천억 파라미터 모델이 API로 제공되는 시대가 됐어요. 지금 "이건 너무 큰 모델이라 실무에서 못 쓴다"고 느끼는 것들도 2~3년 후에는 스마트폰에서 돌아갈 수 있다는 거예요. 기술 선택을 할 때 현재 제약만 보지 말고, 가까운 미래의 변화까지 고려하는 관점이 중요하죠.

또 하나는 AI 안전에 대한 균형 잡힌 시각이에요. "AI가 위험하다"는 주장과 "AI 위험론은 과장이다"라는 주장 사이에서, 실제 역사가 어떻게 흘러왔는지를 아는 건 개발자로서 자기만의 판단력을 갖는 데 큰 도움이 돼요. GPT-2의 사례는 위험이 없었다는 게 아니라, 위험의 성격과 대응 방식이 시간에 따라 변한다는 걸 보여주는 좋은 사례예요.

마지막으로, OpenAI라는 조직 자체의 변화도 살펴볼 만해요. 2019년에는 "비영리" 연구 조직을 표방하며 안전을 최우선에 뒀는데, 이후 영리 자회사를 설립하고, 점점 더 강력한 모델을 적극적으로 상용화하는 방향으로 전환했거든요. 기술 회사의 포지셔닝과 실제 행보 사이의 간극을 읽는 눈을 기르는 것도 업계에서 일하는 우리에게 중요한 역량이에요.

정리하면

7년 전 "너무 위험해서 공개할 수 없다"던 15억 파라미터 모델이, 지금은 학부생 과제 수준이 된 현실은 AI 기술 발전의 속도와 "위험"이라는 개념의 상대성을 동시에 보여줘요. 여러분은 지금 "위험하다" 또는 "아직 이르다"고 평가되는 기술 중에서, 2~3년 후 일상이 될 것은 무엇이라고 생각하시나요?

🔗 출처: Hacker News

이 글도 읽어보세요