처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
Hacker News 2026.06.11 51

강화학습의 대부 리치 서튼이 말하는 "진짜 창의적인 AI"란 무엇인가

Hacker News 원문 보기

누가 한 이야기냐면요

리처드 서튼(Rich Sutton)이라는 이름, AI에 관심 있으신 분이라면 한 번쯤 들어보셨을 거예요. 강화학습(Reinforcement Learning) 분야를 사실상 만든 사람 중 한 명이고, 2024년에 그 공로로 컴퓨터 과학계의 노벨상이라 불리는 튜링상까지 받았거든요. 강화학습이 뭐냐면요, 정답을 일일이 알려주는 게 아니라 "잘하면 보상, 못하면 벌점"을 주면서 AI가 스스로 시행착오로 배우게 하는 방식이에요. 알파고가 바둑을 배운 방식이 바로 이거죠.

이 분이 AI의 창의성과 발견(discovery)에 대해 의견을 냈는데, 요즘 LLM(거대 언어모델, ChatGPT 같은 거요) 열풍 한가운데에서 꽤 의미심장한 이야기예요.

서튼의 핵심 주장

서튼이 오랫동안 강조해온 건 "진짜 지능은 경험으로부터 배우는 것에서 나온다"는 거예요. 그가 쓴 유명한 에세이 '쓰라린 교훈(The Bitter Lesson)'에서, 사람이 정성껏 지식을 집어넣어 만든 AI보다, 데이터와 계산량을 때려부어서 스스로 학습하게 한 AI가 결국 항상 이겼다고 정리했거든요.

그런데 여기서 한 발 더 나아가요. 지금의 LLM들은 결국 사람이 만든 텍스트를 흉내 내는 방식으로 학습하잖아요. 인터넷에 있는 글을 잔뜩 읽고 "다음에 올 단어"를 예측하면서요. 서튼은 이게 진짜 "발견"이나 "창의성"과는 거리가 있다고 봐요. 왜냐면 인간이 이미 써놓은 것의 평균에 수렴하는 거지, 인간이 모르던 새로운 걸 만들어내는 게 아니거든요.

진짜 창의적인 AI라면, 알파고가 바둑에서 인간이 한 번도 두지 않았던 '신의 한 수(37수)'를 발견했던 것처럼, 세상과 직접 상호작용하면서 아무도 가르쳐주지 않은 새로운 지식을 스스로 만들어내야 한다는 거예요. 그는 동료 데이비드 실버와 함께 '경험의 시대(Era of Experience)'라는 글에서, AI의 다음 도약은 인간 데이터를 모방하는 게 아니라 직접 경험에서 배우는 데서 온다고 주장하기도 했어요.

이게 왜 논쟁적이냐면

지금 업계의 주류 흐름은 정반대거든요. OpenAI, 구글, 앤트로픽 모두 "더 큰 모델에 더 많은 인간 데이터를 학습시키자"는 LLM 노선을 달리고 있어요. 그래서 서튼의 발언은 "지금 다들 가는 길이 AGI(범용 인공지능)로 가는 길이 맞냐"는 근본적인 질문을 던지는 셈이에요.

물론 반론도 만만치 않아요. LLM을 옹호하는 쪽은 "모방에서 시작했어도 충분히 규모가 커지면 새로운 능력이 창발(emergence)한다"고 보거든요. 실제로 LLM이 코드를 짜고 수학 문제를 푸는 걸 보면 단순 암기 이상의 뭔가가 있어 보이기도 하고요. 그래서 "모방 vs 경험"은 지금 AI 학계에서 가장 뜨거운 논쟁 중 하나예요.

한국 개발자에게 주는 시사점

요즘 많은 분들이 LLM API를 가져다 쓰는 데 익숙해졌잖아요. 그런데 서튼의 이야기는 "LLM이 전부가 아니다"라는 시야를 넓혀줘요. 특히 강화학습은 추천 시스템, 로보틱스, 게임 AI, 자원 최적화처럼 "정답이 정해져 있지 않고 스스로 전략을 찾아야 하는" 문제에서 여전히 강력하거든요.

실무적으로는, 요즘 화제인 RLHF(인간 피드백 기반 강화학습)나 LLM에 강화학습을 붙여 추론 능력을 끌어올리는 방식(o1 같은 추론 모델들)이 바로 이 두 흐름이 만나는 지점이에요. 그러니 LLM만 공부하지 말고 강화학습의 기본 개념도 알아두면, 앞으로 나올 모델들을 훨씬 깊이 이해할 수 있을 거예요.

마무리

한 줄로 정리하면, "인간을 잘 따라 하는 AI"와 "스스로 새로운 걸 발견하는 AI"는 다른 길이며, 서튼은 진짜 도약은 후자에서 온다고 믿는다는 이야기예요. 여러분 생각은 어때요? 지금의 LLM은 결국 창의성의 벽에 부딪힐까요, 아니면 규모만 키우면 그 벽도 넘을 수 있을까요?


🔗 출처: Hacker News

이 뉴스가 유용했나요?

이 기술을 직접 배워보세요

AI 도구, 직접 활용해보세요

AI 시대, 코딩으로 수익을 만드는 방법을 배울 수 있습니다.

AI 활용 강의 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.