처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
Hacker News 2026.06.19 27

트랜스포머를 만든 사람이 OpenAI로 갔어요 — 노암 셰이저 이적이 의미하는 것

Hacker News 원문 보기

트랜스포머를 만든 사람이 OpenAI로 갔어요

혹시 「Attention Is All You Need」라는 논문 이름 들어보셨어요? 2017년에 나온 이 논문이 지금 우리가 매일 쓰는 ChatGPT, Gemini, Claude 같은 거대 AI 모델의 출발점이거든요. 여기서 처음 제안한 게 바로 트랜스포머(Transformer) 라는 구조인데, 이게 뭐냐면 문장 안의 단어들이 서로 ‘누가 누구한테 얼마나 중요한지’를 한 번에 계산하는 방식이에요. 그 전까지 AI는 글을 앞에서부터 한 글자씩 순서대로 읽어야 했는데, 트랜스포머가 나오면서 문장 전체를 한꺼번에 병렬로 처리할 수 있게 됐죠. 덕분에 모델을 어마어마하게 키우는 게 가능해졌고, 지금의 AI 붐이 시작된 거예요.

그 논문의 핵심 저자 중 한 명인 노암 셰이저(Noam Shazeer) 가 OpenAI에 합류했어요.

이 사람이 왜 그렇게 중요할까요

노암 셰이저는 단순히 논문 하나 잘 쓴 사람이 아니에요. 구글 브레인에서 오래 일하면서 지금 AI의 밑바닥 기술을 거의 다 손댄 사람이거든요.

대표적인 게 MoE(Mixture of Experts, 전문가 혼합) 라는 기법이에요. 이게 뭐냐면, 모델 안에 여러 명의 ‘전문가’를 두고, 입력이 들어올 때마다 그중 필요한 몇 명만 깨워서 일을 시키는 방식이에요. 예를 들어 수학 질문이 들어오면 수학 잘하는 전문가만, 번역 질문이 들어오면 언어 전문가만 동작하는 식이죠. 모델 전체를 매번 다 돌리지 않으니까 훨씬 효율적이에요. 요즘 나오는 GPT 계열, Mixtral, DeepSeek 같은 최신 모델들이 거의 다 이 구조를 쓰고 있어요.

또 하나는 멀티 쿼리 어텐션(Multi-Query Attention) 인데, 쉽게 말하면 AI가 답을 토해낼 때 속도를 확 빠르게 해주는 기법이에요. 우리가 챗봇이 글자를 술술 써내려가는 걸 볼 수 있는 데에는 이런 최적화 기술들이 깔려 있는 거죠.

그리고 그는 2021년에 구글을 나와 Character.AI 라는 회사를 세웠어요. 가상의 캐릭터랑 대화하는 챗봇 서비스인데 많은 사랑을 받았고, 2024년에는 구글이 그를 다시 데려가면서 제미나이(Gemini) 개발을 이끌게 했죠. 그만큼 업계가 이 한 사람의 가치를 높게 본다는 뜻이에요.

AI 인재 전쟁의 한복판

요즘 빅테크들 사이에서는 핵심 연구자 한 명을 데려오기 위해 상상하기 힘든 금액을 쓰는 일이 벌어지고 있어요. 좋은 모델을 만드는 건 결국 그 구조를 설계할 줄 아는 소수의 머리에서 나오거든요. OpenAI, 구글, 앤트로픽, 메타가 서로 인재를 빼가는 상황에서, 트랜스포머와 MoE를 동시에 만든 사람이 OpenAI로 갔다는 건 단순한 인사 소식 이상의 신호예요. 앞으로 OpenAI 모델의 효율성이나 구조에 그의 색깔이 묻어날 가능성이 크니까요.

한국 개발자에게는

당장 우리가 셰이저처럼 모델을 직접 설계할 일은 없겠지만, 그가 만든 기술들은 이미 우리 코앞까지 와 있어요. 오픈소스 LLM을 골라서 서비스에 붙일 때 ‘이 모델이 MoE 구조인가?’, ‘어텐션 최적화가 돼 있어서 추론이 빠른가?’ 같은 걸 따질 줄 알면 비용과 속도에서 큰 차이를 만들 수 있거든요. 그러니 트랜스포머의 기본 동작 원리와 MoE 개념 정도는 한 번 제대로 공부해두는 걸 추천해요. 이름값 있는 연구자의 이동을 보면서, 그 사람이 무엇을 만들었는지 거슬러 올라가 보는 것도 좋은 공부법이고요.

한줄 정리: 지금 AI를 떠받치는 핵심 기술의 설계자가 OpenAI로 옮겼고, 이는 모델 효율성 경쟁이 더 치열해진다는 신호예요. 여러분은 어떤 오픈소스 모델 구조에 가장 관심이 가시나요?


🔗 출처: Hacker News

이 뉴스가 유용했나요?

이 기술을 직접 배워보세요

AI 도구, 직접 활용해보세요

AI 시대, 코딩으로 수익을 만드는 방법을 배울 수 있습니다.

AI 활용 강의 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.