TECH 으로 돌아가기
TECH REDDIT 4주 전 16분 읽기 126 READS

[심층분석] GPT한테 그림을 그려달라고 했더니… 대체 이 이미지들은 어디서 온 걸까?

들어가며: "내가 시킨 거랑 너무 다른데?"

혹시 ChatGPT한테 이미지를 그려달라고 부탁해 본 적 있으세요? 분명히 "고양이가 노트북 앞에서 코딩하는 그림" 같은 평범한 요청을 했는데, 결과물을 보면 "어? 내가 이런 걸 시켰나?" 싶을 때가 종종 있죠. 그런데 더 신기한 건요, 사람들이 똑같은 프롬프트를 넣었을 때 비슷한 분위기의, 어쩐지 "GPT스러운" 이미지가 계속 튀어나온다는 거예요.

최근 레딧에서 한 사용자가 올린 게시물이 큰 공감을 얻었는데요, 제목이 인상적이에요. "한번 해봤는데, GPT가 대체 이런 이미지들을 어디서 가져오는 건지 모르겠다". 사람들은 각자 다양한 프롬프트를 입력했는데, 결과물에서 묘하게 공통된 패턴, 색감, 구도가 발견됐다는 거예요. 마치 모든 AI 이미지가 어떤 "보이지 않는 화풍"을 공유하고 있는 것처럼요.

이 현상은 단순히 "AI 그림이 좀 이상하다" 수준의 농담거리가 아니에요. 사실 여기에는 생성형 AI(Generative AI)가 작동하는 근본 원리, 그리고 학습 데이터의 편향(bias) 이라는 아주 중요한 이야기가 숨어 있거든요. 이번 글에서는 왜 GPT 같은 모델이 "어디서 본 것 같은" 이미지를 자꾸 만들어내는지, 그 메커니즘을 차근차근 풀어볼게요.

왜 GPT 이미지는 "GPT스럽게" 생길까?

1) 학습 데이터라는 "거대한 그림책"

먼저 이걸 이해해야 해요. ChatGPT의 이미지 생성 기능(DALL·E 3나 GPT-4o의 이미지 모델)이든, Midjourney든, Stable Diffusion이든, 이런 AI들은 사람이 그림을 배우듯 학습해요. 다만 사람과 차원이 좀 다르죠. 사람은 평생 수만 장의 이미지를 보는데, AI는 수십억 장의 이미지를 봐요.

이게 뭐냐면요, 인터넷에 떠도는 거의 모든 이미지 — 구글에서 검색되는 사진, 무료 스톡 이미지 사이트의 일러스트, 아트스테이션 같은 곳의 작품, 위키피디아의 도판, 심지어 SNS의 밈까지 — 이런 걸 통째로 "먹여서" 학습시킨다는 뜻이에요. 그리고 각 이미지에는 보통 캡션(설명 텍스트) 이 붙어 있어요. "고양이가 창가에 앉아 있다" 같은 거요.

AI는 이걸 보면서 "아하, '고양이'라는 단어가 나오면 이런 시각적 패턴이 등장하는구나" 하고 학습해요. 비유하자면, 단어와 이미지를 연결하는 거대한 사전을 머릿속에 만드는 거죠.

2) 확산 모델(Diffusion Model)이라는 마법

요즘 이미지 생성 AI는 대부분 확산 모델(Diffusion Model) 이라는 방식을 써요. 이게 뭐냐면, 좀 신기한 발상인데요.

댓글로 여러분의 경험과 생각을 들려주세요. 같이 이야기 나눠봐요!


🔗 출처: Reddit

SOURCE · REDDIT
원문 전체 보기 → https://www.reddit.com/gallery/1tlrz6v
SHARE
처리 중...