Reddit 2026.03.25 111

#AI #LLM #GPT #ChatGPT #Cursor

[심층분석] 엠 대시(—) 하나에 AI 딱지? — 'AI가 쓴 글' 감별의 함정과 창작의 미래

책을 펼쳤더니 엠 대시가 보였다, 그래서 분노했다

최근 영어권 독서 커뮤니티에서 한 독자의 분노 섞인 리뷰가 뜨거운 논쟁을 불러일으켰어요. 내용은 이래요. 어떤 책을 읽다가 엠 대시(em dash, —)가 빈번하게 등장하는 걸 발견하고는, "이건 AI가 쓴 거다! 사람은 이렇게 안 쓴다!"라고 확신한 거죠. 그 독자는 작가가 직접 글을 쓰다가 어느 지점에서 ChatGPT에게 넘겼는지까지 정확히 알 수 있다고 주장했어요.

이 이야기가 흥미로운 이유는 단순히 한 독자의 불만이 아니기 때문이에요. 이건 AI 시대의 창작물을 어떻게 바라볼 것인가, 그리고 우리가 'AI가 쓴 글'을 정말 구별할 수 있는가라는 훨씬 큰 질문과 맞닿아 있거든요. 개발자든, 콘텐츠 제작자든, 혹은 단순히 글을 읽고 쓰는 사람이든 — 이 논쟁은 우리 모두에게 해당되는 이야기예요.

특히 한국에서도 AI를 활용한 글쓰기, 코드 작성, 콘텐츠 생성이 빠르게 확산되고 있잖아요. "이거 GPT로 쓴 거 아니야?"라는 의심의 시선은 이미 우리 일상에 깊이 들어와 있어요. 그래서 이 사건을 깊이 들여다보면서, AI 글쓰기 감별의 기술적 한계와 사회적 함의를 함께 살펴보려 해요.

엠 대시, 그게 대체 뭔데?

먼저 논쟁의 핵심인 엠 대시부터 알아볼게요. 엠 대시(—)는 영어 문장부호 중 하나인데요, 이게 뭐냐면 쉽게 말해서 긴 줄표예요. 하이픈(-)보다 길고, 문장 중간에 삽입구를 넣거나, 극적인 전환을 만들거나, 부연 설명을 덧붙일 때 써요.

예를 들어볼게요:

"She opened the door — and there he was." (그녀가 문을 열었다 — 그리고 거기 그가 있었다.)
"The plan was simple — too simple, perhaps." (계획은 간단했다 — 아마도 너무 간단했을지도.)

영문학에서 엠 대시는 수백 년 동안 사용되어 온 전통적인 문장부호예요. 에밀리 디킨슨은 엠 대시를 극단적으로 많이 쓰는 것으로 유명하고, 버지니아 울프, F. 스콧 피츠제럴드 같은 대문호들도 즐겨 사용했죠. 현대 작가 중에서도 엠 대시를 빈번하게 쓰는 분들이 아주 많아요.

그런데 ChatGPT가 등장한 뒤로, 엠 대시가 갑자기 'AI 글쓰기의 증거'로 낙인찍히기 시작한 거예요. 왜 그럴까요?

ChatGPT는 정말 엠 대시를 많이 쓸까?

결론부터 말하면, 맞아요. ChatGPT를 비롯한 대형 언어 모델(LLM)들은 엠 대시를 상대적으로 자주 사용하는 경향이 있어요. 이건 기술적으로 몇 가지 이유가 있는데요.

1. 학습 데이터의 특성

LLM이 뭐냐면, 쉽게 말해서 엄청나게 많은 텍스트를 읽고 패턴을 학습한 AI예요. ChatGPT의 경우 인터넷의 방대한 텍스트 — 책, 기사, 블로그, 위키피디아 등 — 을 학습했거든요. 이 학습 데이터에는 편집이 잘 된 고품질 텍스트가 많이 포함되어 있어요. 출판된 책이나 전문 기사에서는 엠 대시가 빈번하게 사용되니까, 모델이 자연스럽게 이 패턴을 많이 학습한 거죠.

2. RLHF의 영향

RLHF라는 건, 쉽게 말해서 사람이 AI의 답변에 점수를 매겨서 더 좋은 답변을 하도록 훈련시키는 방법이에요. Reinforcement Learning from Human Feedback의 약자인데요. 이 과정에서 평가자들은 보통 더 세련되고 잘 구성된 문장에 높은 점수를 주는 경향이 있어요. 엠 대시를 적절히 사용한 문장이 더 정교해 보이니까, 모델이 점점 더 엠 대시를 선호하게 된 측면이 있죠.

3. 토큰화 방식

LLM이 텍스트를 처리하는 방식도 관련이 있어요. 토큰화라는 건 뭐냐면, AI가 글을 이해하기 위해 텍스트를 작은 조각(토큰)으로 나누는 과정이에요. 엠 대시(—)는 하나의 토큰으로 처리되면서도 문장 구조에 다양한 기능을 할 수 있어서, 모델 입장에서는 아주 "효율적인" 문장부호인 셈이에요.

그래서 ChatGPT가 생성한 텍스트에서 엠 대시가 상대적으로 많이 나타나는 건 사실이에요. 하지만 여기서 중요한 건 — 엠 대시가 있다고 해서 그게 AI가 쓴 글이라는 증거가 되느냐는 전혀 다른 문제라는 거예요.

'AI 느낌' 감별의 함정 — 상관관계와 인과관계

이 논쟁에서 가장 핵심적인 문제는 상관관계를 인과관계로 착각하는 오류예요. 이걸 쉽게 설명해 볼게요.

> "아이스크림 판매량이 올라가면 익사 사고도 늘어난다. 그러니까 아이스크림이 익사를 유발한다?"

당연히 아니죠. 둘 다 여름이라는 공통 원인 때문에 함께 올라가는 거예요. 마찬가지로:

> "ChatGPT가 엠 대시를 많이 쓴다. 이 글에 엠 대시가 많다. 그러니까 이 글은 ChatGPT가 썼다?"

이것도 논리적으로 성립하지 않아요. 엠 대시를 많이 쓰는 인간 작가는 수도 없이 많거든요. 이건 마치 "범인은 검은 신발을 신고 있었다"는 정보만으로 검은 신발을 신은 모든 사람을 용의자로 지목하는 것과 같아요.

실제로 이 Reddit 게시글의 댓글란에서도 많은 사람들이 이 점을 지적했어요. 한 댓글러는 이렇게 말했죠:

> "나는 ChatGPT가 존재하기 전부터 엠 대시를 사랑해 왔다. 이제 내 글도 AI가 쓴 걸로 의심받아야 하나?"

또 다른 사람은 고전 문학 작품에서 엠 대시가 얼마나 빈번하게 사용되는지 보여주면서, 만약 엠 대시가 AI의 증거라면 19세기 문학 대부분이 AI가 쓴 게 된다고 꼬집었어요.

AI 탐지 도구의 기술적 한계

그렇다면 전문적인 AI 탐지 도구는 어떨까요? 현재 시장에는 여러 AI 탐지 도구들이 있어요:

GPTZero: 텍스트의 "혼란도(perplexity)"와 "폭발성(burstiness)"을 분석해요
Originality.ai: AI 생성 확률을 퍼센트로 보여줘요
Turnitin AI Detection: 학술 분야에서 많이 쓰이는 표절 탐지 도구에 AI 탐지 기능이 추가된 거예요

여기서 혼란도(perplexity)라는 개념을 쉽게 설명해 볼게요. 이게 뭐냐면, AI가 다음 단어를 얼마나 쉽게 예측할 수 있는지를 나타내는 지표예요. AI가 쓴 글은 AI 자신이 예측하기 쉬우니까 혼란도가 낮고, 사람이 쓴 글은 예측하기 어려우니까 혼란도가 높다는 원리죠.

폭발성(burstiness)은 문장 길이나 복잡도의 변화 폭을 의미해요. 사람은 짧은 문장과 긴 문장을 불규칙하게 섞어 쓰는데, AI는 비교적 균일한 길이와 구조의 문장을 생성하는 경향이 있다는 거예요.

그런데 문제가 있어요. 이 도구들의 정확도가 생각보다 많이 떨어져요. 여러 연구에서 확인된 주요 문제점들을 정리해 볼게요:

| 문제 | 설명 |
|------|------|
| 높은 오탐률 | 사람이 쓴 글을 AI가 쓴 것으로 잘못 판별하는 비율이 상당히 높아요 |
| 비영어권 편향 | 영어가 모국어가 아닌 사람이 영어로 쓴 글을 AI로 오판하는 경향이 있어요 |
| 간단한 우회 | 동의어로 바꾸거나 문장 구조를 살짝 수정하면 탐지를 쉽게 피할 수 있어요 |
| 버전 의존성 | 새로운 모델이 나올 때마다 탐지 도구도 업데이트가 필요해요 |

특히 비영어권 편향 문제는 심각해요. 2023년 스탠퍼드 대학교 연구에서, AI 탐지 도구들이 영어가 모국어가 아닌 사람의 에세이를 AI로 판별하는 비율이 비정상적으로 높다는 결과가 나왔거든요. 한국인이 영어로 글을 쓰면, 문법적으로 정확하지만 표현이 다소 정형화될 수 있는데, 이걸 AI의 특성으로 오판하는 거예요.

OpenAI 자체도 한때 AI 텍스트 분류기를 출시했다가, 정확도가 너무 낮아서 몇 달 만에 서비스를 중단한 적이 있어요. AI를 만든 회사조차 AI가 쓴 글을 정확히 가려내지 못한다는 건, 이 문제가 얼마나 어려운지를 잘 보여주죠.

더 넓은 맥락 — AI와 창작의 경계 논쟁

이 논쟁은 사실 훨씬 더 큰 흐름의 일부예요. AI가 글쓰기, 그림 그리기, 음악 만들기 등 창작 영역에 깊이 들어오면서, 전 세계적으로 "진짜"와 "가짜"의 경계에 대한 논쟁이 뜨거워지고 있거든요.

출판 업계의 현실

아마존에서는 AI로 생성된 책이 폭발적으로 증가하고 있어요. 2023년부터 아마존 킨들 다이렉트 퍼블리싱에 하루에 수천 권의 책이 올라오는데, 상당수가 AI로 생성된 것으로 추정돼요. 이에 아마존은 2023년 후반부터 하루 출판 가능 권수를 3권으로 제한하는 정책을 도입했어요.

이건 단순히 품질 문제만이 아니에요. 실제 작가들의 생계와도 직결되는 문제거든요. 노력해서 쓴 책이 AI가 대량 생산한 책들 사이에 묻혀버리면, 창작의 동기 자체가 사라질 수 있잖아요.

학술계의 혼란

학술 논문에서도 비슷한 문제가 일어나고 있어요. 일부 학술지에서 "이 결과는 제가 AI 언어 모델로서 제공할 수 없는 것입니다"같은 ChatGPT의 기본 거부 응답이 그대로 실린 논문이 발견되기도 했죠. 이건 명백한 부정행위인데, 문제는 교묘하게 AI를 활용한 경우는 거의 잡아내기 불가능하다는 거예요.

개발 분야에서의 유사 논쟁

개발자 커뮤니티에서도 마찬가지 논쟁이 있어요. Stack Overflow에서는 2022년 말부터 AI 생성 답변을 일시적으로 금지했어요. 이유는 AI가 생성한 답변이 그럴듯해 보이지만 미묘하게 틀린 경우가 많아서, 검증 비용이 너무 높아졌기 때문이에요.

GitHub에서도 "이 PR(Pull Request)은 Copilot으로 작성한 거 아니야?"라는 리뷰 코멘트가 종종 달리곤 해요. 코드 리뷰에서도 AI 사용 여부를 둘러싼 미묘한 긴장이 있는 거죠.

진짜 문제는 따로 있다 — AI 사용 자체가 아니라 투명성

여기서 한 발짝 물러서서 생각해 볼 필요가 있어요. AI를 사용하는 것 자체가 문제일까요?

많은 전문가들은 핵심 문제는 AI 사용 여부가 아니라 투명성(transparency)이라고 지적해요. 맞춤법 검사기를 쓴다고 해서 그 글이 "가짜"가 되지는 않잖아요. 번역기의 도움을 받아 외국어 글을 쓴다고 해서 그 사람의 의견이 무가치해지지도 않고요.

문제가 되는 건 다음과 같은 경우예요:

1. AI가 대부분을 쓴 글을 자신이 쓴 것처럼 내세우는 경우 — 특히 학술 논문이나 전문 출판물에서
2. AI 생성 콘텐츠를 대량 생산해서 플랫폼을 오염시키는 경우 — 아마존의 AI 책 홍수처럼
3. 사실과 다른 내용을 AI가 생성했는데 검증 없이 유통시키는 경우 — AI의 할루시네이션(환각) 문제

반면, AI를 도구로서 활용하는 건 점점 더 보편적이고, 어쩌면 자연스러운 일이 되고 있어요.

예를 들어, 작가가 초안을 AI로 빠르게 생성하고, 자신의 목소리와 스타일로 대폭 수정하는 워크플로우는 이미 많은 곳에서 활용되고 있어요. 이건 포토샵으로 사진을 보정하는 것과 크게 다르지 않다는 시각도 있죠.

한국 개발자에게 주는 시사점

이 논쟁이 한국의 개발자들에게 주는 시사점은 생각보다 많아요.

1. AI 생성 코드에 대한 건강한 태도 갖기

GitHub Copilot, Cursor, ChatGPT 등을 활용해서 코드를 작성하는 건 이제 거의 모든 개발자가 하고 있는 일이에요. 중요한 건 생성된 코드를 이해하고 검증하는 능력이에요.

엠 대시 하나로 "이건 AI야!"라고 판단하는 것처럼, 코드에서도 표면적인 패턴만 보고 판단하면 안 돼요. 예를 들어 "이 코드는 변수명이 너무 설명적이니까 AI가 쓴 거다"같은 판단은 위험하죠. 진짜 중요한 건 코드가 올바르게 동작하는가, 엣지 케이스를 처리하는가, 유지보수하기 쉬운가예요.

2. AI 탐지보다 코드 리뷰 문화

"이거 AI로 쓴 거 아니야?"라고 의심하는 데 에너지를 쏟는 것보다, 좋은 코드 리뷰 문화를 만드는 게 훨씬 생산적이에요.

코드 리뷰에서 확인해야 할 것들:

작성자가 이 코드의 동작 원리를 설명할 수 있는가?
비즈니스 요구사항을 정확히 반영했는가?
테스트가 충분한가?
보안 취약점은 없는가?

이런 질문들은 AI로 썼든 사람이 썼든 동일하게 적용되는 거거든요. 결국 코드의 출처가 아니라 코드의 품질이 중요한 거예요.

3. 기술 문서 작성 시 주의점

한국 개발자들이 영어로 기술 블로그나 문서를 작성할 때, AI 탐지 도구에 의해 AI 생성물로 오판될 가능성이 있다는 점을 인지해야 해요. 앞서 말한 비영어권 편향 문제 때문이에요.

대응 방법은 다음과 같아요:

자신만의 목소리를 의식적으로 넣기: 개인적인 경험, 특정 프로젝트의 구체적인 맥락 등
AI 도구를 활용하되, 최종본은 반드시 자신의 어조로 다듬기
필요하다면 AI 활용 사실을 투명하게 밝히기: "이 글의 초안 작성에 AI 도구를 활용했습니다"같은 한 줄이면 충분해요

4. 기술 블로그와 포트폴리오에서의 AI 활용

취업이나 이직을 준비하는 분들이 기술 블로그를 운영하는 경우가 많은데요. AI로 블로그 글을 작성하는 건 괜찮지만, 면접에서 해당 주제에 대해 깊이 있게 대화할 수 있어야 해요. AI가 써준 글을 자기 것처럼 내세웠는데 실제로는 이해하지 못하는 상황이 오면, 그건 엠 대시보다 훨씬 명확한 "AI 탐지 신호"가 되거든요.

앞으로 어떻게 될까?

AI와 인간 창작물의 경계 논쟁은 앞으로 더 복잡해질 거예요. 몇 가지 예상되는 흐름을 정리해 볼게요.

첫째, AI 탐지는 점점 더 어려워질 거예요. 모델이 발전할수록 인간의 글쓰기 패턴을 더 정교하게 모방하게 되고, 엠 대시 같은 표면적 특징으로는 구별이 불가능해질 거예요. 이미 최신 모델들은 이전 모델들의 "AI스러운" 특징을 상당 부분 개선하고 있어요.

둘째, 투명성 규범이 형성될 거예요. EU의 AI Act처럼 AI 생성물에 대한 표시 의무를 규정하는 법률이 늘어나고 있어요. 출판, 학술, 저널리즘 등 분야별로 AI 활용에 대한 가이드라인이 점점 구체화될 거예요.

셋째, 'AI 활용 능력'이 새로운 역량이 될 거예요. AI를 효과적으로 활용하면서도 자신만의 전문성과 관점을 유지하는 능력 — 이게 앞으로의 핵심 경쟁력이 될 가능성이 높아요. 프롬프트 엔지니어링이라는 말이 유행하는 것도 이런 맥락이죠.

넷째, 결국 '내용의 가치'가 판단 기준이 될 거예요. 엠 대시가 있든 없든, 글의 논리가 탄탄한지, 새로운 통찰을 제공하는지, 읽는 사람에게 도움이 되는지 — 이런 본질적인 가치 판단이 더 중요해질 수밖에 없어요.

마무리 — 엠 대시는 죄가 없다

돌아가서 처음 이야기를 다시 볼게요. 한 독자가 엠 대시를 보고 "이건 AI다!"라고 분노했어요. 하지만 실제로 엠 대시는 수백 년간 영문학에서 사랑받아온 문장부호예요. ChatGPT가 나오기 한참 전부터 많은 훌륭한 작가들이 즐겨 사용해 온 도구죠.

이 에피소드가 우리에게 가르쳐주는 건 간단해요. 표면적인 패턴에 집착하면 본질을 놓친다는 것. AI가 쓴 글인지 아닌지를 엠 대시 개수로 판단하는 건, 코드를 들여쓰기 스타일로 평가하는 것만큼이나 부적절해요.

우리가 진짜 관심을 가져야 할 건 다음과 같은 질문들이에요:

이 콘텐츠가 정확하고 유용한가?
창작자가 자신의 작업에 책임을 지고 있는가?
AI 활용 사실에 대해 투명한가?
읽는 사람에게 실질적인 가치를 제공하는가?

그러니 다음에 누군가의 글에서 엠 대시를 발견했을 때, 바로 "AI!"라고 외치기 전에 한 번 더 생각해보세요. 어쩌면 그 사람은 단지 에밀리 디킨슨의 팬일 수도 있으니까요.

여러분은 어떻게 생각하세요? AI로 작성된 콘텐츠와 사람이 작성한 콘텐츠를 구별하려는 시도가 의미가 있을까요? 아니면 이제 콘텐츠의 출처보다 콘텐츠의 가치에 집중해야 할 때가 온 걸까요? 그리고 개발자로서 AI 도구를 활용할 때, 어디까지가 "적절한 활용"이고 어디서부터가 "부정행위"라고 생각하시나요? 여러분의 생각이 궁금해요.

🔗 출처: Reddit

이 글도 읽어보세요

Reddit [심층분석] 요즘 Claude한테 무슨 일이? 사용자들이 체감하는 변화와 그 뒤의 진짜 이야기

Reddit [심층분석] AI 영상 생성, 드디어 픽사를 따라잡았다 - 애니메이션 산업이 흔들리는 순간

원문 보기 (Reddit)

이 뉴스가 유용했나요?

이 기술을 직접 배워보세요

AI 도구, 직접 활용해보세요

AI 시대, 코딩으로 수익을 만드는 방법을 배울 수 있습니다.

AI 활용 강의 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기

비전공자도 6개월이면 첫 수익
20년 경력 개발자 직강
자동화 프로그램 + 소스코드 제공

이전 글 AI 이야기, 솔직히 좀 지겹지 않나요? 다음 글 데이터센터가 교류(AC)를 버리고 직류(DC)로 갈아타고 있는 이유

목록으로

로그인

추가 정보 입력

회원가입

비밀번호 찾기