TECH 으로 돌아가기
TECH HACKER NEWS 오늘 6분 읽기 24 READS

내 SSD가 위험하다? OpenAI Codex 로그 버그 이야기

내 SSD가 위험하다? OpenAI Codex 로그 버그 이야기

코딩 에이전트가 SSD에 테라바이트를 써버린다고요?

요즘 터미널에서 “이 코드 좀 고쳐줘” 하면 알아서 파일을 읽고 수정까지 해주는 AI 코딩 에이전트, 많이들 쓰시죠. OpenAI가 만든 Codex CLI도 그런 도구 중 하나인데요. 이번에 이 도구에서 좀 아찔한 버그 하나가 보고됐어요. 로그(프로그램이 동작하면서 남기는 기록)를 저장하는 과정에서, 노트북이나 데스크톱에 달린 SSD에 테라바이트(TB) 단위의 데이터를 써버릴 수 있다는 거예요.

“로그 좀 많이 쌓이는 게 뭐 그렇게 큰일이야?” 싶으실 텐데, 이게 생각보다 골치 아픈 문제예요. 단순히 디스크 용량을 잡아먹는 걸 넘어서, SSD의 수명 자체를 깎아먹을 수 있거든요.

SSD는 쓰면 쓸수록 닳습니다

이게 뭐냐면요. 우리가 쓰는 SSD 안에는 낸드 플래시(NAND flash)라는 메모리 칩이 들어있는데, 이 칩은 데이터를 쓰고 지우는 횟수에 물리적인 한계가 있어요. 한 칸(셀)마다 “몇 번까지 쓰고 지울 수 있다”는 정해진 수명이 있고, 그걸 넘기면 그 칸이 망가져요. 그래서 SSD 제조사들은 TBW(Terabytes Written)라는 수명 지표를 표시해요. 예를 들어 “이 SSD는 총 600TB까지 쓸 수 있다”는 식이죠.

평소엔 일반 사용자가 이 한계에 닿기 어려워요. 하루에 몇 GB 쓴다고 치면 수십 년은 걸리거든요. 그런데 어떤 프로그램이 버그 때문에 하루에 수백 GB, 심하면 TB 단위로 계속 글을 써댄다면? 몇 년 걸릴 마모가 몇 달 만에 일어날 수도 있는 거예요.

여기에 쓰기 증폭(write amplification)이라는 것도 한몫해요. 이게 뭐냐면, SSD는 작은 데이터 하나를 고치려고 해도 내부적으로는 더 큰 덩어리를 통째로 다시 쓰는 구조라서, 우리가 “1을 썼다”고 생각해도 안에서는 그보다 몇 배 많은 쓰기가 일어나요. 그래서 로그가 자잘하게 계속 쌓이면 실제 SSD 마모는 더 빠르게 진행될 수 있어요.

버그는 왜 생기나

이런 류의 버그는 보통 “로그를 너무 친절하게 남겨서” 생겨요. 에이전트가 코드를 읽고, 모델한테 보내고, 답을 받고, 다시 쓰는 모든 과정을 빠짐없이 기록하려다 보면, 거기에 파일 전체 내용이나 대화 맥락이 통째로 반복해서 들어가는 경우가 있거든요. 긴 작업을 돌리거나, 에이전트가 같은 내용을 계속 다시 쓰는 루프에 빠지면 로그 파일이 눈덩이처럼 불어나는 거죠.

문제는 이게 조용히 일어난다는 점이에요. 화면에는 멀쩡하게 작업이 진행되는 것처럼 보이는데, 백그라운드에서 디스크에는 쉴 새 없이 글이 써지고 있는 거예요.

업계 맥락: 에이전트 시대의 새로운 부작용

사실 “로그가 디스크를 꽉 채운다”는 문제 자체는 새롭지 않아요. 옛날부터 서버 운영하면 로그 로테이션(오래된 로그를 자동으로 지우거나 압축하는 것) 설정을 안 해놔서 디스크 터지는 사고가 흔했거든요. 그런데 AI 코딩 에이전트는 이 문제를 한 단계 더 키워요. 사람이 명령어를 하나하나 치는 게 아니라, 에이전트가 알아서 수십 번씩 파일을 읽고 모델을 호출하니까, 로그도 그만큼 폭발적으로 늘어날 여지가 큰 거죠. Claude Code, Cursor, Aider 같은 다른 에이전트 도구들도 비슷한 위험에서 완전히 자유롭진 않아요.

한국 개발자에게 주는 시사점

당장 할 수 있는 건 내 에이전트 도구가 어디에 로그를 쌓는지 한 번 확인해보는 것이에요. macOS라면 ~/.codex~/Library 같은 곳, 리눅스라면 홈 디렉토리 아래 숨김 폴더를 한 번 들여다보세요. 며칠 썼는데 로그 폴더가 수십 GB라면 의심해볼 만해요.

그리고 본인이 개발자라면, 자기가 만드는 도구에서도 로그 레벨을 함부로 debug로 둔 채 배포하지 않았는지, 같은 내용을 반복해서 쓰고 있진 않은지 점검하는 계기로 삼으면 좋아요. SSD 수명이라는 건 한번 닳으면 되돌릴 수 없으니까요.

마무리

편리한 자동화 뒤에는 우리가 안 보는 비용이 숨어 있다는 걸 다시 한번 일깨워주는 사례예요. 여러분은 평소에 개발 도구들이 디스크에 뭘 쓰고 있는지 신경 쓰면서 쓰시나요? 혹시 “이 도구가 내 SSD를 갉아먹고 있었네” 했던 경험이 있으면 공유해주세요.


🔗 출처: Hacker News

SOURCE · HACKER NEWS
원문 전체 보기 → https://github.com/openai/codex/issues/28224
SHARE
처리 중...