GLM-5.2 전용 코딩 에이전트 'ZCode' — 같은 모델도 '하네스'가 다르면 결과가 달라져요

무슨 일이 벌어졌냐면요

요즘 AI로 코딩하는 도구가 정말 우후죽순처럼 쏟아지고 있죠. Claude Code, Cursor, OpenAI의 Codex CLI, 구글 Gemini CLI... 이름만 들어도 벅찰 정도인데요. 여기에 중국 AI 기업 Z.ai(예전에 Zhipu AI, 智谱AI로 불리던 곳이에요)가 자사 대형 언어 모델(LLM) GLM-5.2에 딱 맞춰 만든 코딩 에이전트 ZCode를 새로 공개했어요.

그런데 이 소식을 제대로 이해하려면 '에이전트'랑 '하네스(harness)'라는 말을 먼저 알아야 하거든요. 사실 이게 이번 이야기의 진짜 핵심이에요.

'하네스'가 뭐냐면요

우리가 흔히 쓰는 ChatGPT나 Claude는 기본적으로 '질문하면 글로 답해주는' 모델이잖아요. 그런데 이걸로 실제 개발을 하려면 그것만으론 부족해요. 모델이 내 프로젝트 파일을 직접 열어보고, 코드를 고치고, 터미널에서 명령을 실행하고, 테스트를 돌려보고, 에러가 나면 스스로 원인을 찾아 다시 고치는 이런 과정을 반복할 수 있어야 하거든요.

이때 모델 바깥에서 '파일 읽는 도구', '코드 수정 도구', '명령 실행 도구'를 쥐어주고, 지금 어떤 도구를 써야 할지 판단하게 하고, 그 결과를 다시 모델에게 물려주는 바깥 껍데기(scaffold)를 바로 하네스라고 불러요. 말(모델)에 씌우는 마구(하네스)에서 따온 말인데요. 말이 아무리 명마여도 마구를 엉성하게 채우면 제대로 못 달리는 것과 똑같아요.

여기서 진짜 재밌는 포인트가 있어요. 똑같은 모델이라도 하네스가 다르면 결과물의 품질이 확 달라진다는 거예요. 도구를 어떻게 설계했는지, 파일이 클 때 어디까지 보여줄지, 에러를 어떤 형태로 되돌려줄지, 여러 단계 작업을 어떻게 기억하게 할지... 이런 자잘한 설계가 모여서 '이 AI 잘하네 / 못하네'를 가르거든요. 그래서 요즘은 '모델 성능만큼 하네스 설계가 중요하다'는 말이 업계에서 거의 정설처럼 굳어지고 있어요.

GLM-5.2와 ZCode가 노리는 지점

GLM 시리즈는 원래 코딩 능력이랑, 여러 단계를 스스로 계획해서 처리하는 '에이전트형 작업'에 강하다고 평가받아 온 모델이에요. Z.ai가 굳이 자기네 모델 전용 하네스를 따로 만든 이유가 여기 있어요. 범용 도구에 그냥 얹는 것보다, GLM-5.2의 버릇과 강점에 맞춰 도구 호출 방식이랑 프롬프트를 튜닝하면 훨씬 안정적으로 굴러가거든요.

또 하나 무시 못 할 게 가격이에요. Z.ai를 비롯한 중국계 모델들은 대체로 '성능은 최상위권을 바짝 쫓으면서 값은 훨씬 싸게'라는 전략을 밀고 있어요. 월 정액제 코딩 플랜을 저렴하게 내놓는 식이죠. AI 코딩 도구를 매일 돌리다 보면 토큰 비용이 은근히 부담되는데, 이 지점을 정면으로 파고드는 거예요.

업계 흐름에서 보면요

지금 AI 코딩 도구 판은 크게 두 축으로 갈라져 있어요. 한쪽은 Anthropic(Claude Code), OpenAI(Codex), 구글(Gemini) 같은 미국 빅테크 진영이고, 다른 한쪽은 알리바바 Qwen, DeepSeek, Moonshot의 Kimi, 그리고 이번 GLM 같은 중국계 진영이에요. 특히 중국계는 오픈웨이트(open-weight, 모델 가중치를 공개해서 직접 내려받아 돌릴 수 있는 것) 전략을 자주 쓴다는 게 큰 차이점이에요.

이게 왜 중요하냐면, 오픈웨이트면 회사 내부 서버에 모델을 직접 올려서 코드가 외부로 안 나가게 할 수 있거든요. 보안이 민감한 기업 입장에선 이 한 가지만으로도 선택지가 확 넓어져요.

한국 개발자에게 주는 시사점

당장 실무에 쓸 거라면, ZCode 같은 전용 하네스를 한번 붙여보고 우리가 쓰던 Claude Code나 Cursor랑 똑같은 작업으로 비교해보는 걸 추천해요. 리팩터링, 버그 수정, 테스트 작성 같은 반복 업무에서 결과 품질과 비용을 나란히 놓고 재보면 감이 확 옵니다.

더 길게 보면, '하네스 설계 자체가 하나의 실력'이 되어가고 있다는 점을 챙겨두면 좋아요. 사내 코드베이스에 맞는 도구와 프롬프트를 직접 다듬을 줄 아는 사람이 앞으로 귀해질 거거든요. 특정 모델 하나에 목매기보다, 모델은 언제든 갈아끼울 수 있게 해두고 하네스 쪽 노하우를 쌓는 게 현명한 방향이에요.

마무리

결국 AI 코딩의 승부처는 '어떤 모델이냐'에서 '그 모델을 얼마나 잘 부리느냐'로 옮겨가고 있어요. 여러분은 지금 어떤 AI 코딩 도구를 쓰고 계신가요? 미국계와 중국계 모델을 실무에서 비교해본 경험이 있다면, 어떤 작업에서 차이가 크게 났는지 댓글로 나눠주세요.

🔗 출처: Hacker News

GLM-5.2 전용 코딩 에이전트 'ZCode' — 같은 모델도 '하네스'가 다르면 결과가 달라져요

무슨 일이 벌어졌냐면요

'하네스'가 뭐냐면요

GLM-5.2와 ZCode가 노리는 지점

업계 흐름에서 보면요

한국 개발자에게 주는 시사점

마무리

이어서 읽을 만한, 세 편.

로그인

추가 정보 입력

회원가입

수강 신청

비밀번호 찾기