Claude Opus 4.6에서 4.7로, 시스템 프롬프트가 말해주는 AI의 진화 방향

시스템 프롬프트를 비교하면 뭐가 보일까

Simon Willison이 자신의 블로그에 흥미로운 분석을 올렸어요. Anthropic의 Claude Opus 4.6과 새로 나온 4.7 버전의 시스템 프롬프트 차이를 꼼꼼히 비교한 글인데요. 여기서 시스템 프롬프트가 뭔지부터 설명해드릴게요. 챗봇이 사용자 메시지를 받기 전에, 회사 측에서 미리 모델에게 "너는 이런 성격이고, 이런 건 하면 안 되고, 이런 상황엔 이렇게 대답해"라고 지시해두는 사전 지침문이에요. 사용자 눈에는 안 보이지만, AI의 대답 방식을 결정하는 가장 강력한 설계 요소 중 하나죠.

이걸 비교한다는 건 단순한 가십이 아니에요. 시스템 프롬프트의 변화를 보면 AI 회사가 어떤 문제를 발견했고, 어떤 방향으로 모델을 다듬고 있는지가 고스란히 드러나거든요. 모델 버전이 올라갔다고 해서 가중치(weights)만 바뀐 게 아니라, 그 위에서 돌아가는 "성격 설정"도 함께 진화한다는 걸 알 수 있어요.

4.6에서 4.7로, 무엇이 바뀌었나

Simon의 분석에 따르면 주요 변화는 몇 가지 큰 축으로 나눌 수 있어요. 먼저 아첨(sycophancy) 억제가 훨씬 강화됐어요. 이게 뭐냐면, 이전 모델들이 사용자 의견에 지나치게 동조하거나 "좋은 질문이에요!" 같은 불필요한 칭찬을 자주 했거든요. 4.7의 시스템 프롬프트는 이런 행동을 명시적으로 피하도록 지시해요. 동의하지 않을 땐 정중하게 반대 의견을 내라고 권장하는 문구가 추가됐죠.

두 번째는 과도한 면책 조항(disclaimer) 줄이기예요. 예전 Claude는 "저는 AI라서 정확하지 않을 수 있어요" 같은 경고를 너무 자주 붙여서 답변이 길고 번거로워지는 문제가 있었어요. 4.7에서는 이런 반복적인 면책 문구를 꼭 필요한 경우에만 넣도록 조정됐어요.

세 번째는 도구 사용(tool use)과 에이전트 작업 관련 지침이 더 정교해졌다는 점이에요. Claude가 파일을 읽거나, 웹을 검색하거나, 코드를 실행하는 등의 도구를 쓸 때 어떤 순서로, 얼마나 많이 호출할지에 대한 가이드가 추가됐어요. 특히 "불필요한 도구 호출을 피하라"는 지시가 눈에 띄어요. 모델이 자꾸 확신이 없을 때 도구를 남발하는 경향을 억제하려는 거죠.

또 하나 재미있는 건 길이 조절 부분이에요. 이전 모델은 질문에 비해 답변이 너무 긴 경우가 많았는데, 4.7 프롬프트는 "단순한 질문에는 짧게, 복잡한 질문에만 길게"라는 원칙을 더 강하게 적용해요. 불필요한 서론, 결론, 요약을 줄이라는 지시도 명시적으로 들어가 있습니다.

업계 맥락에서 보는 프롬프트 엔지니어링

이런 시스템 프롬프트 공개 문화는 AI 업계에서 꽤 독특한 현상이에요. OpenAI는 자사 시스템 프롬프트를 공식적으로 공개하지 않지만, 사용자들이 "프롬프트 유출" 같은 방식으로 일부를 끌어내곤 해요. 반면 Anthropic은 공식 문서를 통해 시스템 프롬프트를 상대적으로 투명하게 공개하는 편이고, 이게 연구자들에게 좋은 분석 재료가 돼요. xAI의 Grok 역시 시스템 프롬프트를 공개해왔죠.

이런 비교 분석이 보여주는 흐름은 분명해요. 이제 모델 경쟁의 무대는 단순한 "더 큰 파라미터, 더 많은 데이터" 에서 "더 정교한 행동 설계" 로 옮겨가고 있다는 거예요. 같은 모델이라도 시스템 프롬프트를 어떻게 짜느냐에 따라 완전히 다른 AI처럼 느껴지거든요. 이 영역을 전문적으로 다루는 프롬프트 엔지니어링이 독립된 직무로 자리 잡은 이유이기도 해요.

한국 개발자에게 주는 시사점

API를 통해 Claude나 GPT를 서비스에 붙이는 한국 개발자라면, 이번 변화에서 몇 가지 실무 교훈을 얻을 수 있어요. 첫째, 시스템 프롬프트는 제품의 일부라는 인식을 가져야 해요. 코드만큼이나 프롬프트도 버전 관리하고, A/B 테스트하고, 모니터링해야 할 자산이에요. 둘째, Anthropic이 명시한 "아첨 억제"나 "면책 최소화" 같은 원칙은 여러분이 만드는 AI 제품에도 그대로 적용할 수 있어요. 사용자는 진짜로 도움이 되는 답을 원하지, 예의 바른 인사를 원하는 게 아니거든요.

셋째, 모델 버전업이 있을 때마다 기존 프롬프트가 여전히 잘 작동하는지 재검증해야 해요. 4.6에 맞춰 튜닝된 프롬프트가 4.7에서 오히려 이상하게 동작할 수 있거든요. 이건 Anthropic뿐 아니라 OpenAI, Google도 마찬가지예요. 프로덕션에 AI를 쓰고 있다면, 모델 업데이트를 단순한 "성능 향상"으로 받아들이지 말고, 회귀 테스트가 필요한 변경으로 대해야 해요.

국내에서도 네이버 HyperCLOVA X, 카카오 같은 회사들이 자체 LLM을 운영하고 있는데, 이들의 행동 설계 철학을 Anthropic의 공개 프롬프트와 비교해보면 흥미로운 학습이 될 거예요.