DeepSeek가 또? '정밀도'로 거대 모델에 도전하는 효율 전략 이야기

작은 팀이 거대 모델의 약점을 파고든다

중국의 DeepSeek가 새 모델로 다시 화두에 올랐어요. 이번 기사의 요지는 'DeepSeek의 최신 모델이 정밀도(precision)라는 특정 영역에서 더 크고 비싼 상용 모델을 앞섰다'는 거예요. 여기서 먼저 짚고 넘어갈 게 있어요. 이건 한 매체가 내놓은 비교 결과이고, 벤치마크라는 게 '어떤 문제로 재느냐'에 따라 결과가 크게 달라지거든요. 그러니 '모든 면에서 이겼다'가 아니라 '특정 측정에서 앞섰다'로 읽는 게 정확해요.

그래도 이 흐름 자체가 중요한 이유가 있어요. DeepSeek는 그동안 '적은 비용으로 최고급 성능에 근접한다'는 전략으로 업계를 놀래켜 왔거든요. 거대 자본을 가진 곳들이 GPU를 산더미처럼 쌓아 모델을 만들 때, 상대적으로 적은 자원으로 영리하게 따라붙는 모습을 계속 보여줬어요.

'정밀도'가 대체 뭐길래

여기서 정밀도라는 말을 풀어볼게요. 모델 평가에서 정밀도가 높다는 건, 쉽게 말해 '아니라고 말해야 할 때 함부로 그렇다고 우기지 않는다'는 뜻에 가까워요. 예를 들어 모델한테 코드에서 버그를 찾으라고 시켰을 때, 멀쩡한 코드를 자꾸 '여기 버그 있어요'라고 잘못 짚으면 정밀도가 낮은 거예요. 반대로 진짜 버그만 콕 집어내면 정밀도가 높은 거죠.

왜 이게 중요하냐면, 실무에서 AI를 쓸 때 가장 짜증나는 게 바로 '그럴듯하게 틀리는 것(환각)'이거든요. 자신감 넘치게 거짓 정보를 내놓으면 사람이 그걸 일일이 검증해야 해서, 오히려 일이 늘어요. 그래서 요즘 모델 경쟁은 '더 많이 안다'에서 점점 '더 신중하고 정확하게 답한다' 쪽으로 무게가 옮겨가고 있어요. 정밀도를 강조하는 이번 결과도 이 흐름의 한 장면이에요.

어떻게 적은 자원으로 따라붙을까

DeepSeek가 효율을 내는 비결로 자주 언급되는 게 MoE(Mixture of Experts), 우리말로 '전문가 혼합' 구조예요. 이게 뭐냐면, 모델 안에 여러 명의 전문가를 두고, 들어온 질문마다 관련 있는 전문가 몇 명만 깨워서 일을 시키는 방식이에요. 회사에 직원이 백 명 있어도 회계 질문엔 회계팀만 움직이는 것과 같아요. 모델 전체는 거대하지만, 한 번 답할 때 실제로 계산에 동원되는 부분은 일부라서 비용과 속도에서 이득을 봐요.

여기에 DeepSeek는 추론 과정을 스스로 점검하게 만드는 훈련, 그리고 무엇보다 가중치를 공개(오픈 웨이트)하는 전략을 더해 왔어요. 모델 파일을 직접 받아서 내 서버에서 돌릴 수 있다는 건, 데이터가 외부로 안 나가도 된다는 뜻이라 기업 입장에선 매력이 크죠.

업계 맥락에서 보면

지금 구도는 명확해요. 막대한 자본으로 '가장 똑똑한 모델'을 만드는 진영과, 효율과 공개를 무기로 '충분히 똑똑한데 훨씬 싼 모델'을 미는 진영이 부딪히고 있어요. 후자가 무서운 건, 80~90% 성능을 10분의 1 비용으로 제공하면 많은 실무 현장에선 그걸로 충분하기 때문이에요. 비싼 최고급 모델은 정말 어려운 문제에만 아껴 쓰고, 일상적인 작업은 싸고 빠른 오픈 모델로 돌리는 '모델 섞어 쓰기'가 점점 자연스러워지고 있어요.

한국 개발자에게 주는 시사점

당장 해볼 만한 건 '한 모델만 고집하지 않기'예요. 우리 서비스에서 가장 비용이 많이 나가는 AI 호출을, 오픈 모델로 바꿔도 품질이 유지되는지 같은 작업으로 A/B 비교해보세요. 특히 사내 데이터를 다루는 곳이라면, 직접 띄워 쓸 수 있는 오픈 웨이트 모델은 보안 측면에서 진지하게 검토할 가치가 있어요. 다만 벤치마크 숫자는 그대로 믿지 말고, 우리 실제 데이터로 직접 재보는 것이 가장 정확하다는 걸 꼭 기억하세요.