
무슨 일이 있었나요
DeepSeek이 자사의 플래그십 모델인 V4 Pro의 가격 할인을 영구적으로 적용한다고 발표했어요. 원래는 출시 기념 프로모션으로 한시적으로 내려놓은 가격이었는데, 이걸 그대로 정가로 굳혀버린 거죠. 단순히 "세일을 계속한다"는 마케팅 멘트가 아니라 공식 가격 페이지(api-docs.deepseek.com/quick_start/pricing) 자체를 갈아엎었다는 점에서 의미가 큽니다.
DeepSeek은 중국에서 시작된 LLM(대형 언어 모델) 회사인데요, 작년부터 "가성비 끝판왕"이라는 평을 들으며 글로벌 개발자들 사이에서 빠르게 입지를 넓혀왔어요. GPT-4급 성능을 OpenAI 가격의 5~10분의 1 수준으로 제공해서, 비용 부담 때문에 LLM 도입을 망설이던 스타트업들에게 단비 같은 존재였습니다.
V4 Pro가 어떤 모델이길래
DeepSeek V4 Pro는 MoE(Mixture of Experts, 전문가 혼합) 구조를 채택한 모델이에요. 이게 뭐냐면, 모델 안에 여러 "전문가 서브네트워크"를 두고 입력이 들어올 때마다 가장 적합한 일부 전문가만 활성화시키는 방식이에요. 전체 파라미터는 수천억 개에 달하지만 한 번 추론할 때 실제로 사용되는 건 일부라서, 거대 모델의 똑똑함과 작은 모델의 속도를 동시에 챙길 수 있죠.
특히 V4 Pro는 추론(reasoning) 능력이 강화된 모델로, 수학·코딩·논리 문제에서 OpenAI o1이나 Claude의 thinking 모드와 견줄 만한 성능을 낸다고 알려져 있어요. 컨텍스트 윈도우도 충분히 길어서 긴 문서를 통째로 넣어 분석시키는 RAG(검색 증강 생성) 워크로드에도 적합합니다.
가격이 얼마나 파격적인가요
공식 페이지에 따르면 V4 Pro의 가격은 입력 토큰 100만 개당 1달러 미만, 출력 토큰도 그에 비례해 매우 저렴한 수준으로 책정됐어요. 게다가 DeepSeek은 컨텍스트 캐싱(Context Caching) 기능을 제공해서, 같은 시스템 프롬프트나 문서를 반복해서 보내는 경우 캐시 적중 시 가격이 1/10 수준으로 또 떨어집니다. 챗봇처럼 동일한 시스템 메시지를 매번 보내는 서비스라면 실제 청구액이 명목 가격의 절반 이하로 떨어질 수도 있어요.
비교해보면 차이가 확연합니다. OpenAI GPT-4o 계열은 입력 100만 토큰당 2.5~5달러, Anthropic Claude Sonnet 4.6은 3달러 수준이에요. DeepSeek V4 Pro는 그 1/3에서 1/5 가격으로 비슷한 수준의 성능을 제공한다는 거죠. 대량 트래픽을 다루는 서비스라면 월 청구서가 백만 원 단위로 갈리는 차이가 납니다.
업계 흐름에서 보는 의미
2025년 들어 LLM API 시장은 본격적인 가격 전쟁 국면에 들어섰어요. Google Gemini가 Flash 모델로 가격을 후려치고, Meta가 Llama를 오픈소스로 풀고, 중국 쪽에서는 DeepSeek·Qwen·Kimi 같은 모델들이 줄줄이 저가로 치고 들어오면서, OpenAI와 Anthropic 같은 프리미엄 진영도 가격 압박을 받고 있죠. DeepSeek의 "할인 영구화"는 이 흐름을 가속시키는 신호탄이에요.
또 하나 주목할 건 오픈소스 전략입니다. DeepSeek은 모델 가중치를 공개하는 정책을 유지하고 있어서, 자체 인프라에 배포하고 싶은 기업들은 API 대신 직접 운영할 수도 있어요. 즉 "우리 API를 안 써도 되니까 일단 우리 모델을 쓰게 만들겠다"는 생태계 전략이 깔려 있는 셈이죠.
한국 개발자에게 주는 시사점
실무 관점에서 보면 선택지가 늘어났다는 게 가장 큰 변화예요. 사이드 프로젝트나 초기 스타트업에서 LLM을 활용한 서비스를 만들 때, 토큰 비용 때문에 머뭇거렸다면 이제는 한결 부담이 줄었어요. 특히 챗봇, 문서 요약, 코드 어시스턴트처럼 토큰 소비량이 큰 워크로드는 DeepSeek으로 옮기기만 해도 운영비가 크게 떨어집니다.
다만 고려할 점도 있어요. 첫째는 데이터 거버넌스입니다. 회사 정책상 중국 회사의 API에 사용자 데이터를 보내는 게 허용되지 않는 경우가 있을 수 있어요. 이럴 땐 모델 가중치를 직접 받아 자체 서버에 올리는 방식을 검토해야 합니다. 둘째는 한국어 품질인데, V4 Pro는 다국어 성능이 많이 올라왔다고는 하지만 도메인에 따라 GPT-4o나 Claude보다 떨어질 수 있으니 자신의 유스케이스로 벤치마크해보는 게 필수예요.
전략적으로는 "한 모델에 올인"하기보다는 모델 라우터 패턴을 도입하는 게 좋아요. 간단한 작업은 저가 모델로, 복잡한 추론은 프리미엄 모델로 분기하는 식이죠. LiteLLM이나 OpenRouter 같은 도구를 쓰면 코드 변경 없이 모델을 갈아끼울 수 있습니다.
마무리
LLM 가격은 앞으로도 계속 떨어질 거예요. DeepSeek의 이번 발표는 그 흐름을 가속하는 한 장면이고, 결국 "누가 가장 똑똑하냐"보다 "누가 가장 합리적이냐"의 싸움으로 시장이 옮겨가고 있다는 신호예요.
여러분은 지금 어떤 LLM API를 쓰고 계세요? 가격이 절반 이하로 떨어진다면, 어떤 새로운 기능을 서비스에 추가해볼 수 있을까요?
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공