DeepSeek V4 공개: 오픈소스 LLM 경쟁의 판도를 또 한 번 흔들다

중국발 오픈소스 LLM, 또 한 번 큰 걸음을 내디뎠어요

LLM 업계는 이제 '한 달이 한 시대'라는 말이 농담이 아니에요. 그런 와중에 DeepSeek가 V4 모델을 공개했습니다. 작년에 V3, R1이 나오면서 '오픈소스 진영도 GPT-4급에 거의 따라잡았다'는 충격을 줬던 그 회사예요. 이번 V4는 거기서 또 한 단계 도약했다고 발표했어요.

간단히 배경을 짚고 갈게요. DeepSeek는 중국의 헤지펀드 출신 기술팀이 만든 AI 회사예요. 그런데 이 회사가 특별한 이유는, 연구 결과를 거의 다 오픈소스로 공개한다는 점이에요. 모델 가중치(weights)부터 학습 방법론까지 논문으로 다 풀어버리거든요. 이게 미국 빅테크들의 '클로즈드' 전략과 정반대 노선이라, 글로벌 AI 연구 커뮤니티에 미치는 영향이 굉장히 컸어요.

V4의 핵심 변화는 뭘까

DeepSeek V4의 가장 중요한 진전은 크게 세 가지로 정리할 수 있어요.

첫째, MoE(Mixture of Experts) 아키텍처의 정교화예요. MoE가 뭐냐면, 거대한 모델 하나를 통째로 쓰는 게 아니라 작은 '전문가 모델' 여러 개를 두고 입력에 따라 필요한 전문가만 활성화하는 방식이에요. 비유하자면, 종합병원에 갔을 때 모든 의사가 다 진료에 참여하는 게 아니라, 증상에 맞는 전문의만 만나는 거죠. 이렇게 하면 전체 파라미터 수는 엄청나게 크게 가져가면서도 실제 추론할 때 쓰는 연산량은 작게 유지할 수 있어요. V4는 이 라우팅(어떤 전문가를 부를지 정하는 로직)을 더 정교하게 다듬었다고 해요.

둘째, 컨텍스트 길이의 대폭 확장이에요. 컨텍스트 길이라는 건 모델이 한 번에 읽고 이해할 수 있는 텍스트의 양이에요. V4는 매우 긴 문서나 코드베이스 전체를 한 번에 처리할 수 있는 수준으로 확장됐어요. 이건 코드 리뷰, 긴 논문 분석, 책 한 권 요약 같은 작업에서 결정적인 차이를 만들어요. 기존엔 긴 문서를 잘라서 여러 번 호출해야 했는데, 이제 한 번에 던질 수 있게 된 거죠.

셋째, 추론(reasoning) 능력의 강화예요. 작년에 OpenAI o1이 등장하면서 'LLM이 단순 답변이 아니라 단계별로 사고하는' 패러다임이 열렸어요. DeepSeek는 R1으로 이 흐름에 빠르게 합류했는데, V4에서는 이 추론 모드를 일반 모델에 더 자연스럽게 통합했다고 합니다. 수학 문제, 코딩 챌린지, 복잡한 논리 추론에서 벤치마크 점수가 크게 오른 게 보고됐어요.

가격과 성능의 충격적인 조합

DeepSeek가 업계를 흔드는 진짜 이유는 사실 가격이에요. V3가 처음 나왔을 때, GPT-4 수준의 성능을 그 당시 OpenAI 가격의 10분의 1에서 30분의 1 수준으로 제공해서 충격을 줬거든요. V4도 이 기조를 이어갈 것으로 보여요. API 가격이 현재 가장 싼 프론티어급 모델 중 하나로 책정될 가능성이 높습니다.

또 모델 가중치를 공개하기 때문에, 자체 인프라가 있는 회사라면 외부 API 호출 없이 사내에서 직접 돌릴 수 있어요. 이게 데이터 보안이 중요한 금융권, 의료, 정부 영역에서 엄청난 매력 포인트예요.

업계 지형도에서 보면

현재 LLM 시장은 크게 세 진영으로 나뉘어 있어요. 첫째는 OpenAI, Anthropic, Google 같은 미국 클로즈드 진영. 가장 강력한 모델을 제공하지만 모델 내부는 블랙박스고요. 둘째는 Meta의 Llama 시리즈 같은 미국 오픈웨이트 진영. 가중치는 공개하지만 라이선스 제약이 있고, 프론티어 성능과는 다소 차이가 있죠. 셋째가 DeepSeek, Qwen(알리바바), Yi(01.AI) 같은 중국 오픈소스 진영이에요.

중국 오픈소스 진영의 무서운 점은 '진짜 프론티어급 성능'을 '진짜 자유로운 라이선스'로 풀어버린다는 거예요. Llama는 상업적 사용에 제약이 좀 있는데, DeepSeek는 더 관대한 라이선스를 적용해왔어요. 이게 글로벌 스타트업과 연구자들에게 거대한 선물이 되고 있어요.

또 하나 흥미로운 변화는 하드웨어 효율이에요. 미국 빅테크들이 H100, B200 같은 최신 엔비디아 GPU를 수십만 대씩 쓰는 반면, DeepSeek는 수출 규제 때문에 상대적으로 제한된 하드웨어로 비슷한 결과를 내고 있어요. 이건 '제약이 혁신을 낳는다'는 클래식한 패턴의 재현이에요. 알고리즘 효율, 분산 학습 최적화, 데이터 큐레이션 같은 기본기에서 새로운 기법들이 쏟아지고 있죠.

한국 개발자와 기업에게는

한국에서도 LLM을 쓰는 회사가 정말 많아졌어요. 그런데 비용 문제로 고민하는 곳이 적지 않죠. ChatGPT API로 모든 트래픽을 처리하면 월 수천만 원이 우습게 나갑니다. DeepSeek V4는 이 문제에 강력한 대안이에요.

실무적으로 활용 가능한 시나리오를 몇 가지 꼽아볼게요. 사내 문서 검색과 요약 같은 RAG(검색 증강 생성) 시스템에서는 V4의 긴 컨텍스트가 큰 무기예요. 코드 리뷰나 자동 PR 분석 봇에서는 추론 능력 강화가 직접적으로 도움이 되고요. 고객 상담 챗봇 같은 대량 트래픽 서비스에서는 가격 우위가 결정적이죠.

다만 주의할 점도 있어요. 중국 회사 API를 직접 쓰는 게 데이터 거버넌스 정책상 어려운 경우가 있어요. 이런 경우엔 모델 가중치를 받아서 자체 호스팅하는 게 답이 될 수 있고, 또는 한국이나 미국 클라우드에서 호스팅하는 서드파티 추론 서비스를 활용할 수도 있어요. 한국어 성능도 직접 벤치마크해보시는 게 좋아요. 모델마다 한국어 토큰 효율과 자연스러움에 차이가 꽤 있거든요.

마무리

DeepSeek V4의 등장은 'AI는 결국 거대 자본이 있는 미국 빅테크의 게임'이라는 통념을 또 한 번 흔드는 사건이에요. 오픈소스, 효율적 아키텍처, 합리적 가격이라는 조합이 얼마나 강력한지를 보여주고 있고, 이건 한국 같은 중간 규모 시장의 개발자들에게 특히 좋은 소식이에요.

여러분의 회사는 LLM을 어디까지 활용하고 계세요? 그리고 클로즈드 API와 오픈소스 자체 호스팅 사이에서 어느 쪽으로 무게추를 옮기고 계신가요?

🔗 출처: Hacker News

이 글도 읽어보세요