
무슨 일이 있었나
AI 모델을 제품에 붙여 쓰는 사람이라면 한 번쯤 짜증 났을 거예요. "GPT-5는 입력 토큰 100만 개당 얼마지?", "Claude Opus랑 Sonnet 중에 context window가 더 긴 게 뭐였더라?", "Gemini가 함수 호출(function calling) 지원하던가?" 이런 질문에 답하려고 OpenAI 홈페이지, Anthropic 홈페이지, Google 홈페이지를 번갈아 들락거리며 가격표를 확인해본 경험, 다들 있을 거예요.
이 짜증을 해결해보겠다는 오픈소스 프로젝트가 'Models.dev'예요. GitHub에 공개된 이 저장소는 현존하는 주요 AI 모델들의 스펙, 가격, 기능을 한 곳에 모아놓은 데이터베이스예요. 단순 위키가 아니라 JSON 형태의 구조화된 데이터로 제공되기 때문에, 자기 서비스에 그대로 끌어다 쓸 수도 있어요.
핵심 내용 — 뭐가 들어있나
프로젝트의 데이터 구조를 보면 굉장히 실용적으로 짜여 있어요. 각 모델마다 들어있는 항목은 대략 이래요. 모델 이름과 제공자(OpenAI, Anthropic, Google, Meta, Mistral 등), 입력/출력 토큰당 가격, context window 크기(한 번에 받아들일 수 있는 텍스트 길이), 최대 출력 토큰 수, 지원하는 modality(텍스트만인지, 이미지·음성도 되는지), function calling과 structured output 지원 여부, vision 입력 가능 여부, 그리고 cutoff date(어느 시점까지의 데이터를 학습했는지)까지요.
이게 왜 중요하냐면, 예를 들어 여러분이 RAG(검색 증강 생성) 시스템을 만든다고 쳐봐요. 문서를 한 번에 얼마나 많이 넣을 수 있는지가 중요할 텐데, 모델마다 context window가 4K부터 200K, 심지어 1M, 2M까지 천차만별이에요. 가격도 입력/출력이 다르고, 캐싱 적용 시 또 달라요. 이걸 일일이 외우는 건 불가능하고, 매번 검색하는 건 시간 낭비죠. Models.dev가 있으면 코드 안에서 그냥 models.gpt5.input_price 같은 식으로 꺼내 쓸 수 있어요.
특히 '모델 라우팅'을 구현할 때 진가를 발휘해요. 모델 라우팅이 뭐냐면, 사용자 요청을 보고 "이건 간단한 질문이니까 싼 모델로 처리하고, 이건 어려운 분석이니까 비싼 모델로 보내자"고 자동 분기하는 거예요. 이런 라우팅 로직을 짤 때 각 모델의 가격·성능 정보가 코드에 박혀있으면 안 되거든요. 가격이 자주 바뀌니까요. 외부 데이터베이스로 빼두고 주기적으로 업데이트하는 게 맞는데, Models.dev가 딱 그 역할을 해줘요.
업계 맥락 — 비슷한 시도들
사실 비슷한 프로젝트가 몇 개 있어요. 가장 유명한 게 OpenRouter예요. OpenRouter는 단순 카탈로그를 넘어서 실제로 여러 모델 API를 단일 엔드포인트로 묶어주는 서비스인데, 사이드 메뉴에 모델 비교표가 잘 정리돼있어요. Artificial Analysis라는 사이트도 있어요. 여기는 가격뿐 아니라 실제 추론 속도(tokens per second)와 벤치마크 점수까지 측정해서 보여줘요.
그럼 Models.dev는 뭐가 다른가? 차별점은 오픈소스이고, 데이터가 코드 친화적이라는 점이에요. OpenRouter나 Artificial Analysis는 멋진 UI가 있지만 데이터를 가져다 쓰려면 그쪽 API에 의존해야 해요. Models.dev는 GitHub에 JSON으로 올라가있어서, fork해서 자기 입맛대로 고치거나 자기 시스템에 embed할 수 있어요. PR을 통한 커뮤니티 기여도 가능하고요.
또 하나, LiteLLM이라는 라이브러리가 비슷한 데이터를 내부적으로 유지하고 있어요. LiteLLM은 100개 넘는 모델 API를 OpenAI 호환 인터페이스로 묶어주는 라이브러리인데, 그 내부에 모델 가격표가 있거든요. Models.dev는 그 부분만 떼어내서 독립 프로젝트로 만든 것에 가까운 느낌이에요.
한국 개발자에게 주는 시사점
LLM을 제품에 붙이는 한국 회사가 정말 많아졌어요. 챗봇, 요약 서비스, 코드 어시스턴트, 고객 응대 자동화까지 분야도 다양하고요. 그런 팀이라면 Models.dev 같은 카탈로그를 알아두면 두 가지 면에서 도움이 돼요.
첫 번째는 비용 최적화예요. 같은 작업이라도 어떤 모델을 쓰느냐에 따라 비용이 10배 이상 차이 나는 경우가 흔해요. 예를 들어 단순한 분류 작업에 GPT-5를 쓰는 건 낭비고, Haiku나 Mini 계열로도 충분하죠. 이걸 의식적으로 라우팅하려면 각 모델의 가격·성능 데이터가 시스템에 들어와있어야 해요. Models.dev에서 데이터를 받아서 매주 자동 업데이트하는 스크립트 하나만 짜놓으면, 가격 변동에 따른 대응이 훨씬 빨라져요.
두 번째는 모델 선택 의사결정 표준화예요. 팀 안에서 "이 작업에 어느 모델 쓸까?" 같은 토론이 매번 반복되는 회사가 많을 거예요. 각자 머릿속에 다른 가격표를 갖고 있으니 합의가 안 되거든요. 공용 데이터 소스를 두고 거기 기반으로 의사결정하면 훨씬 효율적이에요.
주의할 점도 있어요. 오픈소스 카탈로그는 업데이트가 느릴 수 있어요. 모델 가격이 바뀌었는데 PR이 머지되기 전까지는 옛날 정보가 나가있을 수 있죠. 그래서 미션 크리티컬한 비용 계산에는 결국 공급자의 공식 가격 페이지를 정기 확인하는 절차가 별도로 필요해요.
마무리
한 줄로 정리하면, Models.dev는 'AI 모델의 위키피디아'를 코드 친화적으로 만들어보려는 시도예요. 모델 종류가 폭발적으로 늘어나는 지금, 이런 카탈로그형 인프라가 사이드 도구로 점점 더 중요해질 거예요.
여러분 팀에서는 모델 선택과 비용 관리를 어떻게 하고 있나요? 코드에 하드코딩? 노션 페이지에 정리? 아니면 자체 라우터를 갖고 있나요?
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공