[심층분석] 주식 차트를 '언어'처럼 읽는 AI, Kronos가 금융 AI의 판을 바꿀 수 있을까

주식 차트도 언어다? 금융 시장의 GPT를 꿈꾸는 프로젝트

요즘 AI 하면 ChatGPT, Claude 같은 텍스트 기반 모델을 먼저 떠올리잖아요. 그런데 한 발 물러서서 생각해보면, "언어"라는 건 꼭 사람이 쓰는 말만을 의미하지는 않거든요. 유전자 서열도 일종의 언어이고, 음악의 악보도 언어예요. 그렇다면 주식 시장의 캔들차트(봉차트)도 하나의 언어로 볼 수 있지 않을까요?

Kronos는 바로 이 질문에서 출발한 프로젝트예요. 금융 시장의 캔들스틱 데이터, 흔히 K-line(케이라인)이라고 부르는 데이터를 마치 자연어처럼 취급해서, GPT가 다음 단어를 예측하듯 다음 캔들(봉)을 예측하는 파운데이션 모델이에요. 전 세계 45개 이상의 거래소 데이터로 사전학습했고, AAAI 2026(세계 최고 수준의 AI 학회 중 하나)에 논문이 채택될 만큼 학술적으로도 인정을 받았어요.

"파운데이션 모델"이라는 게 뭐냐면, 쉽게 말해서 범용 기초 모델이에요. GPT가 다양한 텍스트 작업에 쓸 수 있는 것처럼, Kronos도 주가 예측뿐 아니라 이상 탐지, 패턴 분류 등 금융의 다양한 과제에 파인튜닝해서 쓸 수 있도록 설계됐어요. 그리고 무엇보다, 오픈소스라는 점이 큰 매력이에요.

핵심 기술: 캔들차트를 토큰으로 바꾸는 2단계 프레임워크

왜 금융 데이터는 특별한 접근이 필요할까

보통 시계열(Time Series) 예측 모델이라고 하면, 날씨 예측이나 전력 수요 예측 같은 데에 쓰이는 모델들이 있어요. 그런데 금융 데이터는 이런 일반적인 시계열 데이터와 성격이 꽤 달라요.

노이즈가 엄청 많아요: 주가는 뉴스 한 줄, 트윗 하나에도 출렁이거든요. 신호(signal) 대비 노이즈(noise) 비율이 극단적으로 높아요.
다차원 데이터예요: 하나의 캔들에 시가(Open), 고가(High), 저가(Low), 종가(Close), 거래량(Volume) — 소위 OHLCV — 다섯 가지 정보가 동시에 담겨 있어요.
스케일이 제각각이에요: 삼성전자 주가는 수만 원대이고, 비트코인은 수천만 원대인데, 패턴 자체는 비슷할 수 있거든요.

기존의 범용 시계열 모델(TSFM, Time Series Foundation Model)들은 이런 금융 데이터의 특수성을 잘 반영하지 못했어요. Kronos는 이 문제를 해결하기 위해 2단계 프레임워크를 제안해요.

1단계: 전용 토크나이저 — 연속 데이터를 이산 토큰으로

GPT가 "안녕하세요"라는 문장을 ["안녕", "하세", "요"] 같은 토큰으로 쪼개서 처리하듯, Kronos도 캔들차트 데이터를 토큰으로 바꿔야 해요. 그런데 텍스트와 달리 캔들 데이터는 연속적인 숫자 값이잖아요. 이걸 어떻게 토큰으로 만들까요?

Kronos는 계층적 양자화(Hierarchical Quantization) 방식을 써요. 이게 뭐냐면, 쉽게 비유하자면 이래요:

> 색깔을 표현할 때, RGB 값(255, 128, 64)을 그대로 쓰는 대신에 "주황색 계열 → 좀 밝은 편 → 약간 붉은 기운" 이런 식으로 단계적으로 범주화하는 거예요.

OHLCV 다섯 가지 값을 한꺼번에 하나의 숫자로 뭉뚱그리는 게 아니라, 각 차원의 정보를 계층적으로 보존하면서 이산적인 토큰으로 변환하는 거예요. 이렇게 하면 시가·고가·저가·종가 사이의 관계(예: 양봉인지 음봉인지, 꼬리가 긴지 짧은지)가 토큰 자체에 담기게 돼요.

현재 공개된 토크나이저는 두 가지 버전이에요:

Kronos-Tokenizer-2k: 2048 토큰 컨텍스트를 지원하는 버전
Kronos-Tokenizer-base: 512 토큰 컨텍스트를 지원하는 기본 버전

2단계: 오토리그레시브 트랜스포머 — 다음 캔들을 예측

토큰이 준비되면, 그 다음은 우리가 잘 아는 디코더 전용(Decoder-only) 트랜스포머 구조가 등장해요. GPT 시리즈와 같은 구조인데요, 이전 토큰들의 시퀀스를 보고 다음 토큰(= 다음 캔들)을 예측하는 방식으로 학습해요.

"이전 100개의 봉을 봤을 때, 101번째 봉은 어떤 모양일까?" — 이걸 수십억 개의 캔들 데이터로 반복 학습하는 거예요. 마치 GPT가 방대한 텍스트를 읽으면서 "다음 단어 예측"을 통해 언어를 이해하게 되는 것과 같은 원리죠.

모델 라인업: 4백만에서 5억 파라미터까지

Kronos는 네 가지 크기의 모델을 제공해요. 이건 실무에서 꽤 중요한 포인트인데, 연구 목적이냐 실서비스냐에 따라 적절한 크기를 골라 쓸 수 있거든요.

| 모델 | 파라미터 수 | 컨텍스트 길이 | 오픈소스 여부 |
|------|-----------|-------------|------------|
| Kronos-mini | 4.1M | 2048 | ✅ |
| Kronos-small | 24.7M | 512 | ✅ |
| Kronos-base | 102.3M | 512 | ✅ |
| Kronos-large | 499.2M | 512 | ❌ |

주목할 점이 몇 가지 있어요:

Kronos-mini가 파라미터는 가장 적지만 컨텍스트 길이가 2048로 가장 길어요. 더 긴 과거 데이터를 참조할 수 있다는 뜻이에요. 가볍게 실험하기에 딱 좋아요.
Kronos-large는 비공개예요. 이건 아마 상업적 활용을 위한 전략적 판단으로 보여요. 연구와 실험은 오픈소스로, 실전 성능이 필요하면 별도 협의를 하라는 구조죠.
모든 모델이 Hugging Face에 올라가 있어서, pip install과 몇 줄의 코드만으로 바로 써볼 수 있어요.

기본적인 사용법도 꽤 간결해요. KronosPredictor라는 클래스 하나로 데이터 전처리, 정규화, 예측, 역정규화까지 한 번에 처리되도록 설계됐거든요. 파인튜닝 스크립트도 공개되어 있어서, 자기만의 데이터(예: 특정 종목, 특정 시간대)에 맞게 모델을 조정할 수도 있어요.

업계 맥락: 기존 접근법과 뭐가 다를까

전통적 퀀트 모델 vs. Kronos

금융 분야에서 AI를 쓰는 건 전혀 새로운 게 아니에요. ARIMA, LSTM, Transformer 기반 모델들이 이미 수년째 쓰이고 있거든요. 하지만 이런 모델들은 대부분 특정 종목, 특정 시간프레임에 맞춰 개별 학습하는 방식이에요.

비유하자면 이래요:

> 기존 방식: 영어 번역기, 일본어 번역기, 중국어 번역기를 각각 따로 만드는 것
> Kronos 방식: 먼저 "언어 자체를 이해하는 모델"을 만들고, 그 위에 각 언어별로 살짝 튜닝하는 것

이게 파운데이션 모델의 핵심 철학이에요. 45개 이상의 거래소 데이터로 "금융 시장의 언어" 자체를 먼저 이해시키고, 이후에 특정 과제에 파인튜닝하는 거죠. 이 접근의 장점은:

전이학습(Transfer Learning) 효과: A 시장에서 배운 패턴이 B 시장에도 통할 수 있어요
소량 데이터 적응: 신규 상장 종목처럼 데이터가 적어도, 사전학습된 지식이 있으니 어느 정도 예측이 가능해요
멀티태스크: 예측뿐 아니라 이상 탐지, 분류 등 여러 작업에 하나의 모델로 대응할 수 있어요

기존 시계열 파운데이션 모델과의 비교

최근 시계열 파운데이션 모델도 많이 나오고 있어요. Google의 TimesFM, Salesforce의 Moirai, Amazon의 Chronos 같은 것들이 대표적인데요. 이들과 Kronos의 가장 큰 차이점은 금융 특화 설계예요.

| 항목 | 범용 시계열 모델 (TimesFM 등) | Kronos |
|------|---------------------------|--------|
| 대상 데이터 | 날씨, 전력, 교통 등 다양 | 금융 K-line 특화 |
| 입력 형태 | 단일 변량 또는 다변량 시계열 | OHLCV 구조화된 캔들 데이터 |
| 토크나이저 | 범용 양자화 | 캔들 구조를 반영한 계층적 양자화 |
| 노이즈 대응 | 일반적 | 금융 고노이즈 환경 특화 |

핵심은, 범용 모델들이 "모든 시계열을 커버하겠다"는 접근이라면, Kronos는 "금융이라는 특수한 도메인에 올인하겠다"는 접근이에요. 이건 마치 GPT(범용) vs. BioGPT(의료 특화)의 관계와 비슷해요.

솔직한 한계점과 주의사항

여기서 냉정하게 짚고 넘어가야 할 부분이 있어요.

첫째, 주가 예측의 근본적 한계예요. 아무리 좋은 모델이라도 주가를 정확히 예측하는 건 본질적으로 불가능에 가까워요. 금융 시장은 뉴스, 정치, 심리, 블랙스완 이벤트 등 차트에 담기지 않는 변수가 너무 많거든요. Kronos가 배우는 건 "과거 캔들 패턴에서 나타나는 통계적 규칙성"이지, 미래를 보는 수정구슬이 아니에요.

둘째, 실전 트레이딩에서의 검증이 부족해요. 학술 논문이 채택되고 벤치마크에서 좋은 성능을 보이는 것과, 실제 돈을 걸고 트레이딩했을 때 수익을 내는 것은 완전히 다른 문제예요. 슬리피지(체결 가격 차이), 수수료, 시장 충격 같은 현실적 요소들이 백테스트 결과를 크게 왜곡할 수 있거든요.

셋째, Kronos-large가 비공개라는 점이에요. 가장 성능이 좋을 것으로 예상되는 모델에 접근할 수 없다는 건, 실전 활용을 고려하는 개발자 입장에서는 아쉬운 부분이에요.

한국 개발자에게 주는 시사점

퀀트에 관심 있는 개발자라면

한국에서도 퀀트 투자, 알고리즘 트레이딩에 관심 있는 개발자가 정말 많아졌어요. 지금까지는 주로 TA-Lib으로 기술적 지표를 계산하고, LSTM이나 간단한 트랜스포머로 직접 모델을 만들어야 했는데, Kronos를 쓰면 이 과정이 훨씬 간단해질 수 있어요.

구체적인 시나리오를 하나 들어볼게요:

> "코스피 200 종목에 대해 단기 방향성 예측 모델을 만들고 싶다"
> 기존: 데이터 수집 → 피처 엔지니어링 → 모델 설계 → 학습 (수주 소요)
> Kronos: 데이터 수집 → Kronos-base 파인튜닝 → 평가 (수일 소요)

이미 45개 거래소의 패턴을 학습한 모델이 있으니, 한국 시장 데이터로 파인튜닝만 하면 되는 거예요. 특히 파인튜닝 스크립트가 이미 공개되어 있고, CSV 형태의 데이터에서도 바로 파인튜닝할 수 있도록 finetune_csv 디렉토리가 따로 준비되어 있어요.

AI/ML 엔지니어라면

금융이 아니더라도, Kronos의 아키텍처에서 배울 점이 있어요:

1. 도메인 특화 토크나이저 설계: 연속 데이터를 이산 토큰으로 변환하는 방법론은 다른 도메인(센서 데이터, IoT, 의료 바이탈 등)에도 응용할 수 있어요
2. 작은 모델로도 충분: 최대 5억 파라미터면 LLM 기준으로는 아주 작은 모델이에요. RTX 4090 한 장이면 Kronos-base까지는 충분히 돌릴 수 있거든요. GPU 자원이 제한된 환경에서 파운데이션 모델을 어떻게 설계할지 좋은 참고가 돼요
3. 오토리그레시브 접근의 범용성: "다음 토큰 예측"이라는 단순한 목표 하나로 다양한 다운스트림 태스크를 커버하는 설계 철학은, 자연어 모델에서 이미 검증된 전략이에요

학습 로드맵 제안

이 프로젝트를 제대로 이해하고 활용하려면 이런 순서를 추천드려요:

1. 시계열 분석 기초: 이동평균, OHLCV 데이터의 의미 이해
2. 트랜스포머 기초: Attention 메커니즘, 디코더 구조 이해
3. Kronos 실습: Kronos-mini로 BTC/USDT 예측 따라해보기 (라이브 데모도 참고)
4. 파인튜닝: 자기가 관심 있는 종목 데이터로 모델 커스터마이징
5. 백테스트: 예측 결과를 실제 트레이딩 전략에 연결해서 검증

앞으로 어떤 변화를 가져올까

금융 분야의 AI가 "범용 시계열 모델을 가져다 쓰는 시대"에서 "금융 전용 파운데이션 모델의 시대"로 넘어가는 신호탄이 될 수 있어요. 마치 자연어 처리에서 BERT가 나온 이후로 도메인별 BERT(BioBERT, FinBERT, KoBERT 등)가 쏟아진 것처럼, 캔들차트 전용 파운데이션 모델도 앞으로 더 많이 등장할 수 있어요.

특히 한국 시장은 KOSPI, KOSDAQ의 독특한 특성(동시호가, 상한가/하한가 제도, 공매도 규제 등)이 있어서, 한국 시장에 특화된 Kronos 변형 모델이 나온다면 그 가치가 상당할 거예요.

한 가지 더 흥미로운 점은, 이 모델이 멀티모달 금융 AI의 한 축이 될 수 있다는 거예요. 지금은 캔들 데이터만 보지만, 뉴스 텍스트를 처리하는 LLM과 결합하면 "차트 패턴 + 뉴스 심리"를 동시에 고려하는 모델도 가능해지거든요.

여러분의 생각은?

마지막으로 토론거리를 하나 던져볼게요. 금융 AI 모델이 점점 더 정교해지면, 시장 참여자 대부분이 비슷한 AI를 쓰게 되는 상황이 올 수 있어요. 모두가 같은 패턴을 예측하면, 그 예측 자체가 무효화되는 "자기실현적 예언의 역설"이 일어나지 않을까요? 그리고 오픈소스로 이런 모델을 공개하는 것이 시장의 효율성을 높이는 건지, 아니면 새로운 형태의 군비경쟁을 촉발하는 건지 — 여러분은 어떻게 생각하시나요?

🔗 출처: GitHub