처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
Hacker News 2026.07.01 47

부스팅 트리의 시대는 끝나는가? 구글이 공개한 표 데이터 파운데이션 모델 'TabFM'

Hacker News 원문 보기

이미지·텍스트에는 파운데이션 모델이 자리 잡았지만, 정작 현업에서 가장 많이 쓰는 표(tabular) 데이터는 여전히 XGBoost 같은 그래디언트 부스팅 트리가 지배해 왔습니다. 데이터셋마다 처음부터 다시 학습하고 튜닝해야 했기 때문이죠. 구글 리서치가 공개한 TabFM은 이 판을 흔듭니다. 핵심은 '제로샷'입니다. 대규모 표 데이터로 사전학습된 트랜스포머가, 새 데이터셋을 별도 학습 없이 문맥 안에 넣어주기만 하면(in-context learning) 바로 예측을 수행합니다. 컬럼 종류나 타입이 제각각인 이질적 데이터도 그대로 받아들입니다. 벤치마크에서는 오랜 시간 튜닝한 부스팅 트리에 견줄 만한 성능을, 그것도 튜닝 없이 즉시 냅니다. 실무 관점의 인사이트는 명확합니다. 앞으로 표 데이터 문제는 '모델을 새로 학습'하는 대신 'API 한 번 호출'로 프로토타입을 만드는 시대가 올 수 있습니다. 특히 데이터가 적거나 빠른 실험이 필요한 상황에서 강력합니다. 다만 초대형 데이터셋과 극한의 정밀도가 필요한 프로덕션에서는 여전히 전통 기법이 유효하니, 두 접근을 상황에 맞게 조합하는 안목이 중요해질 전망입니다.

이 뉴스가 유용했나요?

TTJ 코딩클래스 정규반

월급 외 수입,
코딩으로 만들 수 있습니다

17가지 수익 모델을 직접 실습하고, 1,300만원 상당의 자동화 도구와 소스코드를 받아가세요.

144+실전 강의
17개수익 모델
4.9수강생 평점
정규반 자세히 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.