
무슨 일이 있었나요
Modelrift라는 곳이 운영하는 OpenSCAD 건축 3D LLM 벤치마크에서 Antigravity 2.0이라는 모델이 1위를 차지했다는 소식이에요. 처음 들으면 "OpenSCAD가 뭐고, 거기에 왜 LLM 벤치마크가 있지?" 싶을 텐데, 이게 요즘 AI 분야에서 꽤 흥미로운 흐름을 보여 주는 평가라 한번 풀어 볼 만해요.
OpenSCAD가 뭐냐면요
3D 모델링이라고 하면 보통 Blender나 SketchUp처럼 마우스로 메시(mesh)를 깎아 가며 만드는 도구를 떠올리잖아요. OpenSCAD는 그 반대예요. 마우스를 거의 안 쓰고, 코드로 3D 형상을 정의하는 모델러입니다. 예를 들어 cube([10, 20, 5]) 라고 쓰면 가로 10, 세로 20, 높이 5인 직육면체가 만들어지고, translate([0,0,5]) cylinder(h=10, r=3) 같은 식으로 위에 원기둥을 올릴 수 있어요. 마치 CSS로 도형을 그리듯이 3D를 글로 짜는 거죠.
이 방식이 LLM 평가용으로 매력적인 이유가 바로 여기 있어요. 결과물이 "이미지" 같은 모호한 게 아니라 결정적인(deterministic) 코드이고, 그 코드는 다시 정확한 3D 메시로 렌더링이 됩니다. 그러니까 "이 모델이 진짜로 공간을 이해하면서 코드를 쓰는가"를 측정하기에 딱이에요.
벤치마크는 어떻게 동작하나요
방식은 비교적 단순합니다. 모델에게 "3층짜리 박공지붕 단독주택을 모델링하라", "고딕 양식 첨탑을 가진 교회를 그려라" 같은 건축적 프롬프트를 던지면, 모델이 OpenSCAD 코드를 통째로 생성해야 해요. 생성된 코드를 실제로 렌더링해 본 다음에 결과물의 정확성, 디테일, 비례, 프롬프트 충실도 등을 종합해 점수를 매깁니다.
여기서 LLM에게 요구되는 능력이 한두 가지가 아니에요. 우선 OpenSCAD 문법을 정확히 알아야 하고, 컴파일 에러 없이 코드가 돌아가야 해요. 그 다음에는 "3층"이라는 말을 듣고 각 층의 높이를 적절히 분배하는 수치적 공간 추론이 들어가고, "박공지붕"이라는 단어에서 두 면이 마주 보며 기우는 형태를 떠올리는 시각적 상상력도 필요해요. 마지막으로 창문, 문, 굴뚝 같은 디테일을 위치 충돌 없이 잘 배치하는 공간 일관성 능력까지 봐야 합니다. 한마디로 코드 생성 + 수학 + 공간 지능을 한 큐에 보는 셈이에요.
Antigravity 2.0이 1위라는 게 어떤 의미냐면
현재 상위권에는 흔히 들어 본 프론티어 모델들이 줄지어 있는데, 그 위에 Antigravity 2.0이 올라섰다는 게 포인트예요. 일반 텍스트나 코드 벤치마크에서 좋은 점수를 받는 것과, OpenSCAD처럼 "수치 기반 3D 공간"을 글로 풀어내는 능력은 또 다른 차원이거든요. 흔히 LLM이 "공간 감각이 약하다"는 평가를 받아 왔는데, 이쪽 벤치마크가 빠르게 올라오고 있다는 건 모델들이 코드라는 매개체를 통해 공간 추론까지 다루기 시작했다는 신호로 읽혀요.
업계 흐름에서의 위치
LLM 벤치마크는 점점 두 갈래로 갈라지고 있어요. 한쪽은 MMLU, GPQA처럼 텍스트 기반 지식·추론을 보고, 다른 한쪽은 SWE-bench, Aider처럼 실제 코드 수정 능력을 측정해요. OpenSCAD 벤치마크는 이 두 줄기를 합쳐서 도메인 특화 코드 생성으로 한 발 더 들어간 형태예요. 비슷한 흐름으로는 CAD 분야의 Onshape FeatureScript 생성, 회로 설계용 SPICE/Verilog 생성, 음악 분야의 SuperCollider 코드 생성 같은 시도들이 같이 늘고 있어요. "LLM이 도메인 특화 언어(DSL)를 얼마나 잘 다루는가"가 새로운 격전지가 되고 있는 거죠.
한국 개발자에게 주는 시사점
당장 어제까지 OpenSCAD를 안 써 봤어도 괜찮아요. 핵심 시사점은 두 가지예요. 첫째, LLM이 일반 코드뿐 아니라 DSL을 신뢰성 있게 쓰기 시작했다는 점. 사내에 자체 스크립트 언어, 게임 엔진의 비주얼 스크립팅, 인프라 IaC 같은 DSL이 있다면 이제 "우리 DSL용 코파일럿"을 만들 수 있는 시대에 한층 더 가까워졌어요. 둘째, CAD·건축·제조 분야의 AI 도입 가능성이에요. 한국은 건축, 조선, 자동차처럼 3D 설계가 중심인 산업이 두텁기 때문에, 코드 기반 모델링과 LLM의 결합은 생각보다 큰 효율을 만들 수 있어요. 설계 초기 단계의 매스 스터디나 반복적인 모듈 배치 같은 작업은 이미 충분히 자동화 후보예요.
마무리
한 줄로 정리하면, "LLM이 글로 건물을 짓는 시대"가 조금씩 진짜가 되고 있다는 거예요. 여러분이 다루는 도메인에는 어떤 DSL이 있나요? 그리고 그 DSL을 LLM에게 맡겨도 되는 순간이 오면, 우리가 잡고 있어야 할 일은 무엇일까요?
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공