TECH 으로 돌아가기
TECH GITHUB 2026.05.22 16분 읽기 137 READS

[심층분석] AI 엔지니어링을 맨바닥부터: 435개 레슨, 20단계, 4개 언어로 배우는 정공법

[심층분석] AI 엔지니어링을 맨바닥부터: 435개 레슨, 20단계, 4개 언어로 배우는 정공법

AI를 '쓰는 사람'은 많지만, '만드는 사람'은 왜 부족할까요?

요즘 개발자 커뮤니티를 돌아다니다 보면 묘한 풍경을 보게 돼요. 누구나 ChatGPT API를 호출해서 챗봇을 만들고, LangChain으로 에이전트를 엮고, 벡터 DB에 임베딩을 집어넣어요. 그런데 막상 "이 모델이 학습할 때 손실 함수(loss function, 모델이 얼마나 틀렸는지를 숫자로 나타낸 값)가 왜 그런 모양으로 떨어졌어요?"라고 물어보면 답하지 못하는 경우가 많아요. 어텐션(attention, 트랜스포머 모델이 문장 안에서 어떤 단어에 더 주목할지 정하는 메커니즘)을 코드로 직접 구현해본 사람은 더 드물고요.

이런 답답함 속에서 등장한 게 바로 rohitg00/ai-engineering-from-scratch라는 오픈소스 커리큘럼이에요. 이름 그대로 "AI 엔지니어링을 맨바닥부터(from scratch)" 배우자는 취지의 무료 학습 자료인데요, 단순한 강의 모음이 아니라 435개 레슨, 20개 단계(phase), 약 320시간 분량으로 짜인 거대한 체계예요. 그것도 Python, TypeScript, Rust, Julia 네 가지 언어를 오가면서 말이죠.

저자가 인용한 통계가 인상적이에요. "학생 중 84%는 이미 AI 도구를 쓰고 있지만, 자기가 그걸 전문가 수준으로 다룰 준비가 됐다고 느끼는 사람은 18%뿐이다." 이 격차를 메우는 게 이 커리큘럼의 존재 이유예요. 즉, AI를 "가져다 쓰는" 단계에서 "직접 만드는" 단계로 넘어가고 싶은 사람들을 위한 정공법인 셈이죠.

왜 지금, 이런 커리큘럼이 필요했을까요?

사실 AI 학습 자료는 차고 넘쳐요. Andrew Ng 교수의 Coursera 강의, fast.ai, Karpathy의 "Neural Networks: Zero to Hero" 영상, Hugging Face의 NLP 코스, 그리고 수많은 블로그와 논문 리뷰들. 그런데 저자가 지적한 문제는 이거예요. "파편화되어 있다"는 거죠.

이게 무슨 말이냐면, 여기서는 트랜스포머 논문 리뷰, 저기서는 파인튜닝(fine-tuning, 이미 학습된 모델을 내 데이터로 다시 살짝 학습시키는 것) 튜토리얼, 또 다른 곳에서는 화려한 에이전트 데모를 보여주는데, 이 조각들이 서로 이어지지 않는다는 거예요. 그래서 챗봇은 띄울 수 있는데 그 내부 동작은 설명을 못 하고, 에이전트에 함수를 연결할 줄은 아는데 그 안에서 어텐션이 뭘 하는지는 모르는 상태가 돼요.

이 커리큘럼은 그 파편들을 하나의 "척추(spine)"처럼 꿰어보자는 시도예요. 바닥에는 선형대수(linear algebra, 행렬과 벡터를 다루는 수학)가 깔리고, 그 위에 미적분, 확률, 그 다음 신경망 기초, 트랜스포머, 그리고 맨 위에는 자율 에이전트 군집(swarm)까지 차곡차곡 쌓아 올리는 구조거든요.

커리큘럼의 뼈대를 들여다보면

20단계의 의미

20개 단계가 어떻게 구성되는지 보면 설계 철학이 잘 드러나요. 정확한 순서는 저장소에서 확인해야 하지만, 구조는 대략 이렇게 흘러가요.

결국 "AI를 쓰는 사람"에서 "AI를 만드는 사람"으로 넘어가는 길은, 결국 자기 손으로 한 줄씩 코드를 짜본 경험의 누적이에요. 이런 자료가 그 여정의 좋은 동반자가 되었으면 좋겠어요. 댓글로 여러분의 학습 경험이나 추천하는 자료도 함께 나눠주세요.


🔗 출처: GitHub

SOURCE · GITHUB
원문 전체 보기 → https://github.com/rohitg00/ai-engineering-from-scratch
SHARE
처리 중...