오픈AI가 SEC에 'S-1 초안'을 비공개로 제출했어요 — 상장 준비, 무슨 의미일까
## 무슨 일이 있었냐면요 챗GPT를 만든 그 오픈AI(OpenAI)가 미국 증권거래위원회(SEC)에 'S-1 초안'을 비공개로 제출했다고 발표했어요. 여기서 SEC는 우리나라로 치면 금융감독원 + 한국거래소 비슷한 역할을 하는, 미국 주식시장을 관...
애플이 'Core AI' 프레임워크를 공개했다 — 온디바이스 AI 시대의 새 무기
## 애플이 AI를 OS 깊숙이 박아넣기 시작했어요 애플 개발자 사이트에 **Core AI**라는 새로운 프레임워크 문서가 등장했어요. 이름에서 느껴지듯, Core ML(애플의 머신러닝 실행 엔진), Core Image, Core Data처럼 애...
시리 두뇌를 구글에 맡긴 애플, 자존심을 굽힌 진짜 속사정
## 무슨 일이 있었나요? 애플이 한동안 시리(Siri) 때문에 속앓이를 했다는 건 좀 관심 있으신 분들은 다 아실 거예요. 챗GPT가 세상을 뒤집어 놓는 동안, 시리는 여전히 "죄송해요, 무슨 말인지 잘 모르겠어요"만 반복하고 있었거든요. 새로...
프레임워크 없이 CUDA로 GPT를 처음부터: '뜯어보기 좋은' 미니 구현체
## PyTorch가 가려놓은 커튼을 직접 걷어보자 우리가 평소에 모델을 학습시킬 때는 PyTorch나 텐서플로 같은 프레임워크를 쓰죠. `loss.backward()` 한 줄이면 미분(역전파)이 알아서 되고, GPU도 알아서 굴러가요. 정말 편...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
DeepSeek가 또? '정밀도'로 거대 모델에 도전하는 효율 전략 이야기
## 작은 팀이 거대 모델의 약점을 파고든다 중국의 DeepSeek가 새 모델로 다시 화두에 올랐어요. 이번 기사의 요지는 'DeepSeek의 최신 모델이 정밀도(precision)라는 특정 영역에서 더 크고 비싼 상용 모델을 앞섰다'는 거예요....
가장 작은 인공 두뇌 만들기: 파이썬으로 퍼셉트론을 밑바닥부터 구현해보자
## 거대한 AI도 결국 이 작은 벽돌에서 시작했어요 ChatGPT니 거대 언어모델이니 요즘 AI가 워낙 화려하다 보니, '딥러닝은 나랑 먼 이야기' 같은 느낌이 들 수 있어요. 그런데 그 모든 신경망의 가장 작은 출발점, 그러니까 **'인공 뉴런 ...
회사들이 똑같은 AI로 사람을 뽑으면 벌어지는 일 — '알고리즘 단일재배'의 함정
## 한 번 떨어지면 어디서도 못 붙는다면? 요즘 채용 시장에서 AI가 이력서를 1차로 걸러내는 건 더 이상 특별한 일이 아니에요. 지원자가 수백, 수천 명씩 몰리니까 사람이 일일이 다 볼 수가 없거든요. 그래서 많은 회사들이 AI 채용 도구를 ...
LLM에게 답을 빼앗기지 말고, LLM으로 배우기: 'Lathe'라는 발상의 전환
## AI가 다 해주는데, 나는 점점 모르겠다 요즘 코딩하다 막히면 ChatGPT나 Claude한테 물어보면 답이 쫙 나오잖아요. 편하죠. 그런데 솔직히 이런 적 없으세요? 답은 받아서 붙여넣었는데, 며칠 지나면 '내가 뭘 한 거지?' 싶고, 비...
"LLM이 내 개발자 커리어를 갉아먹고 있어요" — 어느 시니어의 솔직한 고백
## 무슨 일이 있었냐면요 한 소프트웨어 엔지니어가 블로그에 꽤 솔직하고 무거운 글을 하나 올렸어요. 제목을 그대로 옮기면 "LLM이 내 소프트웨어 엔지니어링 커리어를 침식하고 있는데, 뭘 어떻게 해야 할지 모르겠다"예요. 여기서 LLM이 뭐냐면...
LLM은 사실 계산을 못 한다? 그런데 어떻게 덧셈을 맞히는 걸까
## "계산기도 아닌데 어떻게 더하지?" ChatGPT 같은 거대 언어 모델(LLM)한테 "36 + 59는?"이라고 물으면 "95"라고 잘 답하죠. 그런데 곰곰이 생각해보면 신기해요. 이 모델은 다음에 올 단어를 확률로 예측하도록 학습된 거지, ...
추론 비용의 숨은 주범 'KV 캐시', 손실 없이 4배까지 줄이는 법
## LLM을 돌릴 때 메모리를 잡아먹는 진짜 범인 요즘 GPT 같은 대형 언어 모델(LLM)을 직접 서빙해보신 분들은 "왜 이렇게 GPU 메모리가 금방 꽉 차지?" 하고 당황한 경험이 한 번쯤 있으실 거예요. 모델 가중치(weight)만 올리면 끝...
AI가 짠 파이썬 코드, 어떻게 안전하게 실행할까 — MicroPython + WASM 샌드박스
## 무슨 일이냐면 요즘 ChatGPT나 Claude 같은 LLM한테 "이 데이터 좀 계산해줘" 하면 파이썬 코드를 척척 짜주죠. 그런데 그 코드를 진짜로 실행해서 결과까지 보여주려면 한 가지 큰 고민이 생겨요. **"이 코드, 믿고 돌려도 되나...
영국 경찰, 법정 진술서에 AI 쓰지 마라 — 챗봇이 만든 '그럴듯한 거짓말'의 위험
## 무슨 일이 있었냐면요 영국(잉글랜드와 웨일스) 경찰 당국이 일선 경찰관들에게 "법정에 제출하는 진술서나 증거 문서를 작성할 때 AI(특히 ChatGPT 같은 생성형 챗봇)를 쓰지 말라"는 지침을 내렸어요. 듣고 보면 "당연한 거 아니야?" 싶을...
에이전트 PC 시대, 진짜 오는 걸까? NPU와 온디바이스 AI가 바꾸는 컴퓨터의 미래
## 'AI PC'라는 말, 이제 슬슬 진짜가 되어가요 요즘 노트북 광고 보면 'AI PC', 'NPU 탑재' 같은 문구가 빠지질 않죠. 처음엔 그냥 마케팅 용어 아닌가 싶었는데, 업계가 그리는 그림은 생각보다 커요. 핵심 질문은 이거예요. **"우...
오픈AI도 앤트로픽도 S&P 500에 못 들어간다? 'AI는 돈을 못 번다'는 불편한 진실
## 무슨 일이 있었냐면요 S&P 500이라는 이름, 한 번쯤 들어보셨죠? 미국 증시를 대표하는 500개 우량 기업을 묶은 지수예요. 이 안에 들어간다는 건 '미국 경제의 핵심 기업으로 공인받았다'는 일종의 명예 훈장 같은 거죠. 그런데 최근, ...
트랜스포머는 왜 '짧게 압축해서' 표현을 잘할까 — 이론으로 파고든 연구
## 무슨 이야기냐면 요즘 ChatGPT나 Claude 같은 AI의 심장에는 **트랜스포머(Transformer)**라는 구조가 들어가 있어요. 2017년에 구글이 발표한 "Attention is All You Need" 논문에서 시작된 이 구조는,...
LLM은 도대체 어떻게 다음 단어를 알까? 챗봇 속을 한 꺼풀씩 벗겨봤어요
## 들어가며 ChatGPT 같은 걸 매일 쓰면서도 "얘는 도대체 어떻게 말을 만들어내는 거지?" 하고 한 번쯤 궁금했을 거예요. 막연히 "엄청 똑똑한 AI"라고만 알고 넘어가기엔 좀 아쉽잖아요. 그래서 오늘은 LLM(대형 언어 모델, Large...
사람한테는 안 쓰던 문서를, AI한테는 쓴다고요? 'AI가 바꾼 개발 문화'에 대한 뼈 때리는 이야기
## 어쩐지 뜨끔한 이야기 개발하면서 우리가 제일 안 하는 일 중 하나가 뭘까요? 바로 **문서화(documentation)**예요. "코드만 깔끔하면 됐지, 주석이나 README는 나중에 쓰지 뭐" 하다가 결국 안 쓰고 넘어가는 거, 다들 한 ...
"1995년 그 시절 문서처럼 써줘" — LLM을 직접 파인튜닝해본 실험 이야기
## 챗봇한테 시키는 거랑 뭐가 다른데요? 요즘은 문서 쓰는 일도 챗GPT한테 부탁하면 뚝딱 나오잖아요. 그런데 한 기술 문서 작성자(테크니컬 라이터)가 좀 다른 실험을 했어요. 그냥 프롬프트로 부탁하는 게 아니라, **LLM(거대 언어 모델)을...
트랜스포머에 Q·K·V 세 개가 정말 다 필요할까? — 어텐션 다이어트 실험 이야기
## 모두가 당연하게 여겨온 'QKV 세 쌍둥이' 요즘 AI 모델의 심장이라고 불리는 게 '트랜스포머(Transformer)'예요. ChatGPT든 클로드든, 안을 열어보면 이 구조가 돌아가고 있거든요. 그 핵심이 바로 '어텐션(Attention...