500달러짜리 GPU 하나로 Claude Sonnet 코딩 벤치마크를 넘었다고? ATLAS 프로젝트 살펴보기
## 거대 AI 모델 없이도 코딩을 잘할 수 있다? 요즘 AI 코딩 도구 하면 GitHub Copilot, Claude, GPT 같은 대형 언어 모델(LLM)을 떠올리잖아요. 이런 모델들은 수천 개의 GPU로 학습되고, API 호출 한 번에 몇 ...
ARC-AGI-3 첫날부터 36% 달성 — AI 추론 벤치마크의 새로운 도전이 시작됐어요
## ARC-AGI가 뭔데요? 인공지능이 정말 "생각"을 할 수 있는지 테스트하는 벤치마크가 있어요. ARC-AGI(Abstraction and Reasoning Corpus for Artificial General Intelligence)라는 ...
LiteLLM에 악성코드가 심어졌다 — 한 개발자의 실시간 대응 기록
## 무슨 일이 있었나요? LLM 프록시 도구로 널리 쓰이는 오픈소스 프로젝트 **LiteLLM**에 악성코드가 삽입되는 공급망 공격(supply chain attack)이 발생했어요. LiteLLM이 뭐냐면, OpenAI·Anthropic·Ge...
RAG 시스템을 처음부터 구축한 개발자의 성공과 실패 — 실전에서 배운 것들
## RAG를 직접 만들어본 개발자의 솔직한 후기 요즘 LLM(대규모 언어 모델)을 활용한 서비스를 만들려면 거의 필수적으로 마주치는 개념이 하나 있어요. 바로 RAG(Retrieval-Augmented Generation)인데요. RAG가 뭐냐면,...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
웹사이트에서 원하는 데이터만 쏙 뽑아내는 TypeScript LLM 추출기, Lightfeed Extractor
## 웹 스크래핑, 아직도 셀렉터 노가다 하고 계신가요? 웹에서 데이터를 긁어오는 작업은 개발자라면 한 번쯤 해봤을 거예요. 상품 가격을 모아본다든지, 뉴스 기사를 자동으로 수집한다든지. 그런데 이게 생각보다 정말 귀찮은 작업이거든요. CSS 셀...
양자화(Quantization), 바닥부터 제대로 이해하기
## AI 모델을 가볍게 만드는 마법, 양자화란? 요즘 로컬에서 LLM을 돌려보신 분이라면 "4bit 양자화", "GPTQ", "GGUF" 같은 단어를 한번쯤 보셨을 거예요. 모델 다운로드 페이지에 가면 같은 모델인데 용량이 70GB짜리도 있고 ...
OpenAI 최신 저장소에서 세 번째로 많이 기여한 개발자가 Claude라고?
## 농담 같지만 진짜 일어난 일 OpenAI가 최근 공개한 코드 저장소를 살펴보니, 커밋 기여자(contributor) 순위에서 세 번째로 많은 기여를 한 주체가 다름 아닌 Anthropic의 AI 모델 Claude인 것으로 나타났어요. 네, 맞아...
Ente가 만든 로컬 LLM 앱 'Ensu', 내 데이터를 밖으로 보내지 않는 AI 비서
## 프라이버시 우선 AI 비서가 등장했어요 종단간 암호화 사진 저장 서비스로 잘 알려진 Ente에서 새로운 프로젝트를 공개했어요. 이름은 'Ensu'인데요, 한마디로 설명하면 내 기기에서만 돌아가는 로컬 LLM 앱이에요. LLM이 뭐냐면, L...
구글의 TurboQuant: AI 모델을 극한까지 압축하는 새로운 양자화 기술
## 거대 AI 모델, 작게 만들 수 없을까? 요즘 AI 모델이 점점 커지고 있잖아요. GPT-4니 Gemini니 하는 모델들이 수십~수백 기가바이트에 달하다 보니, 실제로 이걸 서비스에 올리려면 GPU 비용이 어마어마하게 들어요. 그래서 모델을...
알고리즘을 눈으로 보면서 배우자 — Algorithm Visualizer 소개
## 알고리즘 공부, 머릿속으로만 하기엔 한계가 있잖아요 코딩 테스트 준비하거나 자료구조·알고리즘 수업을 듣다 보면, 머릿속으로 배열이 정렬되는 과정을 시뮬레이션하거나 트리가 어떻게 탐색되는지 상상하느라 고생한 경험 다들 있으실 거예요. 교과서의...
트랜스포머는 사실 베이지안 네트워크였다? — AI 모델의 수학적 본질을 파헤치는 새 연구
## 트랜스포머, 우리가 아는 것과 모르는 것 요즘 AI 하면 트랜스포머(Transformer) 아키텍처를 빼놓을 수가 없죠. GPT, Claude, Gemini 같은 대규모 언어 모델(LLM)이 전부 트랜스포머 기반이고, 이미지 생성 모델이나 ...
AI 이야기, 솔직히 좀 지겹지 않나요?
## 모든 대화가 AI로 수렴하는 시대 요즘 개발자 커뮤니티 어디를 가든, 컨퍼런스에 가든, 심지어 회사 점심 시간에도 화제는 하나예요. AI. 새로운 LLM이 나왔다, 코파일럿이 어떻다, AGI가 언제 온다… 한 개발자가 블로그에 솔직하게 적었...
Gemini의 네이티브 비디오 임베딩을 활용한 1초 이내 영상 검색, SentrySearch
## 영상 속 장면을 텍스트로 찾는 시대 영상 콘텐츠가 넘쳐나는 시대에 가장 불편한 것 중 하나가 뭘까요? 바로 "그 장면이 어디 있었더라?"를 찾는 거예요. CCTV 영상에서 특정 상황을 찾거나, 긴 강의 영상에서 원하는 부분을 찾으려면 사람이...
LLM 추론 비용을 확 줄이는 Memory Sparse Attention(MSA), 어떻게 동작할까
## LLM의 고질적 문제, 긴 컨텍스트 처리 비용 요즘 LLM(대규모 언어 모델)을 써보면 컨텍스트 윈도우가 점점 길어지고 있죠. GPT-4o는 128K 토큰, Claude는 200K 토큰까지 지원하고, Gemini는 백만 토큰을 넘기기도 해요...
curl로 리눅스를 설치한다고? — curl > /dev/sda로 만든 미니 배포판 이야기
## curl 한 줄로 OS를 설치할 수 있다면? 보통 리눅스를 설치하려면 ISO 파일을 다운받고, USB에 굽고, 부팅 순서를 바꾸고... 꽤 번거로운 과정을 거쳐야 하잖아요. 그런데 한 개발자가 재미있는 실험을 했어요. `curl URL > /d...
AI 앱은 다 어디로 간 걸까? — 모델은 넘치는데 킬러 앱은 없는 이유
## GPT부터 Claude까지, 모델은 쏟아지는데 Answer.AI에서 흥미로운 질문을 던졌어요. "AI 앱은 다 어디 있는 거야?" 라는 질문인데요. 생각해보면 정말 그래요. GPT-4, Claude, Gemini, Llama 등 모델은 계속...
GPT-5.4 Pro가 미해결 수학 난제를 최초로 풀었다 — AI 수학 추론의 새로운 이정표
## AI가 수학 난제를 풀었다는 게 무슨 뜻일까요? AI 벤치마크 연구기관인 Epoch AI가 운영하는 **FrontierMath** 벤치마크에서, OpenAI의 GPT-5.4 Pro 모델이 **미해결 수학 문제(Open Problem)**를 ...
Mozilla AI가 만든 Cq: AI 코딩 에이전트를 위한 '스택 오버플로'
## AI 에이전트도 질문하고 답을 찾을 수 있는 시대 AI 코딩 에이전트가 코드를 작성하다가 막히면 어떻게 할까요? 사람이라면 Stack Overflow를 검색하거나 동료에게 물어보겠지만, AI 에이전트에게는 그런 채널이 마땅히 없었습니다. M...
AI에게 예전 연구 아이디어를 맡겨봤더니: 자동 연구(Autoresearch)의 가능성과 한계
## 연구자의 오래된 아이디어, AI가 되살리다 연구자라면 누구나 서랍 속에 묵혀둔 아이디어가 있을 것입니다. 시간이 없어서, 다른 프로젝트가 더 급해서, 혹은 당시 기술 수준으로는 실험이 어려워서 미뤄둔 것들이죠. 최근 한 연구자가 이런 오래된 연...
DSPy, 왜 아직도 현장에서 안 쓰일까? — LLM 프로그래밍 프레임워크의 이상과 현실
## 프롬프트 엔지니어링의 한계를 넘으려는 시도 LLM 기반 애플리케이션을 만들어본 분이라면 한 번쯤 느꼈을 겁니다. 프롬프트를 한 글자 바꿨더니 출력이 완전히 달라지고, 모델을 GPT-4에서 Claude로 교체하면 기존 프롬프트가 제대로 동작하...