32GB 맥에서 1조 파라미터 모델을 돌린다고? — NVMe 텐서 스트리밍의 마법
## 무슨 일이 있었나요? AI 모델을 로컬에서 돌려보신 적 있으시죠? 요즘 Llama나 Mistral 같은 오픈소스 모델을 내 컴퓨터에서 실행하는 게 꽤 흔해졌는데요, 여기엔 항상 큰 벽이 하나 있었어요. 바로 메모리예요. 모델이 클수록 더 많...
LLM 추론 비용을 확 줄이는 Memory Sparse Attention(MSA), 어떻게 동작할까
## LLM의 고질적 문제, 긴 컨텍스트 처리 비용 요즘 LLM(대규모 언어 모델)을 써보면 컨텍스트 윈도우가 점점 길어지고 있죠. GPT-4o는 128K 토큰, Claude는 200K 토큰까지 지원하고, Gemini는 백만 토큰을 넘기기도 해요...
미사일 방어 문제가 NP-완전이라고? 컴퓨터 과학이 국방 문제를 만났을 때
## 미사일을 막는 것도 알고리즘 문제다 미사일 방어 시스템이라고 하면 보통 군사 기술이나 물리학을 떠올리잖아요. 그런데 이걸 순수하게 컴퓨터 과학의 관점에서 바라본 흥미로운 분석이 나왔어요. 결론부터 말하면, "날아오는 미사일들을 최적으로 요격하는...
Homebrew가 느려서 답답했다면, Nanobrew를 한번 살펴보세요
## macOS 패키지 관리의 고질적인 문제, 느린 속도 macOS에서 개발하시는 분들이라면 Homebrew를 안 쓰는 분이 거의 없을 거예요. `brew install`로 거의 모든 개발 도구를 설치할 수 있으니까요. 그런데 Homebrew에는 오...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
AI 앱은 다 어디로 간 걸까? — 모델은 넘치는데 킬러 앱은 없는 이유
## GPT부터 Claude까지, 모델은 쏟아지는데 Answer.AI에서 흥미로운 질문을 던졌어요. "AI 앱은 다 어디 있는 거야?" 라는 질문인데요. 생각해보면 정말 그래요. GPT-4, Claude, Gemini, Llama 등 모델은 계속...
LiteLLM 패키지가 공급망 공격에 뚫렸습니다 — 내 프로젝트는 괜찮을까?
## 무슨 일이 있었나요? LLM(대규모 언어 모델) 프록시 도구로 많이 쓰이는 Python 패키지 **LiteLLM**이 공급망 공격(supply-chain attack)에 노출된 사실이 확인됐어요. 공급망 공격이 뭐냐면, 우리가 평소에 `pi...
웹 프레임워크 벤치마크의 대명사, TechEmpower가 문을 닫는다
## TechEmpower Framework Benchmarks, 안녕 웹 프레임워크를 고를 때 "이 프레임워크가 얼마나 빠르지?"라는 질문에 답해주던 대표적인 프로젝트가 있었어요. 바로 **TechEmpower Framework Benchmar...
개인 키 하나 털려서 230억 원이 찍혀 나왔다 — Resolv 해킹 사건 분석
## 무슨 일이 있었나요? DeFi(탈중앙화 금융) 프로토콜인 Resolv에서 약 2300만 달러(한화 약 300억 원)가 탈취되는 해킹 사건이 발생했어요. 해킹의 원인은 놀랍도록 단순했는데요, 프로토콜을 관리하는 **개인 키(Private Ke...
Winamp 감성 그대로, 터미널에서 음악을 듣는 CLIamp
## 그 시절 Winamp를 기억하시나요? 2000년대 초반 컴퓨터를 쓰셨던 분이라면 Winamp를 기억하실 거예요. 그 특유의 스킨, 이퀄라이저, 그리고 "Winamp, it really whips the llama's ass!"라는 시작 사운...
TI-89 공학용 계산기에서 3D 레이캐스팅 엔진을 돌려버린 프로젝트
## 계산기에서 둠(DOOM)을 돌린다고요? "이 기기에서 둠이 돌아가나요?"라는 밈이 개발자 커뮤니티에서 오래된 농담이잖아요. 그런데 진짜로 1990년대 후반에 나온 TI-89 공학용 계산기에서 **높이맵(Height Map) 기반 3D 레이캐...
좋은 연구자가 되기 위한 비공식 가이드 — 개발자에게도 통하는 이야기
## 연구자를 위한 가이드가 왜 개발자에게 의미 있을까 "An Unsolicited Guide to Being a Researcher"라는 제목의 문서가 공개되었습니다. EMERGE Lab에서 작성한 이 가이드는 신진 연구자들에게 보내는 일종의 비공...
오픈소스 파라메트릭 3D CAD, Dune3D가 조용히 완성도를 높이고 있다
## 3D CAD의 오픈소스 공백 기계 설계나 제품 디자인을 하는 엔지니어에게 3D CAD 소프트웨어는 매일 사용하는 필수 도구입니다. 하지만 이 영역은 오랫동안 SolidWorks, Fusion 360, CATIA 같은 상용 소프트웨어가 독점해...
LocalStack, GitHub 저장소를 아카이브하고 계정 필수 정책으로 전환 — 오픈소스의 경계는 어디인가
## 무슨 일이 일어났나 AWS 서비스를 로컬 환경에서 에뮬레이션해주는 도구로 널리 사용되던 LocalStack이 자사 GitHub 저장소를 아카이브(archive) 처리했습니다. 아카이브된 저장소는 더 이상 이슈나 PR을 받지 않고, 사실상 읽...
하나의 주소 공간에서 여러 실행 파일을 돌린다 — Threadprocs가 제안하는 제로카피 IPC
## 프로세스 격리의 대가, 복사 비용 운영체제를 공부하면 가장 먼저 배우는 개념 중 하나가 **프로세스 격리(process isolation)**다. 각 프로세스는 자신만의 가상 주소 공간을 갖고, 다른 프로세스의 메모리에 직접 접근할 수 없다...
AI가 당신의 기술을 빼앗은 게 아니라, 당신이 스스로 내려놓은 것이다
## 코드를 작성하는 것과 코드를 생성하는 것의 차이 요즘 개발자 커뮤니티에서 빠지지 않는 주제가 있습니다. AI 코딩 도구가 개발자의 역할을 어디까지 대체할 것인가, 그리고 개발자라는 직업의 본질은 무엇인가 하는 질문입니다. GitHub Copil...
Trivy를 노린 GitHub Actions 공급망 공격 — 태그 변조로 시크릿이 유출된다
## 또다시 터진 GitHub Actions 공급망 공격 컨테이너 이미지와 IaC(Infrastructure as Code) 취약점 스캐너로 널리 사용되는 Trivy가 또다시 공급망 공격의 표적이 되었습니다. 이번에는 GitHub Actions의...
보안 피로감(Security Fatigue) — 비밀번호 바꾸라는 알림을 무시하게 되는 심리학적 이유
## 우리 모두 겪고 있는 문제 2단계 인증 설정, 비밀번호 90일마다 변경, 피싱 메일 신고 교육, VPN 접속 후 작업, 보안 업데이트 팝업 확인... 개발자든 일반 사용자든, 현대의 디지털 생활에서 보안 관련 요구사항은 끊임없이 쏟아집니다....
iPhone 17 Pro에서 4000억 파라미터 LLM을 돌렸다 — 모바일 AI의 새로운 이정표
## 스마트폰에서 400B 모델이 돌아간다고? 최근 ANEMLL 팀이 iPhone 17 Pro에서 400B(4000억) 파라미터 규모의 대규모 언어 모델을 실행하는 데모를 공개했습니다. 400B 파라미터라는 숫자가 어느 정도인지 감을 잡아보면, Me...
Antithesis가 만든 Bombadil: 웹 UI를 위한 속성 기반 테스팅의 새로운 접근
테스트를 작성할 때 가장 어려운 부분은 뭘까요? 아마 "어떤 시나리오를 테스트해야 하는지"를 정하는 것일 겁니다. 단위 테스트든 E2E 테스트든, 결국 개발자가 머릿속으로 시나리오를 떠올리고 하나하나 수작업으로 작성해야 합니다. 그런데 우리가 미처...
GitHub의 가용성이 99.9%에도 못 미친다고? — 개발 인프라 의존성을 다시 생각할 때
현대 소프트웨어 개발에서 GitHub는 단순한 코드 저장소가 아니다. CI/CD 파이프라인, 프로젝트 관리, 코드 리뷰, 패키지 레지스트리, 심지어 인증 시스템까지—개발 워크플로우의 거의 모든 것이 GitHub 위에 올라가 있다. 그런 GitHub...