[심층분석] 구글이 만든 'AI Edge Gallery', 내 폰에서 LLM을 돌리는 시대가 정말 왔다
## 클라우드 없이, 내 손 안에서 AI가 돌아간다고? 요즘 AI 하면 ChatGPT, Claude, Gemini 같은 클라우드 기반 서비스를 먼저 떠올리잖아요. 인터넷에 연결해서 서버에 질문을 보내고, 서버가 답변을 만들어서 돌려보내주는 구조요...
맥북에서 Gemma 4 멀티모달 모델을 파인튜닝하자 — Apple Silicon 전용 도구 등장
## 맥북으로 멀티모달 AI를 파인튜닝할 수 있게 됐어요 오픈소스 프로젝트 **Gemma 4 Multimodal Fine-Tuner**가 GitHub에 공개됐어요. 이름에서 알 수 있듯이, Google의 오픈소스 모델인 **Gemma 4의 멀티모...
AWS S3가 파일 시스템이 된다 — S3 Files가 바꾸는 클라우드 스토리지의 판도
## S3가 드디어 파일 시스템처럼 동작해요 AWS의 CTO Werner Vogels가 자신의 블로그에서 **S3 Files**라는 새로운 기능을 소개했어요. 한마디로 요약하면, 그동안 "객체 저장소(Object Storage)"로만 쓰이던 S3...
부동소수점을 밑바닥부터 하드웨어로 구현하기 — 소프트웨어 개발자도 알아두면 좋은 이야기
## 부동소수점, 그게 대체 뭔데 이렇게 어려운 건가요? 개발하다 보면 한 번쯤은 이런 경험을 해보셨을 거예요. `0.1 + 0.2`를 계산했는데 `0.30000000000000004`가 나오는 거. "아 컴퓨터가 소수점 계산을 못 하는구나"라고 넘...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
내 컴퓨터 속 모든 파일을 AI로 검색한다 — 로컬 멀티모달 시맨틱 검색 도구 Recall
## 파일 찾기, 아직도 이름으로 하고 계세요? 컴퓨터를 오래 쓰다 보면 "그 파일 어디 갔지?"라는 상황을 자주 겪게 되는데요. 파일 이름이 기억 안 나고, 어느 폴더에 넣었는지도 모르겠고, 기억나는 거라곤 "노을 사진이었는데…" 같은 모호한 ...
Rust로 만든 실시간 대위법 하모니 생성기, Contrapunk 이야기
## 기타를 치면 바흐 스타일 화음이 실시간으로 따라온다? 음악과 프로그래밍의 접점에서 꽤 흥미로운 프로젝트가 하나 등장했어요. **Contrapunk**이라는 프로젝트인데요, 기타 입력을 실시간으로 분석해서 **대위법(counterpoint)** ...
Apple이 드디어 NVIDIA eGPU를 허락했다 — Arm Mac에서 NVIDIA 외장 GPU 사용 가능
## Mac에서 NVIDIA를? 진짜요? Mac 사용자, 특히 개발자나 크리에이터라면 한 번쯤 이런 생각을 해보셨을 거예요. "Mac에 NVIDIA GPU를 달 수 있으면 얼마나 좋을까." Apple Silicon(M1, M2, M3, M4 칩)...
부동소수점 계산이 맨날 미세하게 틀리죠? Herbie가 수식을 자동으로 고쳐줍니다
## 0.1 + 0.2가 0.3이 아닌 세계에서 살고 있잖아요 개발을 좀 해보신 분이라면 한 번쯤 겪어봤을 거예요. JavaScript 콘솔에 `0.1 + 0.2`를 치면 `0.30000000000000004`가 나오는 그 당황스러운 순간이요. 이건...
Apfel: 맥에 이미 깔려 있는 AI를 꺼내 쓰는 무료 앱
## 내 맥 안에 잠자고 있는 AI가 있다? 혹시 알고 계셨나요? 여러분의 Mac에는 이미 꽤 괜찮은 AI 모델이 내장되어 있어요. Apple이 macOS에 탑재한 온디바이스 머신러닝 모델들이 있는데, 보통은 Siri나 시스템 기능 뒤에서 조용히...
Steam 리눅스 점유율이 5%를 돌파했다 — 리눅스 게이밍의 전환점일까?
## 리눅스에서 게임한다고 하면 이상한 눈으로 보던 시대가 끝나가고 있어요 2026년 3월 Steam 하드웨어 조사 결과, 리눅스 사용자 비율이 처음으로 5%를 넘었어요. 숫자만 보면 작아 보일 수 있는데, 이게 왜 의미 있냐면요. 불과 3~4년...
양자 컴퓨팅에 진짜 큰 일이 일어났다 — 만우절 장난이 아닙니다
## 4월 1일에 터진 양자 컴퓨팅 뉴스 타이밍이 정말 절묘한데요, 하필 4월 1일(만우절)에 양자 컴퓨팅 분야에서 꽤 충격적인 발표들이 쏟아져 나왔어요. 양자 컴퓨팅 이론의 권위자인 스콧 아론슨(Scott Aaronson) 교수가 직접 "이건 ...
JAX로 WebGL 위에 레이마칭 렌더러를 만든다고? 머신러닝 프레임워크의 의외의 활용법
## 머신러닝 프레임워크로 3D 그래픽을 렌더링한다? JAX라고 하면 보통 딥러닝이나 수치 계산을 떠올리잖아요. Google이 만든 고성능 수치 연산 라이브러리로, NumPy와 비슷한 인터페이스를 제공하면서도 GPU/TPU 가속과 자동 미분을 지원하...
아이폰과 맥북에서 대형 AI 모델을 돌린다? SwiftLM의 TurboQuant 압축 기술 살펴보기
## 로컬 AI, 점점 현실이 되고 있어요 요즘 AI 모델을 클라우드 API 없이 내 기기에서 직접 돌리는 "로컬 AI" 흐름이 점점 거세지고 있어요. 프라이버시 걱정 없이, 인터넷 연결 없이도, API 비용 없이 AI를 쓸 수 있다는 건 정말 매력...
Cerno — LLM의 추론 능력을 역이용한 새로운 CAPTCHA가 등장했어요
## CAPTCHA, 이제 사람이 아니라 AI를 걸러야 하는 시대 인터넷을 쓰다 보면 "로봇이 아닙니다"를 클릭하거나, 흐릿한 사진에서 신호등을 찾아 클릭하는 경험을 해보셨을 거예요. 이게 바로 CAPTCHA(캡차)인데요, 원래 목적은 봇과 사람...
[심층분석] 마이크로소프트가 음성 AI를 통째로 오픈소스로 풀었다 — VibeVoice가 바꿀 음성 기술의 판도
## 음성 AI, 드디어 누구나 쓸 수 있는 시대가 열리다 음성 인식(STT)이나 음성 합성(TTS)이라고 하면, 많은 분들이 시리나 구글 어시스턴트 같은 서비스를 떠올리실 거예요. 그런데 이런 기술을 직접 만들거나 커스터마이징하려면 어마어마한 ...
Ollama가 Apple Silicon에서 MLX 엔진으로 전환 — 맥에서 로컬 LLM 성능이 확 달라집니다
## 맥에서 로컬 LLM 돌리는 분들 주목하세요 Ollama가 Apple Silicon(M1, M2, M3, M4 칩) 환경에서 **MLX 기반 추론 엔진**을 프리뷰로 지원하기 시작했어요. 지금까지 Ollama는 내부적으로 llama.cpp를 ...
소프트웨어 엔지니어를 위한 ML 입문서 'There is No Spoon' — 마법이 아니라 수학이에요
## 머신러닝, 어렵다고 느끼는 건 당연해요 머신러닝(ML)이라는 단어를 들으면 어떤 느낌이 드시나요? "나는 백엔드 개발자니까 그건 데이터 사이언티스트 영역이지"라고 생각하시는 분들 꽤 많을 거예요. 사실 ML 분야는 용어부터가 벽처럼 느껴지거...
CERN이 AI를 실리콘에 태워 넣은 이유 – 초당 10억 번의 충돌을 실시간으로 걸러내는 법
## 10억 번의 충돌, 그 중 의미 있는 건 극소수 CERN(유럽입자물리연구소)에는 LHC(Large Hadron Collider, 대형 강입자 충돌기)라는 거대한 장치가 있어요. 둘레가 27km에 달하는 지하 터널에서 양성자를 거의 빛의 속도...
메모리 최적화, 옛날 기법이 다시 뜨는 이유
## 메모리가 남아돌던 시대는 끝났다? 한동안 개발자들 사이에서 "메모리는 싸니까 신경 쓰지 마"라는 분위기가 있었어요. RAM 가격이 계속 떨어지고, 클라우드에서 서버 스펙을 올리기도 쉬우니까, 메모리 최적화에 공들이는 게 시간 낭비처럼 느껴지...
하드웨어를 쉽게 버리지 마세요 — 오래 쓰는 것이 왜 중요한가
## 새 제품이 나올 때마다 바꿔야 할까? 매년 새 노트북, 새 스마트폰, 새 태블릿이 쏟아져 나오죠. 제조사들은 "이번 건 진짜 다르다"고 말하고, 벤치마크 숫자는 해마다 올라가고, 우리는 자연스럽게 "이제 슬슬 바꿔야 하나" 하는 생각이 들어...