Gemma 4를 내 컴퓨터에서 돌리고 Claude Code와 연결하기: LM Studio 헤드리스 CLI 활용법
## 로컬 LLM, 이제 터미널에서 바로 띄운다 구글이 최근 공개한 **Gemma 4**를 내 컴퓨터에서 직접 돌려보고 싶다면, 이제 꽤 편한 방법이 생겼어요. LM Studio가 새로 추가한 **헤드리스(headless) CLI** 기능을 사용...
일본의 로봇은 일자리를 뺏으러 온 게 아니라, 아무도 안 하려는 일을 대신하고 있다
## 로봇이 사람 일자리를 뺏는다고요? "AI와 로봇이 일자리를 뺏는다"는 이야기, 이제 좀 지겹기도 하죠. 그런데 일본에서는 이 서사가 좀 다르게 흘러가고 있어요. 로봇이 사람의 자리를 빼앗는 게 아니라, **애초에 사람이 하기 싫어하거나 할 ...
LLM이 도대체 어떻게 작동하는 걸까? 직접 만들어보면 이해돼요 — GuppyLM 프로젝트
## GPT, Claude, Gemini… 다들 쓰는데, 원리는 알고 계신가요? 요즘 개발하면서 LLM(대규모 언어 모델)을 안 쓰는 사람이 거의 없죠. 코드 자동완성, 챗봇, 문서 요약까지. 그런데 막상 "LLM이 어떻게 동작해?"라고 물으면,...
구글 Gemma 4, 이제 아이폰에서 오프라인으로 돌린다
## 스마트폰 위에서 돌아가는 AI 모델, 이제 현실이 됐어요 구글이 최신 경량 AI 모델인 Gemma 4를 아이폰에서 바로 실행할 수 있도록 **Google AI Edge Gallery**라는 앱을 앱스토어에 공개했어요. 이게 무슨 뜻이냐면, 서버...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
LLM한테 "원시인처럼 말해"라고 시키면 토큰을 아낄 수 있다고?
## 이게 대체 무슨 프로젝트인가요 "Talk like caveman"이라는 이름의 GitHub 프로젝트가 등장했어요. 이름만 보면 장난 같지만, 실제로 담고 있는 아이디어는 꽤 흥미로워요. 핵심은 이거예요: LLM(대규모 언어 모델)에게 응답을...
Rust로 만든 실시간 대위법 하모니 생성기, Contrapunk 이야기
## 기타를 치면 바흐 스타일 화음이 실시간으로 따라온다? 음악과 프로그래밍의 접점에서 꽤 흥미로운 프로젝트가 하나 등장했어요. **Contrapunk**이라는 프로젝트인데요, 기타 입력을 실시간으로 분석해서 **대위법(counterpoint)** ...
[심층분석] 코드 제안을 넘어서: Block의 오픈소스 AI 에이전트 Goose가 그리는 개발자 자동화의 미래
## 들어가며 — AI가 '제안'이 아니라 '실행'하는 시대 AI 코딩 도구 하면 어떤 게 떠오르시나요? GitHub Copilot처럼 코드를 자동완성해주는 도구, 아니면 ChatGPT에 코드를 물어보는 것 정도가 대부분일 거예요. 그런데 최근 ...
Karpathy의 LLM 아이디어 파일 — AI 연구자의 머릿속을 들여다보다
## Andrej Karpathy가 자기 아이디어를 정리한 문서를 공개했어요 **Andrej Karpathy**라는 이름, AI에 관심 있는 분이라면 한 번쯤 들어보셨을 거예요. Tesla의 AI 디렉터를 지냈고, OpenAI 초기 멤버이기도 했...
GPU 한 대를 여러 개발자가 나눠 쓴다 — sllm으로 LLM 추론 비용 줄이기
## GPU 비용, 개발자의 영원한 고민 LLM(대규모 언어 모델)을 다뤄본 분이라면 공감하실 텐데요, GPU 비용이 정말 어마어마해요. OpenAI나 Anthropic의 API를 쓰면 토큰당 과금이 되니까 프로토타이핑할 때는 괜찮지만, 본격적으로 ...
AI 코딩 에이전트는 어떻게 만들어질까? 핵심 구성 요소 완전 해부
요즘 Cursor, GitHub Copilot, Claude Code 같은 AI 코딩 도구를 써보신 분 많으시죠? 코드를 짜달라고 하면 알아서 파일을 읽고, 수정하고, 심지어 터미널 명령어까지 실행하는 모습을 보면 "이거 어떻게 만든 거지?" 하는...
Claude Code가 리눅스 커널에 숨어있던 23년 된 취약점을 찾아냈다
## AI가 사람 대신 보안 취약점을 찾는 시대 리눅스 커널에 23년 동안 숨어있던 보안 취약점을 AI 코딩 도구가 발견했다는 소식이 전해졌어요. Anthropic의 AI 코딩 에이전트인 Claude Code를 활용해 코드를 분석하던 중, 수십 ...
[심층분석] 모든 LLM을 하나로 묶는 오픈소스 AI 플랫폼, Onyx가 바꿀 업무 환경의 미래
## 왜 지금 Onyx 이야기를 해야 할까 AI 챗봇 하나쯤은 다들 써보셨을 거예요. ChatGPT, Claude, Gemini… 선택지가 정말 많아졌죠. 그런데 막상 회사에서 본격적으로 AI를 도입하려고 하면 골치 아픈 문제들이 쏟아져요. "우리 ...
LLM도 감정을 '이해'할까? Anthropic이 밝혀낸 대형 언어 모델 속 감정 개념의 작동 원리
## 기계가 감정을 느끼는 건 아니지만, 뭔가 흥미로운 일이 벌어지고 있어요 Anthropic이 대형 언어 모델(LLM) 내부에서 감정 개념이 어떻게 표현되고 기능하는지를 분석한 연구를 공개했어요. 우리가 ChatGPT나 Claude 같은 AI에...
RAG를 버리고 가상 파일시스템을 도입했더니 AI 문서 어시스턴트가 완전히 달라졌다
## AI가 문서를 이해하는 방식, 근본부터 다시 생각하다 AI 기반 문서 어시스턴트를 만들어본 분이라면 RAG(Retrieval-Augmented Generation)라는 개념을 한 번쯤 들어보셨을 거예요. RAG는 쉽게 말하면 "AI가 대답하...
Mac mini 하나로 Gemma 4 26B 로컬 AI 돌리기: Ollama 셋업 가이드
## 내 맥 미니에서 26B 파라미터 모델을 돌린다고? 요즘 AI 모델을 직접 내 컴퓨터에서 돌려보고 싶다는 분들이 정말 많아졌어요. ChatGPT나 Claude 같은 클라우드 서비스도 좋지만, 매달 구독료가 나가고, 내 데이터가 외부 서버를 거...
구글, Gemma 4 오픈 모델 공개 — 멀티모달과 긴 컨텍스트를 품은 오픈웨이트의 새 기준
## 무슨 일이 있었나요? 구글 딥마인드가 Gemma 시리즈의 최신 버전인 **Gemma 4**를 공개했어요. Gemma는 구글이 자사의 대형 모델 Gemini에서 기술을 가져와 만든 오픈웨이트(open-weight) 모델인데요, 쉽게 말해 모델의 ...
워드프레스 창시자도 속을 뻔한 피싱 공격, 우리는 안전할까?
## 무슨 일이 있었나요? 워드프레스의 공동 창시자이자 Automattic의 CEO인 맷 멀렌웨그(Matt Mullenweg)가 자신의 블로그에 "Gone (Almost) Phishin'"이라는 글을 올렸어요. 제목에서 눈치채셨겠지만, 그가 피싱...
AMD가 만든 로컬 LLM 서버 'Lemonade' — GPU와 NPU를 동시에 쓴다고요?
## AMD가 로컬 AI 시장에 본격적으로 뛰어들었어요 AI를 내 컴퓨터에서 직접 돌리고 싶은데, NVIDIA GPU가 없으면 좀 막막했잖아요. 그런 분들에게 반가운 소식이에요. AMD가 'Lemonade'라는 오픈소스 로컬 LLM 서버를 공개했...
Qwen3.6-Plus 공개 — 중국발 AI 에이전트 시대가 한 발짝 더 가까워졌어요
## 알리바바가 또 한 수를 던졌어요 알리바바 클라우드의 AI 연구팀이 Qwen(통의천문) 시리즈의 최신 모델인 Qwen3.6-Plus를 공개했어요. 이번 모델의 부제가 "Towards Real World Agents"인데요, 이름에서 알 수 있듯이...
LiteLLM 오픈소스 공급망 공격으로 AI 스타트업 Mercor가 해킹당하다
## 무슨 일이 있었나요? AI 채용 스타트업 **Mercor**가 사이버 공격을 당했는데요, 흥미로운 건 공격 경로예요. Mercor의 시스템을 직접 뚫은 게 아니라, Mercor가 사용하던 오픈소스 프로젝트인 **LiteLLM**이 먼저 침해...