처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
Hacker News 2026.06.19 27

무료 오픈 AI 딥시크가 이제 '눈'을 떴어요 — 이미지를 이해하는 DeepSeek 비전

Hacker News 원문 보기

딥시크(DeepSeek)라는 이름은 작년부터 개발자들 사이에서 부쩍 자주 들리기 시작했어요. 중국의 AI 연구팀인데요, '거대 모델은 돈을 산더미처럼 써야 만든다'는 통념을 깨고 훨씬 적은 비용으로 GPT급 모델을 만들어내면서 단숨에 이름을 알렸거든요. 더 반가운 건, 모델의 가중치(weight, 쉽게 말하면 AI가 학습으로 얻은 '두뇌' 그 자체예요)를 공개해서 누구나 자기 서버에 가져다 쓸 수 있게 했다는 점이에요. 그동안 딥시크 챗은 글자만 주고받을 수 있었는데, 이번에 드디어 이미지를 알아보는 '비전(Vision)' 기능이 붙었어요.

'비전'이 붙었다는 게 무슨 뜻이냐면

지금까지의 챗봇은 우리가 키보드로 친 글자만 읽을 수 있었어요. 그런데 비전 기능이 생기면, 이제 사진이나 스크린샷, 손으로 그린 도표, 화면 캡처 같은 '그림'을 그대로 던져줘도 모델이 그 안의 내용을 이해해요. 예를 들어 에러가 잔뜩 뜬 터미널 화면을 캡처해서 올리면 '여기 이 줄에서 모듈을 못 찾고 있네요' 하고 짚어주고, 복잡한 표가 들어간 보고서 이미지를 주면 표 안의 숫자를 읽어서 정리해주는 식이에요.

이게 어떻게 가능하냐면, 모델 안쪽에 '비전 인코더(vision encoder)'라는 부품이 하나 더 들어가요. 이게 뭐냐면 — 이미지를 잘게 쪼개서, 언어 모델이 알아들을 수 있는 형태(토큰, 모델이 처리하는 의미 조각이에요)로 번역해주는 통역사 같은 거예요. 사람으로 치면 눈으로 본 장면을 머릿속 말로 바꾸는 과정인 셈이죠. 그래서 모델은 글과 그림을 한 덩어리로 묶어서 같이 추론할 수 있게 돼요. '이 스크린샷을 보고 코드로 옮겨줘' 같은 부탁이 가능해지는 거고요.

이미 GPT, 제미나이, 클로드는 보고 있었는데

사실 이미지를 이해하는 멀티모달(multi-modal, 글·그림·소리 등 여러 종류의 입력을 한꺼번에 다루는 걸 말해요) 기능 자체는 새로운 건 아니에요. 오픈AI의 GPT-4o, 구글 제미나이, 앤트로픽 클로드는 진작에 이미지를 읽을 수 있었거든요. 그래서 '딥시크가 이제야?'라고 볼 수도 있는데, 진짜 포인트는 다른 데 있어요. 이 기능을 무료로, 그리고 가중치가 공개된 모델 계열에서 쓸 수 있게 됐다는 점이에요. 상용 API에 돈을 내야만 누리던 걸, 비용 부담 없이 또는 직접 서버에 올려서 쓸 길이 열린다는 거죠. '강력한 멀티모달'이 소수 빅테크의 전유물에서 벗어나 점점 누구나 쓰는 기본기가 되어가는 흐름을 보여주는 변화예요.

한국 개발자에게는?

당장 멀티모달 기능을 실험해보고 싶은데 API 비용이 걱정이었다면, 부담 없이 프로토타입을 만들어볼 좋은 선택지가 하나 늘었어요. OCR(이미지 속 글자 인식)이나 화면 분석, 영수증·서류 자동 정리 같은 기능을 붙여보기에 괜찮거든요. 다만 한 가지는 꼭 짚고 갈게요. 딥시크 챗 같은 중국 서비스에 데이터를 올리면 그 자료가 해외 서버를 거친다는 점이에요. 사내 코드나 고객 개인정보처럼 민감한 자료라면, 클라우드 챗에 그냥 올리기보다는 공개된 가중치를 우리 회사 서버에 직접 올려서(셀프 호스팅) 쓰는 쪽을 검토하는 게 안전해요. 사실 이게 가중치를 공개하는 모델의 진짜 장점이기도 하고요.

정리하면

멀티모달은 더 이상 '비싼 프리미엄 기능'이 아니라 기본 사양이 되어가고 있어요. 딥시크가 비전을 단 건 그 흐름을 한 번 더 확인시켜준 신호예요.

여러분은 이미지를 이해하는 AI에게 가장 먼저 어떤 일을 시켜보고 싶으세요? 그리고 무료·오픈 모델과 상용 API, 여러분의 프로젝트라면 어느 쪽을 고르시겠어요?


🔗 출처: Hacker News

이 뉴스가 유용했나요?

이 기술을 직접 배워보세요

AI 도구, 직접 활용해보세요

AI 시대, 코딩으로 수익을 만드는 방법을 배울 수 있습니다.

AI 활용 강의 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.