중국 AI 스타트업 딥시크(DeepSeek)가 자사 챗봇에 이미지를 이해하는 비전(Vision) 기능을 추가했습니다. 이제 텍스트뿐 아니라 사진, 스크린샷, 문서, 차트, 손글씨 등을 업로드해 분석을 요청할 수 있게 되면서, GPT-4V나 Gemini가 주도하던 멀티모달 경쟁에 본격적으로 합류했다는 평가입니다. 핵심 포인트는 '가성비'입니다. 딥시크는 그동안 오픈 가중치 모델과 파격적인 저비용 추론으로 주목받아 왔는데, 비전 역량까지 갖추면서 한국 개발자 입장에서는 OCR·문서 파싱·UI 분석·데이터 시각화 해석 같은 실무 작업을 훨씬 저렴하게 자동화할 수 있는 선택지가 늘었습니다. 다만 기업 환경에서는 데이터 전송 경로와 보안·규정 준수 이슈를 반드시 확인해야 합니다. 민감 정보가 포함된 이미지를 외부 API로 보낼 때는 사내 정책 검토가 필수입니다. 멀티모달이 더 이상 빅테크의 전유물이 아니게 된 흐름을, 직접 테스트해보며 체감해볼 시점입니다.
이 글도 읽어보세요
이 뉴스가 유용했나요?
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공