유튜브나 X(구 트위터) 영상을 다운로드한 뒤, 한국어·영어 이중자막을 자동 생성하고 영상에 합성(burn-in)까지 해주는 오픈소스 워크플로우 툴킷이 공개됐습니다.
핵심 기능
video-subtitle-toolkit은 단순한 자막 생성 도구가 아니라, AI 코딩 에이전트에서 호출 가능한 '스킬' 형태로 설계된 점이 특징입니다.
- 영상 다운로드: 유튜브, X(트위터) 영상 URL을 입력하면 자동으로 영상을 가져옴
- 자막 자동 생성: 음성 인식(STT)을 통해 원본 언어 자막을 추출하고, 한국어↔영어 번역 자막을 생성
- 자막 합성: 생성된 이중자막을 영상에 직접 burn-in 처리
- 에이전트 연동: Claude, OpenAI Codex, VS Code 등 AI 코딩 환경에서 명령어로 바로 호출 가능
왜 주목할 만한가
최근 AI 에이전트 생태계에서 '스킬(skill)'이라는 개념이 부상하고 있습니다. 단일 목적의 CLI 도구를 만드는 것이 아니라, LLM 에이전트가 자연어 명령으로 호출할 수 있는 모듈화된 워크플로우를 설계하는 방식입니다. 이 프로젝트는 그 패턴을 영상 자막이라는 실용적인 영역에 적용했습니다.
한국 개발자 입장에서는 해외 기술 콘텐츠를 한국어 자막과 함께 빠르게 소비하거나 공유할 때 유용할 수 있고, 반대로 한국어 콘텐츠를 영어권에 소개할 때도 활용 가능합니다. 특히 사내 기술 세미나 영상이나 컨퍼런스 발표 영상에 이중자막을 입히는 작업을 자동화할 수 있다는 점이 실무적으로 매력적입니다.
마무리
AI 에이전트 시대에 '도구'의 형태가 CLI에서 에이전트 스킬로 진화하고 있는 흐름을 보여주는 프로젝트입니다. 여러분은 AI 코딩 에이전트에서 어떤 반복 작업을 자동화하고 싶으신가요?
🔗 출처: GitHub
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공