처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
Hacker News 2026.05.30 29
#AI

공짜로 집 청소해드립니다, 대신 로봇 학습용 데이터를 받을게요

Hacker News 원문 보기
공짜로 집 청소해드립니다, 대신 로봇 학습용 데이터를 받을게요

청소 스타트업이 사실은 AI 회사였다

실리콘밸리에서 좀 특이한 서비스가 등장했어요. Shift라는 스타트업인데요, 사람의 집을 무료로 청소해줘요. 진짜 공짜예요. 대신 청소하는 동안 카메라와 센서를 잔뜩 단 청소부가 집안 곳곳을 돌아다니면서 모든 동작을 기록해요. 그 데이터로 미래의 가사 로봇을 학습시키겠다는 거죠.

이게 왜 지금 나오는 얘기냐면, 요즘 휴머노이드 로봇 업계가 "하드웨어는 거의 다 만들었는데, 학습시킬 데이터가 없다"는 벽에 부딪혔거든요. Tesla Optimus, Figure, 1X, Apptronik 같은 회사들이 다 비슷한 문제를 안고 있어요. 자율주행은 수백만 대의 차량이 매일 도로를 달리면서 데이터를 모으잖아요? 그런데 가사용 로봇은 그런 데이터를 얻을 방법이 마땅치 않아요. 그래서 "사람을 로봇 대신 보내서 데이터를 모으자"는 발상이 나온 거예요.

어떻게 데이터를 모으나

Shift의 방식은 흥미로워요. 청소부들은 머리에 카메라를, 손목에는 모션 센서를 차고, 등에는 추가 센서 백팩을 메요. 이걸로 1인칭 시점의 영상, 손과 팔의 정확한 움직임, 물체와의 상호작용을 동시에 기록해요. AI 학습 용어로 말하면 "멀티모달 데이터셋"을 만드는 거죠. 영상만 있어도 안 되고, 동작만 있어도 안 되거든요. "이걸 봤을 때 이렇게 움직였다"가 한 세트로 묶여 있어야 로봇이 따라할 수 있어요.

이 방식은 이미 학계에서 이미테이션 러닝(imitation learning) 또는 행동 복제(behavior cloning) 라고 부르는 접근법이에요. 사람의 행동을 그대로 모델이 학습해서 비슷한 상황에서 비슷하게 행동하도록 만드는 거죠. Stanford의 ALOHA 프로젝트, Google의 RT-2, Tesla의 데이터 수집 방식 모두 비슷한 원리를 써요.

특히 청소라는 작업이 학습용으로 의외로 좋아요. 정해진 동선이 없고, 매번 다른 상황을 마주하고, 손의 미세한 조작이 필요하거든요. 컵을 들어 옮기기, 모서리 닦기, 옷 개기 같은 다양한 동작이 한 번의 청소에 다 들어 있어요. "범용 로봇"을 만들고 싶다면 청소만큼 풍부한 데이터셋이 잘 없어요.

업계 흐름에서 보면

비슷한 시도들이 점점 늘고 있어요. Physical Intelligence(π) 라는 회사는 다양한 환경에서 로봇 손 조작 데이터를 모으고, Skild AI는 여러 종류의 로봇에 같이 쓸 수 있는 범용 모델을 만들고 있죠. 중국에서는 Unitree와 AgiBot이 자체 데이터 수집 시설을 운영해요.

Shift의 차별점은 "실제 사람의 집"에서 데이터를 모은다는 거예요. 연구실에서 인위적으로 만든 환경이 아니라, 진짜 어수선한 거실, 좁은 부엌, 사람마다 다른 가구 배치 같은 현실의 무질서함을 학습 데이터에 담는 거죠. 이게 자율주행에서 "실도로 주행 데이터"가 시뮬레이션 데이터보다 훨씬 비싸지만 가치가 큰 것과 같은 원리예요.

다만 윤리적, 프라이버시 문제가 따라붙어요. 남의 집을 카메라로 다 찍는 건데, 그 영상에 가족 사진, 일기장, 우편물 같은 게 다 찍힐 수 있잖아요. Shift는 "민감한 정보는 익명화하고 학습 후에 폐기한다"고 하지만, 이게 실제로 얼마나 잘 지켜지는지는 외부에서 검증하기 어려워요.

한국 개발자에게 주는 시사점

로봇이나 컴퓨터 비전 분야에 관심 있는 분들이라면 이 흐름을 잘 봐두면 좋아요. "데이터가 곧 자산" 이라는 명제가 자율주행에서 휴머노이드 로봇으로 옮겨가고 있거든요. 한국에도 두산, 현대, 레인보우로보틱스 같은 로봇 기업이 있는데, 이들도 결국 같은 데이터 문제에 부딪힐 거예요.

실무 측면에서는 이미테이션 러닝, VLA(Vision-Language-Action) 모델, 데이터 라벨링 파이프라인 같은 분야가 앞으로 채용도 늘고 기회도 많아질 영역이에요. 특히 멀티모달 데이터 처리에 익숙한 ML 엔지니어 수요가 커질 거고요. AI 에이전트가 디지털 세상에서 일을 했다면, 다음 단계는 물리 세상에서 일하는 에이전트인 셈이죠.

마무리

"무료 청소 서비스"라는 포장 뒤에 진짜로 노리는 건 희소한 물리 세계 데이터셋이에요. 데이터를 모으는 방식이 점점 창의적이고 또 약간은 음흉해지는 시대인 거죠.

여러분은 무료 서비스를 받는 대신 본인 집의 영상 데이터를 제공하라고 하면 동의하실 건가요? 개인정보의 가치를 어디까지 양보할 수 있다고 생각하세요?


🔗 출처: Hacker News

이 뉴스가 유용했나요?

이 기술을 직접 배워보세요

AI 도구, 직접 활용해보세요

AI 시대, 코딩으로 수익을 만드는 방법을 배울 수 있습니다.

AI 활용 강의 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.