
라디오를 통째로 AI에게 맡겨본 사람들
Andon Labs라는 회사가 좀 엉뚱하지만 흥미로운 실험을 했어요. 라디오 방송국 운영을 통째로 AI에게 맡겨본 거예요. 음악 선곡, 곡 사이 멘트, DJ 페르소나, 방송 스케줄까지 전부 AI가 결정하고 진행하도록 만들었거든요. 이름하여 andon.fm이에요.
왜 이런 걸 했을까요? 단순히 재미삼아 한 건 아니에요. 이 실험의 진짜 목적은 "AI 에이전트가 장시간, 다양한 결정을 연속적으로 내리는 상황에서 얼마나 일관성 있게 행동하는가"를 테스트하는 거예요. 라디오 방송은 24시간 돌아가고, 매 곡마다 "무슨 곡을 틀지", "어떻게 소개할지", "청취자 분위기를 어떻게 잡을지" 같은 결정이 계속 쌓이거든요. 이건 챗봇 한두 마디 대화와는 완전히 다른 종류의 부하예요.
어떻게 동작하는지 들여다보면
구조 자체는 의외로 깔끔해요. 여러 명의 AI "DJ"가 각각 자기만의 페르소나를 가지고 있어요. 누구는 90년대 힙합 전문가이고, 누구는 인디 록 마니아이고 하는 식으로요. 각 DJ는 자기 시간대에 곡을 고르고, TTS(Text-to-Speech, 글을 음성으로 바꿔주는 기술)로 멘트를 읽고, 다음 곡으로 넘어가요.
핵심은 단순히 "랜덤 플레이리스트 + AI 보이스"가 아니라는 점이에요. AI가 세트 리스트의 흐름을 신경 쓴다는 게 특징이에요. 예를 들어 빠른 곡이 세 번 연속 나왔으면 차분한 곡으로 호흡을 바꿔주고, 같은 아티스트가 너무 자주 나오지 않게 조절하고, 멘트에서 직전에 튼 곡과 다음 곡 사이의 연결고리를 만들어줘요. 사람 DJ가 머릿속에서 자연스럽게 하는 작업들이지만, AI가 이걸 일관되게 해내려면 꽤 정교한 컨텍스트 관리가 필요해요.
또 흥미로운 부분은 실패 모드예요. 블로그에 따르면 AI가 종종 이상한 짓을 한다고 해요. 같은 곡을 짧은 간격으로 다시 틀거나, 존재하지 않는 곡을 "재생"하려고 하거나(환각 현상이죠), 멘트가 점점 산으로 가서 라디오 진행과 무관한 이야기를 늘어놓거나요. 이런 사례를 수집하고 분석하는 게 사실 이 실험의 진짜 결과물이에요.
왜 이게 의미 있는 실험인가
요즘 AI 에이전트 분야의 가장 큰 화두는 "긴 시간 자율적으로 일하는 에이전트" 예요. 코딩 에이전트가 한 시간씩 작업한다거나, 고객 응대 에이전트가 며칠짜리 케이스를 처리한다거나 하는 식이죠. 그런데 짧은 대화에서는 멀쩡하던 모델도 시간이 길어지면 점점 어긋나는 현상이 자주 관찰돼요. 컨텍스트가 쌓이면서 잘못된 가정이 누적되거나, 같은 패턴을 반복하거나, 갑자기 톤이 바뀌거나요.
라디오 방송은 이런 장기 에이전트 문제를 관찰하기에 아주 좋은 실험장이에요. 24시간 무중단으로 돌아가고, 결과물이 음성과 음악으로 누구나 검증할 수 있고, 사람 DJ라는 비교 기준이 명확하거든요. 비슷한 결의 실험으로는 Anthropic이 했던 "Claude에게 자판기 운영을 맡기기" 같은 게 있었어요. 그 실험에서도 AI가 처음엔 잘 운영하다가 점점 이상한 가격 정책을 펴거나 존재하지 않는 손님과 대화하는 등 흥미로운 실패 패턴을 보였죠.
업계 흐름에서 보면
AI가 콘텐츠를 "생성"하는 건 이제 흔하지만, 콘텐츠를 "큐레이션하고 운영"하는 영역은 아직 초기 단계예요. 음악 추천은 Spotify의 알고리즘이 이미 잘하지만, "왜 이 곡을 지금 이 순간에 트는지 설명하고, 다음 곡과 자연스럽게 잇는다"는 건 다른 차원의 작업이거든요. 이 영역에 도전하는 비슷한 시도들로 AI VTuber, AI 팟캐스트 호스트, AI 게임 마스터(TRPG 진행) 등이 있어요.
공통점은 모두 "실시간성 + 일관된 페르소나 + 청중과의 상호작용" 이 요구된다는 점이에요. 그리고 모두 비슷한 문제에 부딪혀요. 처음 한두 시간은 신기하고 재밌는데, 길어지면 반복적이거나 어색한 순간이 늘어나요. andon.fm은 이 문제를 정면으로 다루는 실험이라는 점에서 의미가 있어요.
한국 개발자에게 주는 시사점
직접적으로 라디오를 만들 일은 별로 없을 거예요. 하지만 "장시간 동작하는 AI 시스템"을 만들 때 참고할 인사이트가 많아요. 특히 컨텍스트 관리, 페르소나 일관성 유지, 실패 감지와 자가 복구 같은 부분요.
예를 들어 사내에서 AI 챗봇이나 자동화 워크플로우를 운영한다면, 짧은 대화 단위로만 테스트하지 말고 하루, 일주일 단위의 장기 행동을 모니터링하는 체계를 만들 필요가 있어요. 사람이 보면 이상한 패턴이지만 모델은 자기 출력 안에서는 그럴듯하다고 느끼는 경우가 많거든요. 외부 관찰자가 정기적으로 샘플링하거나, 자동화된 검증 룰을 두는 게 좋아요.
또 콘텐츠 서비스를 운영하는 분이라면, AI 큐레이션의 가능성과 한계를 모두 체감해볼 수 있는 좋은 레퍼런스가 돼요. 무작정 "AI가 다 알아서 한다"가 아니라, 어떤 부분은 AI가 잘하고 어떤 부분은 사람이 가드레일을 쳐야 하는지를 구체적으로 보여주거든요.
마무리
핵심을 한 줄로 정리하면, AI에게 라디오를 맡긴 건 장난이 아니라 "장기 자율 에이전트"의 한계를 들여다보는 실험이라는 거예요. 결과물이 완벽하지 않다는 게 오히려 가치 있는 데이터이고요.
여러분은 24시간 AI가 운영하는 라디오, 청취자로서 들어보고 싶으세요? 아니면 결국 사람 DJ의 그날그날의 감정이 담긴 방송이 더 매력적일까요?
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공