한 시대를 정의한 사이트의 퇴장
데이터 분석으로 글을 쓰는 사람이라면 FiveThirtyEight이라는 이름을 한 번쯤 들어봤을 거예요. Nate Silver가 2008년에 만든, 통계와 확률로 정치·스포츠·과학을 해석한다는 컨셉의 사이트였거든요. 미국 대선 결과를 모델로 예측해서 화제가 됐고, 이후 ESPN을 거쳐 ABC News(디즈니 산하)에 인수되며 데이터 저널리즘이라는 장르 자체를 대중화시켰어요. 그런데 ABC News가 FiveThirtyEight의 모든 기사를 웹에서 내려버렸다는 사실이 확인됐어요. 사이트 자체가 통째로 사라진 거예요.
사실 작년에 ABC가 FiveThirtyEight 팀을 해체한다는 소식은 있었어요. 다만 그때까지만 해도 "이미 발행된 기사들은 그대로 남는다"는 게 일반적인 기대였거든요. 그런데 어느 순간부터 도메인을 방문하면 기사들이 사라지고, 검색 결과도 점차 깨지기 시작했어요. 십수 년 동안 쌓아 올린 통계 분석 자료, 인터랙티브 그래픽, 선거 모델 데이터가 한꺼번에 인터넷에서 자취를 감춘 거죠.
이게 왜 큰 문제인가
단순히 "옛날 기사 좀 사라진 것 가지고 호들갑"이라고 생각할 수도 있는데, 그게 그렇지가 않거든요. FiveThirtyEight의 기사들은 그냥 글이 아니라 수년에 걸친 데이터셋과 방법론, 코드, 인터랙티브 차트의 묶음이었어요. 학계 논문에서 인용되는 경우도 많고, 후속 데이터 저널리스트들이 자기 모델을 검증할 때 비교 기준으로 삼던 자료들이에요. 그게 한순간에 무효 링크(404)로 변하면, 거기에 의존하던 수많은 연구와 글의 토대가 무너지는 거죠.
이게 뭐냐면, 링크 부패(link rot)라는 디지털 시대의 고질병이 단일 사건 수준에서 폭발한 사례라고 볼 수 있어요. 인터넷은 "한 번 올라가면 영원하다"고 흔히 말하지만, 실제로는 굉장히 휘발성이 강한 매체거든요. 회사가 인수되거나, 비즈니스 모델이 바뀌거나, 단순히 호스팅 비용이 아까워지면 수년치 콘텐츠가 며칠 만에 사라질 수 있어요. 다행히 Internet Archive의 Wayback Machine에 상당량이 보존돼 있긴 하지만, 인터랙티브 차트나 동적 데이터는 그쪽에서도 완전히 복원되지 않거든요.
데이터 저널리즘이라는 장르의 흔들림
FiveThirtyEight은 단지 한 매체가 아니라 "데이터로 세상을 해석한다"는 직업 자체를 만들어낸 곳이었어요. 이곳에서 일하던 사람들이 The Pudding, The Upshot(뉴욕타임스), The Economist의 데이터팀 같은 곳으로 흩어지면서 업계 전체에 영향을 줬고요. 그 본진이 사라졌다는 건 상징적으로 한 시대의 마침표가 찍힌 셈이에요.
비슷한 일이 최근 미디어 업계 전반에서 반복되고 있어요. Vice의 아카이브 일부가 위태로워졌고, Gawker는 한 차례 사라졌다 돌아왔고, MTV News는 디지털 아카이브 전부를 삭제했어요. 광고 기반 미디어의 수익성 위기가 결국 "옛 기사들의 호스팅 비용"이라는 가장 약한 고리부터 끊고 있는 거죠.
한국 개발자에게 던지는 시사점
첫 번째 교훈은 명백합니다. 중요한 자료는 자기 손에 사본을 두자. 즐겨찾기로 저장해 둔 글, 참고용으로 링크만 걸어 놓은 데이터셋, 회사 위키에 외부 링크로만 연결된 문서들. 이런 게 다 "내일 사라질 수 있는 자산"이거든요. Pocket이나 Raindrop.io 같은 북마크 서비스보다도, 가능하면 PDF나 HTML 로컬 저장, 그리고 데이터셋은 자체 백업이 안전합니다. (참고로 Pocket도 곧 서비스 종료를 발표했죠.)
두 번째는 시스템 설계 차원의 이야기예요. 우리가 만드는 서비스가 링크에 의존하고 있다면, 외부 링크가 깨졌을 때 어떻게 우아하게 실패할지 한 번쯤 고민해 봐야 해요. 사용자 콘텐츠에 외부 URL이 잔뜩 박혀 있는 커뮤니티 서비스라면, Wayback Machine API나 자체 아카이빙 서버를 함께 운영하는 것도 고려해 볼 만하고요.
세 번째, 더 큰 그림에서는 공공성 있는 디지털 자산을 누가 어떻게 보존할 것인가라는 질문이 점점 절박해지고 있어요. 국립중앙도서관의 OASIS 같은 한국의 디지털 아카이브 사업도 있긴 한데, 민간 미디어 아카이브까지 책임지긴 어려운 구조죠. 이 문제에 관심 있는 분이라면 IPFS, Arweave 같은 영구 저장 프로토콜이나 Common Crawl 같은 공공 데이터셋 프로젝트가 흥미로운 출발점이 될 거예요.
정리
"인터넷에 한번 올라간 건 영원하다"는 말은 이제 거의 농담에 가까워요. 우리가 매일 참조하는 자료들은 생각보다 훨씬 약한 기반 위에 서 있거든요. FiveThirtyEight의 퇴장은 그 사실을 다시 한번 일깨워 준 사건이에요.
여러분의 즐겨찾기 폴더에서, 만약 호스팅 회사가 내일 사라진다면 가장 아쉬울 자료는 뭔가요? 그걸 어디에 백업해 두면 좋을지 같이 고민해 봐도 좋을 것 같아요.
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공