
1조 블록의 디지털 고고학
혹시 마인크래프트의 "2B2T" 서버를 들어보셨나요? "2 Builders 2 Tools"의 약자인데, 마인크래프트 세계에서 가장 오래되고 가장 무법지대인 서버로 유명해요. 2010년에 시작돼서 지금까지 한 번도 리셋된 적이 없어요. 규칙도, 운영진의 개입도 거의 없어서 "인터넷의 야생"이라고 불려요. 이 서버에서 최근 엄청난 프로젝트가 공개됐어요. 세계 지도 전체를 다운로드해서 분석하고 공개한 것이에요.
그 규모가 황당해요. 가로세로 각 102만 4천 블록, 그러니까 약 1조 개(1,024,000²)의 블록 영역이에요. 마인크래프트 블록 하나가 1미터라고 치면, 한 변이 1,024킬로미터죠. 서울에서 부산이 약 400km니까 그것의 두 배 반이에요. 면적으로 따지면 약 100만 제곱킬로미터. 한반도 전체의 4~5배 크기예요. 이걸 디지털로 통째로 백업하고 분석한 거예요.
어떻게 이런 게 가능했을까
이게 뭐냐면, 마인크래프트 서버는 플레이어가 가본 적 있는 "청크(chunk)"라는 16x16 단위 영역만 디스크에 저장해요. 가본 적 없는 곳은 그때그때 절차적으로 생성되거든요. 그러니까 2B2T 같은 오래된 서버의 "진짜 세계"는, 16년 동안 수많은 플레이어가 탐험하면서 만들어진 흔적들의 집합이에요. 누군가 만든 거대한 건축물, 폭파된 도시, 끝없이 이어진 "하이웨이"라고 불리는 채광 통로 같은 것들이요.
이걸 다운받으려면 보통은 한 명이 직접 그 영역을 다 돌아다녀야 해요. 그런데 1조 블록을 돌아다닌다는 건 사람 평생 걸려도 못 끝낼 일이죠. 그래서 이 팀은 분산된 봇 네트워크를 만들었어요. 수백 명의 자원 봉사자들이 자기 컴퓨터에서 자동화 봇을 돌려서 각자 다른 영역을 탐험하게 한 거예요. 그렇게 수집한 청크 데이터를 한곳에 모아서 거대한 지도로 합친 거죠.
결과물의 용량도 어마어마해요. 압축된 형태로도 수 테라바이트(TB)에 달해요. 그래서 일반인이 받기 쉽도록 토렌트(BitTorrent)로 배포하고 있어요. 또 핵심 부분만 모은 "하이라이트 팩"도 따로 제공하더라고요. 이 데이터를 가지고 누구든 자기 컴퓨터에서 2B2T의 역사적 건축물들을 탐험할 수 있게 됐어요.
흥미로운 발견들
이 다운로드 프로젝트의 진짜 가치는 데이터 자체보다 그 안에서 발견된 것들에 있어요. 16년 동안 아무도 못 봤던 영역에 누군가 몰래 지어놓은 거대 도시들이 나오고요. 한 변이 수만 블록에 달하는 사각형 패턴, 누군가 디스크 용량을 일부러 늘리려고 일부러 노출시킨 "청크 폭탄" 같은 흔적도 발견됐어요.
특히 흥미로운 건 하이웨이 시스템이에요. 2B2T에는 동서남북 4방향으로 끝없이 이어지는 채굴된 통로가 있어요. 16년간 플레이어들이 자원을 약탈하러 외곽으로 나가면서 만든 길이죠. 이 하이웨이를 따라가다 보면 수십만 블록 떨어진 곳에 또 다른 "문명"이 발견되곤 해요. 디지털판 실크로드 같은 셈이에요. 이번 다운로드 덕분에 이 하이웨이 네트워크 전체가 처음으로 시각화됐어요.
또 인공지능이나 데이터 분석에도 활용 가능성이 있어요. "인간 집단이 16년 동안 가상 세계에서 어떤 패턴으로 영역을 확장하는가"라는, 사회학적으로도 의미 있는 데이터셋이거든요. 게임 데이터지만 실제로는 인간 행동의 거대한 로그인 셈이에요.
비슷한 디지털 보존 프로젝트들과 비교
게임 세계를 통째로 보존하는 시도는 이번이 처음은 아니에요. 인터넷 아카이브(Internet Archive)는 옛날 웹사이트를 보존하고, 게임 보존 협회들은 1980~90년대 아케이드 게임을 에뮬레이션 형태로 남겨요. 그런데 마인크래프트처럼 사용자 생성 콘텐츠가 곧 세계 그 자체인 게임의 보존은 본질적으로 달라요. 화면이나 코드만 남겨서는 의미가 없거든요. 그 안의 모든 블록 배치, 모든 흔적이 함께 보존돼야 해요.
이 점에서 2B2T 1M 프로젝트는 "디지털 고고학"의 새로운 형태예요. 실제 고고학자들이 도시의 지층을 파헤치듯이, 이 사람들은 마인크래프트의 청크 파일을 파헤쳐서 "가장 오래된 디지털 문명" 중 하나의 역사를 복원하는 거예요. 비슷한 시도로는 "세컨드라이프(Second Life)"의 초기 영역 보존 프로젝트가 있었지만, 규모나 체계성에서 이번 작업이 훨씬 야심차요.
한국 개발자에게 주는 시사점
게임을 안 만드는 분들에게도 이 프로젝트는 시사하는 바가 커요. 일단 분산 데이터 수집의 실전 사례로 보면, 수백 대의 클라이언트가 동시에 다른 영역을 탐색하고 그 결과를 중앙에 모으는 아키텍처는 크롤러 시스템이나 분산 ETL 파이프라인과 본질적으로 같아요. 코디네이션 문제, 중복 작업 방지, 데이터 무결성 검증 같은 이슈가 똑같이 등장하거든요.
또 장기간 누적된 데이터의 가치도 생각해볼 만해요. 우리가 만드는 서비스도 시간이 쌓일수록 그 안의 데이터가 곧 자산이 돼요. 카카오톡의 대화 기록이나 네이버 카페의 게시글이 그렇잖아요. 그런데 우리는 그걸 "백업 가능한 형태로" 잘 보존하고 있나요? 서비스가 종료될 때 그 안의 디지털 유산은 어떻게 될까요? 2B2T 프로젝트는 "누군가는 결국 이 데이터를 구하려고 한다"는 걸 보여줘요.
마무리
게임 안의 가상 토지 1조 블록을 백업한다는 건 누가 봐도 쓸데없는 일 같지만, 그 안에 16년의 디지털 문명사가 담겨 있다고 보면 이야기가 달라져요. 여러분이 운영하거나 만드는 서비스가 10년 뒤 사라질 때, 그 안의 데이터는 누구에게 어떤 의미로 남을까요?
🔗 출처: Hacker News
TTJ 코딩클래스 정규반
월급 외 수입,
코딩으로 만들 수 있습니다
17가지 수익 모델을 직접 실습하고, 1,300만원 상당의 자동화 도구와 소스코드를 받아가세요.
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공