
Azure에서 직접 일했던 엔지니어의 내부 이야기
마이크로소프트 Azure에서 Core 엔지니어로 일했던 사람이 "Azure의 신뢰를 갉아먹은 결정들"이라는 제목의 글을 공개했어요. 클라우드 시장에서 AWS, GCP와 치열하게 경쟁하고 있는 Azure가 내부에서는 어떤 문제를 겪고 있었는지, 현장의 시각에서 풀어낸 글이에요.
클라우드 인프라를 쓰는 개발자라면, 특히 Azure를 쓰고 있거나 도입을 검토 중인 팀이라면 꼭 읽어볼 만한 내용이에요.
어떤 결정들이 문제였을까요?
글의 핵심은 기술적 우수성보다 단기적인 비즈니스 지표를 우선시하는 의사결정이 반복되면서, 결과적으로 플랫폼의 신뢰성과 개발자 경험이 희생됐다는 거예요.
구체적으로 어떤 이야기가 나오냐면, Azure 내부에서 새로운 서비스를 빠르게 출시하는 데만 집중하다 보니, 기존 서비스의 안정성이나 운영 품질이 뒷전으로 밀렸다는 거예요. 이게 뭐냐면, 마케팅에서 "우리도 이런 서비스 있어요"라고 말할 수 있는 체크리스트를 채우는 데 급급한 나머지, 각 서비스의 완성도가 떨어졌다는 뜻이에요. 기능은 있는데 안정적으로 쓸 수 없는 상태, 개발자라면 이게 얼마나 답답한 상황인지 아실 거예요.
또 하나 중요한 포인트는 엔지니어링 문화의 변화예요. 기술 부채를 갚거나 인프라를 개선하는 작업이 승진이나 성과 평가에 제대로 반영되지 않으면서, 엔지니어들이 "보이는 성과"를 만드는 새 기능 개발에만 몰리게 됐다는 거예요. 이건 많은 테크 기업에서 공통적으로 나타나는 문제이기도 해요. 기술 부채(technical debt)는 당장은 티가 안 나지만, 쌓이면 시스템 전체의 안정성을 위협하거든요.
서비스 간의 일관성 부족도 지적됐어요. Azure에는 수백 개의 서비스가 있는데, 각 팀이 독립적으로 움직이다 보니 API 디자인, 문서 품질, 에러 처리 방식 등이 서비스마다 제각각이라는 거예요. AWS도 비슷한 문제가 있긴 하지만, Azure가 특히 이 부분에서 개발자 불만이 많았다는 게 내부자의 시각이에요.
AWS, GCP와 비교해서 보면
클라우드 3대장 중에서 Azure의 포지셔닝은 독특해요. AWS가 가장 넓은 서비스 포트폴리오와 시장 점유율을 가지고 있고, GCP는 데이터/ML 영역에서 기술적 강점을 어필하고 있죠. Azure는 전통적으로 엔터프라이즈 시장, 특히 이미 Microsoft 생태계(Windows Server, Active Directory, Office 365 등)를 쓰고 있는 기업을 타겟으로 성장해왔어요.
이 전략 자체는 성공적이었어요. 엔터프라이즈 계약으로 매출이 꾸준히 성장했으니까요. 하지만 글쓴이는 이게 양날의 검이었다고 말해요. 엔터프라이즈 영업 중심으로 움직이다 보니, 개발자 경험(DX)에 대한 투자가 상대적으로 부족했다는 거예요. AWS가 개발자 커뮤니티를 꾸준히 키워온 것과 대조적이죠.
최근 Azure의 장애 사례들도 이 맥락에서 이해할 수 있어요. 인프라가 빠르게 확장되는데, 그 확장을 뒷받침할 엔지니어링 역량과 문화가 같은 속도로 따라가지 못한 거예요.
한국 개발자에게 주는 시사점
한국에서 Azure를 쓰는 팀이 꽤 많아요. 특히 대기업이나 공공 부문에서 Microsoft EA(Enterprise Agreement) 계약을 통해 Azure를 쓰는 경우가 많죠. 이런 환경에서 일하는 개발자라면, 이 글에서 언급된 문제들이 실제로 체감되는지 점검해볼 필요가 있어요.
클라우드 벤더를 선택할 때 단순히 기능 목록만 비교하는 게 아니라, 운영 안정성, 문서 품질, 장애 대응 투명성 같은 요소를 같이 봐야 한다는 교훈도 있어요. 기능은 있는데 신뢰성이 낮으면 오히려 운영 부담이 더 커지거든요.
더 넓게 보면, 이 글이 담고 있는 "기술 부채를 무시하고 새 기능만 쫓으면 결국 플랫폼 전체의 신뢰가 무너진다"는 메시지는 클라우드뿐 아니라 모든 소프트웨어 프로젝트에 적용되는 이야기예요. 여러분의 팀에서도 기술 부채 관리와 신규 기능 개발 사이의 균형을 어떻게 잡고 있는지 돌아볼 좋은 기회가 될 수 있어요.
정리하면
내부자의 시각에서 본 Azure의 문제는 결국 "비즈니스 지표 중심의 의사결정이 엔지니어링 품질을 잠식한 것"으로 요약돼요. 이건 특정 회사만의 문제가 아니라, 빠르게 성장하는 모든 기술 조직이 마주하는 딜레마이기도 하고요.
여러분의 팀에서는 기술 부채를 어떻게 관리하고 있나요? 새 기능 개발과 안정성 확보 사이에서 어떤 기준으로 우선순위를 정하시나요?
🔗 출처: Hacker News
TTJ 코딩클래스 정규반
월급 외 수입,
코딩으로 만들 수 있습니다
17가지 수익 모델을 직접 실습하고, 1,300만원 상당의 자동화 도구와 소스코드를 받아가세요.
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공