
[뉴스스페이스=이종화 기자] 2025년 10월 20일 월요일, 세계 최대 클라우드 서비스 기업 아마존 웹 서비스(Amazon Web Services, 이하 AWS)에서 발생한 대규모 장애가 전 세계 수백개의 웹사이트와 애플리케이션에 심각한 중단 사태를 초래했다.
CNN, CNBC, Reuters, Sky News, BBC, Al Jazeera, Hindustan Times, CBC, Independent, NBC News, Euronews에 따르면, 이번 장애는 미국 버지니아 북부에 위치한 AWS 핵심 데이터 센터인 US-EAST-1 리전에서 동부 표준시로 오전 3시 11분경 처음 발생했으며, Snapchat, Roblox, Fortnite, Duolingo, Ring 초인종 뿐만 아니라 아마존 자체 서비스인 Alexa와 Prime Video까지 광범위한 영향을 받았다.
장애는 빠르게 확산되어 Downdetector 집계 기준으로 장애 신고자가 5만명이 넘었으며, 소셜 미디어, 게임, 금융, 스마트 홈 기기 등 다양한 산업계 플랫폼이 심각한 피해를 입었다.
Coinbase, Venmo, McDonald's 앱, PlayStation Network, 그리고 영국 내 주요 은행인 Lloyds와 Halifax 등 금융 분야에서도 접속불가 현상이 보고되어 전 세계적으로 금융 서비스 안정성에도 큰 균열을 드러냈다.
AWS는 공식 발표를 통해 장애의 원인으로 US-EAST-1 리전에서 DynamoDB API 엔드포인트의 DNS(도메인 네임 시스템) 해석 문제를 지목했다. DynamoDB는 많은 애플리케이션에 데이터베이스 서비스로 작동하는 핵심 서비스로, 이 문제로 인해 연쇄적인 오류율 증가가 발생하면서 다른 서비스들도 대거 영향을 받았다. AWS는 복구를 위한 병렬 경로 작업을 긴급히 진행 중이며, 고객들이 실패한 요청을 재시도할 것을 권고하고 있다.
이번 장애는 인터넷이 특정 클라우드 서비스에 얼마나 집중되어 있으며, 단일 장애가 글로벌 디지털 인프라에 미치는 파급력이 얼마나 큰지를 단적으로 보여준다. AWS는 전 세계 클라우드 인프라 시장의 약 3분의 1을 점유하고 있으며, 지난해 1070억 달러(약 130조원)의 매출을 기록, 아마존 전체 수익의 17%를 차지하는 초대형 사업부다. 따라서 US-EAST-1 리전에서 발생한 이번 장애는 수많은 기업과 이용자의 비즈니스 연속성과 서비스 신뢰도에 중대한 위협을 가했다.
영국의 정부 기관인 HM Revenue & Customs(HMRC)도 이번 사태로 웹 서비스가 중단되는 등 공공 부문에도 적지 않은 영향을 미쳤다. AI 스타트업 퍼플렉시티(Perplexity)의 CEO 아라빈드 스리니바스는 SNS를 통해 “Perplexity가 현재 다운되었으며, 근본 원인은 AWS 문제”라고 확인했고, 코인베이스(Coinbase)도 “모든 자금은 안전하지만 접속 문제는 AWS 장애 때문”이라고 공식 입장을 밝혔다.
사이버 보안 전문가들은 “이번 대규모 장애는 전 세계 인터넷이 한정된 핵심 공급자에 의존하는 취약한 구조임을 다시 한번 경고한다”며 “기업들이 공급망 및 인프라 복원력을 강화해 단일 실패 지점에 대비해야 한다”고 조언했다.
AWS는 10월 20일 오후까지도 복구 작업을 이어가고 있으며, 장애 발생 후 10시간이 경과한 시점에서도 완전 복구에는 시간이 더 소요될 것으로 전망된다. 이번 사건은 글로벌 클라우드 업계의 안정성과 중장기적 리스크 관리에 대한 중요한 경종이 될 전망이다.