[뉴스스페이스=김정영 기자] 익명의 글로벌 기업이 한 달 만에 앤트로픽(Anthropic)의 클로드(Claude) AI 사용료로 5억달러(약 6,800억원)에 달하는 청구서를 받았다는 보도가 나왔다. 전 세계 기업의 생성형 AI 도입이 비용 통제 없는 ‘토큰 전쟁’으로 치닫고 있다는 경고음이 커지고 있다.
5월 28일(현지시간) 액시오스(Axios)에 이 사실을 전달한 AI 컨설턴트는 “조직 차원의 지출 한도와 사용량 통제가 사실상 전무한 상태에서 수천명의 직원이 클로드를 무제한으로 사용한 결과”라고 설명했다. 다만 이 사례는 한 명의 컨설턴트와 익명 고객 증언에 근거한 ‘보고된 사례(reported anecdote)’로, 독립적인 추가 검증은 아직 이뤄지지 않았다.
무엇이 어떻게 잘못됐나…‘무제한’과 ‘토큰맥싱’의 치명적 조합
해당 기업은 클로드를 전사(全社) 도입하면서 직원별 사용 한도, 부서별 예산 캡(cap), 실시간 비용 모니터링 대시보드, 과다 사용 알림(Alert) 시스템 등 기본적인 재무·IT 거버넌스 장치를 거의 마련하지 않은 것으로 알려졌다. AI 코딩 에이전트, 오토파일럿 방식의 에이전틱(agentic) 워크플로우처럼 토큰 소비가 큰 기능들이 인기 워크플로우로 자리 잡았지만, 경영진 누구도 “이 사용량이 얼마짜리 청구서로 돌아올지”를 추적하지 않았던 셈이다.
기업 고객은 클라우드 기반 생성형 AI 도구에 대해 ‘월 구독’이 아닌 ‘토큰 사용량 기반 종량제(metered)’로 비용을 지불하는 구조가 일반적이다. 문제는 단일 챗봇 질의·응답보다, 여러 단계를 자동으로 수행하는 에이전틱 파이프라인이 최대 1,000배까지 더 많은 토큰을 먹어치울 수 있다는 점이다.
정보기술 매체 인포월드(InfoWorld)가 전한 독일 IT 매체 c’t 3003의 테스트에 따르면, 클로드의 상위 모델(Opus) 기반 에이전트 프레임워크 ‘OpenClaw’를 하루 사용하는 데만 109.55달러 상당의 토큰이 소요됐고, 앤트로픽 자체 벤치마크에서도 전문 개발자 1인의 클로드 코드(Claude Code) 평균 일일 비용은 6달러, 상위 10%는 12달러를 웃도는 것으로 나타났다. 이런 구조에서 수천명이 에이전틱 워크플로우를 아무 제약 없이 돌리면, 한 달 누적 비용이 기하급수적으로 늘어나는 것은 시간문제였다.
이 사건을 계기로 IT 업계에서 새로 회자되는 용어가 바로 ‘토큰맥싱(tokenmaxxing)’이다. 토큰맥싱은 “실질적인 비즈니스 성과와 무관하게, AI 토큰 소비량을 생산성 또는 디지털 혁신의 상징처럼 과시하는 행태”를 의미하며, 일부 빅테크 내부에서도 사용량 리더보드 경쟁을 부추기면서 나타난 부작용으로 지적되고 있다. 결국 이 미확인 기업은 토큰맥싱과 비용 거버넌스 부재가 결합된 ‘최악의 케이스 스터디’로 남게 됐다.
숫자가 말하는 AI 지출 빅뱅…2.59조달러 시장과 예측 실패
이번 5억달러 청구서 사건은 개별 기업의 황당한 해프닝을 넘어, 글로벌 AI 인프라 지출이 어디까지 치솟고 있는지를 상징적으로 보여주는 사례로 받아들여지고 있다. 가트너(Gartner)는 최근 보고서에서 2026년 전 세계 AI 관련 지출이 2조 5,900억달러에 달해 1년 전 대비 47% 급증할 것이라고 전망했다. 이 중 절반 가까운 1조 4,300억달러가 AI 인프라 분야에서 발생하며, 2027년에는 1조 8,900억달러 수준까지 늘어날 것이라는 분석도 내놓았다.
더 큰 문제는 기업들의 ‘예측 실패’다. 여러 AI 비용 거버넌스 연구에 따르면 전 세계 기업의 약 80~85%가 AI 인프라 비용을 25% 이상 과소 혹은 과대 추정하고 있는 것으로 나타났다. 특히 생성형 AI와 에이전틱 워크플로우가 동시에 확산되는 상황에서, 토큰 단가·모델 버전·에이전트 구조에 따른 비용 민감도가 높아졌지만, 전통적인 IT 예산 프로세스는 이를 따라가지 못하고 있다는 지적이 잇따른다.
이미 빅테크 내부에서도 경고등은 켜져 있다. 인도 비즈니스투데이(Business Today)와 인디아투데이(India Today)는 마이크로소프트가 엔지니어 1인당 월 500~2,000달러까지 치솟은 클로드 코드 라이선스 비용을 문제 삼아 내부 사용 규모를 축소했으며, 아마존에서는 일부 직원들이 AI 사용량 리더보드 상위를 차지하기 위해 토큰 소비를 과장했다가 적발된 사례도 있었다고 전했다.
이는 ‘토큰 소비량’과 ‘실제 생산성’ 사이에 상당한 괴리가 존재하며, 사용량을 KPI처럼 포장하는 문화가 오히려 비용 통제 실패를 부르는 구조적 문제임을 시사한다.
거버넌스 공백…“측정하지 않으면 관리할 수 없다”
이번 사건을 계기로 AI 컨설턴트와 분석가들이 입을 모아 지적하는 부분은 “AI에는 다른 IT·설비 투자와 같은 수준의 재무 통제가 적용되고 있지 않다”는 점이다. CFOtech와 IT Brief 등이 전한 가트너 분석에 따르면, 향후 수년간 AI 인프라 지출의 중심은 생성형 AI와 에이전틱 워크플로우를 처리하는 ‘AI 최적화 서버’와 대규모 클러스터로 이동할 전망이며, 클라우드 서비스 사업자와 대형 벤더의 투자 경쟁이 지속될 가능성이 크다.
그러나 기업 내부에서는 이러한 거대 인프라 위에서 돌아가는 에이전트·모델·애플리케이션 레이어에 대한 세밀한 코스트 가시성(cost visibility)과 책임체계가 여전히 미흡하다는 평가다.
업계 전문가들이 제안하는 대응 방향은 비교적 명확하다. 첫째, 실시간 비용 대시보드와 부서·사용자·에이전트 단위의 세분화된 사용량 추적을 구축해, 토큰 소비를 ‘보이는 비용’으로 만들어야 한다는 것이다. 둘째, 프로젝트별·모델별 ROI 기반 예산 심사와 사전 지출 승인 절차를 마련해, “실험”과 “확대 배포” 단계의 비용 구조를 구분해야 한다. 셋째, 토큰맥싱을 조장하는 사용량 리더보드나 ‘많이 쓰는 사람이 우수 사용자’라는 인식 대신, 실제 비즈니스 성과와 연동된 KPI 체계를 도입해 AI 사용 문화를 재설계해야 한다는 목소리가 커지고 있다.
무엇보다도 이번 5억달러 청구서 사례는 “AI 지출이 더 이상 실험실의 소액 비용이 아니라, 단일 프로젝트만으로도 기업 손익계산서를 흔들 수 있는 수준의 ‘본격적인 자본 지출’ 단계에 진입했다”는 사실을 각인시킨다. 아직 이 익명 기업이 실제로 5억달러 전액을 지불했는지, 앤트로픽과의 협상을 통해 일부를 조정했는지는 알려지지 않았다.
그럼에도 한 달 만에 반기 실적급 비용이 쏟아져 나온 이 사건은, 국내외 기업들이 생성형 AI 도입을 추진하면서 반드시 참고해야 할 '비용 거버넌스 악몽'의 전조로 읽힌다.























































