[뉴스스페이스=김문균 기자] 앤트로픽이 2월 17일(현지시간) AI 모델 '클로드 소네트 4.6'을 공식 출시하면서, 최상위 '오퍼스급' 성능이 중급 가격대로 내려오는 전례 없는 상황이 펼쳐졌다. 지난 2월 5일 '오퍼스 4.6' 출시 후 불과 2주 만에 발표된 이 모델은, 코딩·컴퓨터 활용·추론·에이전트 등 전반적 AI 역량에서 전작 소네트 4.5를 압도적으로 뛰어넘었을 뿐 아니라, 일부 지표에서는 오퍼스 4.6마저 능가하는 '하극상'을 연출했다.
anthropic.com, mashable, lmcouncil, infoq, officechai에 따르면, 구체적인 벤치마크 수치가 이를 여실히 증명한다. 코딩 능력을 측정하는 'SWE-벤치 베리파이드'에서 소네트 4.6은 79.6%를 기록해, 오퍼스 4.6(80.8%)에 근접하면서도 오픈AI의 GPT-5.2(80.0%)를 바짝 추격했다.
재무 분석 능력을 평가하는 'Finance Agent v1.1'에서는 63.3%로 오퍼스 4.6(60.1%)과 GPT-5.2(59.0%)를 모두 제쳤고, 사무업무 지표인 'GDPval-AA Elo'에서도 1633점으로 오퍼스 4.6(1606점)과 GPT-5.2(1462점)을 상회하며 전 모델 중 최고점을 기록했다.
컴퓨터 활용 능력, 16개월 만에 5배 급등
가장 극적인 도약은 컴퓨터 활용 분야에서 나타났다. 실제 소프트웨어(크롬, 리브레오피스, VS코드 등) 환경에서 AI의 컴퓨터 조작 능력을 측정하는 'OSWorld-Verified' 벤치마크에서, 소네트 4.6은 72.5%를 달성해 전작 소네트 4.5(61.4%)를 크게 웃돌았다. GPT-5.2의 38.2%와 비교하면 거의 두 배에 달하는 수치다. 2024년 10월 클로드 소네트 3.5가 같은 벤치마크에서 14.9%에 불과했던 점을 감안하면, 불과 16개월 만에 점수가 거의 5배로 뛰어오른 셈이다.
앤트로픽은 초기 사용자들이 복잡한 스프레드시트 탐색과 다단계 웹 양식 작성 등에서 이미 인간 수준(human-level)의 작업 능력을 경험하고 있다고 밝혔다 . 보험업계 특화 테스트에서는 94%라는 최고 점수를 기록해, 미션 크리티컬한 업무에서의 활용 가능성을 입증했다.
100만 토큰·동일 가격…기업 고객 겨냥 '가성비 전략'
소네트 4.6의 콘텍스트 윈도(한 번에 처리 가능한 정보량)는 100만 토큰(베타)으로 확장됐다 . 이는 전체 코드베이스, 대규모 법률 문서, 수십 편의 연구논문을 단일 요청으로 처리할 수 있는 규모다. 결정적으로, 기업 고객용 가격은 입력 100만 토큰당 3달러, 출력 100만 토큰당 15달러로 소네트 4.5와 동일하게 유지됐다. 오퍼스급 성능을 소네트 가격에 제공하겠다는 앤트로픽의 전략적 의도가 명확하다.
실제로 클로드 코드(Claude Code)에서 초기 테스트를 진행한 개발자들은 소네트 4.6을 소네트 4.5보다 약 70%의 비율로 선호했으며, 심지어 2025년 11월의 최상위 모델이었던 오퍼스 4.5보다도 59%의 비율로 소네트 4.6을 더 선호했다 . Box는 자체 평가에서 소네트 4.6이 소네트 4.5 대비 복잡한 추론 Q&A에서 15%포인트 향상된 성능을 보였다고 보고했다.
'사스포칼립스' 2라운드…$2,850억 공포 재점화 우려
소네트 4.6 출시의 파급력은 단순한 기술적 업그레이드를 넘어선다. 지난 2월 3일 앤트로픽이 '클로드 코워크(Claude Cowork)' AI 에이전트와 11개 전문 플러그인을 출시했을 때, 글로벌 소프트웨어·IT 서비스 주식에서 약 2,850억 달러(한화 약 413조 원)의 시가총액이 48시간 만에 증발했다.
제프리스(Jefferies) 트레이딩 데스크의 트레이더 제프리 파부자(Jeffrey Favuzza)가 블룸버그에 "우리는 이것을 '사스포칼립스(SaaSpocalypse)', 즉 SaaS 주식의 아포칼립스라고 부른다"고 명명한 이 사태는, AI가 기존 소프트웨어 비즈니스 모델 자체를 위협한다는 시장의 공포를 적나라하게 드러냈다.
당시 피해 현황은 처참했다. 톰슨 로이터스 16~18% 급락, RELX(렉시스넥시스 모기업) 14% 하락, 리걸줌 20% 폭락, 월터스 클루워 13% 하락, 런던증권거래소그룹 8.5~13% 하락을 기록했다. 인도에서는 니프티 IT 지수가 7% 이상 급락하며, 인포시스(-8.36%), TCS(-6~7%), 퍼시스턴트 시스템스·LTI 마인드트리(-8%), HCL 테크·위프로(-5~6%)가 일제히 무너졌다. 골드만삭스의 미국 소프트웨어 주식 바스켓은 2025년 4월 관세 충격 이후 최대 하루 낙폭을 기록했고, JP모건 애널리스트들은 이 섹터가 "재판도 받기 전에 선고를 받고 있다"고 경고했다.
핵심은 '좌석당 과금' 모델의 종말
사스포칼립스의 본질적 공포는 AI 에이전트가 인간 직원의 소프트웨어 사용 자체를 대체할 수 있다는 데 있다. 기존 SaaS 기업들은 '좌석당 과금(per-seat pricing)' 모델로 수익을 올려왔는데, AI가 업무를 수행하면 기업이 구매해야 할 소프트웨어 라이선스 수 자체가 줄어든다는 구조적 위협이 부각된 것이다. 오르투스 어드바이저스의 앤드류 잭슨은 "AI가 전통적인 워크플로 종속형 SaaS 제품을 완전히 대체할 잠재력을 갖고 있다"고 진단했다.
이전에는 오퍼스급 모델에서만 가능했던 고난이도 업무가 소네트 4.6이라는 저렴한 가격대에서도 실현 가능해지면서, '사스포칼립스' 우려는 2라운드로 접어들 전망이다. 기업 입장에서 5,000석이 필요하던 소프트웨어 라이선스가 500석 이하로 줄어들 수 있다는 전망까지 나오는 상황에서, 소네트 4.6은 그 전환을 가속화할 촉매제가 될 수 있다.
2026년은 AI가 '생산성 도구'에서 '대체 엔진'으로 전환하는 원년이라는 평가가 잇따르고 있다. 소네트 4.6의 등장은 그 전환이 더 이상 프리미엄 가격표 뒤에 숨어 있지 않다는 것을 의미한다. 월 100~200달러 수준의 구독료로 법률 검토, 재무 분석, 영업 파이프라인 관리, 컴플라이언스 워크플로까지 자동화할 수 있는 시대가 열린 것이다. 전통적 SaaS 기업들에게 남은 해자(moat)는 더 이상 UI나 기능 수가 아닌, '고유 데이터와 유통 채널'이라는 냉정한 현실이 소네트 4.6 한 장의 카드로 다시 한번 확인됐다.























































