[빅테크칼럼] 30시간 연속 자율코딩 가능한 AI 나왔다…앤트로픽 Claude Sonnet 4.5 출시 “세계 최고 코딩 모델”

[뉴스스페이스=김정영 기자] 앤트로픽이 2025년 9월 29일(현지시간) 공개한 최신 인공지능 모델 Claude Sonnet 4.5는 최대 30시간 이상 연속 자율 코딩이 가능한 혁신적 AI로 평가받고 있다.

이는 기존 모델인 Claude Opus 4가 약 7시간 연속 작업할 수 있었던 것에 비해 네 배 이상 늘어난 수치로, AI가 복잡한 다단계 프로젝트를 장시간에 걸쳐 안정적으로 수행할 수 있다는 점에서 큰 진전을 의미한다.

앤트로픽 공식 블로그, VentureBeat, CNBC, Los Angeles Times, TechRadar, GeekNews에 따르면, 앤트로픽은 이 모델이 실제 소프트웨어 엔지니어링 과제를 평가하는 SWE-Bench Verified 시험에서 77.2%라는 최고 점수를 기록했다고 밝혔다.

이 시험은 AI가 실제 프로그래밍 도전 과제를 해결하는 능력을 종합적으로 측정하는 엄격한 평가제로, Claude Sonnet 4.5는 10차례 평가 평균을 기준으로 이 같은 높은 점수를 획득했다. 특히, 내부 테스트에서는 약 1만1000줄에 달하는 전체 채팅 어플리케이션 코드를 일관성 있게 자율 생성해냈다.

앤트로픽의 신모델은 SWE-Bench뿐만 아니라 OSWorld 벤치마크에서도 61.4%의 성과로, 4개월 전 모델인 Sonnet 4의 42.2% 대비 약 20%포인트 상승하는 등 장기간 컴퓨터 인터랙션 작업에서도 우수한 능력을 입증했다. 이는 AI가 복잡한 사용자 인터페이스 조작, 문서 작성, 스프레드시트 편집 등 실무 중심의 작업을 안정적으로 수행할 수 있음을 보여준다.

개발자 기능 측면에서도 Claude Sonnet 4.5는 눈에 띄는 개선을 선보인다. 새로 도입된 Claude Code 체크포인트 기능을 통해 개발자는 작업 진행 상황을 저장하고 원하는 시점으로 롤백할 수 있어, 장시간 대규모 개발 프로젝트에서 효율성을 높였다. 또한, 대화 내에서 코드 실행은 물론 스프레드시트, 프레젠테이션 파일, 문서 작성까지 가능해 일체화된 작업 환경을 구현한다.

VS Code 확장과 Claude API의 메모리 관리 기능도 강화되어 복잡한 애플리케이션 개발에 적합하다. 이러한 기능들은 사용자의 편의성과 생산성을 크게 향상시키는 요소로 평가받는다.

안전성과 윤리적 정렬(Alignment) 측면에서 Claude Sonnet 4.5는 앤트로픽의 최첨단 모델로, 아첨이나 기만, 권력 추구 같은 문제 행동이 상당히 줄었으며, 특히 악의적 입력에 의한 프롬프트 인젝션 공격 방어력이 강화됐다. 앤트로픽은 AI 모델의 사회적 책임을 중시하며 AI Safety Level 3(ASL-3) 보호 체계 하에 이 모델을 배포해, 화학·생물학·방사능·핵무기 관련 위험 콘텐츠를 탐지하는 필터 시스템을 적극 운영 중이다.

또한, 개발자들이 독자적인 자율 에이전트를 구축할 수 있도록 메모리 관리, 권한 처리, 다중 서브에이전트 조정을 지원하는 Claude Agent SDK도 공개했다. 이는 실사용 분야에서 신뢰성과 안정성을 보장하는 첨단 인프라라 할 수 있다.

앤트로픽은 이 모델을 통해 기존 보조형 AI에서 협업자 수준, 나아가 완전 자율 에이전트 단계로 진화했다고 강조한다. 30시간 연속 코딩이라는 성과는 AI가 소프트웨어 개발자 및 연구자들의 생산성을 극대화하는 디지털 파트너로서 자리매김할 가능성을 분명히 보여준다.

앤트로픽의 공동창업자 Jared Kaplan은 Sonnet 4.5가 모든 면에서 이전 버전보다 뛰어나며, 올해 중 더 진화된 Opus 후속 모델 출시도 예고하고 있다.

결국 Claude Sonnet 4.5는 실제 산업 현장에서 활용 가능한 최고 수준의 코딩 AI로서, 장시간 집중력과 정확성, 그리고 안전하고 효율적인 개발 지원이라는 세 마리 토끼를 모두 잡으며 AI 소프트웨어 생태계에 새로운 지평을 열고 있다.