2025.12.31 (수)

  • 맑음동두천 -7.7℃
  • 구름조금강릉 -2.3℃
  • 맑음서울 -5.6℃
  • 맑음대전 -4.8℃
  • 구름많음대구 -1.2℃
  • 구름많음울산 -0.9℃
  • 맑음광주 -2.2℃
  • 맑음부산 0.0℃
  • 구름조금고창 -3.2℃
  • 흐림제주 2.6℃
  • 맑음강화 -7.3℃
  • 맑음보은 -5.3℃
  • 맑음금산 -4.0℃
  • 맑음강진군 -1.7℃
  • 구름많음경주시 -1.3℃
  • 맑음거제 1.2℃
기상청 제공

빅테크

[빅테크칼럼] 30시간 연속 자율코딩 가능한 AI 나왔다…앤트로픽 Claude Sonnet 4.5 출시 “세계 최고 코딩 모델”

 

[뉴스스페이스=김정영 기자] 앤트로픽이 2025년 9월 29일(현지시간) 공개한 최신 인공지능 모델 Claude Sonnet 4.5는 최대 30시간 이상 연속 자율 코딩이 가능한 혁신적 AI로 평가받고 있다.

 

이는 기존 모델인 Claude Opus 4가 약 7시간 연속 작업할 수 있었던 것에 비해 네 배 이상 늘어난 수치로, AI가 복잡한 다단계 프로젝트를 장시간에 걸쳐 안정적으로 수행할 수 있다는 점에서 큰 진전을 의미한다.

 

앤트로픽 공식 블로그, VentureBeat, CNBC, Los Angeles Times, TechRadar, GeekNews에 따르면, 앤트로픽은 이 모델이 실제 소프트웨어 엔지니어링 과제를 평가하는 SWE-Bench Verified 시험에서 77.2%라는 최고 점수를 기록했다고 밝혔다.

 

이 시험은 AI가 실제 프로그래밍 도전 과제를 해결하는 능력을 종합적으로 측정하는 엄격한 평가제로, Claude Sonnet 4.5는 10차례 평가 평균을 기준으로 이 같은 높은 점수를 획득했다. 특히, 내부 테스트에서는 약 1만1000줄에 달하는 전체 채팅 어플리케이션 코드를 일관성 있게 자율 생성해냈다.

 

앤트로픽의 신모델은 SWE-Bench뿐만 아니라 OSWorld 벤치마크에서도 61.4%의 성과로, 4개월 전 모델인 Sonnet 4의 42.2% 대비 약 20%포인트 상승하는 등 장기간 컴퓨터 인터랙션 작업에서도 우수한 능력을 입증했다. 이는 AI가 복잡한 사용자 인터페이스 조작, 문서 작성, 스프레드시트 편집 등 실무 중심의 작업을 안정적으로 수행할 수 있음을 보여준다.

 

개발자 기능 측면에서도 Claude Sonnet 4.5는 눈에 띄는 개선을 선보인다. 새로 도입된 Claude Code 체크포인트 기능을 통해 개발자는 작업 진행 상황을 저장하고 원하는 시점으로 롤백할 수 있어, 장시간 대규모 개발 프로젝트에서 효율성을 높였다. 또한, 대화 내에서 코드 실행은 물론 스프레드시트, 프레젠테이션 파일, 문서 작성까지 가능해 일체화된 작업 환경을 구현한다.

 

VS Code 확장과 Claude API의 메모리 관리 기능도 강화되어 복잡한 애플리케이션 개발에 적합하다. 이러한 기능들은 사용자의 편의성과 생산성을 크게 향상시키는 요소로 평가받는다.

 

안전성과 윤리적 정렬(Alignment) 측면에서 Claude Sonnet 4.5는 앤트로픽의 최첨단 모델로, 아첨이나 기만, 권력 추구 같은 문제 행동이 상당히 줄었으며, 특히 악의적 입력에 의한 프롬프트 인젝션 공격 방어력이 강화됐다. 앤트로픽은 AI 모델의 사회적 책임을 중시하며 AI Safety Level 3(ASL-3) 보호 체계 하에 이 모델을 배포해, 화학·생물학·방사능·핵무기 관련 위험 콘텐츠를 탐지하는 필터 시스템을 적극 운영 중이다.

 

또한, 개발자들이 독자적인 자율 에이전트를 구축할 수 있도록 메모리 관리, 권한 처리, 다중 서브에이전트 조정을 지원하는 Claude Agent SDK도 공개했다. 이는 실사용 분야에서 신뢰성과 안정성을 보장하는 첨단 인프라라 할 수 있다.

 

앤트로픽은 이 모델을 통해 기존 보조형 AI에서 협업자 수준, 나아가 완전 자율 에이전트 단계로 진화했다고 강조한다. 30시간 연속 코딩이라는 성과는 AI가 소프트웨어 개발자 및 연구자들의 생산성을 극대화하는 디지털 파트너로서 자리매김할 가능성을 분명히 보여준다.

 

앤트로픽의 공동창업자 Jared Kaplan은 Sonnet 4.5가 모든 면에서 이전 버전보다 뛰어나며, 올해 중 더 진화된 Opus 후속 모델 출시도 예고하고 있다.

 

결국 Claude Sonnet 4.5는 실제 산업 현장에서 활용 가능한 최고 수준의 코딩 AI로서, 장시간 집중력과 정확성, 그리고 안전하고 효율적인 개발 지원이라는 세 마리 토끼를 모두 잡으며 AI 소프트웨어 생태계에 새로운 지평을 열고 있다.

배너
배너
배너

관련기사

34건의 관련기사 더보기


[이슈&논란] 챗GPT 미인으로 꼬시고 머스크로 속였다…캄보디아 19억 '로맨틱 피싱 조직' 적발

[뉴스스페이스=윤슬 기자] 캄보디아 포이펫 지역을 거점으로 로맨스 스캠과 가짜 스페이스X 투자 사기를 결합해 약 19억3000만원을 편취한 보이스피싱 조직이 서울동부지검 보이스피싱 범죄 정부합동수사단에 적발됐다. 중국인 총책 지휘 아래 한국인 조직원 20명이 활동한 이 단체는 13명을 기소했으며, 이 중 11명이 구속 상태로 재판에 넘겨졌다. 치밀한 '하이브리드' 사기 수법 조직원들은 챗GPT를 활용해 재력 있는 젊은 여성으로 위장, 피해자들에게 접근해 환심을 산 뒤 일론 머스크의 스페이스X 투자로 '대박 수익'을 약속하며 가짜 앱 설치와 투자금을 유인했다. 피해자 신뢰를 쌓기 위해 가상 신상정보, 사진, 대화 대본을 미리 준비하고, 상담팀을 '채터'(메신저)와 '텔레마케터'(전화)로 분담 운영했다. 범죄수익은 달러나 테더코인(USDT)으로 지급받아 원화로 환전, 철저히 분배했다. ​ 포이펫 '태자단지'의 어두운 실체 캄보디아-태국 국경 포이펫의 철조망 둘러싸인 '태자단지' 콜센터에서 활동한 이 조직은 지난해 12월부터 올해 10월까지 19억3000만원 규모 피해를 냈다. 유사 캄보디아 사기단은 로맨스 스캠으로만 16억원(36명 피해, 최대 2억1000만원)