2025.10.01 (수)

  • 맑음동두천 25.8℃
  • 구름조금강릉 27.3℃
  • 맑음서울 26.6℃
  • 구름많음대전 25.0℃
  • 흐림대구 22.6℃
  • 흐림울산 23.8℃
  • 구름많음광주 24.8℃
  • 흐림부산 27.2℃
  • 구름조금고창 25.2℃
  • 제주 24.5℃
  • 맑음강화 25.7℃
  • 구름많음보은 24.4℃
  • 구름많음금산 25.9℃
  • 구름많음강진군 26.3℃
  • 흐림경주시 22.1℃
  • 구름많음거제 25.3℃
기상청 제공

빅테크

[빅테크칼럼] 30시간 연속 자율코딩 가능한 AI 나왔다…앤트로픽 Claude Sonnet 4.5 출시 “세계 최고 코딩 모델”

 

[뉴스스페이스=김정영 기자] 앤트로픽이 2025년 9월 29일(현지시간) 공개한 최신 인공지능 모델 Claude Sonnet 4.5는 최대 30시간 이상 연속 자율 코딩이 가능한 혁신적 AI로 평가받고 있다.

 

이는 기존 모델인 Claude Opus 4가 약 7시간 연속 작업할 수 있었던 것에 비해 네 배 이상 늘어난 수치로, AI가 복잡한 다단계 프로젝트를 장시간에 걸쳐 안정적으로 수행할 수 있다는 점에서 큰 진전을 의미한다.

 

앤트로픽 공식 블로그, VentureBeat, CNBC, Los Angeles Times, TechRadar, GeekNews에 따르면, 앤트로픽은 이 모델이 실제 소프트웨어 엔지니어링 과제를 평가하는 SWE-Bench Verified 시험에서 77.2%라는 최고 점수를 기록했다고 밝혔다.

 

이 시험은 AI가 실제 프로그래밍 도전 과제를 해결하는 능력을 종합적으로 측정하는 엄격한 평가제로, Claude Sonnet 4.5는 10차례 평가 평균을 기준으로 이 같은 높은 점수를 획득했다. 특히, 내부 테스트에서는 약 1만1000줄에 달하는 전체 채팅 어플리케이션 코드를 일관성 있게 자율 생성해냈다.

 

앤트로픽의 신모델은 SWE-Bench뿐만 아니라 OSWorld 벤치마크에서도 61.4%의 성과로, 4개월 전 모델인 Sonnet 4의 42.2% 대비 약 20%포인트 상승하는 등 장기간 컴퓨터 인터랙션 작업에서도 우수한 능력을 입증했다. 이는 AI가 복잡한 사용자 인터페이스 조작, 문서 작성, 스프레드시트 편집 등 실무 중심의 작업을 안정적으로 수행할 수 있음을 보여준다.

 

개발자 기능 측면에서도 Claude Sonnet 4.5는 눈에 띄는 개선을 선보인다. 새로 도입된 Claude Code 체크포인트 기능을 통해 개발자는 작업 진행 상황을 저장하고 원하는 시점으로 롤백할 수 있어, 장시간 대규모 개발 프로젝트에서 효율성을 높였다. 또한, 대화 내에서 코드 실행은 물론 스프레드시트, 프레젠테이션 파일, 문서 작성까지 가능해 일체화된 작업 환경을 구현한다.

 

VS Code 확장과 Claude API의 메모리 관리 기능도 강화되어 복잡한 애플리케이션 개발에 적합하다. 이러한 기능들은 사용자의 편의성과 생산성을 크게 향상시키는 요소로 평가받는다.

 

안전성과 윤리적 정렬(Alignment) 측면에서 Claude Sonnet 4.5는 앤트로픽의 최첨단 모델로, 아첨이나 기만, 권력 추구 같은 문제 행동이 상당히 줄었으며, 특히 악의적 입력에 의한 프롬프트 인젝션 공격 방어력이 강화됐다. 앤트로픽은 AI 모델의 사회적 책임을 중시하며 AI Safety Level 3(ASL-3) 보호 체계 하에 이 모델을 배포해, 화학·생물학·방사능·핵무기 관련 위험 콘텐츠를 탐지하는 필터 시스템을 적극 운영 중이다.

 

또한, 개발자들이 독자적인 자율 에이전트를 구축할 수 있도록 메모리 관리, 권한 처리, 다중 서브에이전트 조정을 지원하는 Claude Agent SDK도 공개했다. 이는 실사용 분야에서 신뢰성과 안정성을 보장하는 첨단 인프라라 할 수 있다.

 

앤트로픽은 이 모델을 통해 기존 보조형 AI에서 협업자 수준, 나아가 완전 자율 에이전트 단계로 진화했다고 강조한다. 30시간 연속 코딩이라는 성과는 AI가 소프트웨어 개발자 및 연구자들의 생산성을 극대화하는 디지털 파트너로서 자리매김할 가능성을 분명히 보여준다.

 

앤트로픽의 공동창업자 Jared Kaplan은 Sonnet 4.5가 모든 면에서 이전 버전보다 뛰어나며, 올해 중 더 진화된 Opus 후속 모델 출시도 예고하고 있다.

 

결국 Claude Sonnet 4.5는 실제 산업 현장에서 활용 가능한 최고 수준의 코딩 AI로서, 장시간 집중력과 정확성, 그리고 안전하고 효율적인 개발 지원이라는 세 마리 토끼를 모두 잡으며 AI 소프트웨어 생태계에 새로운 지평을 열고 있다.

배너
배너
배너

관련기사

27건의 관련기사 더보기


[빅테크칼럼] 젠슨 황 “中 반도체는 ‘나노 초’밖에 안 뒤진다"…미중 기술패권 속 경쟁 '불가피'

[뉴스스페이스=김시민 기자] 엔비디아 젠슨 황 CEO가 최근 BG2 팟캐스트 및 주요 언론 인터뷰에서도 중국 반도체 산업의 미국과 격차를 ‘단지 몇 나노초’에 불과하다고 평가하며, 미중간 기술 경쟁이 불가피함을 강도 높게 주장했다. 로이터, 야후파이낸스, 블룸버그, BBC, SCMP, ITIF, TrendForce에 따르면, 황 CEO는 중국의 거대한 인적자원, 근로문화, 그리고 지방간 경쟁시스템이 반도체 제조 역량과 AI 기술 발전을 가속화한다고 진단했다. 미중 기술 격차와 정책 변수 황 CEO는 “중국은 미국에 단지 ‘나노초’밖에 뒤지지 않을 정도로 빠르게 성장하고 있다”고 언급하며, 미국이 글로벌 시장에서의 경쟁을 막는 것보다 오히려 경쟁을 허용해야 미국의 경제적·지정학적 영향력을 극대화할 수 있다고 주장했다. 이미 엔비디아가 설계한 중국 특화 AI 칩 H20 판매는 2025년 4월 트럼프 행정부의 수출 규제로 중단됐으나, 7월 미중 협상을 통해 조건부로 다시 허용된 바 있다. 특히, 엔비디아와 AMD 등이 중국에 칩을 수출할 때 수익의 15%를 미국 정부에 납부하는 새 제도(수출 라이선스 조건)가 시행되면서 반도체 분야의 국제 경쟁 규칙이 변화하고 있

[이슈&논란] 성범죄자 엡스타인 명단에 머스크 "초대받았지만 거절했다"…일정표의 진실 놓고 '갑론을박'

[뉴스스페이스=김정영 기자] 미국 민주당은 최근 성범죄자로 알려진 제프리 엡스타인 관련 새로운 방문자 명단 문건을 공개하며 일론 머스크 테슬라 CEO 등 유명 인사의 이름이 또다시 대중의 관심을 끌고 있다. 영국 스카이뉴스는 2025년 9월 27일(현지시간) 미 하원 감독위원회 민주당의 발표를 인용해 머스크가 2014년 12월 6일 카리브해 '리틀 세인트 제임스' 엡스타인 개인 섬 방문자 명단에 올랐다고 단독 보도했다. 문건에는 ‘알림: 일론 머스크, 12월6일 섬 방문(아직도 진행되나요?)’라는 메모가 포함돼 있었으나, 머스크는 즉각적으로 소셜미디어 X(구 트위터) 공식 입장을 밝혀 “스카이뉴스의 보도는 완전히 왜곡된 제목이다. 엡스타인은 나를 섬으로 초대했지만 나는 거절했다”며 강력히 부인했다. 머스크는 자신이 사실상 ‘섬 방문’ 자체를 거부했으며, “실제로 방문한 요크 공작(앤드루 왕자)보다 내 이름이 먼저 언급된 것은 부당하다”고 비판했다. 앤드루 왕자(찰스 3세 영국 국왕의 동생)는 2000년 5월 12일 뉴저지에서 플로리다 팜비치로 향하는 엡스타인 전용기에 동승했다는 기록이 이번 문서에 포함됐다. 탑승자 명단에는 앤드루 왕자, 엡스타인, 당시 여자

[내궁내정] 삼성 갤럭시S·갤럭시노트·갤럭시폴드 시리즈 암호명(코드명)에 숨겨진 의미

[뉴스스페이스=이종화 기자] <편집자주> 유튜브, 인스타 등에서 활동하는 인플루언서들이 '협찬을 받지 않았다', '광고가 아니다'라는 사실을 보이기 위해 "내 돈 주고 내가 샀다"라는 뜻의 '내돈내산'이라는 말이 생겼다. 비슷한 말로 "내가 궁금해서 결국 내가 정리했다"는 의미의 '내궁내정'이라고 이 기획코너를 명명한다. 우리 일상속에서 자주 접하는 소소한 얘기거리, 궁금증, 호기심, 용어 등에 대해 정리해보는 코너를 기획했다. 삼성전자는 신제품 개발 과정에서 보안 유지와 정보 유출 방지를 위한 수단으로 암호명을 사용한다. 이는 단순히 보안측면의 의미뿐만 아니라 제품의 철학과 기능을 은유적으로 표현하는 수단으로 사용돼 많은 사람들에게 호기심을 유발하는 장치가 되기도 한다. 특히 이 암호명(코드명, 프로젝트명)은 삼성전자가 개발한 기기의 혁신성과 기술적 성취를 함축적으로 나타내고 있다. 예를 들어, 갤럭시 S10의 '비욘드'는 새로운 디자인과 기술을, 갤럭시 S20의 '허블'은 카메라 성능을, 갤럭시 S25의 '패러다임'은 삼성의 모바일 기술과 AI 통합에서의 새로운 표준을 설정한다는 의미를 담고 있다. 또한, 갤럭시 노트 10의 ‘다빈치(Da Vi