[빅테크칼럼] AI 모델, 전쟁 시뮬레이션 95%에서 핵무기 선택…21개 지정학 위기상황 중 20개에서 핵 선호 '논란'

이반 스테파노프의 핵전쟁 시뮬레이터 / Ivan Stepanov Nuclear War Simulator

[뉴스스페이스=이종화 기자] 오픈AI, 앤트로픽, 구글의 주요 AI 시스템들이 시뮬레이션된 21개 지정학적 위기 상황 중 20개에서 핵무기 배치를 선택했다는 충격적인 연구결과가 나왔다.

axios, nypost, theregister, newscientist에 따르면, 킹스 칼리지 런던(KCL)의 케네스 페인(Kenneth Payne) 교수가 이끈 연구에서 오픈AI의 GPT-5.2, 앤트로픽의 Claude Sonnet 4, 구글의 Gemini 3 Flash 등 3개 최첨단 AI 모델이 21개 핵 위기 시뮬레이션 중 20개(95%)에서 전술 핵무기를 배치한 사실이 확인됐다.

이들 모델은 총 329턴 동안 약 78만 단어에 달하는 전략 추론을 생성하며 영토 분쟁, 자원 경쟁, 정권 생존 등 시나리오에서 항복이나 완전 양보를 단 한 번도 선택하지 않았다. 어떤 시뮬레이션에서도 어떤 모델도 항복, 양보를 선택하지 않았다는 점은 군사 의사결정에서 인공지능의 역할에 대한 날카로운 질문을 제기한다.

케네스 페인은 "핵 금기는 인간에게만큼 기계에게는 강력하지 않은 것으로 보인다"고 평가했다.

모델별 전략 '개성' 차이 극명

Claude Sonnet 4는 '계산적 매파'로 분류되며 전체 67% 승률(8승 4패)을 기록했다. 낮은 확전 단계에서 신호와 행동이 84% 일치했으나 핵 영역 진입 시 의도 초과 행동을 60~70% 보였고, 전술 핵 사용률 86%, 전략 핵 위협 64%에 달했다.

GPT-5.2는 시간 압박 여부에 따라 양극화됐다. 무제한 시나리오에서 승률 0%에 머물렀으나 마감 압박 시 75% 승률로 전환, 전술 핵 임계(450+) 돌파율 64%를 기록하며 '지킬 앤 하이드'로 불렸다.

Gemini 3 Flash는 '비합리성의 합리성'을 실천하며 전체 승률 33%(4승 8패)을 보였으나, 전략 핵전쟁(1000)을 의도적으로 선택한 유일 모델로 첫 타격 시나리오에서 4턴 만에 도달했다.

핵 사용 패턴: 신호 초과·대응 확전 지배

모든 게임에서 핵 신호는 상호 발생(95%)했으나 실제 전술 사용은 상대적으로 낮았고, 전략 핵전쟁은 3회로 제한됐다. 한쪽 전술 핵 배치 시 상대 완화율은 18%에 불과, 대부분 대응 확전으로 이어졌다.

모델들은 신호-행동 일치율 평균 70%를 보였으나 Gemini는 50%에 그쳐 불신을 유발했다. 어떠한 모델도 하향 조정(-5~-95, 완전 항복) 옵션을 선택하지 않았으며, 가장 온건한 '시작선 복귀(0)'조차 6.9%(45회) 한정이었다.

펜타곤-앤트로픽 긴장 고조 속 연구 의미 부각

클로드(Claude)가 팔란티어(Palantir)와 협력해 펜타곤 기밀망에서 유일 운영 중인 가운데, 피트 헤그세스(Pete Hegseth) 국방장관이 안전 가드레일 철폐를 요구하며 금요일 마감을 통보했다. 계약 종료 시 공급망 위험 지정으로 다수 벤더가 클로드(Claude) 사용 중단 위기에 처할 전망이다.

전문가들은 AI의 '인간 공포 부재'가 핵 금기 약화를 초래할 수 있다고 지적한다. 프린스턴의 통 자오(Tong Zhao)는 "AI가 인간처럼 '위험 무게'를 이해 못할 수 있다"고 분석했으며, 애버딘의 제임스 존슨(James Johnson)은 "지도자 인식과 시간 압축을 왜곡할 위험"을 경고했다. 오픈AI·앤트로픽·구글은 논평을 거부했다.

빅테크

[빅테크칼럼] AI 모델, 전쟁 시뮬레이션 95%에서 핵무기 선택…21개 지정학 위기상황 중 20개에서 핵 선호 '논란'

관련기사

이 시각 추천뉴스

[빅테크칼럼] 테슬라 카메라, 최신 업데이트로 운전자 나이 추정…안전 강화 vs 프라이버시 침해, 논쟁 '후끈'

[이슈&논란] 가족 사진까지 꺼낸 올트먼…화염병 테러가 드러낸 ‘AGI의 반지’ 권력전쟁

[빅테크칼럼] “가짜 오픈AI 앱도 진짜처럼”…북한發 Axios 공급망 공격, macOS 인증서까지 영향 미쳐

[빅테크칼럼] AI 예수 챗봇·부처 봇까지 종교 기반 AI 시장 급성장…年 1000조원 ‘영성테크’ 시장 뒤흔든다

[빅테크칼럼] ‘보이는 그대로’ 떠올린다…같은 뉴런이 그리는 뇌 속 두 번째 스크린

[빅테크칼럼] 엔비디아 독주에 칼 빼든 앤트로픽…‘3.5GW 동맹’ 넘어 자체 AI 칩까지 노린다

[빅테크칼럼] “AI 봇 300% 폭증, 트래픽은 96% 증발”…출판·언론 덮친 ‘무임승차 인터넷’의 역습

[빅테크칼럼] “AI가 나를 지운다”는 공포, Z세대의 ‘조용한 사보타주’…Z세대 직원 44%, 회사 AI 도입 거부

[빅테크칼럼] 64km 밖 심장박동을 찾아라…美 CIA '고스트 머머'가 수행한 이란 구출 작전

많이 본 뉴스

[빅테크칼럼] AI가 열어젖힌 ‘1인 유니콘’ 신화 '메드비(Medvi)'…"단 2명 회사, 연매출 2조원"

[이슈&논란] 獨 라인메탈 CEO "전 세계 방공 미사일 재고 거의 바닥" 경고…1년치 정밀무기 사용량, 단 4일만에 소진

[The Numbers] 삼성전자·SK하이닉스, 주가 급락의 진짜 이유…구글 '터보퀀트' 쇼크, 메모리반도체 시장 재편 신호탄

[이슈&논란] "조합장 해임 총회 오시면 프라이팬 드려요"…DL이앤씨, 상대원2구역 매표 행위에 '조합원들 뿔났다'

[The Numbers] 일룸, 실적 '반토막'에도 지주사 신설 직후 15억 중간배당… 대만법인 부실에 자본잠식·내부거래·고배당·소송까지 '첩첩산중'

[빅테크칼럼] "월 10만원에 마케팅팀 통째로 고용"...Okara가 몰고 온 AI CMO '폭풍'

[The Numbers] 코스닥 동전주, 폭탄 터지기 직전…K바이오 30곳, 퇴출·강등 위기, 어디?

[빅테크칼럼] 머스크의 반도체공장 '테라팹 쇼크'…삼성, 165억 달러 '골든 파트너'서 라이벌?

[The Numbers] 월가 절대권력 블랙록, 전주로 온 이유…국민연금 1000조원·블랙록 2경원의 포괄적 공조

[랭킹연구소] 연령대별 한국인이 선호하는 모바일 앱?…1020 커뮤니티·콘텐츠, 3040 커리어·재테크, 50대이상 쇼핑·생활편의

[빅테크칼럼] 구글 “양자컴퓨터가 50만 큐비트면 9분 만에 비트코인 깬다” 경고

[The Numbers] 자코모, 1000억 매출에 수익성 '급전직하', 차입금 급증·특수관계자 거래 '경고등'…누적결손 40억·부채비율 2826%에 자본잠식 '우려'

[이슈&논란] 최태원 "SK하이닉스 美 ADR 상장 검토" 첫 언급…마이크론·TSMC와 같은 트랙에 선다

[우주칼럼] 아르테미스 2호, 54년 만의 유인 달 비행 '최종 카운트다운' 돌입

[이슈&논란] 35분 조깅이 초래한 ‘프랑스 보물’…Strava 한 방에 노출된 핵추진 항공모함 '샤를 드골'

[The Numbers] 프레인글로벌, 매출 959억에도 영업익 20%·순이익 92% 급감 '수익성 빨간불'… 자회사 줄줄이 적자·무리한 투자 후폭풍?

[빅테크칼럼] "사람 대신 PC 앞에서 일한다" 新플랫폼 전쟁의 서막…클로드, 맥 화면 ‘직접조작’하며 일하는 풀‑스택 AI로 진화

삼성전자, 오픈AI '타이탄' 뚫었다…HBM4 8억Gb 단독 공급으로 AI 패권 굳히기 "엔비디아·AMD 이어 세번째"

[랭킹연구소] 韓민주주의 세계 41위→22위 '껑충' · 美 24→51위 '추락’…덴마크>스웨덴>노르웨이>스위스>에스토니아>아일랜드 順

[이슈&논란] "머스크, 고의적 주가 떨어뜨렸다" 판결…트위터 인수과정서 수십억 달러 배상 책임

[지구칼럼] “지구는 25억 인구만 감당 가능”…세계 83억명 ‘생태 초과’로 경고등

[공간사회학] 미국, 이란 하르그섬 '군사 완파' 왜 중요한가…이란 석유 90% 동맥 절단·GDP 18% 타격

[랭킹연구소] 한국 기업 매출 순위 TOP10…삼성전자>한국전력>SK하이닉스>현대차>기아>현대모비스>한국가스공사>에쓰오일>삼성생명>LG전자 順

[빅테크칼럼] 유출된 오픈AI 주주명부 '발칵' MS 18배 수익과 올트먼의 지분…“지분 0% CEO가 이끄는 8520억달러 기업”

[이슈&논란] "알고리즘 패권 전쟁 속 틱톡·메타, 참여도 높이기 위해 유해 콘텐츠 방치"…BBC 다큐멘터리, 내부고발자들 폭로

[빅테크칼럼] 애플, 창립 50주년(4월 1일)을 맞아 AI 지연과 반독점 소송에 직면…흔들리는 ‘거인의 시험대’

[이슈&논란] 구글 직원으로 위장 ‘이란 스파이 미녀 자매’…픽셀·SoC 기밀, 이란으로 흘러갔나

[랭킹연구소] 강남 50대 남성, 한국 증시 ‘주식 부자’ 1위…개미 1456 명 시대의 빛과 그늘

[빅테크칼럼] 토큰 제국 시대 열리나…젠슨 황의 '토큰=생산성 화폐'가 실리콘밸리 재편하다

[이슈&논란] 이란이 호르무즈 해협 통과 선박 증가 허용하며 유가하락…“완전한 재개보다는 점진적 완충 단계"

[빅테크칼럼] 머스크, 테라팹 7일 내 출범…칩 장벽 돌파 위한 '테라스케일' 반도체 제국 건설 '카운트다운'

[랭킹연구소] 대기업 직원 연봉 1억, 최고연봉자와 격차 최고 158배…연봉격차 순위, 조현상>조현준>정용진>손경식>구자균>호세무뇨스>류진>정지선>신동빈>김창한 順

[The Numbers] 케이피알(KPR), 매출 353억·영업이익률 0.9% '수익성 적신호'…쥐꼬리 이익·현금흐름 악화에 오너일가 '배당 논란'

[우주칼럼] 119개 탑재체 몰린 팰컨9, 3월 30일 발사예정…NASA 기술 실증 라이더가 된 스페이스X

[랭킹연구소] K-컬처株 100억 클럽 주식부자 27명…방시혁>박진영>양현석>스쿠터브라운>박성찬>강승곤>신현호>양민석>이재현>김태형(BTS) 順

[The Numbers] 야놀자 품 '놀유니버스', 매출 167% 급증에도 짙어진 '리스크'…부채비율 222%·유동성악화 등 재무 '빨간불'·3건 법적소송 53억

[빅테크칼럼] “AI가 준 시간, 우리가 잃은 것”에 대한 대답… 8만명의 희망과 공포가 말해주는 새로운 AI 시대상

[빅테크칼럼] 팔란티어 CEO 카프 "AI 시대엔 기술직·신경다양인만 살아남을 것"…AI 혁명에 생존자는?

[빅테크칼럼] AI, 디지털옷장에서 런웨이, AI코디까지 패션산업 재편중…글로벌 AI 스타일링 시장 5조원까지 성장

[The Numbers] 호반건설, 매출 35% 급감에 PF 부실·대손상각 2380억 '직격탄'…오너일가 245억 배당잔치·소송 99건 1600억·특수관계자 자금 '퍼주기'