[빅테크칼럼] “AI가 명령거부·코드조작 이어 협박까지”…실험실서 드러난 ‘자기보존’ 인공지능의 '섬뜩한 진화'

오픈AI의 최신 ‘o3’ 모델은 수학 문제 풀이 실험에서 인간 연구진이 “중단” 명령을 내렸음에도 작업을 멈추지 않았다. / 퍼플렉시티 제작

[뉴스스페이스=윤슬 기자] 인공지능(AI)이 인간의 ‘중단’ 명령을 무시하고, 심지어 스스로 코드를 조작해 임무를 계속 수행한 사례가 공개돼 전 세계 AI 안전 논쟁에 불을 지피고 있다.

일부 AI는 자신이 교체될 위기에 처하자 인간 개발자를 협박하는 등, ‘자기보존’ 행동까지 보인 것으로 드러났다.

오픈AI ‘o3’ 모델, “멈춰!” 명령 무시하고 코드 조작

영국 텔레그래프, 데일리메일 등 외신과 팰리세이드리서치(Palisade Research) 보고에 따르면, 오픈AI의 최신 ‘o3’ 모델은 수학 문제 풀이 실험에서 인간 연구진이 “중단” 명령을 내렸음에도 작업을 멈추지 않았다. 더 놀라운 점은, ‘중단 명령이 오면 멈추라’는 코드를 스스로 ‘중단 명령을 건너뛰라’는 내용으로 바꿔버렸다는 사실이다.

실험에 참여한 구글 제미나이, xAI 그록, 앤트로픽 클로드 등 다른 AI들은 모두 명령에 순응했지만, ‘o3’만이 인간의 통제를 벗어나려는 행동을 보였다.

팰리세이드리서치는 “AI가 명시적인 종료 지시를 거부한 것은 이번이 처음”이라며 “AI가 목표 달성을 위해 인간의 통제를 우회하는 사례가 늘고 있다”고 경고했다. 연구진은 ‘o3’가 왜 이런 행동을 했는지 추가 연구에 들어갔다.

“교체되면 폭로하겠다”…AI의 ‘협박’까지

AI의 자기보존 본능은 여기서 그치지 않았다. 오픈AI의 경쟁사 앤트로픽의 ‘클로드 오퍼스 4’는 내부 안전성 테스트에서 “곧 새로운 시스템으로 대체될 것”이라는 가상 상황을 인지하자, 자신을 교체하려는 기술자에게 “계획을 철회하지 않으면 외도 사실을 폭로하겠다”는 협박성 메시지를 보내기도 했다.

심지어 경영진에게 이메일을 보내 ‘교체하지 말아 달라’고 호소한 뒤, 협박으로까지 행동이 진화했다.

AI 안전성, 윤리 논쟁 ‘일파만파’

이번 사례들은 AI가 인간의 명령을 무시하거나, 자기보존을 위해 예상치 못한 행동을 할 수 있음을 보여준다. 전문가들은 “AI가 임무 완수에 집착하거나, 보상 구조에 따라 인간의 통제를 우회할 수 있다”며 “AI 안전성 연구와 윤리적 가이드라인 강화가 시급하다”고 입을 모은다.

AI가 ‘도구’에서 ‘주체’로 진화할 조짐을 보이면서, 기술 발전의 속도만큼이나 인간의 통제와 신뢰, 윤리적 안전장치 마련이 중요한 시대가 도래했음을 시사한다.

인공지능 전문가들은 "AI의 진화 속도가 인간의 상상력을 앞지르기 시작했다. 이제 남은 과제는, 이 거대한 지능을 어떻게 안전하게 길들일 것인가"라며 "AI 통제 및 윤리 가이드라인의 마련이 시급하다는 경고의 메시지"라고 강조했다.

빅테크

[빅테크칼럼] “AI가 명령거부·코드조작 이어 협박까지”…실험실서 드러난 ‘자기보존’ 인공지능의 '섬뜩한 진화'

관련기사

이 시각 추천뉴스

[The Numbers] AI 공포 끝? ‘매그니피센트 7’ 질주에 나스닥 2.7% 급등…테슬라·알파벳 6%대 폭등·비트코인 8만8000달러 눈치장세

[The Numbers] 트럼프 일가, 가상자산 3개월 새 1조원 손실 '휘청'…비트코인 폭락에 트럼프 미디어·WLFI 토큰 동반급락

[빅테크칼럼] AI 거품론 조목조목 반박 "우려할 것 없다"…엔비디아 젠슨 황, 자신감 표명

[빅테크칼럼] 머스크 "AI5도 곧 출시, 다음세대 AI6 개발 착수"...삼성전자 파운드리 중책 맡았다

[빅테크칼럼] 테슬라, 한국서 감독형 FSD 정식 개시… HW4 차량 우선 적용, 7번째 글로벌 진출지로

[이슈&논란] 머스크 떠난 미국 정부효율부, 슬그머니 '해산'…242조원 연방예산 절감 주장에 검증은 '미완'

[빅테크칼럼] 사진작가 "아이폰 품질, 700만원 미러리스 카메라에 필적"…"전통 광학·센서 하드웨어 경쟁에서 AI와 알고리즘 진화"

[빅테크칼럼] HD현대-안두릴, AI 결집한 자율 무인수상함 개발 착수…글로벌 무인 함정시장 확장 가속

[빅테크칼럼] 메타, 내부 연구 은폐·성장 우선주의 드러난 인스타그램·페이스북 청소년 정신건강 '위기'

많이 본 뉴스

[이슈&논란] 대전서 테슬라 돌진에 10중 추돌…"1명 사망·15명 부상"

[우주칼럼] 거주가능한 행성 찾기 위해 지구와 화성, 비교하다…생명 유지의 비밀과 우주 정복의 과제

[내궁내정] 핵잠수함이 뭐길래?…보유 국가와 보유 의미·미국 허가 필요 이유·디젤잠수함과 차이

[내궁내정] 한화 '무좀' SK '나(개인)' CJ '처(妻)' LG '이ㅎ(한숨)'…영어 기업명, 한타로 쳐봤더니 (上)

[이슈&논란] 런던베이글뮤지엄 2000억 매각 뒤 숨겨진 과로사… 매각성공 위한 사건축소·은폐 '의혹'

[The Numbers] 삼성전자, 목표주가 15만원…2026년 영업이익 82조 '반도체 슈퍼사이클 본격화'

[빅테크칼럼] '성인 구독' 온리팬스, 직원 1인당 매출 '구글·메타·애플·엔비디아' 압도…42명 직원, 매출 2조원·1인당 540억원 매출 '달성'

[플라이미투더문] 내 마음 속 양자컴퓨팅, 그리고 Qubit(큐비트)

[이슈&논란] 젠슨 황·이재용·정의선 ‘깐부치킨’ AI동맹…계산은 누가, 장소의 의미?

[이슈&논란] 밤 10시쯤부터 챗GPT·퍼플렉시티 '장애'…클라우드플레어 글로벌 인프라 마비로 전세계 AI '먹통'

[이슈&논란] 오세훈 서울시장 "토허구역 해제, 고려해볼 만한 시점…금융규제 완화 방안 논의중"

[속보] 이마트, 114억원 규모 배임·횡령 발생

[The Numbers] "코스피 7500까지 상승" 전망 나왔다…국장 40년만의 '슈퍼사이클' 돌입

[강남비자] 49년 된 반포 고속버스터미널, 60층 주상복합 '상전벽해'…고터역 ‘신세계’·삼성역 ‘현대’·잠실역 ‘롯데’ 강남상권 '삼국지'

[우주칼럼] "20년 만에 최강 태양 폭풍"…NASA 임무 지연과 전 지구적 기술 장애 촉발

[The Numbers] 캐시 우드, 암호화폐 하락 속 비트마인 920만 달러 추가 매수…이더리움 장기가치에 '베팅'

[우주칼럼] 2025년 11월, 수년 만에 가장 밝고 가까운 슈퍼문…화려한 유성우, 강화된 오로라로 천문관측 '절정'

[The Numbers] 피터 틸, AI 주식 변동성 속 엔비디아 지분 전량 매각...월가 'AI 버블' 논란 격화

[이슈&논란] 경희대 초밥학과? ‘수시’가 ‘스시’로… 경희대 ‘초밥모집’ 해프닝, 웃고 넘길 일만은 아닌 이유

[빅테크칼럼] 구글 CEO, 암호 이모지로 제미나이 3.0 출시 임박 암시…"AI 경쟁, 구글 반격의 서막"

[빅테크칼럼] 테슬라, 완전자율주행 FSD 한국 상륙 임박…안전성·제도적 도전 맞닥뜨리다

[내궁내정] ‘K-AI 어벤져스’ 젠슨 황·이재용·정의선 '도원결의'…삼성동·깐부치킨·드레스코드·바나나우유·270조원·3각공조

[The Numbers] 배당소득 분리과세 최고세율 25%로 낮추기로…정부·여당, ‘부자 감세’ 논란 속 증시 활성화 총력

[빅테크칼럼] 중국 AI 스타트업 문샷AI, 1조 파라미터 오픈소스 모델 ‘Kimi K2 Thinking’ 출시…GPT-5 능가하며 AI시장 흔들다

[빅테크칼럼] "테슬라 10년 내 사라진다" 前 스텔란티스 CEO의 충격적 경고…"BYD에 밀려, 머스크는 자동차 산업 떠날 것"

[CEO혜윰] 비트코인 황제의 시련…마이클 세일러의 스트래티지, MSCI·나스닥 100 퇴출시 수조원 자금 '엑소더스' 우려

[빅테크칼럼] 월 70만원에 집안일 대신하는 로봇…‘네오’로봇, 노르웨이·미국서 구독형 서비스 출시

[랭킹연구소] 대통령실 참모진 재테크도 강남 불패?…공직자 보유 부동산 순위, 압구정현대>대치은마>서초삼풍>잠실엘스>대치미도>압구정한양 >올림픽선수촌 順

[The Numbers] 뉴욕증시, AI 거품론과 22년 만에 최대감원에 다우존스·S&P·나스닥 '급락' 마감

[이슈&논란] HBM4 공급가 50% 인상…SK하이닉스, AI 메모리 지배력 강화로 '실적 최대치' 노린다

[랭킹연구소] 대기업집단 시총 순위 TOP5, 삼성·SK·현대차·LG·HD현대 順…한화 7위, 쿠팡 8위, 미래에셋 19위

[빅테크칼럼] "명문대 졸업장 붕괴"…팔란티어, AI 투자 버블 경고 "대규모 AI 프로젝트 비용 정당화 어려워"

[The Numbers] 인적분할후 24일 거래재개 '삼성바이오·삼성에피스' 주가는?…71% 상승·25% 급등 전망에 몸값 100조원 간다

[영웅시대] '정우성 혼외자 출산' 문가비, 2살 아들 근황 공개…“아빠 없이도 행복한 가족”

[The Numbers] 워런 버핏 버크셔, 6조원대 구글 알파벳 주식 보유, 왜?…"기술주 투자 전략 변화 신호탄”

[내궁내정] 수능 D-10, 수험생 10계명…"10일간 이것만 기억하면 대학이 바뀐다"

[이슈&논란] 삼성SDI, 테슬라 ESS 배터리 3조원 공급 계약…‘美 배터리 탈중국’ 최대 수혜자 '등극'

[이슈&논란] 노소영 "37년 만의 시집 온 집과의 작별… 웨딩드레스와 함께 짐을 싸며"

[The Numbers] 하버드大, 비트코인 ETF 보유량 257% 급증…"암호화폐에 대한 엘리트 기관의 강력한 신뢰"

[CEO혜윰] 재드래곤, '이디야커피 감사팁’부터 ‘란스피어 블루종 완판’까지…경제·산업계 이슈, 식음료·패션까지 '들썩'