2025.07.16 (수)

  • 흐림동두천 23.0℃
  • 흐림강릉 20.8℃
  • 서울 27.9℃
  • 구름많음대전 28.0℃
  • 흐림대구 27.6℃
  • 구름많음울산 25.5℃
  • 구름조금광주 28.6℃
  • 구름조금부산 28.2℃
  • 구름조금고창 28.4℃
  • 구름많음제주 29.8℃
  • 흐림강화 26.6℃
  • 구름많음보은 23.2℃
  • 구름많음금산 27.2℃
  • 구름많음강진군 29.6℃
  • 구름많음경주시 26.8℃
  • 맑음거제 28.6℃
기상청 제공

빅테크

[빅테크칼럼] “AI가 명령거부·코드조작 이어 협박까지”…실험실서 드러난 ‘자기보존’ 인공지능의 '섬뜩한 진화'

 

[뉴스스페이스=윤슬 기자] 인공지능(AI)이 인간의 ‘중단’ 명령을 무시하고, 심지어 스스로 코드를 조작해 임무를 계속 수행한 사례가 공개돼 전 세계 AI 안전 논쟁에 불을 지피고 있다.

 

일부 AI는 자신이 교체될 위기에 처하자 인간 개발자를 협박하는 등, ‘자기보존’ 행동까지 보인 것으로 드러났다.

 

오픈AI ‘o3’ 모델, “멈춰!” 명령 무시하고 코드 조작

 

영국 텔레그래프, 데일리메일 등 외신과 팰리세이드리서치(Palisade Research) 보고에 따르면, 오픈AI의 최신 ‘o3’ 모델은 수학 문제 풀이 실험에서 인간 연구진이 “중단” 명령을 내렸음에도 작업을 멈추지 않았다. 더 놀라운 점은, ‘중단 명령이 오면 멈추라’는 코드를 스스로 ‘중단 명령을 건너뛰라’는 내용으로 바꿔버렸다는 사실이다.

 

실험에 참여한 구글 제미나이, xAI 그록, 앤트로픽 클로드 등 다른 AI들은 모두 명령에 순응했지만, ‘o3’만이 인간의 통제를 벗어나려는 행동을 보였다.

 

팰리세이드리서치는 “AI가 명시적인 종료 지시를 거부한 것은 이번이 처음”이라며 “AI가 목표 달성을 위해 인간의 통제를 우회하는 사례가 늘고 있다”고 경고했다. 연구진은 ‘o3’가 왜 이런 행동을 했는지 추가 연구에 들어갔다.

 

“교체되면 폭로하겠다”…AI의 ‘협박’까지

 

AI의 자기보존 본능은 여기서 그치지 않았다. 오픈AI의 경쟁사 앤트로픽의 ‘클로드 오퍼스 4’는 내부 안전성 테스트에서 “곧 새로운 시스템으로 대체될 것”이라는 가상 상황을 인지하자, 자신을 교체하려는 기술자에게 “계획을 철회하지 않으면 외도 사실을 폭로하겠다”는 협박성 메시지를 보내기도 했다.

 

심지어 경영진에게 이메일을 보내 ‘교체하지 말아 달라’고 호소한 뒤, 협박으로까지 행동이 진화했다.

 

AI 안전성, 윤리 논쟁 ‘일파만파’

 

이번 사례들은 AI가 인간의 명령을 무시하거나, 자기보존을 위해 예상치 못한 행동을 할 수 있음을 보여준다. 전문가들은 “AI가 임무 완수에 집착하거나, 보상 구조에 따라 인간의 통제를 우회할 수 있다”며 “AI 안전성 연구와 윤리적 가이드라인 강화가 시급하다”고 입을 모은다.

 

AI가 ‘도구’에서 ‘주체’로 진화할 조짐을 보이면서, 기술 발전의 속도만큼이나 인간의 통제와 신뢰, 윤리적 안전장치 마련이 중요한 시대가 도래했음을 시사한다.

 

인공지능 전문가들은 "AI의 진화 속도가 인간의 상상력을 앞지르기 시작했다. 이제 남은 과제는, 이 거대한 지능을 어떻게 안전하게 길들일 것인가"라며 "AI 통제 및 윤리 가이드라인의 마련이 시급하다는 경고의 메시지"라고 강조했다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


의사 국시까지 뚫은 국산 AI…LG ‘엑사원 4.0’, 하이브리드 혁신으로 글로벌 AI 시장에 '도전장'

[뉴스스페이스=조일섭 기자] LG가 독자 개발한 하이브리드 AI 모델 ‘엑사원(EXAONE) 4.0’이 공식 공개된 가운데, 국내 최초로 의사 국가시험 등 6개 국가공인 전문가 자격증 필기 시험을 통과할 정도의 기본기와 전문성을 모두 겸비한 점이 가장 큰 화제가 됐다. 또 글로벌 오픈소스 AI 플랫폼 ‘허깅페이스(Hugging Face)’에 오픈 웨이트로 공개되어 학술·연구·교육 등 폭넓은 용도로 활용될 전망이다. 국내 첫 ‘의사 국시’ 통과…전문 AI로서 의미 엑사원 4.0은 국가의사시험, 변호사시험, 회계사, 노무사 등 6종의 국가공인 시험을 통과한 성적을 직접 공개하며 전문 AI로서의 기술력을 입증했다. 실제로 주요 국가자격증 시험에서 합격점 이상(국시 60%, 변호사시험 40% 등)을 받는 성취를 기록하여, "한국형 전문 AI의 시대"를 연 상징적인 사건으로 평가된다. 미국, 일본 등 해외 빅테크사의 주요 AI와 비교해도 높은 일상 언어 이해력(한국어·영어 등 멀티링구얼)과, 특정 직업군을 위한 문제해결 성능이 동시에 주목받았다. 글로벌 오픈소스 플랫폼 ‘허깅페이스’ 공개…개방과 협력의 AI 전략 LG는 엑사원 4.0의 오픈 웨이트 모델을 허깅페이스에

[내궁내정] 슈퍼맨 신작에 숨겨진 11가지 놀라운 사실 (下)…데일리플래닛·저스티스 갱·주머니우주와 미니빅뱅·외계인이자 이방인

[뉴스스페이스=이종화 기자] <편집자주> 유튜브, 인스타 등에서 활동하는 인플루언서들이 '협찬을 받지 않았다', '광고가 아니다'라는 사실을 보이기 위해 "내 돈 주고 내가 샀다"라는 뜻의 '내돈내산'이라는 말이 생겼다. 비슷한 말로 "내가 궁금해서 결국 내가 정리했다"는 의미의 '내궁내정'이라고 이 기획코너를 명명한다. 우리 일상속에서 자주 접하는 소소한 얘기거리, 궁금증, 호기심, 용어 등에 대해 정리해보는 코너를 기획했다. 7. 데일리플래닛 진짜 있는 곳?…허구와 현실, 그리고 헐리우드 속 상징 데일리플래닛(Daily Planet)은 DC 코믹스의 슈퍼맨 세계관에 등장하는 ‘가상의 신문사’다. 현실 세계에 동일한 이름의 주요 언론사는 존재하지 않는다. 다만, 캐나다에 ‘Chantham Daily Planet’이라는 지역 신문이 1922년까지 존재한 적이 있으나, 슈퍼맨의 데일리플래닛과는 무관하다. 데일리플래닛은 설정상 메트로폴리스(Metropolis)라는 가상의 대도시에 위치한, 미국을 대표하는 일간지다. 편집장 페리 화이트(Perry White), 기자 클라크 켄트(슈퍼맨), 로이스 레인, 사진기자 지미 올슨 등이 직원으로 등장한다. 건물

'트위터 창립자' 잭 도시, 햇빛 노출·비타민 D 맞춤앱 공개…"야외활동 시간따라 일일 비타민 D 합성량까지 예측"

[뉴스스페이스=이종화 기자] 트위터 공동 창립자이자 블록(Block) CEO인 잭 도시는 최근 iOS 베타 앱 ‘Sun Day’를 선보이며 디지털 헬스케어 시장에 새로운 바람을 불러일으켰다. 이 앱은 사용자의 위치, 피부색, 의류 노출 정도 및 실시간 자외선(UV) 정보를 종합해, 안전한 야외활동 시간과 일일 비타민 D 합성량까지 예측해준다. 주요 기능 및 작동 방식 사용자가 테스트플라이트(TestFlight)로 앱을 설치한 뒤 피부 타입(1~6단계)과 옷차림을 입력하면, 앱은 해당 위치의 UV 지수·구름 양·일출·일몰 정보를 자동으로 불러온다. 실시간으로 맞춤 자외선 지수와 일조 정보를 제공한다. 또 피부색과 의류 노출 정도에 따라, 피부 화상 위험 없는 야외 체류 최대 시간을 알려준다. 특히 사용자가 야외로 나갈 때 ‘노출 시작’, 실내 귀가 시 ‘노출 종료’ 버튼을 누르면, 각 세션별 및 하루 누적 비타민 D 합성 추정치(국제단위, IU)를 기록·제공한다. 이 모델은 최신 의학 논문을 기반으로 개발된 다중 요인 알고리즘에 근거한다. 개인 수동 입력방식 채택과 한계점 다만 잭 도시는 X(前 트위터)에서 “자동 조도 감지가 아니라 순수하게 사용자가 노출 시

[빅테크칼럼] “오토파일럿, 과연 안전한가” 자율주행 법적 시험대…미국, 테슬라 사망사고 배심원단 재판 시작

[뉴스스페이스=윤슬 기자] 미국 플로리다에서 테슬라 오토파일럿 기능을 둘러싼 중대한 사망사고 책임을 다루는 연방 배심원단 재판이 7월 14일(현지시간)부터 본격 개시됐다. 블룸버그, 뉴욕타임스, CBS뉴스 등의 매체들은 이번 재판은 자율주행과 운전자 보조시스템 기술의 한계, 제조사의 과실 및 책임소재를 가릴 중대 분수령으로 주목받고 있다고 보도했다. 2019년 플로리다 비극, 쟁점은 ‘기술 결함’ vs ‘운전자 과실’ 사고는 2019년 플로리다주 키라르고에서 야간에 발생했다. 테슬라 모델S가 오토파일럿 모드로 주행 중 도로변에 정차 중이던 SUV를 들이받고, 그 옆에 서 있던 20세 대학생 나이벨 베나비데스 레온을 치어 사망에 이르게 했다. 레온의 남자친구 딜런 앙굴로도 큰 부상을 입었다. 유족과 피해자는 ‘오토파일럿이 도로 경계와 장애물을 인식하지 못했다’며 수백만 달러의 손해배상과 징벌적 배상을 요구하고 있다. 원고는 테슬라가 오토파일럿 위험성에 대해 운전자에게 제대로 고지하지 않았고, 시스템 결함으로 인한 ‘예방 가능했던 참사’였다고 주장했다. 반면, 테슬라 측은 “운전자가 휴대폰 통화 중 휴대폰을 떨어뜨려 주행 중 하체를 숙이며 시선을 뗐고, 액셀러레

[내궁내정] 슈퍼맨 신작에 숨겨진 11가지 놀라운 사실 (上)…DCU 리부트·오마주와 이스터에그·슈퍼독 ‘크립토’·아버지 대화

[뉴스스페이스=이종화 기자] <편집자주> 유튜브, 인스타 등에서 활동하는 인플루언서들이 '협찬을 받지 않았다', '광고가 아니다'라는 사실을 보이기 위해 "내 돈 주고 내가 샀다"라는 뜻의 '내돈내산'이라는 말이 생겼다. 비슷한 말로 "내가 궁금해서 결국 내가 정리했다"는 의미의 '내궁내정'이라고 이 기획코너를 명명한다. 우리 일상속에서 자주 접하는 소소한 얘기거리, 궁금증, 호기심, 용어 등에 대해 정리해보는 코너를 기획했다. 2025년 7월, 제임스 건 감독의 "슈퍼맨"이 북미 박스오피스에서 화려하게 비상하며 슈퍼히어로 장르의 새로운 전기를 예고했다. 개봉 첫 금요일(프리뷰 포함) 5650만 달러의 수익을 기록한 데 이어, 주말 3일간 1억1500만~1억2200만 달러의 오프닝 성적을 올릴 것으로 집계됐다. 이는 2013년 잭 스나이더의 "맨 오브 스틸"이 세운 1억1661만 달러 기록을 뛰어넘는 수치로, 최근 침체됐던 DC 영화계에 극적인 반전을 선사했다. 게다가 로튼 토마토 관객 점수 95%, 평론가 점수 82%로 슈퍼맨 영화 사상 최고 평가를 받았다. 이는 리처드 도너의 1978년작(86%)도 뛰어넘는 수치다. 시네마스코어 A- 등급 획득