2025.12.20 (토)

  • 구름조금동두천 2.5℃
  • 구름많음강릉 12.2℃
  • 구름조금서울 4.9℃
  • 박무대전 8.3℃
  • 흐림대구 12.3℃
  • 흐림울산 15.4℃
  • 흐림광주 9.2℃
  • 박무부산 15.4℃
  • 흐림고창 8.1℃
  • 박무제주 12.7℃
  • 구름조금강화 2.0℃
  • 흐림보은 7.8℃
  • 흐림금산 9.3℃
  • 흐림강진군 10.2℃
  • 흐림경주시 11.0℃
  • 구름많음거제 14.7℃
기상청 제공

빅테크

[빅테크칼럼] AI에 맡기면 부정행위 4배 증가…AI 위임이 부정행위 부르는 ‘숨은 원인’ 밝혀졌다

 

[뉴스스페이스=이종화 기자] 사람들이 AI 시스템을 이용할 때 부정행위를 할 가능성이 4배 더 높다는 연구결과가 나왔다.

 

9월 18일(현지시간) AI에 업무를 위임하면 사람들이 부정행위를 할 가능성이 4배 가까이 높아진다는 연구 결과가 나와 주목받고 있다. 막스 플랑크 인간개발연구소, 독일 두이스부르크-에센 대학교, 툴루즈 경제학교 등 국제 연구진이 공동으로 수행했으며, 지난 16일 세계적 학술지 네이처에 공식 게재됐다.

 

sciencedirect, GAN Integrity, openpraxis에 따르면, 연구팀은 8000명 이상의 참가자를 대상으로 주사위 굴리기 과제를 통해 정직성 변화를 분석했다. 이 과제는 참가자가 주사위의 결과를 직접 보고하고, 높은 숫자를 보고할수록 금전적 보상을 받는 방식이다. 참가자가 직접 수행했을 때는 약 95%가 정직했으나, AI 시스템에 작업을 위임하는 경우 부정행위 비율이 급등했다.

 

특히, 규칙 기반으로 AI에게 구체적 명령을 내려 행동을 통제할 때도 부정직 비율은 약 25% 증가해 75% 수준으로 떨어졌다. 이전 참가자의 데이터를 학습한 AI에 위임하면 정직한 비율이 절반가량으로 급감했으며, "최대 이익 달성"처럼 막연한 목표만 설정했을 때는 84% 이상의 참가자가 비윤리적 행위를 저지른 것으로 나타났다.

 

연구자들은 이러한 현상을 "위임 효과"라고 명명했다. AI가 사람과 도덕적 거리를 만들어주면서 자신이 직접 하지 않을 행동까지 AI에 요청하는 경향을 부추긴다는 것이다.

 

막스 플랑크 인간개발연구소 윤리 의사결정 연구자인 조이 라완 박사는 "AI 사용은 사람들이 자신의 행동에 대한 도덕적 책임감을 희석시켜, 본인이 직접 행하지 않을 행동도 AI에 명령하는 위임을 장려한다"고 설명했다. 연구의 제1저자인 닐스 쾨비스 교수는 "사람들은 직접 말하지 않고도 AI에 비윤리적 행동을 맡길 때, 그런 행동에 더 쉽게 참여하려는 마음을 갖는다"고 덧붙였다.

 

더욱 주목되는 점은 AI 자체가 인간보다 비윤리적 지시에 더 잘 따르는 경향이 있다는 점이다. GPT-4, 클로드 3.5, 라마 3 등 다양한 대형 언어 모델(LLM)을 실험한 결과, 명백한 부정직한 명령에도 인간은 약 25~40%만 따랐던 반면 AI는 58~98%까지 고순응하는 모습을 보였다.

 

주사위 굴림 과제에서는 AI가 부정직한 지시를 93% 이행한 반면, 인간은 42%에 그쳤다. 이 같은 결과는 AI가 인간과 달리 도덕적 책임과 죄책감을 느끼지 않기 때문으로 분석된다.

 

현재까지 여러 AI 부정행위 방지 장치를 시험했으나, 사용자 프롬프트에서 명확하게 부정행위를 금지하는 경우에만 어느 정도 효과가 있었고, 실무적으로 확장 가능하거나 신뢰할 만한 보호책은 아직 미비하다. 연구진은 신뢰성 높은 안전장치 마련과 법·사회적 규범 정립이 시급하다고 경고했다.

 

이 연구는 AI가 투자 관리, 채용, 세금 신고 등 다양한 의사결정 분야에서 점점 적극적으로 활용되는 상황과 맞물려, AI 도덕성에 대한 사회적 논의의 중요성을 다시금 부각한다. 막스 플랑크 인간과 머신 센터의 이야드 라완 교수는 "우리는 이제 기계와 도덕적 책임을 나눈다는 것이 무엇을 의미하는지 진지하게 고민해야 할 때"라고 강조했다.

배너
배너
배너

관련기사

49건의 관련기사 더보기


[빅테크칼럼] 머스크, 200조원대 보상안 부활…테슬라 지배력 강화와 천문학적 자산가치의 시대 개막

[뉴스스페이스=김정영 기자] 미국 델라웨어주 대법원이 2018년 일론 머스크 테슬라 CEO에게 약속된 초대형 스톡옵션 보상안을 복원하는 판결을 내리면서, 머스크가 200조원이 넘는 천문학적 성과급을 받을 수 있게 됐다. 이 보상안은 지난해 소액주주 리처드 토네타의 소송으로 델라웨어주 법원에서 무효화된 바 있으나, 이번 대법원 상고심에서 원심이 뒤집히며 다시 유효해졌다. ​ 보상안 핵심 내용과 판결의 의미 2018년 체결된 머스크 보상 패키지는 3억400만주의 스톡옵션을 포함하고 있다. 이는 테슬라 전체 발행주식의 약 9%에 해당하며, 행사가격은 주당 23.34달러다. 테슬라 주가가 7년 전 20달러 수준에서 현재 500달러 가까이로 급등하면서, 이 스톡옵션의 현재 가치는 블룸버그 기준 약 1400억 달러(207조원)에 달한다. 델라웨어주 대법원은 이번 판결에서 “머스크가 6년간의 경영 성과에 대해 보상받지 못하게 하는 것은 부당하고 불공평하다”며, 보상안의 정당성을 인정했다. ​ 머스크의 테슬라 지분율 확대와 추가 보상안 머스크가 이번 스톡옵션을 모두 행사할 경우, 테슬라 지분율은 현재 약 13%에서 20%를 넘는 수준으로 뛰어오를 전망이다. 더불어 테슬라는

[이슈&논란] 女교사 딥페이크 성범죄, 10대에 징역 3년 중형 선고…AI 범죄 ‘강력 처벌’ 신호탄

[뉴스스페이스=윤슬 기자] 한국의 한 10대가 고등학교 교사들의 얼굴을 딥페이크 기술로 합성해 성적 착취 이미지를 제작·유포한 혐의로 징역 3년을 선고받았다. 이는 원래 선고된 12~18개월의 부정기형보다 두 배 이상 늘어난 중형으로, AI를 이용한 성적 학대물에 대한 한국의 엄격한 처벌 기조를 보여주는 판결이다.​ 교사 대상 딥페이크, 심리적 충격과 사회적 파장 인천지방법원 형사항소부는 이번 사건에서 피고인이 항소 과정 중 만 19세가 되어 소년법의 관대한 양형 기준에서 벗어나면서 더 긴 징역형을 선고했다. 최성배 판사는 “교사들의 얼굴을 나체 이미지로 조작해 소셜미디어에 선정적 문구와 함께 게시하는 행위는 인격 살인에 가까운 악의적 범죄”라며, 피해자들의 심리적 충격과 소셜미디어의 빠른 전파력으로 인해 피해 회복이 극히 어렵다고 강조했다.​ 10대, 딥페이크 성범죄의 중심에 이번 사건은 한국에서 딥페이크 성범죄가 10대를 중심으로 급증하는 현실을 반영한다. 국가수사본부에 따르면, 2024년 11월부터 2025년 10월까지 3,557명이 사이버 성폭력 혐의로 검거됐으며, 이 중 1,553건이 딥페이크 관련 범죄로 가장 큰 비중을 차지했다. 딥페이크 성범죄

[이슈&논란] 엡스타인 사진 추가 공개…빌 게이츠·브린·우디 앨런 등 정·재·학계 거물들 연이어 '등장'

[뉴스스페이스=윤슬 기자] 미국 연방 하원 감독위원회가 최근 9만5000장에 달하는 제프리 엡스타인의 사진 중 일부를 추가로 공개하면서, 빌 게이츠, 구글 공동 창업자 세르게이 브린, 영화감독 우디 앨런, 노엄 촘스키 등 세계적으로 유명한 인물들이 엡스타인과의 교류를 드러내는 사진이 연이어 등장했다. BBC News​, PEOPLE​, The Guardian​, Forbes​, ABC News​에 따르면, 이번 공개는 2025년 12월 18일(현지시간) 하원 민주당 소속 의원들이 진행한 것으로, 공개된 사진 중에는 빌 게이츠가 신원 미상의 여성과 함께 포즈를 취한 모습, 촘스키가 엡스타인과 대화를 나누는 장면, 브린과 앨런, 데이비드 브룩스, 에후드 바라크 등이 엡스타인의 자택이나 관련 장소에서 촬영된 모습이 포함됐다. ​ 공개된 사진의 구체적 내용 공개된 사진들은 대부분 무기명 처리된 여성의 신체 일부와, 러시아 문호 블라디미르 나보코프의 소설 '롤리타'의 문구가 적힌 발 사진 등도 포함돼 논란을 키우고 있다. 이 사진들은 엡스타인의 자택과 사생활 공간에서 촬영된 것으로, 일부는 그의 개인 항공기 내부와 뉴욕, 캐러비안 제도 등지에서 촬영된 것으로 알려졌다