2026.06.10 (수)

  • 맑음동두천 15.1℃
  • 구름많음강릉 19.4℃
  • 맑음서울 18.3℃
  • 구름많음대전 17.8℃
  • 맑음대구 17.9℃
  • 맑음울산 15.9℃
  • 맑음광주 17.8℃
  • 맑음부산 18.4℃
  • 맑음고창 14.3℃
  • 맑음제주 18.2℃
  • 맑음강화 16.2℃
  • 맑음보은 13.7℃
  • 맑음금산 14.4℃
  • 맑음강진군 14.3℃
  • 맑음경주시 15.8℃
  • 맑음거제 15.1℃
기상청 제공

빅테크

[빅테크칼럼] "AI 챗봇, 국가 선전에 오염되다"…《네이처》, 37개국 분석 결과 발표

 

[뉴스스페이스=이승원 기자] AI 챗봇에게 같은 정치 질문을 서로 다른 언어로 던지면 전혀 다른 답변이 돌아온다. 《네이처》가 5월 13일(현지시간) 발표한 연구는 그 이유를 명확히 밝혔다.

 

정부가 온라인 미디어 환경을 통제함으로써 대형 언어 모델(LLM)이 학습하는 데이터에 간접적으로 영향을 미친다는 것이다. 오리건 대학교, 퍼듀 대학교, UC 샌디에이고, 뉴욕 대학교, 프린스턴 대학교 공동 연구팀은 6개의 연구를 통해 국가 통제 미디어에서 챗봇 출력에 이르는 전체 경로를 추적했다.

 

중국 국가 미디어, 위키피디아보다 41배 많이 학습


nature, eurekalert, bioengineer, euronews에 따르면, 연구팀은 중국 정부가 조율한 미디어 콘텐츠가 오픈소스 LLM 학습 데이터셋에 독립 매체보다 압도적으로 많이 포함되어 있음을 발견했다. Common Crawl에서 파생된 주요 오픈소스 다국어 학습 데이터셋을 분석한 결과, 중국 국가 조율 미디어와 상당한 문구 중복을 보이는 중국어 문서가 310만 개 이상 발견됐다.

 

이는 데이터셋의 중국어 하위 집합 중 1.64%에 해당하며, 중국어 위키피디아 문서 포함 비율보다 40배 이상 높은 수치다. 중국 정치 지도자나 기관을 언급하는 문서 중에서는 그 비율이 최대 23%까지 치솟았다.

 

특히 주목할 점은 매칭된 문서 중 12%만이 알려진 정부 또는 언론 도메인에서 나왔다는 사실이다. 이는 해당 콘텐츠가 AI 학습 말뭉치에 도달하기 전에 이미 웹 전체에 광범위하게 퍼졌음을 시사한다. 연구의 교신저자인 프린스턴 대학교 사회학과 Brandon M. Stewart 부교수는 "국가 조율 콘텐츠는 공식 미디어에 나타나는 것뿐만 아니라 재순환에 관한 것"이라며 "동일한 문구가 신문, 앱, 재게시, 일반 웹 페이지를 거쳐 더 광범위한 정보 환경의 일부처럼 보일 때까지 이동한다"고 설명했다.

 

학습 데이터 조작이 모델 행동 80% 바꿔

 

연구팀은 선전 콘텐츠가 실제로 모델 행동을 바꿀 수 있는지 실험했다. 소규모 오픈 모델에 중국 국가 조율 미디어를 사용한 추가 사전 학습을 실시한 결과, 수정되지 않은 모델과 비교해 거의 80%의 확률로 중국 정치 기관과 지도자에 대해 더 호의적인 답변을 생성했다. 이는 다른 비선전 중국 매체와 비교했을 때도 마찬가지였으며, 특히 인터넷에서 가져온 일반 중국어 텍스트를 추가한 경우와 비교하면 더욱 두드러졌다.

 

퍼듀 대학교 정치학과 Eddie Yang 부교수는 "동일한 정치 질문이 학습 데이터의 작은 변화만으로 체계적으로 다른 답변을 생성한다면, 이는 그 추가 문서들이 실질적인 영향을 미치고 있다는 것을 의미한다"고 강조했다. 상용 모델을 대상으로 한 테스트에서는 중국 정부에 관한 질문에 대해 중국어로 프롬프트를 입력했을 때 영어보다 75.3%의 확률로 중국에 더 우호적인 답변이 나왔다. 중국과 무관한 프롬프트에서는 이러한 차이가 우연 수준과 다르지 않았다.

 

37개국 분석..."언론 통제 강한 국가일수록 편향"


이러한 현상은 중국에만 국한되지 않는다. 국가 언어가 단일 국가 내에서 주로 사용되는 37개국을 대상으로 한 교차 국가 분석에서, 언론 통제가 강한 국가의 정부와 기관은 해당 언어로 질문했을 때 영어로 질문했을 때보다 더 호의적으로 묘사됐다. UC 샌디에이고 정치학과 Margaret E. Roberts 교수는 "이것은 AI 기업들이 의도적으로 해당 정부들의 환심을 사려 했다거나, 그 정부들이 챗봇을 염두에 두고 미디어 시스템을 통제한다는 증거가 아니다"라며 "국가가 정보 환경을 형성하고, 정보 환경이 학습 데이터를 형성하며, 학습 데이터가 모델 출력을 형성한다"고 설명했다.

 

연구팀의 공동 제1저자인 오리건 대학교 사회학과 Hannah Waight 부교수는 중국 언론에 대한 선행 연구에서 국가 주도 선전이 중국 신문에 약 90%의 날에 등장하며, 민감한 날에는 주요 신문 콘텐츠의 최대 30%가 국가에 의해 게재된다는 사실을 밝힌 바 있다.

 

Waight 교수는 "사람들은 종종 AI가 인터넷에서 중립적인 방식으로 학습한다고 말하지만 그렇지 않다"며 "AI는 이미 제도와 권력에 의해 형성된 정보 환경에서 학습하며, 그 환경은 모델이 말하는 것에 측정 가능한 흔적을 남길 수 있다"고 지적했다.

 

민주주의 저널리즘은 구조적 불리..."AI 공급망 문제"

 

민주주의수호재단(FDD)이 2026년 3월 발표한 보고서에서도 유사한 우려가 제기됐다. 해당 보고서는 국제 분쟁 관련 질문에 대한 챗봇 응답의 57%에서 친국가적 선전이 나타났으며, 민주주의 국가의 유료 프리미엄 저널리즘은 학습 데이터 파이프라인에서 구조적으로 불리한 위치에 놓여 있다고 밝혔다.

 

퍼듀 대학교의 Yang 교수는 "이것은 실제로 AI 공급망 문제"라며 "모델은 어딘가에서 정보를 얻어야 하는데, 고품질 출처에 대한 접근이 불균등하다"고 지적했다. 뉴욕 대학교 소셜 미디어·AI·정치 센터의 Solomon Messing 연구 부교수는 "학습 데이터는 현대 AI의 토대"라며 "이러한 모델이 반영하는 강력한 이해관계를 이해하려면 콘크리트를 어떻게 조달하는지 알아야 하며, 이는 학습 데이터에 무엇이 들어가는지에 대한 더 많은 투명성에서 시작된다"고 강조했다.

 

연구팀은 생성형 AI가 더욱 보편화될수록 국가 및 강력한 기관들이 LLM 출력을 형성하기 위해 미디어 통제력을 활용하려는 전략적 유인이 커질 것이라고 경고했다. 뉴욕 대학교 정치학과의 Joshua Tucker 교수는 "이것은 기술 문제가 아니라 민주주의와 거버넌스 문제"라며 "사람들이 정치 정보를 얻기 위해 챗봇을 사용하게 되면서, 사용자가 질문을 하기도 전에 어떤 기관이 답변을 형성했는지 조사해야 한다"고 말했다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 프랑스 AI 군사 시스템 ‘아르카디아’, 팔란티어 메이븐에 도전장…유럽 안보의 새 변수 되나

[뉴스스페이스=김정영 기자] 프랑스 육군이 AI 기반 전장 지휘 시스템 ‘아르카디아(Arcadia)’를 앞세워 NATO 표준으로 채택된 팔란티어 ‘메이븐 스마트 시스템(Maven Smart System·MSS NATO)’에 정면 도전장을 던졌다. 이번 행보는 전장 AI까지 ‘디지털 주권’을 확보하려는 유럽의 전략적 승부수이자, 방산·AI 산업 지형을 뒤흔들 수 있는 중장기 변수로 평가된다. 프랑스판 메이븐 ‘아르카디아’의 실체 프랑스 육군은 NATO가 2025년 팔란티어의 메이븐 스마트 시스템을 도입해 연합 지휘·정보 분석의 핵심 도구로 활용하기 시작한 직후, 자체 AI 지휘 체계 아르카디아를 ‘유럽판 메이븐’으로 육성하겠다는 방침을 공식화했다. NATO는 메이븐이 생성형 AI·머신러닝·대규모 언어모델을 활용해 “안전하고 공통된 작전 역량”을 제공한다고 평가하며 작전 지원 체계로 채택한 바 있다. 프랑스군 부사령관 패트릭 쥐스텔(Patrick Justel) 장군은 이 시스템을 유럽 내 NATO 동맹국에 적극 홍보하고 있으며, 6월 NATO 연합훈련에서 실제 전장 시나리오에 투입해 성능을 검증한다는 계획이다. 미군이 장기간 실전에서 다듬은 팔란티어 메이븐과 달

[빅테크칼럼] 벤지오, AI 질주에 제동 걸다…"통제할 방법을 모르는 AI를 세상이 만들고 있다" 경고

[뉴스스페이스=이현주 기자] 요슈아 벤지오가 다시 한 번 AI 업계의 속도전에 경고음을 울렸다. 그는 블룸버그 인터뷰에서 “우리가 통제할 방법을 모르는” 시스템을 세상이 만들고 있다며, 자율적 AI 에이전트의 확산을 막기 위한 국제 공조를 촉구했다. 벤지오는 “지금 우리는 완전한 통제 능력을 갖고 있지 않다”고 직설적으로 말했고, 해법이 국가 단위가 아니라 글로벌 거버넌스 차원에서 나와야 한다는 점을 강조했다. 핵심은 기술의 유용성이 아니라 통제 불가능성이다. LawZero가 공개한 연구 설명에 따르면 벤지오가 구상한 ‘Scientist AI’는 목표를 추구하는 에이전트형 AI와 달리, 세상을 이해하고 예측하되 자체 목표를 갖지 않는 안전 중심 시스템이다. LawZero는 또한 “현재의 첨단 AI 시스템은 공공안전과 보안에 중대한 위험을 초래할 수 있으며, 통제 불가의 인간 통제 상실까지 이어질 수 있다”고 적시했다. 이는 벤지오가 단순한 철학적 우려가 아니라, 기술 설계 자체를 바꾸는 방향으로 문제를 풀겠다고 나선 배경을 보여준다. 벤지오의 경고는 국제적 연구 흐름과도 맞닿아 있다. 2025년 1월 공개된 국제 AI 안전 보고서는 100명의 AI 전문가가