2025.10.03 (금)

  • 맑음동두천 25.8℃
  • 구름조금강릉 27.3℃
  • 맑음서울 26.6℃
  • 구름많음대전 25.0℃
  • 흐림대구 22.6℃
  • 흐림울산 23.8℃
  • 구름많음광주 24.8℃
  • 흐림부산 27.2℃
  • 구름조금고창 25.2℃
  • 제주 24.5℃
  • 맑음강화 25.7℃
  • 구름많음보은 24.4℃
  • 구름많음금산 25.9℃
  • 구름많음강진군 26.3℃
  • 흐림경주시 22.1℃
  • 구름많음거제 25.3℃
기상청 제공

빅테크

[빅테크칼럼] AI가 핵무기 오용을 96%의 정확도로 감지한다고?…앤트로픽-美핵안보국 '맞손'

 

[뉴스스페이스=김정영 기자] 인공지능(AI) 분야에서 민간기업과 미국 정부가 손잡고 개발한 획기적인 AI 도구가, 핵무기 개발에 AI 챗봇이 악용되는 것을 96%의 정확도로 감지하는 데 성공했다.

 

인공지능 스타트업 앤트로픽(Anthropic)과 미국 에너지부 산하 국가 핵안보국(NNSA, National Nuclear Security Administration)은 1년 넘는 협력을 거쳐, 핵 관련 대화를 정당한 연구와 위험 신호 대화로 구분하는 분류기를 공동 개발했다.

 

Anthropic 공식 블로그를 비롯해 FedScoop, The Hill, The Register, Axios, VKTR, FirstPost, SIPRI, Frontier Model Forum 등의 자료와 보도를 취합한 바에 따르면, 이 분류기는 AI 챗봇 클로드(Claude) 내에서 이미 실시간으로 동작 중이며, 핵무기 관련 위험 대화를 정확히 감별해 낸다.

 

앤트로픽은 300개 이상의 합성 테스트 문장을 통해 성능을 검증했는데, 핵무기 관련 질문을 94.8% 정확히 감지했고, 정상적인 연구 대화를 오탐하지 않는 데 100% 성공했다. 결과적으로 전체 정확도는 96.2%에 달한다.

 

정부와 민간의 협력으로 탄생한 기술적 진보


2024년 4월 시작된 이 협력은, NNSA가 기밀 환경에서 앤트로픽의 AI 모델을 대상으로 직접 레드팀 공격을 수행하며 위험 요소를 찾아내는 과정으로부터 출발했다. NNSA는 핵무기 개발과 무관한 핵 관련 대화—예를 들어 원자력 발전이나 의료 분야 대화—와 위험 신호로 여겨지는 대화를 나누기 위한 지표를 제공했다. 앤트로픽은 합성 데이터를 활용해 이들 지표를 기준으로 분류기의 정확도를 계속 개선했다.

 

실제 운용 과정에서 최근 중동 지역 긴장과 같은 국제 정세에 따른 무해한 핵무기 관련 시사 토론이 일부 오탐 사례로 분류되기도 했으나, 앤트로픽의 계층적 요약(Hierarchical Summarization) 시스템이 해당 대화를 정상적인 토론으로 재분류함으로써 오탐 문제를 최소화하고 있다.

 

산업계 전반 확대와 글로벌 AI 안전 기준 제시 방안


앤트로픽은 이번 핵안전 분류기술을 아마존, 메타, 오픈AI, 마이크로소프트, 구글 등이 참여하는 프런티어 모델 포럼(Frontier Model Forum)에 공유, AI 안전에 관한 새로운 표준 사례를 제시할 계획이다.

 

이미 자사 제품 전반에 화학, 생물학, 방사선, 핵무기 개발 관련 지식을 통한 악용을 명확히 금지하는 정책을 강화하고 있음을 밝혀, 민간 AI 산업 전체의 책임 있는 기술 개발과 규율 강화 추세에 부응하고 있다.

 

전문가들은 이번 협력이 AI의 산업적 발전과 국가안보 사이 중요한 균형을 보여주는 사례라 평가하며, 향후 다른 국가안보 분야의 AI 위험 대응 모델로도 확산될 수 있을 것으로 전망한다.

 

현재 AI 거버넌스 성숙도가 45%에 불과한 현실에서, 인간 전문가와 첨단 AI 기술의 융합을 통한 이 같은 선제적 위험 관리 노력은 매우 시의적절한 혁신으로 꼽힌다.

 

이번 앤트로픽-NNSA 협력은 AI 기술 발전의 이면에 도사린 국가 안보 위험을 효과적으로 관리하는 모델로 자리매김하며, AI 안전 기준과 글로벌 협력 강화에 기폭제 역할을 할 전망이다.

배너
배너
배너

관련기사

27건의 관련기사 더보기


[빅테크칼럼] 엔비디아 젠슨 황 아들 스펜서 황, "휴머노이드 로봇 미래는 두 발 걷기 아닌 양손 조작”

[뉴스스페이스=김정영 기자] 세계 최대 AI 기업 엔비디아가 휴머노이드 로봇 분야를 차세대 핵심 성장축으로 집중 육성하는 가운데, 젠슨 황 CEO의 장남 스펜서 황이 10월 1일 서울 코엑스에서 열린 ‘휴머노이드 콘퍼런스 2025’ 산업 패널 토론에 참여해 휴머노이드 로봇 산업 발전 방향과 국내외 기술 협력 전망을 제시했다. 스펜서 황은 2022년 엔비디아에 입사해 로보틱스 부문 프로젝트 리드를 맡고 있으며, 이번 방한에는 여동생 매디슨 황도 동행해 삼성전자 R&D캠퍼스와 수원 생산기술연구소를 방문했다. ZDNet Korea, CNBC, Markets and Markets, IFR에 따르면, 스펜서 황은 토론에서 “휴머노이드 로봇 발전의 핵심은 두 발 보행이 아닌 양손 조작 능력에 있다”고 강조했다. 그는 산업 현장과 물류 창고에서 피킹 작업, 다단계 조립과 같은 손을 이용한 작업이 휴머노이드 로봇 상용화의 가장 현실적 출발점이라며 “현재는 범용성을 위해 데이터를 축적하는 중요한 단계”라고 밝혔다. 실제 물류·산업현장 작업 데이터가 로봇 학습과 성능 향상에 필수적이라는 것이다. 로봇이 반복적이고 위험하거나 무거운 작업을 대신하며 현장 근로자들로부터 긍

[빅테크칼럼] 구글, AI 챗봇 ‘제미나이 포 홈’ 탑재 스마트홈 공개…아마존 ‘알렉사+’와 경쟁

[뉴스스페이스=김정영 기자] 구글이 2025년 10월 1일(현지시간) 스마트홈 브랜드 네스트(Nest)의 신제품을 공개하며, 생성형 인공지능(AI) ‘제미나이 포 홈(Gemini for Home)’을 탑재한 스마트홈 기기 대중화에 나섰다. 이에 앞서 하루 전 공개된 아마존의 ‘알렉사+’ 탑재 신형 홈 기기들과의 경쟁이 치열해질 전망이다. 구글 2025 공식 블로그, 토큰포스트, 카운터포인트리서치에 따르면, 이번에 공개된 구글 신제품은 2K 해상도의 네스트 캠 인도어·아웃도어 카메라, 신형 네스트 도어벨, 360도 음향을 지원하는 소형 홈 스피커 등이다. 특히 ‘제미나이 포 홈’ AI 플랫폼은 기존의 구글 어시스턴트를 완전히 대체하며, 사용자가 대화하듯 자연스럽게 명령을 내릴 수 있도록 하는 점이 핵심이다. 구글은 향후 지난 10년 간 판매된 네스트 디스플레이, 스피커, 카메라, 도어벨 등 모든 스마트홈 기기에도 ‘제미나이 포 홈’을 적용할 계획이다. ‘제미나이 포 홈’은 복잡한 대화 문맥을 이해하고 다단계 명령 수행이 가능하며, 사용자 반복 없이 한결 자연스러운 음성 대화를 통해 스마트홈 전반을 제어한다. 예를 들어, 스피커에 있는 재료를 알려주면 AI가 즉