2026.06.09 (화)

  • 구름많음동두천 25.0℃
  • 구름많음강릉 24.4℃
  • 맑음서울 26.3℃
  • 맑음대전 25.9℃
  • 구름많음대구 23.6℃
  • 구름많음울산 22.3℃
  • 맑음광주 26.2℃
  • 구름많음부산 24.3℃
  • 맑음고창 25.2℃
  • 구름많음제주 23.1℃
  • 흐림강화 23.0℃
  • 맑음보은 25.1℃
  • 구름많음금산 24.0℃
  • 맑음강진군 25.9℃
  • 구름많음경주시 23.2℃
  • 맑음거제 22.3℃
기상청 제공

빅테크

[빅테크칼럼] 오픈AI GPT-5, 인간 업무성과 절반수준 달성…"경제적 산출물, 인간과 거의 대등한 위치 도달"

 

[뉴스스페이스=김시민 기자] 인공지능 모델이 주요 산업 전반에서 전문적 업무 수준이 인간의 성능에 빠르게 접근하고 있다는 조사가 나왔다.

 

오픈AI가 2025년 9월 25일(현지시간) 공개한 혁신적 벤치마크 GDPval 평가 결과, 자사의 AI 모델 GPT-5가 미국 경제 주요 산업 9개 분야, 44개 직업별 업무 과제에서 인간 전문가와의 성능 비교에서 약 40.6%의 승리 또는 동률을 기록하며 인간 수준에 근접한 성과를 나타냈다.

 

이는 경쟁사인 앤트로픽(Anthropic)의 Claude Opus 4.1이 47.6%로 최고 기록을 세운 상황에서 이룬 성과로, AI가 경제적 산출물 면에서 기계가 인간과 거의 대등한 위치에 도달했음을 입증했다.

 

OpenAI GDPval 발표 자료를 비롯해 TechCrunch, Yahoo Finance, Axios에 따르면, GDPval은 기존 학술 중심 AI 테스트와 달리 실제 경제적 가치가 높은 업무 산출물을 대상으로 평가했다. 금융, 의료, 제조, 정부 등 GDP 기여가 막대한 산업별 현업 전문가들이 수십 년간 수행해온 작업을 AI 모델이 생성한 결과물과 익명으로 비교 평가해 객관성을 확보했다.

 

예를 들어, 투자은행가들이 '라스트 마일 배송업계 경쟁 구도 분석' 업무를 수행한 AI 출력물과 인간 보고서를 맞대결 시켜 우수성을 가렸다. 평가 과제는 평균 14년 경력 전문가들이 현실 업무 기준에 맞게 맞춤 설계했다.

 

15개월 전 공개된 GPT-4o 모델이 13.7% 성공률에 그친 데 비해, GPT-5는 40.6%를 기록하며 단기간 내 성능이 3배 이상 급등했다는 점도 주목된다. 테잘 파트워드한 오픈AI 평가팀장은 "이러한 급격한 성능 향상은 매우 고무적"이라고 밝히며 AI가 실질 업무 능력과 경제적 가치 입증에 가속 페달을 밟고 있음을 시사했다.

 

한편 AI는 단순 품질 경쟁을 넘어 생산성 혁신에서도 압도적 우위를 보였다. GDPval 과제 수행 시 AI 모델은 산업 전문가 대비 평균 약 100배 빠르고 100배 저렴한 비용으로 업무를 처리할 수 있었으나, 인간 감독과 통합 비용은 별도로 고려해야 한다고 회사는 밝혔다.

 

오픈AI 최고 이코노미스트 애런 채터지 박사는 "모델 역량이 점차 좋아지면서 전문가들은 일부 업무를 AI에 맡기는 형태로 고부가가치 작업에 집중할 수 있을 것"이라면서 AI가 인간 일자리를 완전 대체하기보다는 인간과 협업하는 증강형 도구로 자리매김할 것이라 전망했다.

 

경제학계에서도 AI가 향후 생산성에 미칠 충격적 영향력을 주목한다. 펜실베이니아대학 월튼스쿨 연구는 AI가 2035년까지 GDP와 노동 생산성을 각각 1.5% 이상 끌어올리고, 2055년에는 3%에 육박하는 상승 효과를 기록한 뒤 점차 안정될 것으로 봤다.

 

노동비용 절감 효과도 현재 평균 25% 수준에서 향후 40%까지 확대될 전망이다. 특히 미국 내 40% 고소득 중간 임금 직업군들이 AI 도입에 가장 큰 영향권에 들어 있으며, 전반적으로 AI가 미래 산업 경제에 지속적인 성장 동력을 제공할 것이라는 해석이 나온다.

 

국내외 여러 매체들도 이번 GDPval 테스트 결과를 주목하며, AI가 경제적 가치 창출뿐 아니라 업무 환경과 인력구조에 미칠 변화를 주시하고 있다. 다만 현재 GDPval이 일부 직무와 산업에 집중된 초기 평가임을 감안할 때, 미래 경제 전반에 대한 AI 위력은 추후 더욱 상세한 연구와 평가를 통해 가시화될 전망이다.

 

이처럼 AI는 이제 인간 전문가와 어깨를 나란히 하며, 속도와 비용 경쟁력까지 겸비하여 산업 현장 전반에 빠르게 융합되고 있다. 인간의 지능과 기계의 효율성이 결합하여 새 시대 경제 성장과 업무 혁신을 이끄는 ‘증강 노동 혁명’의 시대가 도래했음을 명확히 보여준 사건이다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 프랑스 AI 군사 시스템 ‘아르카디아’, 팔란티어 메이븐에 도전장…유럽 안보의 새 변수 되나

[뉴스스페이스=김정영 기자] 프랑스 육군이 AI 기반 전장 지휘 시스템 ‘아르카디아(Arcadia)’를 앞세워 NATO 표준으로 채택된 팔란티어 ‘메이븐 스마트 시스템(Maven Smart System·MSS NATO)’에 정면 도전장을 던졌다. 이번 행보는 전장 AI까지 ‘디지털 주권’을 확보하려는 유럽의 전략적 승부수이자, 방산·AI 산업 지형을 뒤흔들 수 있는 중장기 변수로 평가된다. 프랑스판 메이븐 ‘아르카디아’의 실체 프랑스 육군은 NATO가 2025년 팔란티어의 메이븐 스마트 시스템을 도입해 연합 지휘·정보 분석의 핵심 도구로 활용하기 시작한 직후, 자체 AI 지휘 체계 아르카디아를 ‘유럽판 메이븐’으로 육성하겠다는 방침을 공식화했다. NATO는 메이븐이 생성형 AI·머신러닝·대규모 언어모델을 활용해 “안전하고 공통된 작전 역량”을 제공한다고 평가하며 작전 지원 체계로 채택한 바 있다. 프랑스군 부사령관 패트릭 쥐스텔(Patrick Justel) 장군은 이 시스템을 유럽 내 NATO 동맹국에 적극 홍보하고 있으며, 6월 NATO 연합훈련에서 실제 전장 시나리오에 투입해 성능을 검증한다는 계획이다. 미군이 장기간 실전에서 다듬은 팔란티어 메이븐과 달

[빅테크칼럼] 벤지오, AI 질주에 제동 걸다…"통제할 방법을 모르는 AI를 세상이 만들고 있다" 경고

[뉴스스페이스=이현주 기자] 요슈아 벤지오가 다시 한 번 AI 업계의 속도전에 경고음을 울렸다. 그는 블룸버그 인터뷰에서 “우리가 통제할 방법을 모르는” 시스템을 세상이 만들고 있다며, 자율적 AI 에이전트의 확산을 막기 위한 국제 공조를 촉구했다. 벤지오는 “지금 우리는 완전한 통제 능력을 갖고 있지 않다”고 직설적으로 말했고, 해법이 국가 단위가 아니라 글로벌 거버넌스 차원에서 나와야 한다는 점을 강조했다. 핵심은 기술의 유용성이 아니라 통제 불가능성이다. LawZero가 공개한 연구 설명에 따르면 벤지오가 구상한 ‘Scientist AI’는 목표를 추구하는 에이전트형 AI와 달리, 세상을 이해하고 예측하되 자체 목표를 갖지 않는 안전 중심 시스템이다. LawZero는 또한 “현재의 첨단 AI 시스템은 공공안전과 보안에 중대한 위험을 초래할 수 있으며, 통제 불가의 인간 통제 상실까지 이어질 수 있다”고 적시했다. 이는 벤지오가 단순한 철학적 우려가 아니라, 기술 설계 자체를 바꾸는 방향으로 문제를 풀겠다고 나선 배경을 보여준다. 벤지오의 경고는 국제적 연구 흐름과도 맞닿아 있다. 2025년 1월 공개된 국제 AI 안전 보고서는 100명의 AI 전문가가