
[뉴스스페이스=김시민 기자] 인공지능 모델이 주요 산업 전반에서 전문적 업무 수준이 인간의 성능에 빠르게 접근하고 있다는 조사가 나왔다.
오픈AI가 2025년 9월 25일(현지시간) 공개한 혁신적 벤치마크 GDPval 평가 결과, 자사의 AI 모델 GPT-5가 미국 경제 주요 산업 9개 분야, 44개 직업별 업무 과제에서 인간 전문가와의 성능 비교에서 약 40.6%의 승리 또는 동률을 기록하며 인간 수준에 근접한 성과를 나타냈다.
이는 경쟁사인 앤트로픽(Anthropic)의 Claude Opus 4.1이 47.6%로 최고 기록을 세운 상황에서 이룬 성과로, AI가 경제적 산출물 면에서 기계가 인간과 거의 대등한 위치에 도달했음을 입증했다.
OpenAI GDPval 발표 자료를 비롯해 TechCrunch, Yahoo Finance, Axios에 따르면, GDPval은 기존 학술 중심 AI 테스트와 달리 실제 경제적 가치가 높은 업무 산출물을 대상으로 평가했다. 금융, 의료, 제조, 정부 등 GDP 기여가 막대한 산업별 현업 전문가들이 수십 년간 수행해온 작업을 AI 모델이 생성한 결과물과 익명으로 비교 평가해 객관성을 확보했다.
예를 들어, 투자은행가들이 '라스트 마일 배송업계 경쟁 구도 분석' 업무를 수행한 AI 출력물과 인간 보고서를 맞대결 시켜 우수성을 가렸다. 평가 과제는 평균 14년 경력 전문가들이 현실 업무 기준에 맞게 맞춤 설계했다.
15개월 전 공개된 GPT-4o 모델이 13.7% 성공률에 그친 데 비해, GPT-5는 40.6%를 기록하며 단기간 내 성능이 3배 이상 급등했다는 점도 주목된다. 테잘 파트워드한 오픈AI 평가팀장은 "이러한 급격한 성능 향상은 매우 고무적"이라고 밝히며 AI가 실질 업무 능력과 경제적 가치 입증에 가속 페달을 밟고 있음을 시사했다.
한편 AI는 단순 품질 경쟁을 넘어 생산성 혁신에서도 압도적 우위를 보였다. GDPval 과제 수행 시 AI 모델은 산업 전문가 대비 평균 약 100배 빠르고 100배 저렴한 비용으로 업무를 처리할 수 있었으나, 인간 감독과 통합 비용은 별도로 고려해야 한다고 회사는 밝혔다.
오픈AI 최고 이코노미스트 애런 채터지 박사는 "모델 역량이 점차 좋아지면서 전문가들은 일부 업무를 AI에 맡기는 형태로 고부가가치 작업에 집중할 수 있을 것"이라면서 AI가 인간 일자리를 완전 대체하기보다는 인간과 협업하는 증강형 도구로 자리매김할 것이라 전망했다.
경제학계에서도 AI가 향후 생산성에 미칠 충격적 영향력을 주목한다. 펜실베이니아대학 월튼스쿨 연구는 AI가 2035년까지 GDP와 노동 생산성을 각각 1.5% 이상 끌어올리고, 2055년에는 3%에 육박하는 상승 효과를 기록한 뒤 점차 안정될 것으로 봤다.
노동비용 절감 효과도 현재 평균 25% 수준에서 향후 40%까지 확대될 전망이다. 특히 미국 내 40% 고소득 중간 임금 직업군들이 AI 도입에 가장 큰 영향권에 들어 있으며, 전반적으로 AI가 미래 산업 경제에 지속적인 성장 동력을 제공할 것이라는 해석이 나온다.
국내외 여러 매체들도 이번 GDPval 테스트 결과를 주목하며, AI가 경제적 가치 창출뿐 아니라 업무 환경과 인력구조에 미칠 변화를 주시하고 있다. 다만 현재 GDPval이 일부 직무와 산업에 집중된 초기 평가임을 감안할 때, 미래 경제 전반에 대한 AI 위력은 추후 더욱 상세한 연구와 평가를 통해 가시화될 전망이다.
이처럼 AI는 이제 인간 전문가와 어깨를 나란히 하며, 속도와 비용 경쟁력까지 겸비하여 산업 현장 전반에 빠르게 융합되고 있다. 인간의 지능과 기계의 효율성이 결합하여 새 시대 경제 성장과 업무 혁신을 이끄는 ‘증강 노동 혁명’의 시대가 도래했음을 명확히 보여준 사건이다.