[빅테크칼럼] 오픈AI GPT-5, 인간 업무성과 절반수준 달성…"경제적 산출물, 인간과 거의 대등한 위치 도달"

오픈AI 모델 GPT-5가 미국 경제 주요 산업 9개 분야, 44개 직업별 업무 과제에서 인간 전문가와의 성능 비교에서 약 40.6%의 승리 또는 동률을 기록하며 인간 수준에 근접한 성과를 나타냈다. / 게티이미지

[뉴스스페이스=김시민 기자] 인공지능 모델이 주요 산업 전반에서 전문적 업무 수준이 인간의 성능에 빠르게 접근하고 있다는 조사가 나왔다.

오픈AI가 2025년 9월 25일(현지시간) 공개한 혁신적 벤치마크 GDPval 평가 결과, 자사의 AI 모델 GPT-5가 미국 경제 주요 산업 9개 분야, 44개 직업별 업무 과제에서 인간 전문가와의 성능 비교에서 약 40.6%의 승리 또는 동률을 기록하며 인간 수준에 근접한 성과를 나타냈다.

이는 경쟁사인 앤트로픽(Anthropic)의 Claude Opus 4.1이 47.6%로 최고 기록을 세운 상황에서 이룬 성과로, AI가 경제적 산출물 면에서 기계가 인간과 거의 대등한 위치에 도달했음을 입증했다.

OpenAI GDPval 발표 자료를 비롯해 TechCrunch, Yahoo Finance, Axios에 따르면, GDPval은 기존 학술 중심 AI 테스트와 달리 실제 경제적 가치가 높은 업무 산출물을 대상으로 평가했다. 금융, 의료, 제조, 정부 등 GDP 기여가 막대한 산업별 현업 전문가들이 수십 년간 수행해온 작업을 AI 모델이 생성한 결과물과 익명으로 비교 평가해 객관성을 확보했다.

예를 들어, 투자은행가들이 '라스트 마일 배송업계 경쟁 구도 분석' 업무를 수행한 AI 출력물과 인간 보고서를 맞대결 시켜 우수성을 가렸다. 평가 과제는 평균 14년 경력 전문가들이 현실 업무 기준에 맞게 맞춤 설계했다.

15개월 전 공개된 GPT-4o 모델이 13.7% 성공률에 그친 데 비해, GPT-5는 40.6%를 기록하며 단기간 내 성능이 3배 이상 급등했다는 점도 주목된다. 테잘 파트워드한 오픈AI 평가팀장은 "이러한 급격한 성능 향상은 매우 고무적"이라고 밝히며 AI가 실질 업무 능력과 경제적 가치 입증에 가속 페달을 밟고 있음을 시사했다.

한편 AI는 단순 품질 경쟁을 넘어 생산성 혁신에서도 압도적 우위를 보였다. GDPval 과제 수행 시 AI 모델은 산업 전문가 대비 평균 약 100배 빠르고 100배 저렴한 비용으로 업무를 처리할 수 있었으나, 인간 감독과 통합 비용은 별도로 고려해야 한다고 회사는 밝혔다.

오픈AI 최고 이코노미스트 애런 채터지 박사는 "모델 역량이 점차 좋아지면서 전문가들은 일부 업무를 AI에 맡기는 형태로 고부가가치 작업에 집중할 수 있을 것"이라면서 AI가 인간 일자리를 완전 대체하기보다는 인간과 협업하는 증강형 도구로 자리매김할 것이라 전망했다.

경제학계에서도 AI가 향후 생산성에 미칠 충격적 영향력을 주목한다. 펜실베이니아대학 월튼스쿨 연구는 AI가 2035년까지 GDP와 노동 생산성을 각각 1.5% 이상 끌어올리고, 2055년에는 3%에 육박하는 상승 효과를 기록한 뒤 점차 안정될 것으로 봤다.

노동비용 절감 효과도 현재 평균 25% 수준에서 향후 40%까지 확대될 전망이다. 특히 미국 내 40% 고소득 중간 임금 직업군들이 AI 도입에 가장 큰 영향권에 들어 있으며, 전반적으로 AI가 미래 산업 경제에 지속적인 성장 동력을 제공할 것이라는 해석이 나온다.

국내외 여러 매체들도 이번 GDPval 테스트 결과를 주목하며, AI가 경제적 가치 창출뿐 아니라 업무 환경과 인력구조에 미칠 변화를 주시하고 있다. 다만 현재 GDPval이 일부 직무와 산업에 집중된 초기 평가임을 감안할 때, 미래 경제 전반에 대한 AI 위력은 추후 더욱 상세한 연구와 평가를 통해 가시화될 전망이다.

이처럼 AI는 이제 인간 전문가와 어깨를 나란히 하며, 속도와 비용 경쟁력까지 겸비하여 산업 현장 전반에 빠르게 융합되고 있다. 인간의 지능과 기계의 효율성이 결합하여 새 시대 경제 성장과 업무 혁신을 이끄는 ‘증강 노동 혁명’의 시대가 도래했음을 명확히 보여준 사건이다.

빅테크

[빅테크칼럼] 오픈AI GPT-5, 인간 업무성과 절반수준 달성…"경제적 산출물, 인간과 거의 대등한 위치 도달"

관련기사

이 시각 추천뉴스

[빅테크칼럼] 머스크, 1105조원 자산 돌파 "사상 최초 7000억달러 부자"…스페이스X 상장·1조달러 스톡옵션 보상안까지

[이슈&논란] 삼성 갤럭시 Z 트라이폴드, UAE에서 2분 만에 매진…"한정판 출시 전략과 엔지니어링 혁신이 만났다"

[빅테크칼럼] 구글, AI 경쟁사 견제 위한 검색결과 크롤링 업체 소송…“기생충 같은 사업모델” 비판

[이슈&논란] AI 달력에 날짜 오류, 가짜 복근 '논란'…샘 올트먼, 챗GPT 이미지 공개 후 '역풍'

[빅테크칼럼] 머스크, 200조원대 보상안 부활…테슬라 지배력 강화와 천문학적 자산가치의 시대 개막

[이슈&논란] 넷플릭스에서 제임스본드 영화 만난다…아마존 MGM과 깜짝 제휴로 스트리밍 돌입

[빅테크칼럼] AI의 대부 힌튼 "AI가 인간 노동자 대체, 사회적 혼란 오판…AI 거품 임박" 경고

[빅테크칼럼] “실험실 수준 뇌신호, 일상 속으로”…뉴어러블, 500억원 유치로 헤드폰 사업 확장 '가속'

[이슈&논란] 女교사 딥페이크 성범죄, 10대에 징역 3년 중형 선고…AI 범죄 ‘강력 처벌’ 신호탄

많이 본 뉴스

[지구칼럼] 전생에 지구 구했나? 홍복의 사우디…석유강국 넘어 125km 금광·3300조원 광물 '잭팟'

[우주칼럼] 로켓랩, 센서 문제로 한국 위성 발사 중단… 韓 재난감시 위성 NEONSAT-1A, 발사 첫날 전격 스크럽 이유

[강남비자] 49년 된 반포 고속버스터미널, 60층 주상복합 '상전벽해'…고터역 ‘신세계’·삼성역 ‘현대’·잠실역 ‘롯데’ 강남상권 '삼국지'

[CEO혜윰] 비트코인 황제의 시련…마이클 세일러의 스트래티지, MSCI·나스닥 100 퇴출시 수조원 자금 '엑소더스' 우려

[이슈&논란] “삼성家 이부진 사장 아들, 수능 1개 틀렸다”…국내파 엄마들 ‘열광’ 왜?

[The Numbers] 삼성바이오로직스 200만원 갈까?…재상장 첫날, 단주처리 혼선 속 목표주가 일제히 '상향'

[빅테크칼럼] 테슬라, 한국서 감독형 FSD 정식 개시… HW4 차량 우선 적용, 7번째 글로벌 진출지로

[The Numbers] 인적분할후 24일 거래재개 '삼성바이오·삼성에피스' 주가는?…71% 상승·25% 급등 전망에 몸값 100조원 간다

[랭킹연구소] 한국인이 가장 많이 사용하는 생성형 AI 순위…챗GPT>퍼플렉시티>에이닷>뤼튼>그록>익시오>클로드>제미나이>코파일럿>딥시크 順

[The Numbers] 비트마인, 이더리움 1억1200만 달러 매수…톰 리 '바닥 통과' 선언

스타링크, 12월 4일 한국 상륙…월 8만7000원 무제한 인터넷 시대 개막

[이슈&논란] 테슬라, '감독형 FSD' HW4 차량에만 적용 결정에 차주들 '집단소송'…'자율주행' 역차별 논란

[이슈&논란] 두나무 잔칫날 '날벼락'…업비트, 공교롭게 6년 전 500억원대 대규모 해킹 '재발생'

[이슈&논란] '쿠팡, 역대 최악 全국민 정보 유출'에 민심 싸늘…"김범석, 숨지 말고 나와라" "중국 정부에 체포·송환 요구하라”

[공간사회학] 양재동 화물터미널·반포동 고속버스터미널 개발 호재에 '몸값 급등'…하림지주·천일고속 등 '상한가 랠리'

[빅테크칼럼] 챗GPT, 2026년 1분기 ‘성인 모드’ 출시…"정신건강 위기와 자살기여 오명 대응책"

[빅테크칼럼] AI가 가장 먼저 먹어치울 일자리 3選…오픈AI "제약·고객서비스·개발자, AI에 가장 취약"

[빅테크칼럼] 테슬라, 완전 자율주행 FSD 버전 30일 무료 체험…"하드웨어 4.0 탑재차 대상, 도입률 확대 전략 가속"

[The Numbers] KB증권, 삼성전자 목표가 16만원 상향…4분기 영업이익 19조·2026년 97조 '전망'

[공간사회학] “전세도 스펙 경쟁" 임대인·임차인 모두 검증받는 시대…임차인 면접·6개월 인턴·변호사 세입자 사양 등 ‘뉴 노멀'?

[The Numbers] 마이크론 실적 발표 앞두고 삼성전자·SK하이닉스 기대감 고조…"메모리 슈퍼사이클 본격화의 신호탄"

[The Numbers] SK하이닉스, 투자주의 지정에도 강세장 지속인 이유…“목표주가 100만원, AI 수혜에 날개”

[이슈&논란] 쿠팡의 몰락?…여론악화로 불매운동·집단탈퇴, 손해배상 이어 국회청문회 '설상가상'

[우주칼럼] 한국, 6번째 항공엔진 기술 보유국 도전…정부·군·산업계 ‘심장’ 개발 범부처 협의체 출범

[이슈&논란] 이촌한강맨션·개포우성4차·압구정3구역·성수2지구 '몸살'…서울 재건축, 조합 내홍으로 사업성 '흔들'

[공간사회학] 초강도 대출규제에 청약시장도 '꽁꽁'…로또분양 '반포·용산·서초·방배·흑석·노량진' 2026년 '줄줄이'

[빅테크칼럼] "혼수 품목에서 사라졌다" TV 안보니, TV 안팔린다…'家電에서 個電 시대' 전자제품 미래는?

[이슈&논란] 코카콜라 AI 크리스마스 광고, 소셜 미디어 화제성 1위 차지…긍정·부정 소비자반응 '갑론을박'

[빅테크칼럼] '축구황제' 호날두, AI 검색엔진 퍼플렉시티에 30조원 베팅…투자와 스폰서십 체결의 진짜 이유

[내궁내정] 12월 23일부터 휴대폰 개통 안면인식 의무화…현장 혼란 불가피에도 강행해야 하는 진짜 이유

[이슈&논란] 트럼프·클린턴·게이츠·베넌 등 엡스타인 저택 사진 공개에 美 정치권 '발칵'…"판도라의 상자 열렸다"

[이슈&논란] "규제에도 27만명 몰렸다” 연내 서울 3600가구 분양…역삼센트럴자이·오티에르 반포·더샵 르프리베·아크로 드 서초·아크로 리버스카이 '눈길'

[내궁내정] 빌 게이츠 "연말에 이 책 5권 읽어라"…독서취향에서 드러난 통찰과 시사점

[랭킹연구소] 자사주 보유 비중 TOP30…SK>미래에셋증권>두산>DB손보>삼성화재>LS>KT&G>HD현대>삼성생명>유한양행 順

[빅테크칼럼] 엔비디아 독주 균열? 메타·구글 AI 칩 협상에 삼성전자 몸값 '쑥'…TPU 대안으로 수혜주 '부각'

[랭킹연구소] 구글 알파벳, MS 제치고 세계 3위 기업 '우뚝'…시총순위, 엔비디아>애플>구글>MS 順

[The Numbers] 마이크로스트래티지, 시가총액이 비트코인 보유액 아래로 추락…“순자산가치 역전” 자산매각 신호탄?

[랭킹연구소] 잉여현금흐름 증가액 상위 기업 순위…SK하이닉스>삼성전자>한화오션>HD현대중공업>한국전력>LG화학 順

[The Numbers] AI 공포 끝? ‘매그니피센트 7’ 질주에 나스닥 2.7% 급등…테슬라·알파벳 6%대 폭등·비트코인 8만8000달러 눈치장세

[이슈&논란] 쿠팡, 3370만명 정보 유출로 미국서 천문학적 배상 '직면'…강남 비밀 사무실서 로비 '의혹'