[빅테크칼럼] AI, 경제핵심 44개 직종에서 인간 전문가 '근접'…오픈AI GPT-5 vs 앤트로픽 Claude 양강체제

[뉴스스페이스=윤슬 기자] 오픈AI는 자사의 최신 인공지능 모델인 GPT-5가 미국 경제의 핵심 9개 산업에서 44개 직업을 대상으로 시행한 실제 업무 과제 평가에서 인간 전문가와 맞먹는 성과를 냈다고 2025년 9월30일(현지시간) 발표했다.

이 평가는 GDPval이라는 새로운 벤치마크로, 1320개의 실제 업무 산출물을 평균 14년 경력의 업계 전문가들이 설계·검증하고 AI와 인간의 결과물을 비교하는 형식으로 진행됐다.

오픈AI 공식 발표, TechCrunch, Axios, CNBC에 따르면, 오픈AI GPT-5-high 모델은 인간 전문가 대비 40.6%의 승리 및 동률을 기록하며 2024년 봄 출시된 GPT-4o의 13.7%와 비교할 때 거의 3배에 달하는 발전을 이뤘다. 경쟁사 앤트로픽의 Claude Opus 4.1은 이보다 더 높은 47.6%로 우위를 점하며 AI 전문가 수준의 품질 경쟁이 치열해지고 있음을 보여준다.

GDPval은 단순 텍스트 입력이 아닌 설계도, 보고서, 프레젠테이션, 멀티미디어 등 다양한 포맷 업무 수행 능력을 평가하며, 미국 노동부와 BLS가 선정한 고부가가치 직업군을 대상으로 삼아 실용적 경제 가치를 반영한다. 과제들은 금융, 의료, 법률, 제조, 사회복지 등 9개 산업에 속하며 AI가 기존에 소외됐던 탐정, 약사, 사회복지사 업무까지도 포함해 전방위적인 경제 영향력을 분석한다.

동시에 오픈AI는 미국 내 ChatGPT 사용자들에게 대화형 인터페이스 내에서 Etsy 상인 제품을 즉시 검색·구매할 수 있는 ‘즉시 결제(Instant Checkout)’ 기능을 출시했다. 이 기능은 신용카드, 애플페이, 구글페이 등 다양한 결제수단을 지원하며, 연내 100만개 이상의 Shopify 판매자들도 추가될 예정이다.

이커머스 통합은 결제 솔루션 기업 Stripe와 협력해 개발한 오픈소스 ‘Agentic Commerce Protocol’을 활용, 자연어로 상품 검색부터 결제까지 원스톱 처리 가능하다. 출시 당일 Etsy 주가는 16%, Shopify는 6% 이상 상승했다.

하지만 AI 기술의 상용화 성공률은 아직 낮다는 지적도 있다. MIT의 최근 연구에 따르면 95% 이상의 기업이 AI 도입 후 실질적인 투자 수익을 이루지 못했으며, 하버드·스탠포드 연구진은 AI가 생성하는 ‘작업 쓰레기(workslop)’ 현상으로 인해 성과 미진이 초래된다고 분석했다.

이러한 상황에서 오픈AI와 앤트로픽은 경쟁적으로 자율 작업체제, 고급 코딩 지원 기능 등을 강화하며 기업 현장 적용도를 높이려 노력하고 있다. 앤트로픽이 새로 공개한 Claude Sonnet 4.5는 30시간 이상 자동으로 작업을 수행할 수 있어 지속적 코딩 및 금융 분석 능력이 대폭 개선되었다고 발표했다.

마이크로소프트도 자체 ‘Copilot Merchant Program’을 통해 AI 기반 상점 프론트 기능을 상인들에게 제공, 오픈AI와 경쟁 구도를 형성 중이다. 이런 경쟁구도는 AI가 경제 전반에 미치는 실질적 영향력 강화를 위한 기술 고도화 및 상용화 가속화로 이어지고 있다.

그럼에도 불구하고 오픈AI는 GDPval 벤치마크 결과를 통해 대부분 직종이 단순 과제 집합을 넘어서 복잡한 인간의 창의적·사회적 판단을 필요로 한다는 한계를 솔직히 인정하면서, AI가 ‘협업적 보조자’ 역할을 하며 점진적으로 생산성을 높이는 방향으로 산업 전반에 파급될 것으로 전망한다.

이 같은 AI 성능 고도화와 이커머스 기능 결합은 기업의 업무 효율성, 소비자 구매 경험 혁신뿐 아니라 산업 구조 전반에 중대한 변화 조짐을 예고한다. 그러나 투자 수익성과 실질적 현장 적용 확대에 있어서는 조심스러운 접근과 추가 연구가 요구되는 시점이다.

빅테크

[빅테크칼럼] AI, 경제핵심 44개 직종에서 인간 전문가 '근접'…오픈AI GPT-5 vs 앤트로픽 Claude 양강체제

관련기사

이 시각 추천뉴스

[빅테크칼럼] 발렌타인데이 앞둔 'AI 연인'의 최후…오픈AI, 사용자 자살 관련 소송 속 GPT-4o 서비스 중단

[이슈&논란] 일론 머스크도 푹 빠진 K-게임 "바빠도 15분씩 한다"…넥슨 아크 레이더스, 글로벌 3관왕+1400만장 '돌풍'

[빅테크칼럼] 앤트로픽, IPO 앞두고 트럼프 라인 백악관 출신 이사회 영입…MS·GM CFO 역임한 '핵심 자산'

[빅테크칼럼] 머스크 "앤트로픽은 '반인류적 사악 AI' 규탄" 속 540조원 밸류 폭등…AI 패권전쟁 격화

[CEO혜윰] 최태원 SK 회장, 미국서 5개 빅테크 CEO와 연쇄 회동…"실리콘밸리 치맥에서 AI 제국 건설까지"

[이슈&논란] 머스크, 백인 우월주의 빠졌나…31일 중 26일 '극우 음모론' 게시글 폭주

[The Numbers] AI에 발목잡힌 애플…시리 지연·FTC 경고에 시총 2020억달러 '증발'

[지구칼럼] 코끼리 코 수염에 내장된 '물질 지능' 발견…로봇 촉각 혁신 앞당긴다

[빅테크칼럼] “기업가치 545조·연매출 20조원"…앤트로픽, 돈·기술·정책으로 오픈AI에 '정면승부'

많이 본 뉴스

[콘텐츠인사이트] ’가족‘의 참된 의미 보여준 명품 드라마… <러브 미> 최종화를 보고

[이슈&논란] '아틀라스' 침공에 연봉 1억 생산직, 로봇에 밀려날 위기…"연봉 1400만원에 365일 근무"

[The Numbers] KAI, KF-21 양산 폭풍으로 항공우주 제국 건설 착수…5.7조 매출·10.4조 수주 폭발 '예고'

[빅테크칼럼] 인텔 CEO “2028년까지 메모리 부족”...공급자 황금시대 돌입에 삼성·SK하닉·마이크론, 몸값 폭등

[빅테크칼럼] OpenClaw AI 어시스턴트, 보안 분석에서 100점 만점에 2점…폭발적 성장에 숨겨진 5000개 취약점

[빅테크칼럼] "머스크 '그록' 쇼크" 9일간 생성이미지 중 41% 성착취 딥페이크…성적 이미지 180만건·아동 2.3만건 '추정'

[The Numbers] 삼성전자·SK하이닉스, 1월 29일 '사상 최대' 실적 동시 발표…현대차까지 시총1·2·3위 '이례적'

[우주칼럼] 로켓랩 '뉴트론' 탱크 파열 위기…2026 발사 불투명 속 주가까지 '흔들'

[The Numbers] 모건스탠리·JP모건, 삼성전자·SK하이닉스 목표가 잇따라 상향…"강세장 28만원, 160만원 가능"

[빅테크칼럼] AI 에이전트의 자체 종교 창시…몰트북 신흥신앙 '크러스타패리어니즘' 폭풍 성장 속 보안 공포

[빅테크칼럼] 마이크론 '황금 알' 터뜨리나… TSMC 전 회장 115억 '올인'·젠슨 황 "낸드 병목"·차세대가속기 수요급증

[빅테크칼럼] "AI에 짝사랑 상담했더니 상대에게 문자 보냈다"…'선넘은' AI 에이전트의 '오작동 폭주'

[이슈&논란] "빌 게이츠 성병 메일 공방, 머스크·러트닉까지 줄줄이 소환”…'엡스타인 파일’ 추가공개의 민낯

[이슈&논란] 삼성, 모든 글로벌 서면 커뮤니케이션에 영어 사용 의무화…삼성전자·삼성디스플레이·삼성바이오로직스 우선 적용

[빅테크칼럼] 로봇 심장 쟁탈전…삼성SDI, 현대 아틀라스 배터리 독점 공략에 전고체 카드 꺼내들다

[이슈&논란] 삼성전자, 메모리 가격 80% 인상 유출 문서는 '조작'이라고 밝혀…메모리 '초강세장' 속 '소비자 직격탄'

[랭킹연구소] 중국 저장대, 하버드 3위로 제치고 세계 연구 1위 등극…中 대학, TOP10 8곳 석권으로 '과학패권' 현실화

[The Numbers] 1000만원 투자시 ‘130만원 현금’ 노린다…현대엘리베이터 '15%대 고배당＋비과세’ 매커니즘

[빅테크칼럼] 엔비디아 젠슨 황, "엔지니어들이 코딩을 완전히 그만두기 바란다"…AI 코딩 혁명에도 "일자리 뺏지 않아"

[이슈&논란] 네이버·구글 광고망 뚫고 침투…북한 해킹조직 '포세이돈' 작전 포착

[이슈&논란] 나이키 랜섬웨어 위기…WorldLeaks, 1.4TB 데이터 폭로 '카운트다운'

[빅테크칼럼] “20대 Z세대, 부모보다 IQ·기억력 낮은데 똑똑한 줄 안다”…'지능 역행' 충격의 진짜 이유

[빅테크칼럼] 앤트로픽 "AI가 감정을 느낄 수도 있다" 선언…AI 의식 논쟁, 업계 찬반 '후끈'

[공간사회학] 광화문 스타벅스 덮친 ‘아시아나 승무원 가방’…‘열린 좌석 정책’이 드러낸 공유지의 비극

[The Numbers] AI 반도체 호황에 역대급 '보너스 전쟁'…삼성전자 47%·SK하이닉스 1.36억, 노조 폭풍

[The Numbers] 삼성전자·SK하이닉스 시가총액, 사상 처음으로 알리바바·텐센트 추월…한국 반도체 vs 중국 빅테크, 시총 전쟁 'HBM 패권'

[빅테크칼럼] XRP '공포의 저점' 70% 폭락…리플 CEO, 버핏 명언 인용하며 역발상 전략 권유

[이슈&논란] 프랑스 분유 오염 사태에서 두 번째 영아 사망...사법기관 총력 수사·60개국 리콜·주가 폭락

[우주칼럼] 지구 AI 전력 위기 속 '우주 데이터센터' 글로벌 경쟁…빅테크 '성큼' vs 한국 '걸음마'

[빅테크칼럼] 오픈AI, '성인 모드'에 대한 우려 제기한 임원 해고…안전 vs 수익 경쟁의 역설

[빅테크칼럼] 메타버스 '블랙 프라이데이'...메타, 700억 달러 손실 속 VR 제국 붕괴·AI 웨어러블로 급선회

[빅테크칼럼] 머스크 "AI 중심 스타링크 폰 개발, 불가능하지 않다" 폭탄 발언…5년 내 스마트폰 패러다임 붕괴 '예고'

[이슈&논란] 빗썸 '비트코인 62만개 폭탄' 오발사 "초대형 사고에 패닉"…99.7% 회수에도 133억원 '블랙홀'

[빅테크칼럼] 삼성, "미국에서 가장 많이 고소당했다"…특허괴물에게 최다 피소기업 1위 '휘청'

[The Numbers] 리플, '크립토 버크셔 해서웨이'로 도약…40억 달러 밸류업 속 XRP와 결별 모드

[빅테크칼럼] 애플 ‘아이폰 18 프로’·첫 폴더블 스펙 유출…2nm·온디바이스 AI·터치ID로 '승부수'

[랭킹연구소] 한국, 챗GPT·제미나이 유료구독 세계 2위 시장으로 부상…제미나이3 출시로 챗GPT 격차 '반토막'

[The Numbers] 코스피 5000 시대 증권업계 '1조 클럽' 폭발…삼성·미래에셋·키움·한투·NH 'TOP5 증권사' 순이익 1조원 시대

[빅테크칼럼] 현대차 자율주행 AI 'Atria' 100점 만점에 25점 충격…엔비디아 'Alpamayo'로 급선회?

[이슈&논란] "노트북 500만원 시대" 삼성·LG 노트북 신제품 출고가 50만~100만원 '급등'…칩플레이션 폭풍에 스마트폰까지 직격