오픈AI, 국제수학올림피아드 금메달 ‘충격’…"인간 수학을 넘어선 새역사·인간문명에 도전장"

오픈AI(OpenAI)가 개발한 범용 추론 언어 모델이 세계 최고 고등학생 수학 경진대회인 국제수학올림피아드(IMO)에서 ‘금메달 수준’ 성적을 공식 인증받았다. / 퍼플렉시티

[뉴스스페이스=김정영 기자] 2025년 7월, 인공지능(AI)이 또 한 번 역사를 썼다. 오픈AI(OpenAI)가 개발한 범용 추론 언어 모델이 세계 최고 고등학생 수학 경진대회인 국제수학올림피아드(IMO)에서 ‘금메달 수준’ 성적을 공식 인증받았다.

Business Insider, TechCrunch, Engadget 등의 매체와 Simon Willison’s Weblog, lesswrong.com, THE-DECODER.com 등의 자료를 분석한 결과에 따르면, 이 모델은 인간과 동등한 조건(두 번의 4.5시간 시험 세션, 인터넷∙계산도구 미사용)에서 출제된 6개 문제 가운데 5개를 완벽히 풀어내며, 42점 만점에 35점을 획득해 금메달 기준점을 넉넉히 넘었다.

IMO는 630명의 참가자 중 약 67명(전체의 10% 정도)만이 금메달을 따는 세계에서 가장 까다로운 대회로 알려져 있다. 오픈AI의 모델은 이 대회에서 실제 인간 수상자들과 같은 방식, 동일한 평가지침 아래서 전직 IMO 메달리스트 심사위원 3인에 의해 각각 채점됐고, 만장일치로 점수가 확정됐다.

“단일 과업 특화 모델 아니다”…범용 AI의 본격 도약

이번 성과는 전문 수학 프로그램이 아닌 일반 범용 대화형 AI가 달성했다는 점이 더욱 충격적이다.

연구원 Alexander Wei는 이번 성과가 “특정 과업 최적화가 아니라, 범용 강화학습과 시험 시 컴퓨팅 확장(test-time compute scaling)의 신기술을 적용한 결과”라고 밝혔다. 모델은 인간처럼 문제를 자연어(영어)로 서술해가며 해설했고, 기존 LLM(대규모 언어 모델)과 달리 시험 중 답을 내기까지 ‘수 시간’을 집중적으로 고민하는 접근으로 높은 평가를 받았다.

오픈AI 연구원 Noam Brown은 “최고의 인간과 AI의 약간 차이는 엄청난 차이”라고 강조했다.

경쟁 모델과 격차 ‘수치로 입증’

최근 MathArena.ai가 주요 상용 및 연구 모델(Gemini 2.5 Pro, Grok-4, o3 등)을 동일한 IMO 2025 문제로 평가한 결과, 최고 성적을 기록한 Gemini 2.5 Pro가 13점(42점 만점, 약 31%)에 그치며 동메달 커트라인(19점)에도 미달했다는 점은 AI 간 ‘성능 격차’의 현실을 수치로 단적으로 드러낸다.

심지어 일부 모델은 논리적 오류, 불완전한 해설, 심지어 없는 정리까지 만들어내는 등 한계를 노출했다는 것이 해외 IT매체들의 지적이다.

“곧 출시될 GPT-5와는 다른 연구 성과”…일반 공개는 미정

오픈AI는 “이 모델은 실험적으로만 개발된 연구용 시스템으로, 수 개월 내에라도 대중에 공개할 계획이 없다”고 못박았다. 대신 곧 공개될 예정인 GPT-5는 별도 팀이 개발 중인 소비자용 모델로, 이번 수학 올림피아드 금메달 성능과는 직접 관련이 없음을 분명히 했다.

AI 추론력의 한계 돌파…수학을 넘어 ‘문명 패러다임’ 바꿀까

AI의 수학 고차원 문제 해결력은 그 자체로 미래 문명의 ‘패러다임 시프트’ 신호탄으로 주목받고 있다. 전문가들은 이번 성과가 단순 수치 향상을 넘어 ▲범용 추론력 강화 ▲복잡한 창의 문제 해결 ▲증명 중심의 자연어 의사소통 등 인간 학습과정의 핵심 단계마저 기계가 넘기 시작한 기점으로 해석한다.

빅테크

오픈AI, 국제수학올림피아드 금메달 ‘충격’…"인간 수학을 넘어선 새역사·인간문명에 도전장"

관련기사

이 시각 추천뉴스

[빅테크칼럼] “프롬프트 한 줄이 파워포인트 대체”… 앤트로픽, ‘Claude Design’으로 Adobe·Figma 정조준

[빅테크칼럼] 챗GPT 광고 단가, 9주 만에 반토막…오픈AI의 ‘글로벌 경매 실험’ 어디까지 왔나

[빅테크칼럼] 하사비스 "AI 진짜 승부처, 챗봇 경쟁 아니다"… AGI 안전·과학에 ‘장기전’ 선포

[빅테크칼럼] 지멘스, 독일 공장에 AI 휴머노이드 로봇 배치…시간당 60박스로 생산라인 재설계

[빅테크칼럼] TSMC CEO "테슬라와 인텔은 고객이자 경쟁자"…머스크의 테라팹이 흔드는 ‘파운드리 3강’ 질서

[빅테크칼럼] “AI가 곧 맥이다”…퍼플렉시티, Mac 전용 ‘Personal Computer’로 에이전트 전쟁에 불을 붙였다

[빅테크칼럼] ‘GPT-로절린드’로 여는 AI 신약개발 시대…오픈AI, 왜 생명과학을 택했나

[빅테크칼럼] “세계서 가장 파괴적인 AI 제국” 만든 앤트로픽 아모데이 남매, TIME까지 주목한 이유

[빅테크칼럼] 엔비디아 젠슨 황 "앤트로픽 투자 기회 놓친 것은 내 실수"발언의 속셈?…GPU·풀스택 전략의 압도적 우위 자신감 '역설적 신호'

많이 본 뉴스

[빅테크칼럼] AI가 열어젖힌 ‘1인 유니콘’ 신화 '메드비(Medvi)'…"단 2명 회사, 연매출 2조원"

[이슈&논란] 獨 라인메탈 CEO "전 세계 방공 미사일 재고 거의 바닥" 경고…1년치 정밀무기 사용량, 단 4일만에 소진

[The Numbers] 삼성전자·SK하이닉스, 주가 급락의 진짜 이유…구글 '터보퀀트' 쇼크, 메모리반도체 시장 재편 신호탄

[이슈&논란] "조합장 해임 총회 오시면 프라이팬 드려요"…DL이앤씨, 상대원2구역 매표 행위에 '조합원들 뿔났다'

[The Numbers] 일룸, 실적 '반토막'에도 지주사 신설 직후 15억 중간배당… 대만법인 부실에 자본잠식·내부거래·고배당·소송까지 '첩첩산중'

[The Numbers] 코스닥 동전주, 폭탄 터지기 직전…K바이오 30곳, 퇴출·강등 위기, 어디?

[The Numbers] 월가 절대권력 블랙록, 전주로 온 이유…국민연금 1000조원·블랙록 2경원의 포괄적 공조

[랭킹연구소] 연령대별 한국인이 선호하는 모바일 앱?…1020 커뮤니티·콘텐츠, 3040 커리어·재테크, 50대이상 쇼핑·생활편의

[The Numbers] 공차코리아, 매출·영업익 동반 하락 속 '오너 배당 잔치'…로열티 부담에 소송 리스크까지 '첩첩산중'

[랭킹연구소] 한국 기업 매출 순위 TOP10…삼성전자>한국전력>SK하이닉스>현대차>기아>현대모비스>한국가스공사>에쓰오일>삼성생명>LG전자 順

[The Numbers] 자코모, 1000억 매출에 수익성 '급전직하', 차입금 급증·특수관계자 거래 '경고등'…누적결손 40억·부채비율 2826%에 자본잠식 '우려'

[The Numbers] 프레인글로벌, 매출 959억에도 영업익 20%·순이익 92% 급감 '수익성 빨간불'… 자회사 줄줄이 적자·무리한 투자 후폭풍?

[빅테크칼럼] 구글 “양자컴퓨터가 50만 큐비트면 9분 만에 비트코인 깬다” 경고

[이슈&논란] 35분 조깅이 초래한 ‘프랑스 보물’…Strava 한 방에 노출된 핵추진 항공모함 '샤를 드골'

[우주칼럼] 아르테미스 2호, 54년 만의 유인 달 비행 '최종 카운트다운' 돌입

[빅테크칼럼] "사람 대신 PC 앞에서 일한다" 新플랫폼 전쟁의 서막…클로드, 맥 화면 ‘직접조작’하며 일하는 풀‑스택 AI로 진화

[이슈&논란] 구글 직원으로 위장 ‘이란 스파이 미녀 자매’…픽셀·SoC 기밀, 이란으로 흘러갔나

[The Numbers] 함샤우트글로벌, 매출 15% 감소·순이익 37% 급감 '어닝쇼크'… 9.8억 회계오류·특수관계자 대여금 4배 급증·부채비율 425% '리스크'

[지구칼럼] “지구는 25억 인구만 감당 가능”…세계 83억명 ‘생태 초과’로 경고등

[랭킹연구소] 옴디아 ‘삼성 1위' vs 카운터포인트 '애플 1위’…1분기 다른 스마트폰 세계지도, 진짜 1위는?

[이슈&논란] "머스크, 고의적 주가 떨어뜨렸다" 판결…트위터 인수과정서 수십억 달러 배상 책임

[빅테크칼럼] 유출된 오픈AI 주주명부 '발칵' MS 18배 수익과 올트먼의 지분…“지분 0% CEO가 이끄는 8520억달러 기업”

[빅테크칼럼] 애플, 창립 50주년(4월 1일)을 맞아 AI 지연과 반독점 소송에 직면…흔들리는 ‘거인의 시험대’

[The Numbers] 케이피알(KPR), 매출 353억·영업이익률 0.9% '수익성 적신호'…쥐꼬리 이익·현금흐름 악화에 오너일가 '배당 논란'

[The Numbers] 5조 매출 배민(우아한형제들)의 그늘…수익성 역주행·5700억 본사 송금·공정위 칼날 '삼중고'

[The Numbers] 라이나생명, 영업이익 26% 급감에도 美 본사에 3000억 '배당 잔치'… 자본유출 논란 '도마 위'·법적소송 29건

[The Numbers] 피알원, 매출 6.2% 급감에 영업이익 45% 곤두박질…오너 일가 연계 특수관계자 거래 580억원 '내부거래 그물망' 촘촘

[이슈&논란] AI 과일 연애쇼, 10일 만에 3억 조회·330만 팔로워…틱톡, ‘저품질 AI’ 규정으로 강제 퇴출

[이슈&논란] 이란이 호르무즈 해협 통과 선박 증가 허용하며 유가하락…“완전한 재개보다는 점진적 완충 단계"

[The Numbers] 제주신화월드, 영업손실 지속·부채비율 악화 '흔들'…1.3조 결손금에 6건 소송·차입금 '부담'에 경영진 고액보상·본사로열티 '빈축'

[랭킹연구소] 대기업 직원 연봉 1억, 최고연봉자와 격차 최고 158배…연봉격차 순위, 조현상>조현준>정용진>손경식>구자균>호세무뇨스>류진>정지선>신동빈>김창한 順

[The Numbers] 메가커피 운영 엠지씨글로벌, 매출 6469억이지만 '속빈 강정'…그 뒤엔 772억 '오너 배당잔치'·1057억 차입금 폭탄·해외법인 적자누적

[빅테크칼럼] 팔란티어 CEO 카프 "AI 시대엔 기술직·신경다양인만 살아남을 것"…AI 혁명에 생존자는?

[The Numbers] 야놀자 품 '놀유니버스', 매출 167% 급증에도 짙어진 '리스크'…부채비율 222%·유동성악화 등 재무 '빨간불'·3건 법적소송 53억

[The Numbers] 다이닝브랜즈그룹(BHC), 영업이익률 27%·당기순이익 40% 급증…1408억 배당잔치·7건(192억) 법적소송·종속사 손상차손 13억 '지배구조의 부끄러운 민낯'

[우주칼럼] 119개 탑재체 몰린 팰컨9, 3월 30일 발사예정…NASA 기술 실증 라이더가 된 스페이스X

[빅테크칼럼] AI, 디지털옷장에서 런웨이, AI코디까지 패션산업 재편중…글로벌 AI 스타일링 시장 5조원까지 성장

[The Numbers] 성원애드피아, 매출 1000억원대 방어·순이익 19% 급감…오너일가 배당 3배 ‘껑충’ 특수관계자 자금대여·소송 '리스크'

[The Numbers] 호반건설, 매출 35% 급감에 PF 부실·대손상각 2380억 '직격탄'…오너일가 245억 배당잔치·소송 99건 1600억·특수관계자 자금 '퍼주기'

[빅테크칼럼] “가짜 오픈AI 앱도 진짜처럼”…북한發 Axios 공급망 공격, macOS 인증서까지 영향 미쳐