2025.12.04 (목)

  • 구름많음동두천 -0.2℃
  • 맑음강릉 2.7℃
  • 구름많음서울 1.9℃
  • 맑음대전 2.3℃
  • 맑음대구 3.5℃
  • 맑음울산 3.2℃
  • 맑음광주 4.6℃
  • 맑음부산 5.2℃
  • 맑음고창 5.3℃
  • 흐림제주 8.8℃
  • 흐림강화 0.8℃
  • 맑음보은 0.9℃
  • 맑음금산 2.0℃
  • 맑음강진군 5.3℃
  • 맑음경주시 2.9℃
  • 구름조금거제 2.7℃
기상청 제공

빅테크

오픈AI, 국제수학올림피아드 금메달 ‘충격’…"인간 수학을 넘어선 새역사·인간문명에 도전장"

 

[뉴스스페이스=김정영 기자] 2025년 7월, 인공지능(AI)이 또 한 번 역사를 썼다. 오픈AI(OpenAI)가 개발한 범용 추론 언어 모델이 세계 최고 고등학생 수학 경진대회인 국제수학올림피아드(IMO)에서 ‘금메달 수준’ 성적을 공식 인증받았다.

 

Business Insider, TechCrunch, Engadget 등의 매체와 Simon Willison’s Weblog, lesswrong.com, THE-DECODER.com 등의 자료를 분석한 결과에 따르면, 이 모델은 인간과 동등한 조건(두 번의 4.5시간 시험 세션, 인터넷∙계산도구 미사용)에서 출제된 6개 문제 가운데 5개를 완벽히 풀어내며, 42점 만점에 35점을 획득해 금메달 기준점을 넉넉히 넘었다.

 

IMO는 630명의 참가자 중 약 67명(전체의 10% 정도)만이 금메달을 따는 세계에서 가장 까다로운 대회로 알려져 있다. 오픈AI의 모델은 이 대회에서 실제 인간 수상자들과 같은 방식, 동일한 평가지침 아래서 전직 IMO 메달리스트 심사위원 3인에 의해 각각 채점됐고, 만장일치로 점수가 확정됐다.

 

“단일 과업 특화 모델 아니다”…범용 AI의 본격 도약


이번 성과는 전문 수학 프로그램이 아닌 일반 범용 대화형 AI가 달성했다는 점이 더욱 충격적이다.

 

연구원 Alexander Wei는 이번 성과가 “특정 과업 최적화가 아니라, 범용 강화학습과 시험 시 컴퓨팅 확장(test-time compute scaling)의 신기술을 적용한 결과”라고 밝혔다. 모델은 인간처럼 문제를 자연어(영어)로 서술해가며 해설했고, 기존 LLM(대규모 언어 모델)과 달리 시험 중 답을 내기까지 ‘수 시간’을 집중적으로 고민하는 접근으로 높은 평가를 받았다.

 

오픈AI 연구원 Noam Brown은 “최고의 인간과 AI의 약간 차이는 엄청난 차이”라고 강조했다.

 

경쟁 모델과 격차 ‘수치로 입증’


최근 MathArena.ai가 주요 상용 및 연구 모델(Gemini 2.5 Pro, Grok-4, o3 등)을 동일한 IMO 2025 문제로 평가한 결과, 최고 성적을 기록한 Gemini 2.5 Pro가 13점(42점 만점, 약 31%)에 그치며 동메달 커트라인(19점)에도 미달했다는 점은 AI 간 ‘성능 격차’의 현실을 수치로 단적으로 드러낸다.

 

심지어 일부 모델은 논리적 오류, 불완전한 해설, 심지어 없는 정리까지 만들어내는 등 한계를 노출했다는 것이 해외 IT매체들의 지적이다.

 

“곧 출시될 GPT-5와는 다른 연구 성과”…일반 공개는 미정


오픈AI는 “이 모델은 실험적으로만 개발된 연구용 시스템으로, 수 개월 내에라도 대중에 공개할 계획이 없다”고 못박았다. 대신 곧 공개될 예정인 GPT-5는 별도 팀이 개발 중인 소비자용 모델로, 이번 수학 올림피아드 금메달 성능과는 직접 관련이 없음을 분명히 했다.

 

AI 추론력의 한계 돌파…수학을 넘어 ‘문명 패러다임’ 바꿀까

 

AI의 수학 고차원 문제 해결력은 그 자체로 미래 문명의 ‘패러다임 시프트’ 신호탄으로 주목받고 있다. 전문가들은 이번 성과가 단순 수치 향상을 넘어 ▲범용 추론력 강화 ▲복잡한 창의 문제 해결 ▲증명 중심의 자연어 의사소통 등 인간 학습과정의 핵심 단계마저 기계가 넘기 시작한 기점으로 해석한다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 트럼프 행정부, 로봇 산업 육성카드에 테슬라 '급등'…美·中 기술패권 전쟁 새 국면

[뉴스스페이스=김정영 기자] 도널드 트럼프 미국 행정부가 인공지능(AI) 산업에 이어 로봇 산업을 차기 전략 산업으로 선정하고, 관련 행정명령 발령을 검토 중이라는 보도가 연이어 나오면서 글로벌 로봇 산업이 새로운 주목을 받고 있다. 폴리티코는 12월 3일(현지시간) 익명의 정통 소식통 3명을 인용해, 하워드 러트닉 상무부 장관이 최근 로봇 산업 CEO들과 잇달아 회의를 진행하며 산업 발전 가속화에 나서고 있다고 전했다. 이에 따라 내년(2026년) 로봇 산업 관련 행정명령 발령이 현실화될 가능성이 제기되고 있다.​ 미국, 로봇 산업 육성에 본격 돌입 상무부 대변인은 폴리티코에 "로봇 공학과 첨단 제조업은 중요한 생산을 미국으로 되돌리는 데 핵심적인 역할을 하기 때문에, 우리는 로봇 공학과 첨단 제조업에 전념하고 있다"고 밝혔다. 교통부도 올해 말 로봇공학 실무 그룹(태스크포스)을 발표할 준비를 하고 있다는 전언이다. 이는 미국이 로봇 산업을 제조업 재건과 국가 경쟁력 강화의 핵심 축으로 삼겠다는 의지를 보여주는 대목이다.​ 중국과의 기술패권 경쟁 심화 국제로봇연맹(IFR)이 발표한 ‘World Robotics 2024’ 보고서에 따르면, 2023년 기준 중

[이슈&논란] 머스크재단, 자선 기부 뒤에 숨은 ‘사익 증진’ 논란…20조원 기부금의 80%, 측근 단체로

[뉴스스페이스=김정영 기자] 일론 머스크 테슬라 최고경영자(CEO)가 설립한 머스크재단이 자선활동 명목으로 거액을 기부했지만, 실제로는 머스크 본인과 그의 사업과 밀접한 단체들이 최대 수혜자가 되고 있다는 논란이 확산되고 있다. 뉴욕타임스(NYT), 블룸버그 등 주요 외신은 2025년 12월 머스크재단의 세금신고서를 분석해, 지난해 4억7400만 달러(약 6조9650억원)를 기부했지만, 이중 약 80%에 해당하는 3억7000만 달러(약 5조4370억원)가 머스크 측근이 텍사스에서 운영하는 비영리단체 ‘더 파운데이션’으로 흘러갔다고 보도했다.​ 더 파운데이션은 머스크가 텍사스에서 추진하는 각종 사업(테슬라, 스페이스X, 보링컴퍼니 등) 근처에 위치한 초등학교를 운영하며, 사실상 머스크 계열사 직원들의 자녀 교육을 담당하는 단체로 알려졌다. 이 단체는 향후 고등학교와 대학 설립까지 계획하고 있으며, 머스크재단은 2022년 이후 지금까지 이 단체에 6억700만 달러(약 8조9000억원)를 기부한 것으로 확인됐다. 이는 머스크재단 전체 기부금의 상당 부분을 차지한다.​ 머스크재단의 다른 주요 기부처도 머스크와 밀접한 연관이 있다. 스페이스X 로켓 발사 시설 인근 텍