2026.05.17 (일)

  • 맑음동두천 13.9℃
  • 맑음강릉 22.1℃
  • 맑음서울 17.1℃
  • 맑음대전 15.6℃
  • 맑음대구 17.2℃
  • 맑음울산 18.1℃
  • 맑음광주 17.4℃
  • 맑음부산 18.0℃
  • 맑음고창 13.1℃
  • 맑음제주 18.1℃
  • 맑음강화 12.4℃
  • 맑음보은 12.7℃
  • 맑음금산 13.7℃
  • 맑음강진군 13.6℃
  • 맑음경주시 13.8℃
  • 맑음거제 15.7℃
기상청 제공

빅테크

오픈AI, 국제수학올림피아드 금메달 ‘충격’…"인간 수학을 넘어선 새역사·인간문명에 도전장"

 

[뉴스스페이스=김정영 기자] 2025년 7월, 인공지능(AI)이 또 한 번 역사를 썼다. 오픈AI(OpenAI)가 개발한 범용 추론 언어 모델이 세계 최고 고등학생 수학 경진대회인 국제수학올림피아드(IMO)에서 ‘금메달 수준’ 성적을 공식 인증받았다.

 

Business Insider, TechCrunch, Engadget 등의 매체와 Simon Willison’s Weblog, lesswrong.com, THE-DECODER.com 등의 자료를 분석한 결과에 따르면, 이 모델은 인간과 동등한 조건(두 번의 4.5시간 시험 세션, 인터넷∙계산도구 미사용)에서 출제된 6개 문제 가운데 5개를 완벽히 풀어내며, 42점 만점에 35점을 획득해 금메달 기준점을 넉넉히 넘었다.

 

IMO는 630명의 참가자 중 약 67명(전체의 10% 정도)만이 금메달을 따는 세계에서 가장 까다로운 대회로 알려져 있다. 오픈AI의 모델은 이 대회에서 실제 인간 수상자들과 같은 방식, 동일한 평가지침 아래서 전직 IMO 메달리스트 심사위원 3인에 의해 각각 채점됐고, 만장일치로 점수가 확정됐다.

 

“단일 과업 특화 모델 아니다”…범용 AI의 본격 도약


이번 성과는 전문 수학 프로그램이 아닌 일반 범용 대화형 AI가 달성했다는 점이 더욱 충격적이다.

 

연구원 Alexander Wei는 이번 성과가 “특정 과업 최적화가 아니라, 범용 강화학습과 시험 시 컴퓨팅 확장(test-time compute scaling)의 신기술을 적용한 결과”라고 밝혔다. 모델은 인간처럼 문제를 자연어(영어)로 서술해가며 해설했고, 기존 LLM(대규모 언어 모델)과 달리 시험 중 답을 내기까지 ‘수 시간’을 집중적으로 고민하는 접근으로 높은 평가를 받았다.

 

오픈AI 연구원 Noam Brown은 “최고의 인간과 AI의 약간 차이는 엄청난 차이”라고 강조했다.

 

경쟁 모델과 격차 ‘수치로 입증’


최근 MathArena.ai가 주요 상용 및 연구 모델(Gemini 2.5 Pro, Grok-4, o3 등)을 동일한 IMO 2025 문제로 평가한 결과, 최고 성적을 기록한 Gemini 2.5 Pro가 13점(42점 만점, 약 31%)에 그치며 동메달 커트라인(19점)에도 미달했다는 점은 AI 간 ‘성능 격차’의 현실을 수치로 단적으로 드러낸다.

 

심지어 일부 모델은 논리적 오류, 불완전한 해설, 심지어 없는 정리까지 만들어내는 등 한계를 노출했다는 것이 해외 IT매체들의 지적이다.

 

“곧 출시될 GPT-5와는 다른 연구 성과”…일반 공개는 미정


오픈AI는 “이 모델은 실험적으로만 개발된 연구용 시스템으로, 수 개월 내에라도 대중에 공개할 계획이 없다”고 못박았다. 대신 곧 공개될 예정인 GPT-5는 별도 팀이 개발 중인 소비자용 모델로, 이번 수학 올림피아드 금메달 성능과는 직접 관련이 없음을 분명히 했다.

 

AI 추론력의 한계 돌파…수학을 넘어 ‘문명 패러다임’ 바꿀까

 

AI의 수학 고차원 문제 해결력은 그 자체로 미래 문명의 ‘패러다임 시프트’ 신호탄으로 주목받고 있다. 전문가들은 이번 성과가 단순 수치 향상을 넘어 ▲범용 추론력 강화 ▲복잡한 창의 문제 해결 ▲증명 중심의 자연어 의사소통 등 인간 학습과정의 핵심 단계마저 기계가 넘기 시작한 기점으로 해석한다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[내궁내정] ‘아킬레우스는 왜 아직도 거북이를 쫓는가’… 제논의 역설이 만든 철학·문화의 러닝타임

[뉴스스페이스=이종화 기자] <편집자주> 유튜브, 인스타 등에서 활동하는 인플루언서들이 '협찬을 받지 않았다', '광고가 아니다'라는 사실을 보이기 위해 "내 돈 주고 내가 샀다"라는 뜻의 '내돈내산'이라는 말이 생겼다. 비슷한 말로 "내가 궁금해서 결국 내가 정리했다"는 의미의 '내궁내정'이라고 이 기획코너를 명명한다. 우리 일상속에서 자주 접하는 소소한 얘기거리, 궁금증, 호기심, 용어 등에 대해 정리해보는 코너를 기획했다. 고대 그리스의 한 철학자가 던진 ‘논리적 장난감’이 인류의 시간·공간·무한 개념을 2,500년째 흔들고 있다. 현실의 상식으로는 너무나 분명한 “아킬레우스는 거북이를 반드시 따라잡는다”는 사실이, 제논의 손을 거치면 “논리적으로는 따라잡을 수 없다”는 결론으로 변신하는 순간, 철학은 물론 수학·물리학·대중문화까지 거대한 파장을 일으켰다. 제논, ‘세상은 움직이지 않는다’고 외친 고대의 트러블메이커 엘레아의 제논(Zeno of Elea, 기원전 490~430년경)은 스승 파르메니데스의 일원론을 방어하기 위해 다수성과 운동의 개념을 정면으로 공격한 철학자다. 파르메니데스가 “현실은 하나이며, 변하지 않는다”고 주장하자, 제자는

[빅테크칼럼] “애플이 약속한 ‘슈퍼 플랫폼’은 없었다”…오픈AI, 파트너십 균열로 애플 상대 법적 조치 '검토'

[뉴스스페이스=이승원 기자] 애플과 오픈AI의 ‘AI 동맹’이 법정 다툼 직전까지 치달으면서, 한때 상징적이었던 ‘애플·오픈AI 연합 전선’이 AI 패권 전쟁의 새로운 분수령으로 떠오르고 있다. 블룸버그 등 주요매체 보도를 종합하면, 오픈AI는 2년 전 체결한 애플과의 파트너십에서 약속된 수준의 챗GPT 통합과 가입자 확대 효과를 얻지 못했다며 복수의 외부 로펌과 함께 애플의 계약 위반 가능성을 검토하고 있는 것으로 전해졌다. 파트너십, 왜 ‘법정 직전’까지 갔나 블룸버그 통신은 14일(현지시간) 복수의 소식통을 인용해, 오픈AI가 애플을 상대로 정식 소송 제기 여부를 포함한 다양한 시나리오를 협의 중이며, 1차 단계로는 ‘정식 소송’이 아닌 계약 위반 통지(Notice of breach)를 보내는 방안이 유력하게 거론되고 있다고 전했다. 이는 곧바로 법정으로 가기보다는 협상력을 높이기 위한 ‘준(準) 분쟁 단계’에 들어섰다는 의미다. 오픈AI의 핵심 불만은 “애플이 아이폰·아이패드·맥에서 챗GPT를 전면에 내세우고 사용자를 폭발적으로 늘려줄 것”이라는 기대가 제대로 이행되지 않았다는 점으로 요약된다. 국내 매체들도 “챗GPT 통합 효과가 사실상 없었다는 내

[빅테크칼럼] BBC "메타 AI안경 착용자들, 여성 몰래 촬영"…'1억명 스마트 안경 시대'에 프라이버시 전쟁 '격화'

[뉴스스페이스=김정영 기자] BBC는 이번 주 메타의 레이밴 스마트 안경을 착용한 남성들이 공공장소에서 여성을 몰래 촬영한 뒤 동의 없이 영상을 온라인에 공유하는 사례가 급증하고 있다는 조사 결과를 발표했다. 심지어 한 여성은 해당 영상을 삭제받으려면 돈을 내야 한다는 요구를 받았다고 전해졌다. 이 보고서는 애플, 구글, 삼성, 스냅 등 글로벌 빅테크 기업들이 경쟁 제품 출시를 준비하는 시점에 공개돼, 얼굴에 착용하는 카메라가 본격 보급되는 시대에 프라이버시 규범이 살아남을 수 있을지에 대한 근본적 의문을 제기하고 있다. 논란 속 폭발적 성장세 메타의 레이밴 스마트 안경은 빠르게 성장하는 시장에서 압도적 지배력을 확보했다. 제조 파트너인 에실로룩소티카는 2026년 2월 2025년 한 해 동안 AI 안경을 700만개 이상 판매했다고 발표했는데, 이는 2023년과 2024년 합산 판매량 200만개의 3배를 훌쩍 넘는 수치다. 카운터포인트 리서치에 따르면 2025년 하반기 글로벌 스마트 안경 시장에서 메타가 82%의 점유율을 기록했으며, 메타는 현재 에실로룩소티카와 연간 생산량을 2,000만개로 두 배 늘리는 방안을 협의 중인 것으로 알려졌다. 그러나 이러한 성공