2025.09.04 (목)

  • 구름많음동두천 29.3℃
  • 맑음강릉 33.1℃
  • 구름많음서울 29.7℃
  • 구름조금대전 30.6℃
  • 구름조금대구 30.8℃
  • 맑음울산 31.3℃
  • 구름조금광주 30.5℃
  • 맑음부산 31.2℃
  • 맑음고창 31.0℃
  • 맑음제주 31.5℃
  • 구름많음강화 28.8℃
  • 구름조금보은 27.9℃
  • 맑음금산 29.4℃
  • 구름조금강진군 30.8℃
  • 맑음경주시 31.7℃
  • 구름조금거제 30.6℃
기상청 제공

빅테크

오픈AI, 국제수학올림피아드 금메달 ‘충격’…"인간 수학을 넘어선 새역사·인간문명에 도전장"

 

[뉴스스페이스=김정영 기자] 2025년 7월, 인공지능(AI)이 또 한 번 역사를 썼다. 오픈AI(OpenAI)가 개발한 범용 추론 언어 모델이 세계 최고 고등학생 수학 경진대회인 국제수학올림피아드(IMO)에서 ‘금메달 수준’ 성적을 공식 인증받았다.

 

Business Insider, TechCrunch, Engadget 등의 매체와 Simon Willison’s Weblog, lesswrong.com, THE-DECODER.com 등의 자료를 분석한 결과에 따르면, 이 모델은 인간과 동등한 조건(두 번의 4.5시간 시험 세션, 인터넷∙계산도구 미사용)에서 출제된 6개 문제 가운데 5개를 완벽히 풀어내며, 42점 만점에 35점을 획득해 금메달 기준점을 넉넉히 넘었다.

 

IMO는 630명의 참가자 중 약 67명(전체의 10% 정도)만이 금메달을 따는 세계에서 가장 까다로운 대회로 알려져 있다. 오픈AI의 모델은 이 대회에서 실제 인간 수상자들과 같은 방식, 동일한 평가지침 아래서 전직 IMO 메달리스트 심사위원 3인에 의해 각각 채점됐고, 만장일치로 점수가 확정됐다.

 

“단일 과업 특화 모델 아니다”…범용 AI의 본격 도약


이번 성과는 전문 수학 프로그램이 아닌 일반 범용 대화형 AI가 달성했다는 점이 더욱 충격적이다.

 

연구원 Alexander Wei는 이번 성과가 “특정 과업 최적화가 아니라, 범용 강화학습과 시험 시 컴퓨팅 확장(test-time compute scaling)의 신기술을 적용한 결과”라고 밝혔다. 모델은 인간처럼 문제를 자연어(영어)로 서술해가며 해설했고, 기존 LLM(대규모 언어 모델)과 달리 시험 중 답을 내기까지 ‘수 시간’을 집중적으로 고민하는 접근으로 높은 평가를 받았다.

 

오픈AI 연구원 Noam Brown은 “최고의 인간과 AI의 약간 차이는 엄청난 차이”라고 강조했다.

 

경쟁 모델과 격차 ‘수치로 입증’


최근 MathArena.ai가 주요 상용 및 연구 모델(Gemini 2.5 Pro, Grok-4, o3 등)을 동일한 IMO 2025 문제로 평가한 결과, 최고 성적을 기록한 Gemini 2.5 Pro가 13점(42점 만점, 약 31%)에 그치며 동메달 커트라인(19점)에도 미달했다는 점은 AI 간 ‘성능 격차’의 현실을 수치로 단적으로 드러낸다.

 

심지어 일부 모델은 논리적 오류, 불완전한 해설, 심지어 없는 정리까지 만들어내는 등 한계를 노출했다는 것이 해외 IT매체들의 지적이다.

 

“곧 출시될 GPT-5와는 다른 연구 성과”…일반 공개는 미정


오픈AI는 “이 모델은 실험적으로만 개발된 연구용 시스템으로, 수 개월 내에라도 대중에 공개할 계획이 없다”고 못박았다. 대신 곧 공개될 예정인 GPT-5는 별도 팀이 개발 중인 소비자용 모델로, 이번 수학 올림피아드 금메달 성능과는 직접 관련이 없음을 분명히 했다.

 

AI 추론력의 한계 돌파…수학을 넘어 ‘문명 패러다임’ 바꿀까

 

AI의 수학 고차원 문제 해결력은 그 자체로 미래 문명의 ‘패러다임 시프트’ 신호탄으로 주목받고 있다. 전문가들은 이번 성과가 단순 수치 향상을 넘어 ▲범용 추론력 강화 ▲복잡한 창의 문제 해결 ▲증명 중심의 자연어 의사소통 등 인간 학습과정의 핵심 단계마저 기계가 넘기 시작한 기점으로 해석한다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 구글, 크롬 매각 위기 넘겼다 "美 연방법원 분할 명령 거부"…AI가 바꾼 판결·빅테크 반독점 중요선례

[뉴스스페이스=윤슬 기자] 미국 연방법원이 구글에 대해 크롬 브라우저와 안드로이드 운영체제 매각 명령을 거부하며, 구글이 분할되는 최악의 시나리오는 막았다. 워싱턴 D.C. 연방지방법원 아미트 메흐타 판사는 2025년 9월 2일(현지시간), 온라인 검색 시장의 독점 문제를 다룬 대형 반독점 소송에서 미국 법무부가 요구한 구글 분할안을 법원이 받아들이지 않는다고 판결했다. 뉴욕타임스, CNN, 로이터, BBC, 블룸버그, CNBC, NPR, 야후 파이낸스, 테크폴리시에 따르면, 이번 판결은 2020년 10월 법무부가 제기한 이래 5년 만에 1심이 끝나는 시점에서 나왔다. 1990년대 후반 마이크로소프트 반독점 사건 이후 최대 규모로 꼽히는 이번 소송에서 법원은 "구글이 불법적으로 검색 시장과 온라인 광고 시장을 지배한 점은 인정하지만, 회사 분할 등 극단적 조치는 불가피하지 않다"고 판단했다. 구글은 이번 승리로 1조 달러(약 1300조원)에 달하는 기업 가치 하락 우려를 피했다. 다만, 시정 조치로 구글은 경쟁사들에게 검색 쿼리, 인덱스 정보 등 핵심 검색 데이터를 공유해야 하며, 독점 계약 체결도 제한 받게 된다. 다만 광고 데이터 공유 의무는 제외됐다.

[빅테크칼럼] 중국 전승절 열병식에 '늑대 로봇' 깜짝 등장…"무인군사 및 로봇 기술력 대외 과시"

[뉴스스페이스=김정영 기자] 중국은 2025년 9월 3일 베이징 톈안먼 광장에서 열린 전승절 열병식에서 차세대 무인 전투 장비인 사족형 '늑대 로봇'을 공식 공개했다. 중국중앙TV(CCTV)와 남방도시일보를 비롯한 관영 매체들에 따르면, 이 로봇은 최대 20kg의 물체를 운반할 수 있으며, 약 2.5시간 연속 운행이 가능하고, 복잡한 지형에서도 뛰어난 기동성을 자랑한다. 늑대 로봇은 자율 제어가 가능한 중국 제조 칩과 전후방 레이저 라이다 및 360도 전방위 카메라 5대를 탑재해 전방위 감지가 가능하다. 최대 30cm 높이 장애물 극복과 40도 경사 오르기도 가능해 도시 근접 전투와 폐허 지형에서도 인간과 협력해 전쟁 임무를 수행할 수 있다. 로봇은 정찰, 타격, 운반 등 역할 분담이 명확한 무인 전투 소대를 구성할 수 있다. 우두머리 격인 로봇은 전방에서 정찰과 목표정보 수집을 담당하며, 사수 로봇은 소총 등 타격 장비를 장착해 정밀 사격을 수행한다. 특히 정찰 로봇의 정보에 기반해 화력을 집중하며, 지원형 로봇은 탄약과 식량 등 물자를 운반한다. 이들은 네트워크로 연결되어 실시간 정보 공유와 상대 전략에 신속히 대응하는 집단 지능 전투 시스템을 구현한다.

[빅테크칼럼] "한국인, 유럽인보다 빨리 늙는다" 이유는? …대기오염·사회 불평등·정치 불안정이 '노화 가속화' 주범

[뉴스스페이스=이은주 기자] 한국인을 포함한 아시아 일부 국가의 노화 속도가 유럽 국가에 비해 빠르다는 충격적인 연구 결과가 발표됐다. Nature Medicine의 보도에 따르면, 더블린 트리니티대 국제뇌건강연구소(GBHI)가 세계 40개국 16만명을 대상으로 엑스포솜(Exposome) 분석 틀을 활용해 사회·정치·환경 요인이 노화에 미치는 영향을 국제적으로 비교한 결과다. 엑스포솜은 개인이 평생 노출되는 환경적 요인의 총합을 의미하며, 이는 식단, 독소, 스트레스 등 다양한 생물학적 반응을 포함한다. 연구는 대상자의 실제 나이와 건강 지표, 인지 능력, 교육 수준, 신체 기능, 심혈관 위험 요인을 종합해 ‘생체·행동 연령 격차(BBAG)’로 계산했다. BBAG가 클수록 노화가 가속화된 것으로 판단된다. 분석 결과, 한국, 중국, 인도, 이스라엘 등 아시아 4개국은 아프리카 및 라틴아메리카 국가보다는 노화 속도가 느렸으나 북유럽 국가들보다는 전반적으로 빨랐다. 북유럽 국가 중에서도 특히 덴마크와 스웨덴은 건강한 노화가 두드러진 것으로 나타났다. 노화를 앞당기는 핵심 요인으로는 대기질 악화 같은 물리적 환경, 경제 및 성별 불평등과 같은 사회적 조건, 그리고