2026.04.17 (금)

  • 구름많음동두천 14.1℃
  • 흐림강릉 9.9℃
  • 흐림서울 17.5℃
  • 흐림대전 15.8℃
  • 구름많음대구 11.0℃
  • 흐림울산 11.0℃
  • 흐림광주 15.6℃
  • 구름많음부산 12.8℃
  • 흐림고창 13.1℃
  • 흐림제주 15.9℃
  • 흐림강화 13.8℃
  • 흐림보은 13.3℃
  • 흐림금산 14.1℃
  • 흐림강진군 13.9℃
  • 흐림경주시 7.8℃
  • 흐림거제 13.3℃
기상청 제공
thumbnails
빅테크

[빅테크칼럼] AI, 인간 수학자의 ‘성역’ 넘봤나… GPT-5.4의 '에르되시 난제' 해결 주장의 실체

[뉴스스페이스=이종화 기자] 오픈AI의 최신 플래그십 모델 GPT-5.4 Pro가 60년 가까이 풀리지 않았던 에르되시(Erdős) 난제 가운데 하나인 문제 #1196을 약 80분 만에 풀어냈다는 주장이 나오면서, AI의 순수 수학 연구 능력을 둘러싼 논쟁이 다시 불붙고 있다. 문제 풀이 직후 30분 만에 LaTeX 형식의 논문까지 자동으로 정리했다는 설명이 더해지면서, “AI가 드디어 인간 수학자의 프론티어를 넘었다”는 평가와 “과거에도 비슷한 과장 논란이 있었다”는 경계론이 동시에 제기되는 분위기다. axinova, tilnote.io에 따르면, 이번에 GPT-5.4 Pro가 풀었다고 알려진 에르되시 문제 #1196은 1960년대 폴 에르되시가 사르쾨지, 세메레디와 함께 제시한 정수론 난제로, ‘원시 집합(primitive set)’이라 불리는 특수한 정수 집합에서 특정 합의 점근적 거동을 묻는 문제다. 원시 집합이란 집합 안의 어느 정수도 다른 정수의 약수가 되지 않는 구조를 갖는데, 이 특성 때문에 소수 분포, 정수의 분해 구조 등 ‘정수의 해부학(anatomy of integers)’과 밀접히 연결된 영역으로 평가돼 왔다. 미국 수학자 재러드 듀커 릭트먼은 이 합에 대한 상한값을 약 1.399로 끌어내는 데 성공했지만, 에르되시가 제기한 본래의 점근 추측 전체를 완전히 해결하지는 못한 상태였다. GPT-5.4 Pro는 에포크 AI(Epoch AI) 연구원 리엄 프라이스의 프롬프트를 바탕으로 문제에 접근한 것으로 알려졌다. 모델이 제시한 핵심 아이디어는 ‘마르코프 연쇄(Markov chain)’를 도입하고 여기에 ‘폰 망골트 가중치(von Mangoldt weights)’를 결합하는 방식으로, 통계적 과정 이론과 정수론을 접목한 하이브리드 기법이다. 이 조합은 수년간 관련 문제를 파고든 인간 수학자들이 거의 시도하지 않았던 방향이어서, 수학 커뮤니티 내부에서도 “전통적 정수론 직관 바깥에서 나온 비정통적 발상”이라는 평가가 나온다. 필즈상 수상자인 테런스 타오는 에르되시 문제 프로젝트 포럼에 남긴 코멘트에서 GPT-5.4 Pro의 풀이에 대해 “정수의 구조와 마르코프 과정 이론 사이의 이전에 설명된 적 없는 연결고리를 드러낸다”고 평가하며, “이 에르되시 문제 하나를 푸는 수준을 훨씬 넘어서는, 정수 해부학에 대한 의미 있는 기여가 될 수 있다”고 말했다. 다만 테런스 타오는 동일한 글에서 증명의 핵심 단계에 대해 “돌이켜 보면 자명해 보일 수 있지만, 실제로는 다소 비약적인 점이 있다”고 지적해, AI가 제시한 논리 비약을 인간 수학자가 얼마나 엄밀하게 정리하고 재구성할 수 있을지가 향후 검증의 관건이 될 전망이다. GPT-5.4 Pro는 에르되시 문제 #1196뿐 아니라 #1148, #1202 등 다른 문제들에 대해서도 ‘검증 가능한 수준의 해법’을 내놓았다는 주장이 이어지고 있으며, 비영리 연구기관 에포크 AI의 벤치마크 ‘FrontierMath: 오픈 Problems’에 포함된 하이퍼그래프 램지 스타일 문제 한 건에 대해서도 최초의 AI 기반 공식 해법을 제시한 바 있다. 에포크 AI는 GPT-5.4 Pro가 FrontierMath의 ‘미해결 문제(오픈 Problems)’ 가운데 하나를 처음으로 해결했으며, 이후 자체 스캐폴드 환경에서 Claude Opus 4.6, Gemini 3.1 Pro, GPT-5.4 등 다른 상위 모델들도 동일 문제를 풀 수 있음이 확인됐다고 밝혔다. 해당 증명은 정리·가공 과정을 거쳐 정형 증명 시스템 Lean 포맷으로도 작성됐고, 논문 출판이 추진 중이다. 물론 GPT 계열 모델의 ‘수학 난제 해결’ 주장을 시장·홍보 차원의 과장으로 보정해야 한다는 반론도 만만치 않다. 2025년 10월, 오픈AI 부사장 케빈 웨일은 X(옛 트위터)에 “GPT-5가 미해결 에르되시 문제 10개를 해결했다”고 주장했고, 같은 회사 연구원들도 “다른 11개 문제에서 추가 진전을 이뤘다”고 뒷받침하는 글을 올렸지만, 이는 곧바로 뒤집혔다. 에르되시 문제 웹사이트 운영자인 수학자 토머스 블룸이 “웹사이트의 ‘열린 문제(오픈)’ 표기는 단지 내가 해법을 모른다는 뜻일 뿐, 학계 전체에서 미해결이라는 뜻은 아니다”라고 반박하면서, 오픈AI의 홍보는 “이미 해결된 논문을 재발견한 수준”이라는 비판에 직면했다. 당시 논란은 구글 딥마인드 CEO 데미스 허사비스와 메타 AI 수석 연구원 얀 르쿤이 각각 “창피한 일”, “GPT-5 신봉자들의 착각”이라고 직격탄을 날리며 일종의 ‘동료 기업 공개견제’ 양상으로 번졌다. 국내에서도 “오픈AI, 마음 급했나… 수학적 난제 해결했다고 과장 홍보했다가 취소” 같은 제목의 기사가 쏟아지며, AI 기업이 실제 수학적 난제 해결 수준과 ‘이미 존재하는 해법의 재조합·검색’ 수준을 혼동해선 안 된다는 교훈을 남겼다. 이 같은 전례 때문에, 이번 GPT-5.4 Pro의 에르되시 #1196 풀이 역시 ‘수학계의 공식 검증’이 끝나기 전까지는 신중한 접근이 필요하다는 견해가 우세하다. 실제로 에르되시 문제 커뮤니티와 관련 포럼에서는 “증명 구조 자체는 흥미롭지만, 일부 단계는 인간 수학자들이 다시 풀어 써야 할 여지가 있다”는 평가가 나오고 있으며, 정리·공식화 과정에서 기존 문헌과의 중복 여부, 독창적 아이디어의 범위 등이 구체적으로 가려질 전망이다. 특히 최근 또 다른 에르되시 문제 #728이 “AI 도구에 의해 거의 자율적으로 해결됐다”는 사례가 공유되는 등, 인간-기계 협업 구조 속에서 AI의 역할을 어떻게 정의할 것인지가 수학계 내부 주요 쟁점으로 부상하고 있다. 그럼에도 GPT-5.4 Pro를 비롯한 최신 대규모 언어모델이 순수 수학 연구의 풍경을 바꾸고 있다는 점만큼은 부인하기 어렵다. 2025년 국제수학올림피아드(IMO)에서 구글 딥마인드와 오픈AI는 각각 6문제 가운데 5문제를 해결해 인간 금메달 수준의 성적을 기록했고, 이후 1년도 채 안 되는 사이에 FrontierMath처럼 ‘진짜 미해결 문제’를 겨냥한 벤치마크에서 첫 AI 기반 해법이 잇따라 등장하고 있기 때문이다. 정보 검색·패턴 탐지에서 증명 스케치 생성, 형식 검증 보조에 이르기까지, AI는 이미 수학자들의 일상 도구로 스며들고 있으며, 이번 에르되시 #1196 논란은 그 최전선에서 벌어지는 ‘역사적 인수인계’의 첫 장면으로 기록될 가능성이 크다. 하지만 인간 수학자가 아직 ‘직관’과 ‘아이디어의 선택’에서 우위를 점하고 있는 지금, GPT-5.4 Pro의 에르되시 난제 도전은 AI가 그 벽을 어디까지, 얼마나 빠르게 좁혀올지 가늠하게 해주는 시금석이 되고 있다.


최신뉴스




많이 본 카드뉴스


영상뉴스(유튜브)

더보기


배너

최근 한달 많이 본 기사

















[콘텐츠인사이트] 다 보고 남는 건 우도환의 원투펀치뿐…<사냥개들2>를 보고

한때 영화 홍보를 업으로 삼던 시절이 있었다. 그때 경쟁사 홍보팀 막내였던 한 친구가 있었다. 잠시 소식을 끊고 지내는 사이, 그는 결국 꿈꾸던 영화감독이 되어 있었다. 입봉작은 <청년경찰>. 이름 석 자가 또렷이 떠오른다. 김주환. 며칠 전, 회사 후배를 통해 그와 다시 연결됐다. 뜻밖의 인연이었다. 수년 만에 전화로 안부를 주고받았고, 공교롭게도 그 시점에 넷플릭스에 막 공개된 작품이 있었다. 바로 그 친구 연출의 <사냥개들2> 시즌1을 인상 깊게 본 터라 시즌2에 대한 기대는 자연스럽게 높아졌다. 한 회당 한 시간 남짓, 총 7화가 한 번에 공개됐다. 금요일 회식의 숙취로 무거운 몸을 이끌고, 토요일이라는 짧지만 소중한 휴식의 시간을 소파에 맡긴 채 정주행에 들어갔다. 애정하는 후배가 연출한 작품이기에 독설을 아끼고 싶었지만, 결과적으로는 아쉬움이 남는다. ‘왜 이렇게까지?’ ‘그래서 이 다음은?’ 이 질문의 반복이다. 이야기의 개연성은 결국 작품의 뼈대다. 이 작품은 그 균형을 놓친 채 전개되는 인상이 짙다. 전반적으로 서사는 거칠고, 감정의 축적은 충분하지 않다. 카타르시스를 느낄 만한 지점도, 반전의 쾌감도 선명하게 남지 않는

[콘텐츠인사이트] 스끼다시였던 갈등 소재, 본 주제는 따로 있었다…<원정빌라>를 보고

어릴 적 이런 형태의 주거 공간을 자주 보곤 했다. ‘빌라, 멘숀, 빌리지…’ 직접 살아본 적은 없지만 이와 같은 이름들이 묘하게 익숙하다. 예고편과 스틸컷을 훑는 순간, 객관적 지표와는 무관하게 심박이 먼저 반응했다. 보고 싶어졌다. 그렇게 주말의 끝에서 선택한 작품이 티빙의 <원정빌라>다. 톱배우가 등장하는 것도 아니고, 연출이나 서사가 압도적일 것이라 기대하지도 않았다. 다만 평점이 나쁘지 않았고, 무엇보다 소재가 현실과 맞닿아 있다는 점이 끌렸다. ‘현대판 이웃사촌 비극 스릴러인가.’ 평소 반전과 긴장감을 선호하는 입장에서 자연스럽게 몰입했다. OTT 작품답게 러닝타임도 부담스럽지 않다. 결론부터 말하면, 나쁘지 않았다. 시간을 보내기에는 무난하다. 다만 반전의 결이 비교적 예상 가능한 범주에 머물렀다는 점은 아쉬움으로 남는다. ◆ 갈등은 전채였고, 본편은 사이비였다 층간소음, 주차 문제, 사소한 시비. 공동주택에서 흔히 벌어지는 갈등이 주요 서사일 것이라 예상했지만, 이 작품은 그 틀을 비껴간다. 오히려 그 모든 갈등은 본편으로 들어가기 위한 전채에 가깝다. 실제 중심축은 ‘사이비 종교’다. 이는 ‘나는 신이다’ ‘그것이 알고싶다’ ‘PD

















English

더보기





배너









People

더보기

Visual+

더보기

가장 많이 본 기사