[빅테크칼럼] AI, 인간 수학자의 ‘성역’ 넘봤나… GPT-5.4의 '에르되시 난제' 해결 주장의 실체

오픈AI의 최신 플래그십 모델 GPT-5.4 Pro가 60년 가까이 풀리지 않았던 에르되시(Erdős) 난제 가운데 하나인 문제 #1196을 약 80분 만에 풀어냈다는 주장이 나오면서, AI의 순수 수학 연구 능력을 둘러싼 논쟁이 다시 불붙고 있다. / 오픈AI

[뉴스스페이스=이종화 기자] 오픈AI의 최신 플래그십 모델 GPT-5.4 Pro가 60년 가까이 풀리지 않았던 에르되시(Erdős) 난제 가운데 하나인 문제 #1196을 약 80분 만에 풀어냈다는 주장이 나오면서, AI의 순수 수학 연구 능력을 둘러싼 논쟁이 다시 불붙고 있다.

문제 풀이 직후 30분 만에 LaTeX 형식의 논문까지 자동으로 정리했다는 설명이 더해지면서, “AI가 드디어 인간 수학자의 프론티어를 넘었다”는 평가와 “과거에도 비슷한 과장 논란이 있었다”는 경계론이 동시에 제기되는 분위기다.

axinova, tilnote.io에 따르면, 이번에 GPT-5.4 Pro가 풀었다고 알려진 에르되시 문제 #1196은 1960년대 폴 에르되시가 사르쾨지, 세메레디와 함께 제시한 정수론 난제로, ‘원시 집합(primitive set)’이라 불리는 특수한 정수 집합에서 특정 합의 점근적 거동을 묻는 문제다. 원시 집합이란 집합 안의 어느 정수도 다른 정수의 약수가 되지 않는 구조를 갖는데, 이 특성 때문에 소수 분포, 정수의 분해 구조 등 ‘정수의 해부학(anatomy of integers)’과 밀접히 연결된 영역으로 평가돼 왔다.

미국 수학자 재러드 듀커 릭트먼은 이 합에 대한 상한값을 약 1.399로 끌어내는 데 성공했지만, 에르되시가 제기한 본래의 점근 추측 전체를 완전히 해결하지는 못한 상태였다.

GPT-5.4 Pro는 에포크 AI(Epoch AI) 연구원 리엄 프라이스의 프롬프트를 바탕으로 문제에 접근한 것으로 알려졌다. 모델이 제시한 핵심 아이디어는 ‘마르코프 연쇄(Markov chain)’를 도입하고 여기에 ‘폰 망골트 가중치(von Mangoldt weights)’를 결합하는 방식으로, 통계적 과정 이론과 정수론을 접목한 하이브리드 기법이다. 이 조합은 수년간 관련 문제를 파고든 인간 수학자들이 거의 시도하지 않았던 방향이어서, 수학 커뮤니티 내부에서도 “전통적 정수론 직관 바깥에서 나온 비정통적 발상”이라는 평가가 나온다.

필즈상 수상자인 테런스 타오는 에르되시 문제 프로젝트 포럼에 남긴 코멘트에서 GPT-5.4 Pro의 풀이에 대해 “정수의 구조와 마르코프 과정 이론 사이의 이전에 설명된 적 없는 연결고리를 드러낸다”고 평가하며, “이 에르되시 문제 하나를 푸는 수준을 훨씬 넘어서는, 정수 해부학에 대한 의미 있는 기여가 될 수 있다”고 말했다.

다만 테런스 타오는 동일한 글에서 증명의 핵심 단계에 대해 “돌이켜 보면 자명해 보일 수 있지만, 실제로는 다소 비약적인 점이 있다”고 지적해, AI가 제시한 논리 비약을 인간 수학자가 얼마나 엄밀하게 정리하고 재구성할 수 있을지가 향후 검증의 관건이 될 전망이다.

GPT-5.4 Pro는 에르되시 문제 #1196뿐 아니라 #1148, #1202 등 다른 문제들에 대해서도 ‘검증 가능한 수준의 해법’을 내놓았다는 주장이 이어지고 있으며, 비영리 연구기관 에포크 AI의 벤치마크 ‘FrontierMath: 오픈 Problems’에 포함된 하이퍼그래프 램지 스타일 문제 한 건에 대해서도 최초의 AI 기반 공식 해법을 제시한 바 있다.

에포크 AI는 GPT-5.4 Pro가 FrontierMath의 ‘미해결 문제(오픈 Problems)’ 가운데 하나를 처음으로 해결했으며, 이후 자체 스캐폴드 환경에서 Claude Opus 4.6, Gemini 3.1 Pro, GPT-5.4 등 다른 상위 모델들도 동일 문제를 풀 수 있음이 확인됐다고 밝혔다. 해당 증명은 정리·가공 과정을 거쳐 정형 증명 시스템 Lean 포맷으로도 작성됐고, 논문 출판이 추진 중이다.

물론 GPT 계열 모델의 ‘수학 난제 해결’ 주장을 시장·홍보 차원의 과장으로 보정해야 한다는 반론도 만만치 않다. 2025년 10월, 오픈AI 부사장 케빈 웨일은 X(옛 트위터)에 “GPT-5가 미해결 에르되시 문제 10개를 해결했다”고 주장했고, 같은 회사 연구원들도 “다른 11개 문제에서 추가 진전을 이뤘다”고 뒷받침하는 글을 올렸지만, 이는 곧바로 뒤집혔다.

에르되시 문제 웹사이트 운영자인 수학자 토머스 블룸이 “웹사이트의 ‘열린 문제(오픈)’ 표기는 단지 내가 해법을 모른다는 뜻일 뿐, 학계 전체에서 미해결이라는 뜻은 아니다”라고 반박하면서, 오픈AI의 홍보는 “이미 해결된 논문을 재발견한 수준”이라는 비판에 직면했다.

당시 논란은 구글 딥마인드 CEO 데미스 허사비스와 메타 AI 수석 연구원 얀 르쿤이 각각 “창피한 일”, “GPT-5 신봉자들의 착각”이라고 직격탄을 날리며 일종의 ‘동료 기업 공개견제’ 양상으로 번졌다. 국내에서도 “오픈AI, 마음 급했나… 수학적 난제 해결했다고 과장 홍보했다가 취소” 같은 제목의 기사가 쏟아지며, AI 기업이 실제 수학적 난제 해결 수준과 ‘이미 존재하는 해법의 재조합·검색’ 수준을 혼동해선 안 된다는 교훈을 남겼다.

이 같은 전례 때문에, 이번 GPT-5.4 Pro의 에르되시 #1196 풀이 역시 ‘수학계의 공식 검증’이 끝나기 전까지는 신중한 접근이 필요하다는 견해가 우세하다. 실제로 에르되시 문제 커뮤니티와 관련 포럼에서는 “증명 구조 자체는 흥미롭지만, 일부 단계는 인간 수학자들이 다시 풀어 써야 할 여지가 있다”는 평가가 나오고 있으며, 정리·공식화 과정에서 기존 문헌과의 중복 여부, 독창적 아이디어의 범위 등이 구체적으로 가려질 전망이다.

특히 최근 또 다른 에르되시 문제 #728이 “AI 도구에 의해 거의 자율적으로 해결됐다”는 사례가 공유되는 등, 인간-기계 협업 구조 속에서 AI의 역할을 어떻게 정의할 것인지가 수학계 내부 주요 쟁점으로 부상하고 있다.

그럼에도 GPT-5.4 Pro를 비롯한 최신 대규모 언어모델이 순수 수학 연구의 풍경을 바꾸고 있다는 점만큼은 부인하기 어렵다. 2025년 국제수학올림피아드(IMO)에서 구글 딥마인드와 오픈AI는 각각 6문제 가운데 5문제를 해결해 인간 금메달 수준의 성적을 기록했고, 이후 1년도 채 안 되는 사이에 FrontierMath처럼 ‘진짜 미해결 문제’를 겨냥한 벤치마크에서 첫 AI 기반 해법이 잇따라 등장하고 있기 때문이다.

정보 검색·패턴 탐지에서 증명 스케치 생성, 형식 검증 보조에 이르기까지, AI는 이미 수학자들의 일상 도구로 스며들고 있으며, 이번 에르되시 #1196 논란은 그 최전선에서 벌어지는 ‘역사적 인수인계’의 첫 장면으로 기록될 가능성이 크다.

하지만 인간 수학자가 아직 ‘직관’과 ‘아이디어의 선택’에서 우위를 점하고 있는 지금, GPT-5.4 Pro의 에르되시 난제 도전은 AI가 그 벽을 어디까지, 얼마나 빠르게 좁혀올지 가늠하게 해주는 시금석이 되고 있다.

빅테크

[빅테크칼럼] AI, 인간 수학자의 ‘성역’ 넘봤나… GPT-5.4의 '에르되시 난제' 해결 주장의 실체

관련기사

이 시각 추천뉴스

[빅테크칼럼] AI, 인간 수학자의 ‘성역’ 넘봤나… GPT-5.4의 '에르되시 난제' 해결 주장의 실체

[빅테크칼럼] 중국 AI, 10년 묵은 美 수학 난제 ‘앤더슨 추측’을 80시간 만에 깨다…인간 수학자의 종말 선언?

[빅테크칼럼] ‘챗GPT 1강 체제’ 균열…클로드·제미나이, 사용량·점유율서 동시 추격전

[빅테크칼럼] 테슬라 카메라, 최신 업데이트로 운전자 나이 추정…안전 강화 vs 프라이버시 침해, 논쟁 '후끈'

[이슈&논란] 가족 사진까지 꺼낸 올트먼…화염병 테러가 드러낸 ‘AGI의 반지’ 권력전쟁

[빅테크칼럼] “가짜 오픈AI 앱도 진짜처럼”…북한發 Axios 공급망 공격, macOS 인증서까지 영향 미쳐

[빅테크칼럼] AI 예수 챗봇·부처 봇까지 종교 기반 AI 시장 급성장…年 1000조원 ‘영성테크’ 시장 뒤흔든다

[빅테크칼럼] ‘보이는 그대로’ 떠올린다…같은 뉴런이 그리는 뇌 속 두 번째 스크린

[빅테크칼럼] 엔비디아 독주에 칼 빼든 앤트로픽…‘3.5GW 동맹’ 넘어 자체 AI 칩까지 노린다

많이 본 뉴스

[빅테크칼럼] AI가 열어젖힌 ‘1인 유니콘’ 신화 '메드비(Medvi)'…"단 2명 회사, 연매출 2조원"

[이슈&논란] 獨 라인메탈 CEO "전 세계 방공 미사일 재고 거의 바닥" 경고…1년치 정밀무기 사용량, 단 4일만에 소진

[The Numbers] 삼성전자·SK하이닉스, 주가 급락의 진짜 이유…구글 '터보퀀트' 쇼크, 메모리반도체 시장 재편 신호탄

[이슈&논란] "조합장 해임 총회 오시면 프라이팬 드려요"…DL이앤씨, 상대원2구역 매표 행위에 '조합원들 뿔났다'

[The Numbers] 일룸, 실적 '반토막'에도 지주사 신설 직후 15억 중간배당… 대만법인 부실에 자본잠식·내부거래·고배당·소송까지 '첩첩산중'

[빅테크칼럼] "월 10만원에 마케팅팀 통째로 고용"...Okara가 몰고 온 AI CMO '폭풍'

[The Numbers] 코스닥 동전주, 폭탄 터지기 직전…K바이오 30곳, 퇴출·강등 위기, 어디?

[The Numbers] 월가 절대권력 블랙록, 전주로 온 이유…국민연금 1000조원·블랙록 2경원의 포괄적 공조

[랭킹연구소] 연령대별 한국인이 선호하는 모바일 앱?…1020 커뮤니티·콘텐츠, 3040 커리어·재테크, 50대이상 쇼핑·생활편의

[The Numbers] 자코모, 1000억 매출에 수익성 '급전직하', 차입금 급증·특수관계자 거래 '경고등'…누적결손 40억·부채비율 2826%에 자본잠식 '우려'

[The Numbers] 프레인글로벌, 매출 959억에도 영업익 20%·순이익 92% 급감 '수익성 빨간불'… 자회사 줄줄이 적자·무리한 투자 후폭풍?

[빅테크칼럼] 구글 “양자컴퓨터가 50만 큐비트면 9분 만에 비트코인 깬다” 경고

[랭킹연구소] 한국 기업 매출 순위 TOP10…삼성전자>한국전력>SK하이닉스>현대차>기아>현대모비스>한국가스공사>에쓰오일>삼성생명>LG전자 順

[The Numbers] 공차코리아, 매출·영업익 동반 하락 속 '오너 배당 잔치'…로열티 부담에 소송 리스크까지 '첩첩산중'

[우주칼럼] 아르테미스 2호, 54년 만의 유인 달 비행 '최종 카운트다운' 돌입

[이슈&논란] 35분 조깅이 초래한 ‘프랑스 보물’…Strava 한 방에 노출된 핵추진 항공모함 '샤를 드골'

[빅테크칼럼] "사람 대신 PC 앞에서 일한다" 新플랫폼 전쟁의 서막…클로드, 맥 화면 ‘직접조작’하며 일하는 풀‑스택 AI로 진화

삼성전자, 오픈AI '타이탄' 뚫었다…HBM4 8억Gb 단독 공급으로 AI 패권 굳히기 "엔비디아·AMD 이어 세번째"

[랭킹연구소] 韓민주주의 세계 41위→22위 '껑충' · 美 24→51위 '추락’…덴마크>스웨덴>노르웨이>스위스>에스토니아>아일랜드 順

[지구칼럼] “지구는 25억 인구만 감당 가능”…세계 83억명 ‘생태 초과’로 경고등

[이슈&논란] "머스크, 고의적 주가 떨어뜨렸다" 판결…트위터 인수과정서 수십억 달러 배상 책임

[이슈&논란] 구글 직원으로 위장 ‘이란 스파이 미녀 자매’…픽셀·SoC 기밀, 이란으로 흘러갔나

[빅테크칼럼] 유출된 오픈AI 주주명부 '발칵' MS 18배 수익과 올트먼의 지분…“지분 0% CEO가 이끄는 8520억달러 기업”

[랭킹연구소] 옴디아 ‘삼성 1위' vs 카운터포인트 '애플 1위’…1분기 다른 스마트폰 세계지도, 진짜 1위는?

[The Numbers] 함샤우트글로벌, 매출 15% 감소·순이익 37% 급감 '어닝쇼크'… 9.8억 회계오류·특수관계자 대여금 4배 급증·부채비율 425% '리스크'

[빅테크칼럼] 애플, 창립 50주년(4월 1일)을 맞아 AI 지연과 반독점 소송에 직면…흔들리는 ‘거인의 시험대’

[The Numbers] 케이피알(KPR), 매출 353억·영업이익률 0.9% '수익성 적신호'…쥐꼬리 이익·현금흐름 악화에 오너일가 '배당 논란'

[랭킹연구소] 강남 50대 남성, 한국 증시 ‘주식 부자’ 1위…개미 1456 명 시대의 빛과 그늘

[빅테크칼럼] 토큰 제국 시대 열리나…젠슨 황의 '토큰=생산성 화폐'가 실리콘밸리 재편하다

[The Numbers] 피알원, 매출 6.2% 급감에 영업이익 45% 곤두박질…오너 일가 연계 특수관계자 거래 580억원 '내부거래 그물망' 촘촘

[랭킹연구소] 대기업 직원 연봉 1억, 최고연봉자와 격차 최고 158배…연봉격차 순위, 조현상>조현준>정용진>손경식>구자균>호세무뇨스>류진>정지선>신동빈>김창한 順

[이슈&논란] 이란이 호르무즈 해협 통과 선박 증가 허용하며 유가하락…“완전한 재개보다는 점진적 완충 단계"

[빅테크칼럼] 팔란티어 CEO 카프 "AI 시대엔 기술직·신경다양인만 살아남을 것"…AI 혁명에 생존자는?

[The Numbers] 야놀자 품 '놀유니버스', 매출 167% 급증에도 짙어진 '리스크'…부채비율 222%·유동성악화 등 재무 '빨간불'·3건 법적소송 53억

[The Numbers] 라이나생명, 영업이익 26% 급감에도 美 본사에 3000억 '배당 잔치'… 자본유출 논란 '도마 위'·법적소송 29건

[우주칼럼] 119개 탑재체 몰린 팰컨9, 3월 30일 발사예정…NASA 기술 실증 라이더가 된 스페이스X

[랭킹연구소] K-컬처株 100억 클럽 주식부자 27명…방시혁>박진영>양현석>스쿠터브라운>박성찬>강승곤>신현호>양민석>이재현>김태형(BTS) 順

[빅테크칼럼] AI, 디지털옷장에서 런웨이, AI코디까지 패션산업 재편중…글로벌 AI 스타일링 시장 5조원까지 성장

[The Numbers] 성원애드피아, 매출 1000억원대 방어·순이익 19% 급감…오너일가 배당 3배 ‘껑충’ 특수관계자 자금대여·소송 '리스크'

[이슈&논란] AI 과일 연애쇼, 10일 만에 3억 조회·330만 팔로워…틱톡, ‘저품질 AI’ 규정으로 강제 퇴출