2026.05.16 (토)

  • 맑음동두천 16.3℃
  • 맑음강릉 21.8℃
  • 맑음서울 19.1℃
  • 맑음대전 16.9℃
  • 맑음대구 15.2℃
  • 맑음울산 13.4℃
  • 맑음광주 17.8℃
  • 맑음부산 15.4℃
  • 맑음고창 13.9℃
  • 맑음제주 16.5℃
  • 맑음강화 14.6℃
  • 맑음보은 13.2℃
  • 맑음금산 13.9℃
  • 맑음강진군 13.0℃
  • 맑음경주시 10.6℃
  • 맑음거제 12.1℃
기상청 제공

빅테크

[빅테크칼럼] AI, 인간 수학자의 ‘성역’ 넘봤나… GPT-5.4의 '에르되시 난제' 해결 주장의 실체

 

[뉴스스페이스=이종화 기자] 오픈AI의 최신 플래그십 모델 GPT-5.4 Pro가 60년 가까이 풀리지 않았던 에르되시(Erdős) 난제 가운데 하나인 문제 #1196을 약 80분 만에 풀어냈다는 주장이 나오면서, AI의 순수 수학 연구 능력을 둘러싼 논쟁이 다시 불붙고 있다.

 

문제 풀이 직후 30분 만에 LaTeX 형식의 논문까지 자동으로 정리했다는 설명이 더해지면서, “AI가 드디어 인간 수학자의 프론티어를 넘었다”는 평가와 “과거에도 비슷한 과장 논란이 있었다”는 경계론이 동시에 제기되는 분위기다.

 

axinova, tilnote.io에 따르면, 이번에 GPT-5.4 Pro가 풀었다고 알려진 에르되시 문제 #1196은 1960년대 폴 에르되시가 사르쾨지, 세메레디와 함께 제시한 정수론 난제로, ‘원시 집합(primitive set)’이라 불리는 특수한 정수 집합에서 특정 합의 점근적 거동을 묻는 문제다. 원시 집합이란 집합 안의 어느 정수도 다른 정수의 약수가 되지 않는 구조를 갖는데, 이 특성 때문에 소수 분포, 정수의 분해 구조 등 ‘정수의 해부학(anatomy of integers)’과 밀접히 연결된 영역으로 평가돼 왔다.

 

미국 수학자 재러드 듀커 릭트먼은 이 합에 대한 상한값을 약 1.399로 끌어내는 데 성공했지만, 에르되시가 제기한 본래의 점근 추측 전체를 완전히 해결하지는 못한 상태였다.

 

GPT-5.4 Pro는 에포크 AI(Epoch AI) 연구원 리엄 프라이스의 프롬프트를 바탕으로 문제에 접근한 것으로 알려졌다. 모델이 제시한 핵심 아이디어는 ‘마르코프 연쇄(Markov chain)’를 도입하고 여기에 ‘폰 망골트 가중치(von Mangoldt weights)’를 결합하는 방식으로, 통계적 과정 이론과 정수론을 접목한 하이브리드 기법이다. 이 조합은 수년간 관련 문제를 파고든 인간 수학자들이 거의 시도하지 않았던 방향이어서, 수학 커뮤니티 내부에서도 “전통적 정수론 직관 바깥에서 나온 비정통적 발상”이라는 평가가 나온다.

 

필즈상 수상자인 테런스 타오는 에르되시 문제 프로젝트 포럼에 남긴 코멘트에서 GPT-5.4 Pro의 풀이에 대해 “정수의 구조와 마르코프 과정 이론 사이의 이전에 설명된 적 없는 연결고리를 드러낸다”고 평가하며, “이 에르되시 문제 하나를 푸는 수준을 훨씬 넘어서는, 정수 해부학에 대한 의미 있는 기여가 될 수 있다”고 말했다.

 

다만 테런스 타오는 동일한 글에서 증명의 핵심 단계에 대해 “돌이켜 보면 자명해 보일 수 있지만, 실제로는 다소 비약적인 점이 있다”고 지적해, AI가 제시한 논리 비약을 인간 수학자가 얼마나 엄밀하게 정리하고 재구성할 수 있을지가 향후 검증의 관건이 될 전망이다.

 

GPT-5.4 Pro는 에르되시 문제 #1196뿐 아니라 #1148, #1202 등 다른 문제들에 대해서도 ‘검증 가능한 수준의 해법’을 내놓았다는 주장이 이어지고 있으며, 비영리 연구기관 에포크 AI의 벤치마크 ‘FrontierMath: 오픈 Problems’에 포함된 하이퍼그래프 램지 스타일 문제 한 건에 대해서도 최초의 AI 기반 공식 해법을 제시한 바 있다.

 

에포크 AI는 GPT-5.4 Pro가 FrontierMath의 ‘미해결 문제(오픈 Problems)’ 가운데 하나를 처음으로 해결했으며, 이후 자체 스캐폴드 환경에서 Claude Opus 4.6, Gemini 3.1 Pro, GPT-5.4 등 다른 상위 모델들도 동일 문제를 풀 수 있음이 확인됐다고 밝혔다. 해당 증명은 정리·가공 과정을 거쳐 정형 증명 시스템 Lean 포맷으로도 작성됐고, 논문 출판이 추진 중이다.

 

물론 GPT 계열 모델의 ‘수학 난제 해결’ 주장을 시장·홍보 차원의 과장으로 보정해야 한다는 반론도 만만치 않다. 2025년 10월, 오픈AI 부사장 케빈 웨일은 X(옛 트위터)에 “GPT-5가 미해결 에르되시 문제 10개를 해결했다”고 주장했고, 같은 회사 연구원들도 “다른 11개 문제에서 추가 진전을 이뤘다”고 뒷받침하는 글을 올렸지만, 이는 곧바로 뒤집혔다.

 

에르되시 문제 웹사이트 운영자인 수학자 토머스 블룸이 “웹사이트의 ‘열린 문제(오픈)’ 표기는 단지 내가 해법을 모른다는 뜻일 뿐, 학계 전체에서 미해결이라는 뜻은 아니다”라고 반박하면서, 오픈AI의 홍보는 “이미 해결된 논문을 재발견한 수준”이라는 비판에 직면했다.

 

당시 논란은 구글 딥마인드 CEO 데미스 하사비스와 메타 AI 수석 연구원 얀 르쿤이 각각 “창피한 일”, “GPT-5 신봉자들의 착각”이라고 직격탄을 날리며 일종의 ‘동료 기업 공개견제’ 양상으로 번졌다. 국내에서도 “오픈AI, 마음 급했나… 수학적 난제 해결했다고 과장 홍보했다가 취소” 같은 제목의 기사가 쏟아지며, AI 기업이 실제 수학적 난제 해결 수준과 ‘이미 존재하는 해법의 재조합·검색’ 수준을 혼동해선 안 된다는 교훈을 남겼다.

 

이 같은 전례 때문에, 이번 GPT-5.4 Pro의 에르되시 #1196 풀이 역시 ‘수학계의 공식 검증’이 끝나기 전까지는 신중한 접근이 필요하다는 견해가 우세하다. 실제로 에르되시 문제 커뮤니티와 관련 포럼에서는 “증명 구조 자체는 흥미롭지만, 일부 단계는 인간 수학자들이 다시 풀어 써야 할 여지가 있다”는 평가가 나오고 있으며, 정리·공식화 과정에서 기존 문헌과의 중복 여부, 독창적 아이디어의 범위 등이 구체적으로 가려질 전망이다.

 

특히 최근 또 다른 에르되시 문제 #728이 “AI 도구에 의해 거의 자율적으로 해결됐다”는 사례가 공유되는 등, 인간-기계 협업 구조 속에서 AI의 역할을 어떻게 정의할 것인지가 수학계 내부 주요 쟁점으로 부상하고 있다.

 

그럼에도 GPT-5.4 Pro를 비롯한 최신 대규모 언어모델이 순수 수학 연구의 풍경을 바꾸고 있다는 점만큼은 부인하기 어렵다. 2025년 국제수학올림피아드(IMO)에서 구글 딥마인드와 오픈AI는 각각 6문제 가운데 5문제를 해결해 인간 금메달 수준의 성적을 기록했고, 이후 1년도 채 안 되는 사이에 FrontierMath처럼 ‘진짜 미해결 문제’를 겨냥한 벤치마크에서 첫 AI 기반 해법이 잇따라 등장하고 있기 때문이다.

 

정보 검색·패턴 탐지에서 증명 스케치 생성, 형식 검증 보조에 이르기까지, AI는 이미 수학자들의 일상 도구로 스며들고 있으며, 이번 에르되시 #1196 논란은 그 최전선에서 벌어지는 ‘역사적 인수인계’의 첫 장면으로 기록될 가능성이 크다.

 

하지만 인간 수학자가 아직 ‘직관’과 ‘아이디어의 선택’에서 우위를 점하고 있는 지금, GPT-5.4 Pro의 에르되시 난제 도전은 AI가 그 벽을 어디까지, 얼마나 빠르게 좁혀올지 가늠하게 해주는 시금석이 되고 있다.

배너
배너
배너

관련기사

10건의 관련기사 더보기


[내궁내정] ‘아킬레우스는 왜 아직도 거북이를 쫓는가’… 제논의 역설이 만든 철학·문화의 러닝타임

[뉴스스페이스=이종화 기자] <편집자주> 유튜브, 인스타 등에서 활동하는 인플루언서들이 '협찬을 받지 않았다', '광고가 아니다'라는 사실을 보이기 위해 "내 돈 주고 내가 샀다"라는 뜻의 '내돈내산'이라는 말이 생겼다. 비슷한 말로 "내가 궁금해서 결국 내가 정리했다"는 의미의 '내궁내정'이라고 이 기획코너를 명명한다. 우리 일상속에서 자주 접하는 소소한 얘기거리, 궁금증, 호기심, 용어 등에 대해 정리해보는 코너를 기획했다. 고대 그리스의 한 철학자가 던진 ‘논리적 장난감’이 인류의 시간·공간·무한 개념을 2,500년째 흔들고 있다. 현실의 상식으로는 너무나 분명한 “아킬레우스는 거북이를 반드시 따라잡는다”는 사실이, 제논의 손을 거치면 “논리적으로는 따라잡을 수 없다”는 결론으로 변신하는 순간, 철학은 물론 수학·물리학·대중문화까지 거대한 파장을 일으켰다. 제논, ‘세상은 움직이지 않는다’고 외친 고대의 트러블메이커 엘레아의 제논(Zeno of Elea, 기원전 490~430년경)은 스승 파르메니데스의 일원론을 방어하기 위해 다수성과 운동의 개념을 정면으로 공격한 철학자다. 파르메니데스가 “현실은 하나이며, 변하지 않는다”고 주장하자, 제자는

[빅테크칼럼] “애플이 약속한 ‘슈퍼 플랫폼’은 없었다”…오픈AI, 파트너십 균열로 애플 상대 법적 조치 '검토'

[뉴스스페이스=이승원 기자] 애플과 오픈AI의 ‘AI 동맹’이 법정 다툼 직전까지 치달으면서, 한때 상징적이었던 ‘애플·오픈AI 연합 전선’이 AI 패권 전쟁의 새로운 분수령으로 떠오르고 있다. 블룸버그 등 주요매체 보도를 종합하면, 오픈AI는 2년 전 체결한 애플과의 파트너십에서 약속된 수준의 챗GPT 통합과 가입자 확대 효과를 얻지 못했다며 복수의 외부 로펌과 함께 애플의 계약 위반 가능성을 검토하고 있는 것으로 전해졌다. 파트너십, 왜 ‘법정 직전’까지 갔나 블룸버그 통신은 14일(현지시간) 복수의 소식통을 인용해, 오픈AI가 애플을 상대로 정식 소송 제기 여부를 포함한 다양한 시나리오를 협의 중이며, 1차 단계로는 ‘정식 소송’이 아닌 계약 위반 통지(Notice of breach)를 보내는 방안이 유력하게 거론되고 있다고 전했다. 이는 곧바로 법정으로 가기보다는 협상력을 높이기 위한 ‘준(準) 분쟁 단계’에 들어섰다는 의미다. 오픈AI의 핵심 불만은 “애플이 아이폰·아이패드·맥에서 챗GPT를 전면에 내세우고 사용자를 폭발적으로 늘려줄 것”이라는 기대가 제대로 이행되지 않았다는 점으로 요약된다. 국내 매체들도 “챗GPT 통합 효과가 사실상 없었다는 내

[빅테크칼럼] BBC "메타 AI안경 착용자들, 여성 몰래 촬영"…'1억명 스마트 안경 시대'에 프라이버시 전쟁 '격화'

[뉴스스페이스=김정영 기자] BBC는 이번 주 메타의 레이밴 스마트 안경을 착용한 남성들이 공공장소에서 여성을 몰래 촬영한 뒤 동의 없이 영상을 온라인에 공유하는 사례가 급증하고 있다는 조사 결과를 발표했다. 심지어 한 여성은 해당 영상을 삭제받으려면 돈을 내야 한다는 요구를 받았다고 전해졌다. 이 보고서는 애플, 구글, 삼성, 스냅 등 글로벌 빅테크 기업들이 경쟁 제품 출시를 준비하는 시점에 공개돼, 얼굴에 착용하는 카메라가 본격 보급되는 시대에 프라이버시 규범이 살아남을 수 있을지에 대한 근본적 의문을 제기하고 있다. 논란 속 폭발적 성장세 메타의 레이밴 스마트 안경은 빠르게 성장하는 시장에서 압도적 지배력을 확보했다. 제조 파트너인 에실로룩소티카는 2026년 2월 2025년 한 해 동안 AI 안경을 700만개 이상 판매했다고 발표했는데, 이는 2023년과 2024년 합산 판매량 200만개의 3배를 훌쩍 넘는 수치다. 카운터포인트 리서치에 따르면 2025년 하반기 글로벌 스마트 안경 시장에서 메타가 82%의 점유율을 기록했으며, 메타는 현재 에실로룩소티카와 연간 생산량을 2,000만개로 두 배 늘리는 방안을 협의 중인 것으로 알려졌다. 그러나 이러한 성공

[The Numbers] ‘반도체 4조 순매도’ 뒤집은 외국인…현대차·두산·레인보우로 쏠린 ‘피지컬 AI’ 큰손의 선택

[뉴스스페이스=이은주 기자] 외국인 자금이 한국 증시에서 반도체 대형주를 대거 정리하고 현대차·두산로보틱스·레인보우로보틱스로 대표되는 로봇·피지컬 AI 섹터로 급격히 회전하고 있다. 4월까지만 해도 삼성전자·SK하이닉스에 매수 우위를 보이던 외국인이 5월 들어선 정반대 포지션을 취하며, 코스피 주도 섹터 지형이 재편되는 조짐이다. 외국인, 5월 들어 ‘반도체 4조 순매도 vs 로봇 9000억 순매수’ 한국거래소 집계에 따르면 5월 첫째 주(4~8일) 외국인 순매수 1~3위는 모두 로봇과 직결된 종목이었다. 현대자동차는 3,215억~3,240억원 안팎의 순매수를 기록하며 외국인 ‘최애주’로 올라섰고, 두산로보틱스가 약 3,077억~3,160억원, 레인보우로보틱스는 1,770억~2,271억원 수준의 순매수를 기록한 것으로 나타났다. 세 종목을 합친 외국인 순매수 규모는 9,000억원을 훌쩍 넘는다. 반대로 같은 기간 외국인은 반도체를 정면으로 팔았다. SK하이닉스는 2조 3,950억원 순매도라는 ‘최대 매도’ 불명예를 안았고, 삼성전자는 보통주 1조 550억원, 우선주 1조 420억원 등 합산 2조원이 넘는 순매도가 집계됐다. 결과적으로 외국인은 이 짧은 구간에

[빅테크칼럼] “AI와 싸우면 질 수밖에” 데미 무어 한마디가 드러낸 칸·할리우드 영화산업의 불안

[뉴스스페이스=김정영 기자] 제79회 칸 국제영화제 경쟁부문 심사위원으로 나선 배우 데미 무어가 “AI와 싸우는 것은 우리가 질 수밖에 없는 싸움”이라며, 영화 산업이 인공지능과의 공존 전략을 서둘러야 한다고 공개 발언했다. 생성형 AI를 경쟁 부문에서 배제한 칸의 규제와, 조건부 수용을 택한 미국 아카데미의 가이드라인이 맞물리면서, 칸 해변은 ‘레드카펫’이 아니라 ‘AI 룰 전쟁’의 최전선으로 바뀌는 모양새다. “AI와 싸우면 지는 싸움”…데미 무어가 던진 메시지 칸 영화제는 5월 12일(현지 시각) 개막했고, 박찬욱 감독이 심사위원장을 맡은 올해 심사위원단의 얼굴 중 가장 뜨거운 화두를 던진 이는 63세 할리우드 스타 데미 무어였다. 무어는 개막일 기자회견에서 “AI는 이미 우리 곁에 있다. AI와 싸우는 것은 결국 우리가 질 싸움을 하는 것과 같다”고 못 박으면서, “AI와 협력하는 방법을 찾는 것이 더 가치 있는 길”이라고 강조했다. 그는 “AI를 두려워할 필요는 없다. 진정한 예술의 원천은 물질이 아니라 영혼, 그리고 각자의 정신에서 나온다”고 말하며 인간 예술성의 ‘최종 보루’를 분명히 했다. 무어의 발언은 사전에 준비된 프로모션 멘트라기보다는,