2025.12.15 (월)

  • 구름많음동두천 -0.5℃
  • 흐림강릉 5.6℃
  • 흐림서울 1.4℃
  • 맑음대전 1.1℃
  • 맑음대구 0.8℃
  • 맑음울산 2.3℃
  • 맑음광주 3.1℃
  • 맑음부산 5.8℃
  • 맑음고창 0.8℃
  • 맑음제주 6.1℃
  • 흐림강화 2.5℃
  • 맑음보은 -1.0℃
  • 맑음금산 1.4℃
  • 맑음강진군 0.2℃
  • 맑음경주시 -0.7℃
  • 맑음거제 2.6℃
기상청 제공

빅테크

[빅테크칼럼] 국내 AI, 수능 수학에서 해외 프런티어 모델에 크게 뒤처져…"AI 생태계 글로벌 경쟁력 강화 시급"

 

[뉴스스페이스=윤슬 기자] 국내 주요 대형언어모델(LLM)이 수능 수학 문제 풀이에서 해외 선도 모델에 비해 현저히 낮은 성능을 보여 AI 경쟁력 격차가 명확하게 드러났다.

 

김종락 서강대 수학과 교수 연구팀은 15일, 국내 국가대표 AI로 선정된 5개 팀의 LLM과 챗GPT, 제미나이, 클로드, 그록, 딥시크 등 해외 5개 모델을 대상으로 수능 수학 및 논술 문제 총 50문제를 동일한 조건에서 평가했다.​

 

평가 대상 문제는 수능 수학 공통과목, 확률과 통계, 미적분, 기하 영역에서 난이도가 가장 높은 문항 5개씩 20문제와 국내 10개 대학 기출 논술 10문제, 인도·일본 대학 입시 수학 각 10문제 등 총 50문제로 구성됐다. 해외 모델들은 평균 76~92점을 기록하며 고난도 문제에서도 높은 정답률을 보였다.

 

반면 국내 모델 중 업스테이지의 '솔라 프로-2'가 58점으로 가장 높은 점수를 받았고, 나머지 LG AI연구원 '엑사원 4.0.1', 네이버 'HCX-007', SK텔레콤 'A.X 4.0(72B)', 엔씨소프트 '라마 바르코 8B 인스트럭트'는 대부분 20점대에 머물렀다. 특히 '라마 바르코 8B 인스트럭트'는 2점이라는 최저점을 기록했다.​

 

연구팀은 국내 모델들이 단순 추론만으로는 문제 해결이 어렵다고 판단, 파이썬(Python) 도구 사용도 허용했으나 성능 격차는 여전히 컸다. 해외 모델로는 GPT-5.1, 제미나이 3 프로 프리뷰, 클로드 오푸스 4.5, 그록 4.1 패스트, 딥시크 V3.2 등이 포함됐다.​

 

심화 평가에서도 격차는 명확했다. 자체 제작한 '엔트로피매스(EntropyMath)' 문제 세트 10문제(대학 및 연구급 난이도)를 추가로 풀게 한 결과, 해외 모델은 82.8~90점을, 국내 모델은 7.1~53.3점에 그쳤다. 세 차례 시도로 정답을 맞히는 방식의 실험에서는 그록이 만점을, 다른 해외 모델들도 90점을 기록한 반면, 국내 모델은 솔라 프로-2가 70점, 엑사원이 60점, HCX-007이 40점, A.X 4.0이 30점, 라마 바르코 8B 인스트럭트가 20점으로 집계됐다.​

 

김종락 교수는 “국내 5개 소버린 AI 모델에 대한 수능 수학 평가가 부족하다는 지적이 많아 자체 테스트를 진행했다”며 “해외 프런티어 모델과 비교해 국내 모델의 수학적 추론 능력이 크게 뒤처져 있음을 확인했다”고 밝혔다. 연구팀은 이번에 평가한 국내 모델이 모두 기존 공개 버전이라는 점을 강조하며, 국가대표 AI 최신 버전이 공개되면 다시 성능을 평가할 계획이라고 덧붙였다.​

 

이번 실험은 서강대 수리과학 및 데이터사이언스 연구소(IMDS)와 딥파운틴이 공동 지원했다. 국내 AI가 수학 문제 해결 분야에서 해외에 비해 아직 기술 격차를 극복하지 못한 현실이 드러나면서, AI 생태계의 글로벌 경쟁력 강화 필요성이 다시금 제기되고 있다.​

배너
배너
배너

관련기사

11건의 관련기사 더보기


[이슈&논란] 머스크 영향? 중국 억만장자들, 미국 대리모로 '수백명 자녀 출산' 논란…"중국인 대상 대리모 산업까지"

[뉴스스페이스=윤슬 기자] 최근 중국의 억만장자들이 미국에서 대리모를 통해 수십 명에서 100명이 넘는 자녀를 출산하며 시민권 획득과 윤리적 논란을 일으키고 있다. 월스트리트저널(WSJ)을 비롯한 해외 주요 매체들은 온라인 게임 업체 둬이네트워크 창업자 쉬보(徐波)의 사례를 중심으로, 중국 부유층이 미국 대리모 제도를 활용해 대규모 가족을 구성하려는 시도가 증가하고 있다고 보도했다.​​ 쉬보 사례와 자녀 수 논란 쉬보는 2023년 로스앤젤레스 가정법원에서 대리모를 통해 출산한 4명의 자녀에 대한 친권을 신청했으나, 법원 조사 결과 이미 8명 이상의 자녀를 대리모를 통해 두고 있었다는 사실이 밝혀졌다. 쉬보는 “가업을 물려주기 위해 미국 태생 아들 20명을 원한다”고 진술했고, 법원은 “일반적인 양육이라기보다 아이를 수집하는 행위에 가깝다”고 판단했다. 그의 회사는 “수년간 노력한 끝에 100명 조금 넘는 자녀”를 두고 있다고 밝혔으며, 2022년 공개된 영상에서는 10명 이상의 아이들이 “아빠”라고 외치는 장면이 담겼다.​​ 머스크의 출산 장려주의와 영향 최소 14명의 자녀를 둔 일론 머스크는 “지능이 높은 사람이 늘어나야 문명을 지킬 수 있다”며 적극적인