2025.12.16 (화)

  • 구름많음동두천 3.7℃
  • 흐림강릉 7.7℃
  • 서울 4.4℃
  • 구름많음대전 8.7℃
  • 흐림대구 6.8℃
  • 흐림울산 9.5℃
  • 흐림광주 9.1℃
  • 흐림부산 9.8℃
  • 흐림고창 9.7℃
  • 맑음제주 14.3℃
  • 구름많음강화 3.7℃
  • 흐림보은 5.4℃
  • 흐림금산 8.4℃
  • 구름많음강진군 9.7℃
  • 흐림경주시 6.6℃
  • 흐림거제 9.0℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[The Numbers] 테슬라, 최악 판매 속에도 시장점유율은 ‘역주행’…로보택시 무인 운행에 사상 최고가 '재도전'

[뉴스스페이스=이종화 기자] 테슬라가 미국 텍사스주에서 안전 요원 없이 로보택시를 운행하기 시작했다는 소식과 함께, 미국 전기차 시장 점유율 반등 효과가 겹치며 주가가 장중 사상 최고가를 갈아치우는 랠리를 연출했다. 11월 판매량은 3년 만의 최악 부진을 기록했지만, 미국 전기차 시장 전체가 더 큰 폭으로 얼어붙으면서 테슬라만 홀로 점유율을 키우는 ‘기형적 역전’이 연출됐다는 분석이 나온다.​ 사상 최고가 재도전한 테슬라 15일(현지시간) 뉴욕증시에서 테슬라 주가는 장중 7% 이상 급등하며 481.37달러까지 치솟아, 전일 대비 7.71% 급등한 수준에서 올해 들어 가장 높은 가격을 기록했다. 이는 2024년 12월 18일 기록한 장중 사상 최고가 488.54달러에 불과 1.5%포인트가량 못 미치는 수준으로, 테슬라 주가가 사실상 사상 최고 박스권을 다시 두드리기 시작했다는 상징성을 지닌다. 같은 날 종가는 475달러 안팎에서 형성되며 연간 고점에 바짝 다가섰고, 연초 이후 상승률도 약 18%로 확대됐다.​ 콕스 오토모티브, 블룸버그, 야후파이낸스, Teslarati 등에 따르면, 월가에서는 이번 랠리의 1차 동인으로 ‘무인 로보택시’ 현실화를, 2차 동인으

[이슈&논란] 머스크 영향? 중국 억만장자들, 미국 대리모로 '수백명 자녀 출산' 논란…"중국인 대상 대리모 산업까지"

[뉴스스페이스=윤슬 기자] 최근 중국의 억만장자들이 미국에서 대리모를 통해 수십 명에서 100명이 넘는 자녀를 출산하며 시민권 획득과 윤리적 논란을 일으키고 있다. 월스트리트저널(WSJ)을 비롯한 해외 주요 매체들은 온라인 게임 업체 둬이네트워크 창업자 쉬보(徐波)의 사례를 중심으로, 중국 부유층이 미국 대리모 제도를 활용해 대규모 가족을 구성하려는 시도가 증가하고 있다고 보도했다.​​ 쉬보 사례와 자녀 수 논란 쉬보는 2023년 로스앤젤레스 가정법원에서 대리모를 통해 출산한 4명의 자녀에 대한 친권을 신청했으나, 법원 조사 결과 이미 8명 이상의 자녀를 대리모를 통해 두고 있었다는 사실이 밝혀졌다. 쉬보는 “가업을 물려주기 위해 미국 태생 아들 20명을 원한다”고 진술했고, 법원은 “일반적인 양육이라기보다 아이를 수집하는 행위에 가깝다”고 판단했다. 그의 회사는 “수년간 노력한 끝에 100명 조금 넘는 자녀”를 두고 있다고 밝혔으며, 2022년 공개된 영상에서는 10명 이상의 아이들이 “아빠”라고 외치는 장면이 담겼다.​​ 머스크의 출산 장려주의와 영향 최소 14명의 자녀를 둔 일론 머스크는 “지능이 높은 사람이 늘어나야 문명을 지킬 수 있다”며 적극적인