2025.12.04 (목)

  • 흐림동두천 -2.5℃
  • 맑음강릉 1.6℃
  • 천둥번개서울 0.4℃
  • 맑음대전 1.4℃
  • 맑음대구 0.5℃
  • 맑음울산 0.5℃
  • 구름많음광주 3.0℃
  • 맑음부산 3.4℃
  • 흐림고창 2.1℃
  • 흐림제주 9.0℃
  • 흐림강화 1.9℃
  • 맑음보은 -2.8℃
  • 맑음금산 -0.1℃
  • 흐림강진군 2.4℃
  • 맑음경주시 -1.3℃
  • 맑음거제 4.0℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 트럼프 행정부, 로봇 산업 육성카드에 테슬라 '급등'…美·中 기술패권 전쟁 새 국면

[뉴스스페이스=김정영 기자] 도널드 트럼프 미국 행정부가 인공지능(AI) 산업에 이어 로봇 산업을 차기 전략 산업으로 선정하고, 관련 행정명령 발령을 검토 중이라는 보도가 연이어 나오면서 글로벌 로봇 산업이 새로운 주목을 받고 있다. 폴리티코는 12월 3일(현지시간) 익명의 정통 소식통 3명을 인용해, 하워드 러트닉 상무부 장관이 최근 로봇 산업 CEO들과 잇달아 회의를 진행하며 산업 발전 가속화에 나서고 있다고 전했다. 이에 따라 내년(2026년) 로봇 산업 관련 행정명령 발령이 현실화될 가능성이 제기되고 있다.​ 미국, 로봇 산업 육성에 본격 돌입 상무부 대변인은 폴리티코에 "로봇 공학과 첨단 제조업은 중요한 생산을 미국으로 되돌리는 데 핵심적인 역할을 하기 때문에, 우리는 로봇 공학과 첨단 제조업에 전념하고 있다"고 밝혔다. 교통부도 올해 말 로봇공학 실무 그룹(태스크포스)을 발표할 준비를 하고 있다는 전언이다. 이는 미국이 로봇 산업을 제조업 재건과 국가 경쟁력 강화의 핵심 축으로 삼겠다는 의지를 보여주는 대목이다.​ 중국과의 기술패권 경쟁 심화 국제로봇연맹(IFR)이 발표한 ‘World Robotics 2024’ 보고서에 따르면, 2023년 기준 중

[이슈&논란] 머스크재단, 자선 기부 뒤에 숨은 ‘사익 증진’ 논란…20조원 기부금의 80%, 측근 단체로

[뉴스스페이스=김정영 기자] 일론 머스크 테슬라 최고경영자(CEO)가 설립한 머스크재단이 자선활동 명목으로 거액을 기부했지만, 실제로는 머스크 본인과 그의 사업과 밀접한 단체들이 최대 수혜자가 되고 있다는 논란이 확산되고 있다. 뉴욕타임스(NYT), 블룸버그 등 주요 외신은 2025년 12월 머스크재단의 세금신고서를 분석해, 지난해 4억7400만 달러(약 6조9650억원)를 기부했지만, 이중 약 80%에 해당하는 3억7000만 달러(약 5조4370억원)가 머스크 측근이 텍사스에서 운영하는 비영리단체 ‘더 파운데이션’으로 흘러갔다고 보도했다.​ 더 파운데이션은 머스크가 텍사스에서 추진하는 각종 사업(테슬라, 스페이스X, 보링컴퍼니 등) 근처에 위치한 초등학교를 운영하며, 사실상 머스크 계열사 직원들의 자녀 교육을 담당하는 단체로 알려졌다. 이 단체는 향후 고등학교와 대학 설립까지 계획하고 있으며, 머스크재단은 2022년 이후 지금까지 이 단체에 6억700만 달러(약 8조9000억원)를 기부한 것으로 확인됐다. 이는 머스크재단 전체 기부금의 상당 부분을 차지한다.​ 머스크재단의 다른 주요 기부처도 머스크와 밀접한 연관이 있다. 스페이스X 로켓 발사 시설 인근 텍