2025.10.30 (목)

  • 흐림동두천 15.1℃
  • 흐림강릉 15.7℃
  • 흐림서울 16.5℃
  • 흐림대전 19.4℃
  • 흐림대구 19.1℃
  • 흐림울산 19.5℃
  • 흐림광주 22.1℃
  • 흐림부산 21.7℃
  • 구름많음고창 23.2℃
  • 맑음제주 26.3℃
  • 흐림강화 15.4℃
  • 흐림보은 18.0℃
  • 구름많음금산 19.7℃
  • 흐림강진군 23.0℃
  • 흐림경주시 18.6℃
  • 흐림거제 21.8℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 젠슨 황·이재용·정의선 ‘깐부치킨’ AI동맹…계산은 누가, 장소의 의미?

[뉴스스페이스=이종화 기자] 서울 강남 한복판의 치킨집이 30일 밤, 글로벌 AI 동맹의 현장이 됐다. 엔비디아 젠슨 황 CEO, 삼성전자 이재용 회장, 현대차그룹 정의선 회장이 ‘깐부치킨’에서 치맥(치킨+맥주) 회동을 가졌다는 소식이 알려지며 업계와 온라인이 동시에 술렁였다. 이날 젠슨 황은 서울 코엑스에서 ‘지포스’ 한국 출시 25주년 기념행사를 마친 뒤 “한국의 치맥 문화를 직접 경험해보고 싶다”는 제안으로 삼성역 인근 깐부치킨으로 향했다. 깐부치킨은 이 회장과 정 회장이 동석한 자리로, 황 CEO가 주도한 사실상 비공식 비즈니스 회담의 무대가 됐다. 깐부치킨 왜? “우린 깐부잖아” ‘깐부’는 어린 시절 손가락을 걸고 한편이 된 친구를 뜻한다. 2021년 넷플릭스 드라마 ‘오징어 게임’의 “우린 깐부잖아”라는 대사가 전 세계적으로 화제가 되며, 브랜드 역시 큰 반사이익을 얻었다. 이날 회동이 전해지자 누리꾼들은 “AI 동맹 깐부 선언인가”, “HBM·자율주행·로봇까지 손잡는 상징적 회동”이라는 해석을 내놨다. 업계 한 관계자는 “삼성이 엔비디아에 HBM(고대역폭 메모리)을 공급하고 있고, 현대차는 로보틱스·자율주행 협력 중이라는 점에서, 단순한 만남이

[빅테크칼럼] 엔비디아, 美에너지부에 슈퍼컴 7대 구축·6G 통신 추진…미국내 반도체 리더십 강화 기대

[뉴스스페이스=윤슬 기자] 글로벌 그래픽처리장치(GPU) 선도기업 엔비디아가 미국 정부와 긴밀한 협력 아래, 첨단 인공지능(AI) 슈퍼컴퓨터와 차세대 6G 통신망 구축을 추진하며 미전역의 첨단 과학기술 경쟁력을 강화하는 전략을 본격화했다. 이번 행사는 미국 워싱턴에서 개최된 최초의 개발자 행사(GTC)로, 글로벌 기술 리더십 확장과 미국 내 반도체·통신 산업 회복을 동시에 노리는 모양새다. 젠슨 황 엔비디아 최고경영자(CEO)는 10월 28일(현지시간) 워싱턴DC 월터 E. 워싱턴 컨벤션센터에서 열린 개발자행사(GTC) 기조 발표를 통해 이같은 내용을 밝혔다. AI 슈퍼컴퓨터 구축으로 핵심 연구 역량 강화 엔비디아는 에너지부 산하 연구소인 아르곤 국립연구소와 로스앨러모스 국립연구소에 quantum 기반 AI 슈퍼컴퓨터 7대를 설치하기로 했다. 이 슈퍼컴퓨터들은 각각 강력한 연산 능력을 갖춘 양자컴퓨팅 시스템으로, 핵무기와 핵 에너지 연구에 활용될 예정이며, 미국 국방 및 국가 안보 분야의 핵심 기술 경쟁력 확보에 기여할 전망이다. 황 CEO는 "이 프로젝트는 미국의 역량을 에너지 증진과 국방 강화를 동시에 지원하는 '게임체인저'"라고 평가했다. 6G 통신망