2025.12.01 (월)

  • 맑음동두천 7.3℃
  • 맑음강릉 12.2℃
  • 맑음서울 8.6℃
  • 맑음대전 10.6℃
  • 맑음대구 13.2℃
  • 맑음울산 13.9℃
  • 맑음광주 12.2℃
  • 맑음부산 16.2℃
  • 맑음고창 9.9℃
  • 맑음제주 14.7℃
  • 맑음강화 6.6℃
  • 맑음보은 9.9℃
  • 맑음금산 11.1℃
  • 맑음강진군 12.6℃
  • 맑음경주시 13.6℃
  • 구름조금거제 12.7℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 美 법원 "머스크 xAI, 애플·오픈AI 반독점소송 한국서 증거확보 승인"…삼성전자·SK하이닉스·카카오 중 한 곳 '가능성'

[뉴스스페이스=김정영 기자] 미국 연방지방법원이 일론 머스크의 인공지능 회사 xAI가 애플과 오픈AI를 상대로 제기한 반독점 소송에서, 미공개된 한국 기업으로부터 증거를 확보할 수 있도록 공식적으로 승인했다. 연방지방법원 판사 마크 피트먼(Mark Pittman)은 국제 사법 공조 요청을 헤이그 협약에 따라 승인하고, 대한민국 법원행정처에 증거 수집 촉탁서를 송부하도록 명령했다. 다만, 해당 한국 기관의 정체는 법원 문서상 비공개로 남아 있다.​ 업계에서는 이 미스터리 한국 기관이 삼성전자, SK하이닉스, 카카오 중 한 곳일 가능성이 높다고 보고 있다. 삼성전자와 SK하이닉스는 2025년 9월 오픈AI와 협약을 맺고, 오픈AI의 ‘스타게이트(Stargate)’ AI 인프라 프로젝트를 위해 월 90만개 이상의 고대역폭 DRAM 메모리 칩을 공급하고, 한국 내 데이터센터 구축에 협력하기로 했다. 삼성 SDS는 오픈AI와 함께 AI 데이터센터 설계, 운영, 기업용 AI 서비스 제공, 그리고 한국 내 오픈AI 서비스 유통도 담당한다.​ 카카오는 2025년 10월 카카오톡에 챗GPT를 직접 통합하며, 5000만명에 가까운 국내 사용자들에게 AI 챗봇 서비스를 제공하고

[빅테크칼럼] 엔비디아 창업자, 추수감사절에도 대만行…‘노 TSMC 노 엔비디아’ 상징하는 5번째 방문

[뉴스스페이스=윤슬 기자] 인공지능(AI) 반도체 1위 기업 엔비디아의 젠슨 황 최고경영자(CEO)가 미국 추수감사절 연휴를 반납하고 다시 대만을 찾으면서, ‘AI 칩 동맹’의 심장부로 떠오르는 대만과의 관계가 한층 더 공고해졌다는 평가가 나온다. 올해에만 최소 다섯 번째로 이뤄진 대만 방문에는 건강이 악화된 장중머우(張忠謀) TSMC 창업자에 대한 ‘의리 방문’과 더불어, 대만을 글로벌 AI 공급망의 핵심 거점으로 자리매김시키려는 전략 구상이 겹쳐 있는 것으로 보인다.​ 추수감사절 반납한 ‘의리 방북(訪台)’ 28일 대만 연합보·중앙통신(CNA) 등에 따르면 젠슨 황 CEO는 미국 추수감사절 연휴를 맞아 타이베이를 방문해 북부 타이베이 시내 쓰핑제 인근 식당에서 배우자, 딸과 함께 약 40분간 식사하는 모습이 포착됐다. 현지 소식통들은 황 CEO가 식사 후 최근 건강 이상으로 공식 행사에 불참해온 장중머우 TSMC 창업자의 자택이 있는 타이베이 다즈(大直) 지역으로 이동한 것으로 전하면서, 이번 방문의 1차 목적이 장 창업자 문안에 있는 것으로 해석했다.​ 장중머우 창업자는 올해 94세로, 이달 8일 열린 TSMC 연례 체육대회에도 건강상 이유로 불참해 시

[공간혁신] 누워만 있으면 씻겨주고 말려준다 '5억원짜리 인간 세탁기'…15분이면 샤워끝 '세탁혁명·가전혁신'

[뉴스스페이스=김혜주 기자] 일본에서 혁신적인 신개념 미용·가사 기기가 공개되어 화제다. 바로 '인간 세탁기'로 불리는 자동 목욕 캡슐이 오는 12월 25일부터 일본 도쿄의 전자복합쇼핑몰 '라비(LABI)'에서 전시 및 시연되며, 본격적인 판매는 아직 미정이지만 예상 가격은 약 5억6000만원(6000만엔)으로 책정됐다. 이는 1970년 오사카 박람회 당시 일본에서 처음 소개된 이후 55년 만에 현실화된 사례로, 일본 언론이 다수 보도하며 주목받고 있다. 이 제품은 오사카에 본사를 둔 '아이 필 사이언스'사가 업그레이드한 버전으로, 직경 0.001㎜ 이하의 초미세 마이크로 버블 기술을 활용하여 피부와 머리카락의 오염물을 제거한다. 내부에 누우면 15분 만에 세정, 헹굼, 건조까지 자동으로 완료되며, 별도 수건이나 드라이어 없이 바로 사용할 수 있다. 이 기기는 1970년대 SANYO가 최초로 선보였던 콘셉트를 현대 기술로 재구성한 것으로, 4만명 이상의 체험 신청을 기록하기도 했다. 이러한 기술적 혁신은 일본 시장의 고도화된 소비 성향과 높은 스마트 가전 수요를 반영하는 동시에, 환경 친화적이고 에너지 효율적인 세척·건조 시스템에 대한 관심이 높아지고 있음을