2025.11.29 (토)

  • 맑음동두천 -3.3℃
  • 맑음강릉 3.0℃
  • 맑음서울 0.7℃
  • 맑음대전 -1.9℃
  • 맑음대구 -1.7℃
  • 맑음울산 1.4℃
  • 맑음광주 1.4℃
  • 맑음부산 4.6℃
  • 맑음고창 -1.9℃
  • 맑음제주 5.8℃
  • 맑음강화 -0.8℃
  • 맑음보은 -4.4℃
  • 맑음금산 -3.7℃
  • 맑음강진군 -1.1℃
  • 맑음경주시 -3.4℃
  • 맑음거제 1.0℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[공간혁신] 누워만 있으면 씻겨주고 말려준다 '5억원짜리 인간 세탁기'…15분이면 샤워끝 '세탁혁명·가전혁신'

[뉴스스페이스=김혜주 기자] 일본에서 혁신적인 신개념 미용·가사 기기가 공개되어 화제다. 바로 '인간 세탁기'로 불리는 자동 목욕 캡슐이 오는 12월 25일부터 일본 도쿄의 전자복합쇼핑몰 '라비(LABI)'에서 전시 및 시연되며, 본격적인 판매는 아직 미정이지만 예상 가격은 약 5억6000만원(6000만엔)으로 책정됐다. 이는 1970년 오사카 박람회 당시 일본에서 처음 소개된 이후 55년 만에 현실화된 사례로, 일본 언론이 다수 보도하며 주목받고 있다. 이 제품은 오사카에 본사를 둔 '아이 필 사이언스'사가 업그레이드한 버전으로, 직경 0.001㎜ 이하의 초미세 마이크로 버블 기술을 활용하여 피부와 머리카락의 오염물을 제거한다. 내부에 누우면 15분 만에 세정, 헹굼, 건조까지 자동으로 완료되며, 별도 수건이나 드라이어 없이 바로 사용할 수 있다. 이 기기는 1970년대 SANYO가 최초로 선보였던 콘셉트를 현대 기술로 재구성한 것으로, 4만명 이상의 체험 신청을 기록하기도 했다. 이러한 기술적 혁신은 일본 시장의 고도화된 소비 성향과 높은 스마트 가전 수요를 반영하는 동시에, 환경 친화적이고 에너지 효율적인 세척·건조 시스템에 대한 관심이 높아지고 있음을

[빅테크칼럼] 테슬라, 공급업체 평가에 ‘국가 무관’ 선언…"탈중국 공급망, 품질·지속성 우선"

[뉴스스페이스=김정영 기자] 테슬라가 미국, 중국, 유럽 등 전 세계 생산기지에서 공급업체를 평가할 때 국가적 기준이 아닌 품질, 총비용, 기술 성숙도, 장기 공급 지속성 등 객관적 기준을 적용하고 있다고 강조했다. 테슬라 중국 법인의 그레이스 타오 부사장은 최근 중국 SNS 웨이보에 “공급업체의 국적은 배제 기준이 되지 않는다”며, “우리는 어디서 오는지보다 품질과 신뢰성, 기술력, 가격 경쟁력, 공급 안정성 등을 우선시한다”고 밝혔다.​ 미국 생산차량, 중국산 부품 단계적 배제 추진 미국 내 전기차 생산 과정에서는 중국산 부품의 사용을 단계적으로 배제하는 움직임이 본격화되고 있다. 월스트리트저널(WSJ) 등 외신에 따르면, 테슬라는 미국 공장에 공급되는 주요 부품 중 일부를 이미 다른 지역에서 생산된 제품으로 교체했으며, 1~2년 내에 모든 중국산 부품을 미국 또는 제3국산으로 완전히 대체할 계획이다. 이는 미·중 간 지정학적 긴장과 고율 관세 부과 등 무역 리스크를 최소화하고, 미국 내 전기차 세액공제 혜택을 극대화하기 위한 전략으로 분석된다.​ 중국 공급망 협력 현황과 상하이 공장 생산력 하지만 테슬라의 중국 사업 비중은 여전히 크다. 현재 테슬라는