2025.06.12 (목)

  • 구름많음동두천 17.6℃
  • 맑음강릉 20.3℃
  • 구름많음서울 18.2℃
  • 맑음대전 18.5℃
  • 맑음대구 19.0℃
  • 맑음울산 20.0℃
  • 맑음광주 18.4℃
  • 맑음부산 19.1℃
  • 맑음고창 18.4℃
  • 맑음제주 21.3℃
  • 구름많음강화 15.3℃
  • 구름조금보은 17.3℃
  • 맑음금산 18.1℃
  • 맑음강진군 18.7℃
  • 구름조금경주시 20.7℃
  • 맑음거제 19.7℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


"짜고 친 고스톱?" 트럼프-머스크, 극한 대립 끝에 '해빙'……머스크 "후회" 표명에 트럼프 '수용'

[뉴스스페이스=윤슬 기자] 미국 정계와 빅테크기업의 대표적 인물인 도널드 트럼프 대통령과 일론 머스크 테슬라 CEO가 최근 극단적 갈등을 봉합하고 화해 국면에 들어섰다. 백악관과 미국 뉴욕타임스, CNN 등의 보도에 따르면, 양측은 6월 10~11일(현지시각) 사이 JD 밴스 부통령과 백악관 비서실장 등의 중재로 전화 통화를 나누며 대립을 일단락했다. 머스크 "트럼프 비판, 지나쳤다"…트럼프 "후회 표명, 고맙다" 사건의 발단은 머스크가 트럼프 대통령의 감세 정책에 공개적으로 불만을 표출하고, 트럼프 탄핵 동조 및 신당 창당 주장까지 내놓으면서 양측의 갈등이 극한으로 치달은 데 있었다. 트럼프 대통령은 이에 연방정부의 테슬라 관련 계약 해지까지 언급하며 강경 대응을 시사했으나, 실제로는 어떤 조치도 진행하지 않았다고 백악관은 밝혔다. 6월 11일(현지시간) 머스크는 자신의 소셜미디어 X(옛 트위터)에 "지난주 대통령에 대해 올린 게시물 중 일부를 후회한다. 너무 멀리 나갔다"고 공개적으로 사과했다. 트럼프 대통령은 뉴욕포스트 팟캐스트 인터뷰에서 "머스크가 후회를 표명한 것은 아주 좋다고 생각한다"고 화답했다. 그는 "머스크가 내 정책을 비판한 것을 탓하지는

기적의 비만약 '위고비', 시력상실 등 부작용 2배 급증…미용 오남용·불법유통 '경고등'

[뉴스스페이스=김혜주 기자] 비만 치료제 '위고비'가 국내 출시 이후 '다이어트 약'으로 폭발적 인기를 끌면서 부작용 사례가 6개월 만에 2배 가까이 급증한 것으로 나타났다. 유럽에서는 주성분 세마글루타이드의 시력 상실 등 심각한 부작용이 공식 발표됐고, 국내에서는 미용 목적의 무분별한 처방과 불법 유통이 방치되고 있어 관리·감독 강화가 시급하다는 지적이 나온다. 국내 이상사례 6개월 새 2배…가장 흔한 증상은 '구역·구토' 백종헌 국민의힘 의원실이 식품의약품안전처(식약처)로부터 확보한 자료에 따르면, 위고비가 국내에 출시된 지난해 10월부터 올해 3월까지 143건의 이상사례가 보고됐다. 이는 출시 초기 3개월(2023년 10~12월) 49건에서 올해 1~3월 94건으로, 3개월 만에 2배 가까이 급증한 수치다. 실제 이상사례는 보고되지 않은 건까지 포함하면 더 많을 것으로 추정된다. 이상사례 중 가장 많은 증상은 구역(29건), 구토(22건), 설사(15건), 두통(13건) 등 소화기 및 신경계 증상이다. 다만 국내에서는 아직 시신경 손상, 급성 췌장염 등 치명적 부작용은 공식 보고되지 않았다. 식약처는 올해 초부터 위고비 등 비만치료제의 이상사례 모니터링

머스크 "로보택시 D-11"…성공하면 2조 달러 '슈퍼잭팟' 터진다

[뉴스스페이스=윤슬 기자] 일론 머스크 테슬라 최고경영자(CEO)가 오는 6월 22일 완전자율주행 로보택시 상용 서비스를 개시한다고 공식 발표하면서 글로벌 자율주행 시장에 새로운 전환점이 조성되고 있다. 월스트리트 투자은행들은 이번 로보택시 성공시 테슬라 시가총액이 2조 달러까지 치솟을 수 있다는 파격적인 전망을 내놓으며 투자자들의 관심이 집중되고 있다. 텍사스 오스틴서 첫 상용화…6월 28일엔 공장직배송 머스크 CEO는 11일(현지시간) 소셜미디어 플랫폼 X를 통해 "잠정적으로 6월 22일"이라며 로보택시 서비스 출시일을 구체적으로 명시했다. 그는 "우리는 안전 문제에 매우 신중하게 접근하고 있기 때문에 이 날짜는 변경될 수 있다"고 단서를 달았지만, 동시에 "공장 라인 끝에서 고객 집까지 자율주행으로 갈 최초의 테슬라는 6월 28일 출시된다"며 구체적인 로드맵을 제시했다. 테슬라는 텍사스주 오스틴에서 초기 로보택시 서비스를 시작할 예정이다. 머스크는 지난달 CNBC 인터뷰에서 "초기에는 10대로 시작해 20대, 30대, 40대로 점차 늘려가면서 몇 달 내에 1000대에 도달할 것"이라고 밝혔으며, 이후 로스앤젤레스, 샌프란시스코, 샌안토니오 등으로 확장할

네이버·카카오, ‘AI 혁신’ 글로벌로…한국 AI 쌍두마차, ‘소버린’ vs ‘오케스트레이션’

[뉴스스페이스=조일섭 기자] 한국을 대표하는 IT기업 네이버와 카카오가 AI 혁신의 최전선에서 각기 다른 전략으로 글로벌 시장 공략에 나서고 있다. 두 기업 모두 실리콘밸리 등 북미 시장을 거점으로 삼아, 생성형 AI·딥테크 등 첨단기술 스타트업에 투자하며 기술 내재화와 글로벌 네트워크 확장에 속도를 내고 있다. 그 배경과 전략, 그리고 차별화된 혁신 방향을 알아봤다. 네이버 : ‘소버린 AI’와 글로벌 투자로 기술주권 강화 네이버는 자체 초거대 언어모델 ‘하이퍼클로바X’를 기반으로 한 ‘온 서비스 AI’ 전략을 통해 검색, 쇼핑, 지도, 광고 등 전 서비스에 AI를 심층적으로 통합하고 있다. 하이퍼클로바X는 한국어와 국내 데이터에 최적화된 독자 모델로, 네이버는 이를 통해 글로벌 빅테크의 표준화된 AI가 아닌, 한국 실정과 문화에 맞는 ‘소버린 AI(기술주권형 AI)’를 지향한다. 이와 함께 네이버는 실리콘밸리에 ‘네이버 벤처스’를 설립, AI·비디오AI·디지털트윈 등 차세대 기술을 보유한 스타트업에 직접 투자하면서 글로벌 AI 생태계와의 접점을 넓히고 있다. 첫 투자처로 미국의 멀티모달 AI 스타트업 트웰브랩스(TwelveLabs)를 선택, 엔비디아·삼성