2026.01.15 (목)

  • 흐림동두천 2.7℃
  • 맑음강릉 13.4℃
  • 박무서울 6.3℃
  • 연무대전 11.5℃
  • 맑음대구 7.2℃
  • 구름조금울산 15.5℃
  • 구름조금광주 14.2℃
  • 구름많음부산 15.1℃
  • 맑음고창 13.7℃
  • 흐림제주 17.4℃
  • 흐림강화 4.1℃
  • 흐림보은 4.8℃
  • 구름많음금산 13.2℃
  • 구름많음강진군 15.4℃
  • 맑음경주시 15.8℃
  • 구름많음거제 14.6℃
기상청 제공

빅테크

[빅테크칼럼] '제미나이3' 성능 역전에 위기감 올트먼 '코드 레드' 발동…'챗GPT 올인' 비상경영 선언

 

[뉴스스페이스=윤슬 기자] 구글이 최근 출시한 차세대 인공지능(AI) 모델 '제미나이3'의 압도적인 성능과 급속한 이용자 증가에 힘입어 글로벌 AI 경쟁 구도가 다시 한 번 요동치고 있다.

 

WSJ, 구글 공식 블로그, DataCamp, 9to5Google에 따르면, 샘 올트먼 오픈AI 최고경영자(CEO)는 내부적으로 '코드 레드'를 발령하며 챗GPT 성능 개선에 전사적 역량을 집중하고, 광고·쇼핑·건강 AI 에이전트 등 신규 수익화 사업은 일정을 연기하는 등 위기 대응에 나섰다.

 

제미나이3, 벤치마크서 오픈AI·앤트로픽 압도


제미나이3는 최근 공개된 AI 벤치마크에서 기존의 GPT-5.1(OpenAI), 클로드 소넷 4.5(Anthropic)를 모두 제치며 선두에 올랐다. 특히, AI 사고·추론 능력을 측정하는 '휴머니티스 라스트 이그잼'(Humanity’s Last Exam) 평가에서 제미나이3는 37.5%를 기록해 GPT-5.1(26.5%), 클로드 소넷 4.5(13.7%)를 크게 앞섰다.

 

수학적 추론을 평가하는 AIME 2025 벤치마크에서는 코드 실행 없이 95.0%의 높은 점수를 기록, GPT-5.1(88.0%)과 클로드 소넷 4.5(87.0%)를 앞섰으며, 복잡한 수학 문제 해결에서도 제미나이3가 23.4%로 가장 높은 성능을 보였다. 이는 AI 모델의 기초 추론 능력이 구글이 선도하고 있다는 평가를 낳았다.​

 

벤치마크 외적 성능, 응답 속도·멀티모달 등에서도 우위

 

제미나이3는 MMLU(다학제적 질문)에서 90%의 정확도를 기록, GPT-5.1과 클로드 소넷 4.5(각각 85%, 82%)를 상회했다. 특히, 대용량 문서 처리나 복잡한 데이터 분석 등 실무적인 과제에서 제미나이3는 GPT-5.1보다 2배 이상 빠른 속도를 보였으며, 104만 토큰의 초장문 입력 처리도 가능해 기업 및 연구기관의 활용도가 크게 높아졌다. 멀티모달(이미지·음성·동영상) 처리에서도 제미나이3가 영상 이해, 장문 문서 처리 등에서 경쟁 모델을 압도하는 성능을 보였다.​

 

이용자 급증, 구글 AI 플랫폼 위상 상승


제미나이3 출시 이후 구글 AI 플랫폼의 월간 활성 이용자(MAU)는 2025년 7월 4억5000만명에서 10월 6억5000만명으로 급증했다. 구글에 따르면 10월 기준 데스크톱 이용자는 1억400만명, 모바일 이용자는 1억200만명으로, 전년 동기 대비 2배 이상 증가했다. 이는 챗GPT(추정 8억명)와 견주어도 상승세가 매우 빠르며, AI 보조 도구 시장에서 구글의 입지가 강화되고 있음을 보여준다.​

 

오픈AI, 코드 레드 발동과 신사업 연기


이러한 상황 속에서 오픈AI는 챗GPT의 개인화, 응답 속도, 안정성, 처리 범위 등 전반적인 성능을 끌어올리기 위해 '코드 레드' 체제를 발동했다. 광고·쇼핑·건강 AI 에이전트, 맞춤형 리포트 생성(펄스) 등 신규 사업 프로젝트는 일정이 뒷순위로 밀렸다. 오픈AI는 조만간 제미나이3보다 높은 성능을 보이는 새로운 추론 모델을 공개할 계획이며, 내부 평가에서 경쟁 모델을 앞서는 점수를 목표로 하고 있다.

 

AI 시장, '성능-수익' 경쟁 본격화

 

AI 모델의 성능이 곧 시장 점유율과 수익화로 직결되는 시대가 본격화되고 있다. 구글은 제미나이3를 통해 기업 및 소비자 시장에서의 영향력을 확대하며, 오픈AI는 기존 챗GPT의 성장세와 최첨단 AI 연구 우위를 바탕으로 재정적 압박을 완화하려 하고 있다.

 

빅테크 업계 관계자들은 "AI 모델의 성능 경쟁이 단순한 기술적 우위를 넘어, 실제 비즈니스 수익화와 직결되는 경쟁으로 진화하고 있다"고 평가했다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 이란 '전자전' 돌입…스타링크 패킷 80% 차단, 반정부 시위 영상 유포 막기 '안간힘'

[뉴스스페이스=김정영 기자] 이란 정부가 반정부 시위 진압 과정에서 일론 머스크의 스타링크 위성 인터넷을 겨냥한 군용 전파 교란을 강화하며 '전자전'에 돌입했다. 수도 테헤란 서부 지역에서 드론을 동원해 지붕 위 스타링크 안테나를 수색·압수하는 대규모 작전을 펼치고 있다. 인터넷 감시단체 넷블록스에 따르면, 1월 8일부터 이란 전역 인터넷 접속률이 평소 수준의 1% 또는 5%까지 급락하며 100시간 이상 '디지털 블랙아웃' 상태가 지속되고 있다. ​ 스타링크, 밀수입 단말기 10만대…시위 영상 외부 유포 '라이프라인' 이란 내 스타링크 사용자 수는 10만명을 초과하며, 지난 1년간 20배 증가한 것으로 추정된다. 전자상거래협회 관계자는 고유 사용자 3만명 이상이 월 700~2,000달러를 지불하며 위성 인터넷을 이용한다고 밝혔다. 시위 현장에서 촬영된 영상을 스타링크로 외부 제3자에게 전송해 소셜미디어에 게시하는 방식으로 정보가 전 세계에 확산되고 있다. ​ 미안그룹의 아미르 라시디 디지털권리 전문가는 "시위 집중 지역에서 스타링크 패킷 손실률이 30%에서 80%까지 치솟았다"며 정부의 이동식 재머 사용을 지적했다. 스페이스X는 소프트웨어 업데이트로 테헤란