2026.06.08 (월)

  • 맑음동두천 17.3℃
  • 흐림강릉 17.6℃
  • 구름많음서울 20.2℃
  • 흐림대전 22.3℃
  • 흐림대구 19.7℃
  • 흐림울산 18.3℃
  • 흐림광주 21.8℃
  • 흐림부산 20.1℃
  • 흐림고창 20.1℃
  • 구름많음제주 21.5℃
  • 맑음강화 16.4℃
  • 흐림보은 19.9℃
  • 흐림금산 21.7℃
  • 흐림강진군 22.2℃
  • 흐림경주시 19.0℃
  • 구름많음거제 20.2℃
기상청 제공

빅테크

[빅테크칼럼] 오픈AI, 코드네임 'Garlic' 모델로 경쟁사 압도…AI 경쟁 2026년으로 본격화

 

[뉴스스페이스=김정영 기자] 최근 오픈AI가 코딩과 추론 분야에서 경쟁사들을 압도할 것으로 평가받는 'Garlic'이라는 코드네임의 신형 대규모 언어 모델 개발에 박차를 가하고 있다.

 

The Information, Fortune, Investing.com 등 주요 외신은 오픈AI의 내부 평가에서 Garlic이 구글의 제미나이3와 앤트로픽의 Claude Opus 4.5를 특히 코딩 및 추론 과제에서 앞서는 성과를 보였다고 보도했다. 이는 2025년 말 기준으로 치열해진 글로벌 AI 경쟁의 새로운 국면을 보여주는 신호로, 오픈AI는 Garlic을 GPT-5.2 또는 GPT-5.5로 2026년 초에 공개할 계획이다.​

 

벤치마크 데이터로 본 경쟁력

 

Garlic의 내부 평가에서 보고된 주요 성과는 다음과 같다. 오픈AI는 SWE-bench Verified(소프트웨어 엔지니어링 벤치마크)에서 제미나이3 Pro의 76.2%, GPT-5.1의 76.3%에 비해 Garlic이 80% 이상의 성능을 목표로 하고 있으며, Claude Opus 4.5의 80.9%와 견줄 수 있는 수준에 도달할 것으로 예상된다.

 

제미나이3 Pro는 GPQA Diamond(고급 과학 문제)에서 91.9%를 기록해 GPT-5.1(88.1%)을 앞섰으며, ARC-AGI-2(추상적 시각 추론)에서는 31.1%로 GPT-5.1(17.6%)의 두 배에 가까운 점수를 기록했다. Claude Opus 4.5는 SWE-bench Verified에서 80% 이상의 성능을 보이며, 앤트로픽의 내부 소프트웨어 엔지니어링 시험에서도 역대 최고 점수를 기록했다. 이러한 벤치마크는 AI 모델의 실제 업무 적용 능력을 객관적으로 평가하는 지표로 평가된다.​

 

경쟁사들의 성장과 오픈AI의 대응

 

구글은 2025년 11월 18일 제미나이3를 출시해 검색, 이미지 편집, 멀티모달 추론 등에서 벤치마크 1위를 차지했다. 제미나이3 Pro는 Humanity’s Last Exam(일반 추론)에서 37.4점으로 GPT-5 Pro의 31.64점을 넘어섰으며, LMArena(사용자 만족도)에서도 최고 점수를 기록했다.

 

앤트로픽은 11월 24일 Claude Opus 4.5를 발표하며, 복잡한 엔터프라이즈 과제에서 이전 모델 대비 성능이 크게 향상됐다고 강조했다. 이에 따라 Google의 제미나이앱 월간 활성 사용자는 2025년 10월 기준 6억5000만명으로 7월의 4억5000만명에서 급증했으며, 챗GPT의 주간 8억명과의 격차가 좁혀지고 있다는 보도가 나왔다.

 

연구 리더십과 조직 변화


오픈AI의 최고 연구 책임자 마크 첸은 DALL-E, Codex, o1 추론 모델 등 주요 프로젝트를 이끌며, Garlic 모델 개발을 통해 경쟁사들과의 격차를 다시 벌리겠다는 전략을 내세우고 있다. 그러나 오픈AI는 최근 수십 명의 최고 연구원들이 Meta 등 경쟁사와 신생 스타트업으로 이직하는 등 인력 유출에 직면해 있다. CEO 샘 올트먼은 12월 1일 '코드 레드'를 선언하며, 광고 계획 등 다른 이니셔티브를 연기하고 ChatGPT의 반응성, 신뢰성, 개인화 기능 강화에 자원을 집중하겠다고 밝혔다.

 

AI 경쟁의 새로운 국면

 

오픈AI의 Garlic 모델은 단순한 기술적 진보를 넘어, 경쟁사와의 벤치마크에서 구체적인 성능 차이를 보여주며 AI 시장의 판도를 재편할 가능성이 높다. 향후 2026년 초 공개될 Garlic이 GPT-5.2 또는 GPT-5.5로 브랜딩된다면, 기업과 개발자들에게 새로운 선택지를 제공할 것으로 예상된다. AI 경쟁은 단순한 성능 비교를 넘어, 효율성과 비용, 안정성, 실제 업무 적용 능력 등 다양한 차원에서 더욱 치열해질 전망이다.​

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 프랑스 AI 군사 시스템 ‘아르카디아’, 팔란티어 메이븐에 도전장…유럽 안보의 새 변수 되나

[뉴스스페이스=김정영 기자] 프랑스 육군이 AI 기반 전장 지휘 시스템 ‘아르카디아(Arcadia)’를 앞세워 NATO 표준으로 채택된 팔란티어 ‘메이븐 스마트 시스템(Maven Smart System·MSS NATO)’에 정면 도전장을 던졌다. 이번 행보는 전장 AI까지 ‘디지털 주권’을 확보하려는 유럽의 전략적 승부수이자, 방산·AI 산업 지형을 뒤흔들 수 있는 중장기 변수로 평가된다. 프랑스판 메이븐 ‘아르카디아’의 실체 프랑스 육군은 NATO가 2025년 팔란티어의 메이븐 스마트 시스템을 도입해 연합 지휘·정보 분석의 핵심 도구로 활용하기 시작한 직후, 자체 AI 지휘 체계 아르카디아를 ‘유럽판 메이븐’으로 육성하겠다는 방침을 공식화했다. NATO는 메이븐이 생성형 AI·머신러닝·대규모 언어모델을 활용해 “안전하고 공통된 작전 역량”을 제공한다고 평가하며 작전 지원 체계로 채택한 바 있다. 프랑스군 부사령관 패트릭 쥐스텔(Patrick Justel) 장군은 이 시스템을 유럽 내 NATO 동맹국에 적극 홍보하고 있으며, 6월 NATO 연합훈련에서 실제 전장 시나리오에 투입해 성능을 검증한다는 계획이다. 미군이 장기간 실전에서 다듬은 팔란티어 메이븐과 달

[빅테크칼럼] 벤지오, AI 질주에 제동 걸다…"통제할 방법을 모르는 AI를 세상이 만들고 있다" 경고

[뉴스스페이스=이현주 기자] 요슈아 벤지오가 다시 한 번 AI 업계의 속도전에 경고음을 울렸다. 그는 블룸버그 인터뷰에서 “우리가 통제할 방법을 모르는” 시스템을 세상이 만들고 있다며, 자율적 AI 에이전트의 확산을 막기 위한 국제 공조를 촉구했다. 벤지오는 “지금 우리는 완전한 통제 능력을 갖고 있지 않다”고 직설적으로 말했고, 해법이 국가 단위가 아니라 글로벌 거버넌스 차원에서 나와야 한다는 점을 강조했다. 핵심은 기술의 유용성이 아니라 통제 불가능성이다. LawZero가 공개한 연구 설명에 따르면 벤지오가 구상한 ‘Scientist AI’는 목표를 추구하는 에이전트형 AI와 달리, 세상을 이해하고 예측하되 자체 목표를 갖지 않는 안전 중심 시스템이다. LawZero는 또한 “현재의 첨단 AI 시스템은 공공안전과 보안에 중대한 위험을 초래할 수 있으며, 통제 불가의 인간 통제 상실까지 이어질 수 있다”고 적시했다. 이는 벤지오가 단순한 철학적 우려가 아니라, 기술 설계 자체를 바꾸는 방향으로 문제를 풀겠다고 나선 배경을 보여준다. 벤지오의 경고는 국제적 연구 흐름과도 맞닿아 있다. 2025년 1월 공개된 국제 AI 안전 보고서는 100명의 AI 전문가가

[내궁내정] 너의 췌장을 살리고싶어? 망가뜨리는 7가지 습관·살리는 4가지 습관…'침묵의 장기' 췌장의 의미·흥미·재미

[뉴스스페이스=이종화 기자] <편집자주> 유튜브, 인스타 등에서 활동하는 인플루언서들이 '협찬을 받지 않았다', '광고가 아니다'라는 사실을 보이기 위해 "내 돈 주고 내가 샀다"라는 뜻의 '내돈내산'이라는 말이 생겼다. 비슷한 말로 "내가 궁금해서 결국 내가 정리했다"는 의미의 '내궁내정'이라고 이 기획코너를 명명한다. 우리 일상속에서 자주 접하는 소소한 얘기거리, 궁금증, 호기심, 용어 등에 대해 정리해보는 코너를 기획했다. 췌장은 혈당을 조절하고 음식물을 소화시키는 ‘침묵의 핵심 장기’이며, 한 번 망가지면 회복이 어렵기 때문에 생활습관 차원의 선제 관리가 필수다. 특히 흡연·과음·고지방·고당 식습관과 비만, 운동 부족이 췌장을 지속적으로 자극해 췌장염·당뇨병·췌장암 위험을 크게 높인다는 것이 주요 의료기관과 국가기관의 공통된 경고다. 1. 췌장은 어떤 장기인가 … “소화 공장 + 혈당 관제탑” 서울아산병원 인체정보에 따르면 췌장은 위 뒤쪽에 숨듯이 자리한 후복막 장기로, 길이 약 15cm 남짓의 납작한 장기지만 소화와 혈당 조절을 동시에 맡는 복합 ‘이중 모듈’이다. 췌장은 외분비 기능으로 탄수화물·단백질·지방을 분해하는 소화효소(아밀라아제