[뉴스스페이스=윤슬 기자] 중국 인공지능 스타트업 미니맥스(MiniMax)가 2025년 10월 27일 공개한 대규모 언어 모델 M2가 인공지능 평가기관 Artificial Analysis의 Intelligence Index에서 오픈소스 AI 모델 중 최고 점수를 기록하며 글로벌 5위에 올랐다.
Artificial Analysis Intelligence Index, Yahoo Finance, TechNode에 따르면, M2는 61점을 획득해 Google DeepMind의 Gemini 2.5 Pro(60점)를 제치고 중국 오픈소스 AI 생태계에 유의미한 돌파구를 마련했다. 다만 글로벌 1~4위는 미국의 GPT-5, Grok 4, Claude Sonnet 4.5 등 선진 AI들이 차지했다.
MiniMax M2는 총 2300억개의 매개변수를 가진 희소 활성화 방식의 Mixture-of-Experts(MoE) 아키텍처를 채택했다. 실제 추론 과정에서는 100억개만 활성화해 연산 효율을 극대화했다. 이는 동급 경쟁 모델인 DeepSeek V3.2(370억 활성파라미터)나 Moonshot AI의 Kimi K2(320억 활성파라미터) 대비 적은 수치다. 덕분에 FP8 정밀도로 단 4대의 NVIDIA H100 GPU에서 구동이 가능해 중견 조직도 활용이 용이하다. 추론 속도는 초당 약 100 토큰에 달해 Claude Sonnet 4.5 대비 약 두 배 빠르다.
특히 MiniMax M2는 코딩과 에이전트 워크플로우에 최적화된 모델로 평가받는다. 실제 코딩 작업 실측 벤치마크인 SWE-bench Verified에서 69.4점, 도구 사용 능력을 평가하는 τ²-Bench에서 77.2점, 웹 연구 능력의 BrowseComp에서는 44.0점이라는 탁월한 점수를 기록하는 등 실무 활용 가능성을 입증했다.
독립 개발자 테스트에서 혼합 작업 정확도는 약 95%로, GPT-4o(90%) 및 Claude 3.5(88~89%)를 앞섰다. Florian Brand 독일 트리어대학교 박사과정 학생 겸 오픈 모델 전문가도 “전작 M1에 비해 상당한 진전을 이뤘다”며 MiniMax의 기술력에 찬사를 보냈다.
또한 M2는 코드를 단순 생성하는 수준을 넘어, 코드 실행, 디버깅, 자동 검증 및 수정을 포함하는 ‘코드-실행-테스트-수정’ 완전한 사이클을 지원한다. 에이전트 기능도 Shell, 브라우저, Python 실행기 등 다양한 도구 체인을 계획·실행하며, 워크플로우 추적과 자기 수정, 복구 능력으로 실사용에 적합하다.
비용 경쟁력도 눈에 띈다. MiniMax는 API 이용료를 입력 토큰당 0.3달러, 출력 토큰당 1.2달러에 책정해, 경쟁 모델인 Anthropic Claude Sonnet 4.5 비용의 약 8% 수준으로 낮췄다. 가격과 성능, 속도 측면에서 기존 ‘불가능한 삼각형’으로 여겨지던 세 가지 요소를 동시에 개선한 점이 주목받고 있다. 현재 모델 전체 가중치는 MIT 라이선스로 Hugging Face 및 GitHub에 공개되어 있으며, API는 제한된 기간 동안 무료 제공 중이다.
이번 MiniMax M2의 등장은 비용과 효율에서 획기적 개선을 이루어낸 중국 오픈소스 AI 진영의 기술적 진보를 보여줌과 동시에, 글로벌 AI 산업에서 미국과의 경쟁 구도에 새로운 동력을 제공한다는 점에서 의미가 크다. 특히 AI 활용이 가속화되는 기업 환경에서 코딩, 에이전트 작업 등에 특화된 M2의 실용성은 향후 시장에서 주목받을 전망이다.























































