2026.01.13 (화)

  • 맑음동두천 -0.9℃
  • 구름많음강릉 5.0℃
  • 박무서울 1.1℃
  • 구름조금대전 4.2℃
  • 흐림대구 -0.4℃
  • 구름조금울산 7.5℃
  • 구름많음광주 5.6℃
  • 맑음부산 6.7℃
  • 구름많음고창 5.4℃
  • 구름많음제주 11.8℃
  • 맑음강화 -0.1℃
  • 맑음보은 4.0℃
  • 흐림금산 5.3℃
  • 구름많음강진군 7.3℃
  • 맑음경주시 7.4℃
  • 맑음거제 7.7℃
기상청 제공

빅테크

AI(인공지능) 검색 도구 중 가장 정확한 답을 내는 AI 모델은? ‘구글’ 1위…워싱턴포스트 9대 AI 정밀평가

 

[뉴스스페이스=김정영 기자] 워싱턴포스트(WP)가 미국 공공·대학도서관 사서들과 함께 AI 검색 도구의 답변 정확도를 전격 비교 평가한 결과, 구글의 ‘AI 모드’가 100점 만점에 60.2점으로 1위를 기록했다.

 

이번 평가는 GPT-5 기반 오픈AI의 챗GPT(55.1점), 퍼플렉시티(51.3점), 빙 코파일럿(마이크로소프트), 클로드(앤스로픽), 메타AI, 일론 머스크의 그록 등 총 9개 인공지능을 대상으로 30가지 고난도 질의에 대해 900건 답변을 평가하는 방식으로 집계됐다.

 

세부 분야별로는 구글 AI 모드가 퀴즈(일반정보)와 최신 사건 부문에서 가장 두각을 나타냈고, 전문자료 탐색 부문에서는 MS 빙 코파일럿이, 이미지 인식 부문에서는 퍼플렉시티가 각각 우위를 보여 각 AI마다 특화 분야가 드러났다.

 

하위권에는 ‘그록3’(40.1점), ‘메타AI’(33.7점) 등이 자리했으며, WP는 “AI가 여전히 정보 최신성·신뢰성 판단과 비판적 사고 대체에는 한계가 있다”고 지적했다.

 

2025년 상반기 전 세계 AI 검색엔진 월간 방문자는 챗GPT 38억회, 딥시크(DeepSeek) 2.78억회, 구글 제미나이(Google Gemini) 2.68억회, 퍼플렉시티(Perplexity AI) 1억회로 집계됐으며, GPT-5, 구글 AI 모드, 퍼플렉시티 등 주요 도구는 인간의 퀴즈·전문검색·이미지 인식 대응력을 중심으로 진화를 거듭하고 있다. 실시간 웹 검색, 출처 인용 등의 특화 기능으로 학생·전문직에서 Perplexity AI가 특히 주목받고 있다는 평가도 나온다.

 

WP 평가는 실사용에서 AI 도구별로 ‘정확도(accuracy)’와 ‘실제 활용도’의 차이가 있음을 드러냈는데, 예를 들어 챗GPT 5와 구글 AI 모드는 평균 80% 내외의 논리 정확도를 보였다. 사용자는 AI 도구의 답변을 맹신하기보단 “각각의 강점·약점을 파악하고, 항상 출처와 최신성, 비판적 검증 과정을 거쳐야 한다”는 현장의 목소리가 높았다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 아이온큐 공동창업자 "양자 30년 걸린다던 젠슨 황, 긍정적으로 선회"…반전 행보와 상용화 가속

[뉴스스페이스=김시민 기자] 양자컴퓨팅 선도 기업 아이온큐(IonQ)의 공동창업자 김정상 듀크대 교수가 엔비디아 CEO 젠슨 황의 과거 양자 상용화 30년 전망이 최근 긍정적으로 선회했다고 평가했다. 김 교수는 "황 CEO가 지난해 개발자 회의에서 양자 리더들과 논의한 후 퀀티넘 등 기업에 투자하며 태도를 바뀌었다"면서, "이는 양자 기술의 실질적 임팩트가 임박했음을 시사한다"고 강조했다. ​ ​황 CEO 발언 변화 배경 젠슨 황은 2025 CES에서 "양자컴퓨터의 유용한 수준 도달에 20~30년이 필요하다"고 밝혔으나, 같은 해 GTC 파리 컨퍼런스에서 "양자컴퓨팅이 변곡점에 도달했다"며 실세계 문제 해결이 수년 내 가능할 것이라고 수정했다. 엔비디아는 CUDA-Q 플랫폼을 통해 양자-고전 하이브리드 컴퓨팅을 추진하며 NVQLink 기술로 GPU와 양자 프로세서를 연결, 미국 에너지부 등과 협력 중이다. 이러한 행보는 과거 회의적 발언으로 양자주식(아이온큐 등)이 36% 하락했던 시장 반응을 뒤집는 신호로 해석된다. ​ 아이온큐 실적과 기술 진전 아이온큐는 2025년 3분기 매출 3,990만 달러를 기록, 전년 동기 대비 222% 증가하며 연간 가이던스를