
[뉴스스페이스=이종화 기자] 유럽의 다국적 연구진이 의료기록과 생활습관 요인을 분석해 1000가지 이상의 질병을 최대 20년 전에 예측하는 인공지능(AI) 모델 ‘델파이-2M(Delphi-2M)’을 발표하며 의료 혁신에 한발 다가섰다.
2025년 9월 16일자 네이처(Nature)지에 공개된 이번 연구는, 단일 질병 예측을 넘어서 다중 질환의 장기 위험도를 종합적으로 산출하는 AI 시스템으로 주목받고 있다. 특히 지금까지 헬스케어 분야에서 생성형 AI가 가장 포괄적으로 적용된 사례 중 하나로 평가받고 있다.
Nature 발표와 EurekAlert!, BBC News, AAWSAT에 따르면, 델파이-2M은 영국 바이오뱅크(UK Biobank)의 40만명 이상 참가자의 익명 의료 기록과 생활 습관 데이터로 학습됐으며, 덴마크 190만명의 의료 기록으로 검증을 마쳤다.
이 AI는 심장마비·제2형 당뇨·패혈증 등 명확한 진행 양상을 갖는 질환에서 특히 높은 예측력을 보이며, 10년 심장마비 예측 정확도는 약 70%에 달한다(20년 예측 시 14%, 이 또한 단순 연령·성별 정보 대비 우월).
기존 예측 도구가 특정 질병만을 대상으로 하는 데 반해, 델파이-2M은 1258개 질환을 동시에 다루며 개개인의 의료 이벤트 패턴과 생활 습관을 종합해 미래 질병 발생 확률을 산출한다. 모델은 진단 순서와 조합을 학습, 개인별 건강 궤적을 생성하는 방식으로 작동한다. 예컨대, 향후 1년 내 10%의 위험을 예측한 경우, 실제로 10%의 확률에 상당하는 결과를 보여 신뢰도가 높다.
임상 적용을 위한 보완 과제도 있다. 현재 훈련 데이터가 40~70세 중심의 영국 및 덴마크 인구에 한정돼 있어, 인종·연령대 편향 가능성과 일반화 문제를 안고 있다. 또한, 정신 건강 장애처럼 예측이 어려운 질환에 대해서는 신뢰도 낮은 경향이 확인됐다. 연구진은 향후 영상, 유전학, 혈액 검사를 포함한 다양한 데이터 통합을 계획해 정밀도를 높이려 한다.
윤리적 문제 또한 주목된다. AI 기반 건강 예측이 보험사나 금융기관의 차별적 활용으로 이어질 위험성과 개인정보 보호 문제에 대한 우려가 크다. 이에 개발팀은 익명화 데이터 활용, 국가경계 내 안전한 데이터 관리, 그리고 완전한 합성 건강 데이터 생성 기술로 개인정보 유출 위험을 최소화하려 시도 중이다.
합성 데이터는 실제 개인정보와 일치하지 않으면서도 통계적 특성을 유지해 다른 AI 훈련용으로 활용 가능하다. 유럽 분자생물학 연구소의 이완 버니 교수는 “이는 인간 건강과 질병 진행을 이해하는 새로운 지평을 여는 것”이라고 밝혔다.
현재는 예측 정확도가 높지만 의료 현장 적용까지는 5~10년이 소요될 전망이다. 실제로 환자에게 맞춤형 예방 조치를 설계하고, 지역 단위 의료 수요 예측과 자원 배분에 활용하는 방식으로 AI의 잠재력을 확대할 수 있을 것으로 기대된다.
전문가들은 "무분별한 예측 정보로 인한 환자 심리적 부담과 차별 문제에 대비해 임상 시험 통한 효과 분석과 윤리적 규제 마련이 병행돼야 한다"고 강조한다.
이번 델파이-2M은 AI가 개인 건강 예측과 맞춤형 의료에서 혁신적 도구가 될 가능성을 시사하며, 의료 서비스의 선제적 전환과 효율화를 선도할 전망이다.