“소화기 질환 있으니 췌장암 조심”… AI가 질병 1000개 예측

  • 동아일보

코멘트

유럽 공동연구팀, AI 모델 개발
질병 진단 기록-건강 상태 등… 英 40만명의 의료 데이터 학습
예측 정확도, 1 기준 0.7 달해
의학 지식 기반 판단 근거 제시… 특정 질병의 인과 관계 짚어내

유럽 과학자들이 1000개 이상 질병의 발생 가능성을 예측하는 인공지능(AI)을 개발했다. 한두 종류의 질환 예측에 머물렀던 기존 질병 예측 AI의 쓰임새를 훌쩍 뛰어넘는 혁신적인 성과다. 게티이미지코리아
유럽 과학자들이 1000개 이상 질병의 발생 가능성을 예측하는 인공지능(AI)을 개발했다. 한두 종류의 질환 예측에 머물렀던 기존 질병 예측 AI의 쓰임새를 훌쩍 뛰어넘는 혁신적인 성과다. 게티이미지코리아
질병 진단, 질병 조기 예측, 의료영상 판독 등에 활용되는 ‘의료 인공지능(AI)’은 의사를 보조하는 역할로 의료 현장을 빠르게 파고들고 있다. 최근에는 질병 조기 예측을 위한 AI가 치료 시기를 앞당겨 환자의 생존율을 높이고 의료비 부담을 줄일 수 있어 주목받고 있다.

이 가운데 유럽 과학자들이 1000개 이상 질병의 발생 가능성을 예측하는 AI를 개발했다. 한두 종류의 질환 예측에 머물렀던 기존 질병 예측 AI의 쓰임새를 훌쩍 뛰어넘는 혁신적인 성과로 의료 AI 분야에서 큰 진전을 이뤘다는 평가가 나온다.

● 1000개 이상 질병 예측

독일 암연구센터, 유럽생물정보학연구소, 스위스 취리히연방공대 등으로 구성된 공동 연구팀은 방대한 의료 기록 데이터를 분석해 개인의 평생 건강 변화를 예측할 수 있는 AI 모델 ‘델파이-2M(Delphi-2M)’을 개발하고 17일(현지 시간) 국제학술지 ‘네이처’에 발표했다.

연구팀은 오픈AI가 개발한 AI 모델인 ‘GPT-2’를 기반으로 델파이-2M을 만들었다. 우선 모델에 2006∼2020년 40만 명의 영국 바이오뱅크(UK Biobank) 의료 데이터의 80%를 학습시켰다. 영국 바이오뱅크는 영국 국민 약 50만 명의 과거 질병 진단 기록, 질병 발생 여부, 건강 상태, 유전체, 생활 습관 등을 장기적으로 수집한 대규모 데이터다. 델파이-2M이 학습에 사용한 숫자(가중치)의 개수는 220만 개에 달한다.

연구팀은 영국 바이오뱅크 데이터의 나머지 20%와 193만 명의 덴마크 국민 의료 데이터인 ‘덴마크 국가 질환 레지스트리(Danish registry)’를 이용해 델파이-2M의 성능을 검증했다. 60세까지의 개인 의료 데이터를 델파이-2M에 입력하고 이후 20년 동안 1000개 이상의 질병을 대상으로 각 질병이 언제 발생할지 시뮬레이션했다. 가상의 미래 질병 예측 데이터를 만든 것이다.

가상으로 만든 데이터와 실제 개인의 70∼75세의 데이터를 비교한 결과 서로 유사했다. 진단 정확도(AUC)는 평균 0.76이었고 10년 후 질병 예측 정확도는 0.7에 달했다. AUC는 1에 가까울수록 정확도가 높다는 것을 의미한다.

● AI 판단의 근거도 설명… 투명성 높였다

이번 연구 결과가 주목받는 또 다른 이유는 1000개 이상의 질병을 예측하는 데만 그치지 않고 연구팀이 델파이-2M의 판단 과정과 근거를 분석했다는 것이다. 최근 의료 AI에서 논란이 되고 있는 AI의 판단에 대한 신뢰도 및 투명성을 확보하려는 시도다. 의료 AI의 판단은 사람의 생명과 직결되기 때문이다. 현재 AI는 판단을 내릴 뿐 그 근거에 대해 설명할 수 없다.

연구팀은 ‘섀플리 가산 설명법(SHAP)’을 이용해 델파이-2M의 판단 이유를 분석했다. SHAP는 AI 판단에 영향을 준 각 변수를 플레이어로 보고 변수가 예측값에 얼마나 기여했는지를 공정하게 나눠 평가하는 기술이다. 분석에 따르면 췌장암 위험이 높다는 델파이-2M의 판단 근거는 소화기 질환 이력이 있으면 췌장암 발생 위험을 19배 높인다는 결론이었다. 또 우울증·치매 등 정신 질환들과 출산·임신 관련 질환들은 그룹별로 같이 나타나는 경우가 많다고 봤다. 델파이-2M이 기존에 알려진 의학적 결과와 일치하는 패턴을 잡아내 판단한 셈이다. 질병과 질병 사이의 유의미한 관계, 건강 상태나 생활 습관과 특정 질병의 관계를 잘 짚어냈다.

연구팀은 “델파이-2M은 질병 위험이 높은 사람들을 식별하고 검진 계획 등 맞춤형 의료 서비스에 대한 장기적인 계획을 지원하는 데 도움이 된다”며 “연구 결과는 ‘진단 예측 정확도가 높다’에서 멈추지 않고 어떤 요인이 위험을 키웠는지를 보여줘 투명성을 확보했다”고 말했다.

의료 AI의 투명성은 최근 SHAP 방법론을 개발해 학계의 주목을 받은 이수인 워싱턴대 컴퓨터과학·공학과 교수가 10일 ‘네이처 리뷰 바이오엔지니어링(Nature reviews bioengineering)’에 발표한 리뷰 논문에서도 강조한 대목이다. 지난해 삼성호암상을 수상해 주목받은 이 교수는 의료, 금융, 법률 등 설명 책임이 중요한 분야에서 AI의 판단을 설명할 수 있는 기술을 연구하고 있다.

이 교수는 논문에서 다양한 의료 AI의 투명성을 다룬 논문과 사례를 분석하고 의료 AI가 실제 현장에 도입되려면 모델 구축에 사용된 데이터, 학습 과정, 성능 테스트 결과에 대해 투명하게 공개해야 한다고 지적했다. 투명성 외에도 의료 AI가 나날이 발전하는 만큼 AI의 판단을 보완하기 위해 의료진 개입, 데이터 다양성 확보, 지속적 모니터링, 규제 등이 논의되고 있다.

#의료 인공지능#질병 예측#델파이-2M#GPT-2#영국 바이오뱅크
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스