기후위기시계
실시간 뉴스
  • 연합학습 기반 ‘의료AI’ 나온다
DGIST·美스탠퍼드대 공동연구팀
여러기관 흩어진 의료데이터 학습
신체장기 데이터 영역화 기술 개발
대구경북과학기술원(DGIST) 연구팀이 서버에서 의료영상 분석 중인 인공지능(AI) 모델을 확인하고 있다. [DGIST 제공]

대구경북과학기술원(DGIST) 로봇및기계전자공학과 박상현 교수팀이 미국 스탠퍼드대와 함께 연합학습 기법을 활용해 여러 의료기관에 분산된 의료영상 데이터를 효과적으로 학습해 신체 장기들을 정확하게 영역화할 수 있는 기술을 개발했다.

병원 등 각 의료기관에서는 다양한 목적으로 신체 각 부위의 장기 영상 데이터를 가지고 있다. 하지만 원활하고 정확한 의료행위를 위해 개별 기관에서 가지고 있지 못한 각 의료 데이터를 활용해 다중 장기 영역화를 위한 인공지능(AI) 모델 개발이 필요한데, 기존에는 각 의료기관의 영상 데이터를 중앙서버에 모아 학습하는 방식으로 진행해 데이터 유출에 민감한 의료 분야에서 실제로 적용하기 어려웠다. 또 각 기관마다 영상 활용을 위한 관심 영역이 달라 이를 분석해서 다양한 영역을 동시에 영역화 하는 모델을 학습하는데 한계가 존재했다.

박상현 교수팀은 서로 다른 장기의 레이블(파일의 관리나 처리의 편의를 위해 파일에 붙이는 특별한 항목 표시 기록)을 가지는 분산 데이터들을 유출 없이 효과적으로 활용하기 위해 연합학습을 기반으로 한 다중 장기 영역화 모델을 제안했다. 연합학습을 활용할 경우 분산된 데이터를 직접 공유없이 상호 간 협력으로 AI 모델을 학습할 수 있다. 하지만 각 분산 데이터를 통해 획득한 정보를 취합하는 과정에서 정보의 손실로 ‘망각(Catastrophic Forgetting)화 현상’ 문제가 발생하며, 서로 다른 관심 영역에 대한 레이블을 가진 데이터들로 인해 학습이 불안정해지면서 모델이 구축되지 않거나, 학습속도가 느려지는 단점이 존재한다.

연구팀은 이를 해결하기 위해 지식 증류(Knowledge Distillation) 기법을 제안했다. 먼저 다중 헤드 U-Net 모델을 활용해 각 기관의 서로 다른 각 신체 장기 영상 데이터를 영역화하고, 공유 임베딩 학습으로 영역화한 영상을 공유하면서, 각 기관에서 AI 모델 학습 시 글로벌 모델과 사전 훈련된 특정 장기 영역화 모델의 지식을 함께 활용해 연합학습을 수행하도록 했다. 그 결과 기존 제안된 모델보다 적은 파라미터 및 연산량을 활용하면서 성능은 더 우수한 새로운 기술을 개발했다.

연구팀은 개발된 기술을 검증하기 위해 7개의 서로 다른 영역화 레이블을 가지는 복부 CT 데이터셋에 적용했다. 검증 결과 기존의 다중 장기 영역화 기법 모델이 연합학습에서 평균 66.82% 이하의 성능을 기록한 것에 비해, 새로 개발한 기법은 평균 71.00%의 높은 성능을 기록했고, 공유 임베딩 학습으로 추론 시간도 단축했다.

박상현 교수는 “이번 연구를 통해 여러 의료기관의 의료영상 데이터를 공유하지 않더라도 효과적으로 의료 AI를 학습하고 활용할 수 있도록, 각 관심 장기들의 영역화를 수행하기 위한 기술을 개발할 수 있었다” 며, “새롭게 개발한 기술이 의료영상 분석에 큰 도움이 될 것으로 생각하며, 향후 대규모 의료AI 모델 개발에도 기여할 것으로 기대하고 있다”고 말했다.

이번 연구결과는 의료 인공지능 분야 국제학술지 ‘메디컬 이미지 애널리시스(MedIA)’에 게재됐다. 구본혁 기자

nbgkoo@heraldcorp.com

맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크