기후위기시계
실시간 뉴스
  • “대규모 유전자데이터 3시간내 분석”…표적 정밀치료 가능해진다
- 기초과학연구원 의생명 수학 그룹 김재경 CI
- 유용 생물학적 신호찾는 데이터 분석도구 개발
김재경 IBS 의생명 수학그룹 CI(KAIST 수리과학과 교수).[IBS 제공]

[헤럴드경제=구본혁 기자] 국내 연구진이 더 빠르고 정확하게 전사체(RNA)를 해독할 수 있는 새로운 도구가 개발됐다.

기초과학연구원(IBS) 수리 및 계산 과학 연구단 의생명 수학 그룹 김재경 CI(Chief Investigator·KAIST 수리과학과 교수) 연구팀은 전사체 분석 빅데이터에서 유용한 생물학적 정보만 골라내는 새로운 도구인 ‘scLENS(single-cell Low-dimension Embedding using Effective Noise Subtraction)’를 개발했다.

단일세포 전사체 분석은 최근 생물학, 신약 개발, 임상 연구 등 여러 분야에서 주목받는 도구다. 개별 세포 단위에서 유전적 변화를 확인할 수 있기 때문이다. 단일세포 전사체 분석을 이용하면 암 조직 내 수십 가지 종류의 세포를 구분하고, 유전적 변이가 발생한 세포만 표적하는 정밀 치료가 가능해진다.

단일세포 전사체 분석은 수백~수천 개에 이르는 개별 세포의 수만 개에 이르는 다양한 유전자 발현량을 측정하기 때문에 데이터 용량이 수~수십 GB에 달한다. 이 방대한 데이터 중 생물학적으로 유용한 신호는 3% 내외에 불과하다.

지금까지 여러 데이터 처리 도구가 개발됐지만 분석가에 따라 결과가 크게 달라지고, 정확도가 떨어진다는 한계가 있었다.

연구진은 사용자가 노이즈의 임계값을 결정하는 데이터 전처리 방식 자체가 생물학적 신호를 왜곡시킨다는 것을 규명하고, 왜곡 없는 새로운 전처리 방식을 개발했다. 이어 수학적 방법론인 ‘랜덤 행렬 이론’을 이용해 사용자의 주관적 선택 없이 자동으로 단일세포 전사체 분석 데이터에서 신호와 노이즈를 구별하는 프로그램인 ‘scLENS’를 개발했다.

이어 기존 개발된 11가지 데이터 분석 프로그램과 scLENS의 상대적 성능을 비교했다. 이를 통해 scLENS가 다른 모든 프로그램보다 우수한 성능을 보인다는 점을 확인할 수 있었다.

전사체 분석 빅데이터에서 유용한 생물학적 정보만 골라내는 도구 scLENS 모식도.[IBS 제공]

특히 기존 프로그램보다 많은 계산을 하지만 메모리 사용 최적화를 통해 10만 개의 세포와 2만 개의 유전자로 이뤄진 대규모 데이터를 3시간 만에 분석하는 경쟁력 있는 분석 속도를 보였다.

김재경 CI는 “지난 십여 년간 단일세포 전사체를 분석할 수 있는 실험 기술의 비약적인 발전했지만, 데이터 분석 방법의 한계로 인해 큰 비용과 시간을 투자해 얻은 데이터를 최대한 활용하지 못하는 경우가 많았다”며 “기초 수학 이론이 생명과학 연구의 혁신을 견인하고, 감춰졌던 생명의 비밀을 빠르고 정확하게 밝히는 데 쓰일 수 있음을 보여주는 연구”라고 말했다.

이번 연구결과는 국제학술지 ‘네이처 커뮤니케이션즈’ 4월 27일 온라인판에 실렸다.

nbgkoo@heraldcorp.com

맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크