[코로나19]안인성 KISTI 박사팀, 전염병확산·예측장치로 질병 '전망'
'예측' 통한 '대응'으로···질병 정복할 미래 만든다

전 세계가 코로나바이러스감염증-19(이하 코로나19)로 떠들썩하다. 사스, 메르스보다 높은 감염률로 감염 확진자들이 쏟아져 나오고 있다. 길거리에는 사람들이 마스크를 착용한 채 거리를 활보하고 있고 음식점, 화장실, 공공장소 등 어딜 가나 손 소독제가 비치돼 있다.
 
코로나19와 같은 감염병을 사전에 방지하기 위해 KISTI(한국과학기술정보연구원)에서는 빅데이터를 활용해 감염병을 예측하는 연구를 수행하고 있다. 안인성 KISTI 박사팀이다.
 
◆ "전 세계 독감 데이터 바다로부터 연구 아이디어 얻었죠"

안인성 KISTI 박사. 빅데이터를 활용해 감염병을 예측하는 연구를 수행중이다. <사진 = 홍성택 기자>
안인성 KISTI 박사. 빅데이터를 활용해 감염병을 예측하는 연구를 수행중이다. <사진 = 홍성택 기자>
안인성 KISTI 박사팀은 한국화학연구원에 위치한 CEVI융합연구단에서 감염에 관한 질병연구를 진행하고 있다.

CEVI융합연구단은 2016년 메르스 사태 이후 감염질병에 대한 본격적 대응을 위해 8개 정부출연연구기관에서 4개 핵심가치에 맞춰 발족됐다. 진단, 예방, 치료, 확산방지가 4대 가치다.
 
그중 안 박사팀은 확산방지에 대한 과제를 수행중이다. KISTI의 강점인 데이터 수집·처리 기술을 활용해 딥러닝을 하고 고성능의 인공지능 모델을 만들어 질병 초기 징후가 될만한 특징들을 뽑아내고 연구한다.
 
연구단의 질병연구는 초기부터 질병관리본부와 함께 호흡을 맞춰 나갔다. 질병관리본부로부터 연구에 대한 니즈를 파악하기 위해서다. 안 박사는 "독감과 같은 감염병은 매년 찾아오는데 어떤 질병이 어느 시기에 유행하는지를 6개월 단위까지 예측, 패턴을 알아보자는 데서 본격적인 연구에 들어갔다"고 말했다.
 
안 박사팀은 가장 먼저 세계보건기구에 따른 제약회사들의 백신 개발 패턴을 분석했다. 안 박사는 "세계보건기구(WHO)에서 다음 시즌에 유행할 질병을 발표, 제약회사들은 이를 통해 관련 백신을 만든다"면서 "WHO는 플루넷(FluNet)이라는 오픈소스 플랫폼을 통해 전 세계로부터 보고된 바이러스 아형별(亞型別) 발생 정보를 공유한다"고 말했다.
 
안 박사팀은 여기에서 아이디어를 얻어 데이터를 바탕으로 다른 국가와 우리나라와의 질병 패턴을 비교·분석하는 연구를 고안했다.
 
◆ 6개월 전 한국 넘어올 감염병 예측···'전염병확산·예측장치'
 
"다른 국가들은 감염질병을 예측할 때 항공데이터를 주로 이용합니다. 반면 우리 연구팀이 개발한 전염병확산·예측장치는 여러 국가에서 발생한 200여 개 감염병을 분석해 우리나라와의 상관도를 따져 더욱 정확하게 예측할 수 있습니다."
 
연구 끝에 개발한 전염병확산·예측장치는 우리나라와 감염병 발생 패턴이 비슷한 국가들의 수년에서 수십 년간 발생한 질병패턴을 분석, 우리나라로 감염병이 퍼지기 6개월 전 미리 예측할 수 있는 시스템이다. 기존에 알려진 감염병은 물론 변이 또는 새로운 감염병도 예측이 가능하다.
 

다른 나라와 우리나라 사이의 질병 상관도를 수치로 표현했다. 숫자가 높아질수록 우리나라와 비슷한 환경에서의 감염병이 발생된다. <사진 = 안인성 박사 제공>
다른 나라와 우리나라 사이의 질병 상관도를 수치로 표현했다. 숫자가 높아질수록 우리나라와 비슷한 환경에서의 감염병이 발생된다. <사진 = 안인성 박사 제공>
안 박사팀 소속 최수범 KISTI 박사는 "메르스가 우리나라와 상관없는 나라에서 발생한 것이 아니다. 우리나라에 메르스가 발생하기 2년 전 이미 유럽, 미국, 필리핀 등에서 보고가 됐다"면서 "우리나라랑 관련이 높은 나라에서 새로운 질병이 발생한다면 높은 확률로 우리나라에서도 감염병이 올 것이라는 예상으로 시스템을 만들었다"고 말했다.
 
그는 먼저 '프로메드(ProMED)' 사이트에서 나라별 질병발생 상관도 데이터를 추출했다. 이를 주성분 분석(같은 특성을 갖는 나라들끼리의 그룹핑)과 T-SNE(특정 변수들간 거리 계산을 통한 그룹핑)를 통해 우리나라와 밀접한 관계가 있는 나라들을 묶었다.
 
이후 질병들을 점수로 환산해 감염에 대한 정보가 누적되고 어느 순간 임계점을 넘게 되면 우리나라에 해당 질병이 넘어올 가능성이 높다는 결과가 도출되도록 프로그래밍했다. 정확도는 76% 수준이다.

질병상관도를 그래프로 표현했다. 점선으로 표기된 임계점을 넘으면 우리나라에 해당 질병이 발생할 가능성이 높은 것으로 예측된다. <사진 = 안인성 박사 제공>
질병상관도를 그래프로 표현했다. 점선으로 표기된 임계점을 넘으면 우리나라에 해당 질병이 발생할 가능성이 높은 것으로 예측된다. <사진 = 안인성 박사 제공>
최 박사는 "국가별로 어떤 질병이 언제 발생했고 그 질병들이 우리나라에 언제 퍼졌는지 등 세계 질병 데이터베이스를 통해 우리나라와의 질병 상관도 맵을 만든 것"이라면서 "이 상관도 맵에는 국가 간 여객자수 뿐만 아니라 기후·생활패턴 등 질병에 영향을 미칠 수 있는 다양한 요소들의 역할이 함축돼 있다고 생각하면 된다"고 말했다.
 
그는 이어 "우리나라와 질병상관도가 높은 국가는 A라는 질병이 그 나라에 발생하면, 우리나라에도 발생할 가능성이 높다고 해석하면 되는데, 질병발생 빅데이터가 가리키는 그 결과 안에는 기후나 생활패턴, 사람들 간의 왕래량 등 다양한 요인들이 녹아져 있는 것이다"이라고 덧붙였다. 안 박사팀은 지난해 해당 기술 특허를 출원, 현재 등록상태에 있다.
 
최 박사는 "최근 유행하는 코로나19와 같은 새로운 질병도 예측이 가능하다"면서 "아직은 검증단계이며 빠른 상용화가 될 수 있도록 연구해 나갈 것"이라고 말했다.
 
◆ 데이터 기반 예측 연구···"예측 정확도 높여 감염병 정복할 것"
 

안인성 박사와 최수범 박사의 모습. 이들은 질병상관도맵을 통해 전염병 확산을 미리 예측할 수 있는 시스템을 개발했다. <사진 = 홍성택 기자>
안인성 박사와 최수범 박사의 모습. 이들은 질병상관도맵을 통해 전염병 확산을 미리 예측할 수 있는 시스템을 개발했다. <사진 = 홍성택 기자>
어떤 질병이라도 이에 대응하기 위해서는 데이터 수집이 우선적인 과제가 된다. 새로운 질병이라도 수집된 데이터가 적으면 예측 정확도가 떨어지기 마련이다. 안 박사팀이 개발한 기술은 새로운 질병에 대한 데이터가 부족하더라도 우리나라에 전파될 가능성을 예측할 수 있다. 하지만 그들의 연구에도 어려움은 존재한다.
 
감염병 예측 연구에 있어 가장 힘든 점은 바로 사람들의 구체적인 요구다. 안 박사는 "다음에 올 질병이 어떤 건지, 언제 오는지 등 구체적인 대답을 요구하는 경우가 있다"면서 "예측을 연구하는 사람들은 어떤 가능성을 데이터에 기반해서 뽑아내는 것이며 예측 정확도를 높이는 것이 우리의 일"이라고 말했다.
 
앞으로의 연구 방향을 묻자 1초의 고민도 없이 안 박사는 대답한다.
 
"21세기는 발달된 교통기술과 거대도시 집중화 현상으로 그 어느 때보다도 인간과 질병과의 전쟁이 치열할 것으로 보입니다. 소위 똑똑해진 바이러스들에 더욱 효과적으로 대응하기 위해서 우리 연구팀은 IT강국으로서의 자존심과 KISTI맨으로서의 사명감을 가지고 바이러스들과의 정보전을 승리로 이끌기 위해서 최선을 다하겠습니다."
저작권자 © 헬로디디 무단전재 및 재배포 금지