정보분석가 송민 교수, 유전자동의보감사업단 지원 '텍스트 마이닝 기법' 개발
천연물 연구 속도↑ "신약개발 활용토록 정확도 높일 것"

"하루에 쏟아지는 논문만 만 건 정도가 된다는 통계가 있다. 연구자들이 이걸 다 읽고 분석하기란 쉽지 않다. 전문가들이 쏟아내는 중요한 의학 정보들 중 연구자가 필요한 정보가 무엇인지 관계성을 추출해 질병 퇴치에 도움이 되도록 연구하고 있다. 특히 천연물이 치료제로서 어떤 역할을 할 수 있는지, 인체에 어떤 영향을 끼치는지 시스템을 구축하겠다."
 
송민 연세대 문헌정보학 교수는 쏟아지는 정보들을 수집하고 분석 해석해 유통하는 연구자다. 지난 19대 대선을 앞둔 상황에서는 SNS의 정보와 말을 통해 대중들의 선호도를 분석하기도 했다. 그야말로 넘치는 정보들을 정제하고 분석하는 것이 송 교수의 연구주제다.
 
그런 그가 천연물을 바이오의료산업에 활용하기 위해 고군분투하는 연구자들의 든든한 조력자로 나섰다. 유전자동의보감사업단(단장 이도헌 KAIST 교수)을 통해 천연물효능을 예측할 수 있는 텍스트 마이닝 기법을 개발 중인 것. 천연물을 통해 얻은 신약물질의 효능과 관련생물정보를 발굴해 그 효과를 분석할 수 있는 툴을 연구개발 중이다. 여기에는 생물 정보 관련 빅데이터 방법론, 이형네트워크, 딥러닝, 계량개체학 방법론 등이 활용된다.
 
문헌정보학 전문가가 바이오 관련 일을 하는 것은 국내에서 흔한 일은 아니다. 송 교수에게 이 같은 연구가 가능했던 것은 미국에서 교수로 재직하던 시절 바이오인포메틱스(컴퓨터를 구사해, 방대한 생물 정보를 효율성 있게 정리·해석하고 그 생물학적·의학적인 의미를 밝히는 학문)를 통해 알고리즘 분석연구를 했던 것이 기반이 됐다.
 
송민 교수는 쏟아지는 정보들을 수집해 분석 및 해석하여 유통하는 연구자다. 그는 최근 천연물을 통해 얻은 정보들을 분석해 전통천연물의 신약개발에 속도를 높일 수 있도록 돕는 연구를 진행 중이다.<사진=김지영 기자>
송민 교수는 쏟아지는 정보들을 수집해 분석 및 해석하여 유통하는 연구자다. 그는 최근 천연물을 통해 얻은 정보들을 분석해 전통천연물의 신약개발에 속도를 높일 수 있도록 돕는 연구를 진행 중이다.<사진=김지영 기자>
"서양의학과 전통천연물연구와는 다소 차이가 있지만 바이오분야의 범위가 워낙 광범위해 미국이나 유럽 중심의 연구활동성과들도 고려해야 한다는 점에서 지난 연구경험이 도움이 되고 있다"고 말한 그는 "신약개발은 로또라고 말할 정도로 임상부터 실패확률이 굉장히 높다. 실패확률을 최상으로 단축하는 연구가 우리의 과제"라고 강조했다.
 
◆ '약효평가 검증 시스템' 개발 "2020년 상용화 가능 기대"
 
그는 천연물을 통한 신약개발에 주로 활용되는 '인체시험 가설생성 자동시스템'을 통해 가상인체 모델 CODA를 연구개발 중이다. 천연물 기반 신약개발 연구자들은 CODA를 통해 신약후보물질이 인체에 흡수됐을 때 어떤 영향을 끼치는지, 질병의 원인이 어떤 경로로 생기는지 살펴보고 어떤 약을 써야 치료에 도움이 되는지 등의 가설도 제공받을 수 있다.
 
송 교수는 연구자들이 CODA에 필요한 데이터를 제공하는 등 자동가설 생성알고리즘을 만들어 관련특허 출원하고 논문 게재를 마쳤다.
 
그는 이 시스템이 정말 유효성이 있는지 등을 검증하기 위해 연구단의 동료 연구진들과 협력관계를 맺고 있다. 도출된 다양한 가설들이 실제 동물이나 사람을 대상으로 한 약효평가와 얼마나 일치하는지 검증하는 단계를 거치는 중으로 앞으로 검증단계를 한 단계 강화할 계획이다.
 
동물이나 사람을 대상으로 한 임상시험은 생명의 존엄성 뿐 아니라 많은 비용과 시간 등을 필요로 해 자동시스템개발의 필요성이 더욱더 대두되고 있다.
 
그는 "CODA는 아직 개발단계이기는 하지만 가상인체모델을 만들어 신약후보물질의 복잡한 프로세스를 단축하면서 정확률을 높이도록 하는 것이 우리가 추구하는 연구방향"이라며 "특정 질병에 대한 가설을 세우는 시스템보다 많은 연구자들이 활용할 수 있도록 모델을 개발 중으로 2020년 사업단 과제가 완료될 시점에 상용화가 가능할 것으로 보고 있다"고 말했다.
 
이 외에도 그는 기하급수적으로 증가하고 있는 학술문헌의 바다에서 연구자가 관심 있는 개체명과 개체 관계를 추출하는 시스템 PKDE4J를 개발했다. 2015년 알파버전을 거쳐 작년에 완성된 시스템으로 현재 업그레이드 중이다. PKDE4J를 생의학 분야 학술문헌에 적용하면 기존에 밝혀지지 않았던 지식의 관계 또는 새로운 가설 생성 등 효과가 있을 것으로 기대된다.
 

그는 신약후보물질의 복잡한 프로세스 단축을 위한 프로그램을 연구개발 중이다. 사진은 송 교수 논문 일부분.<사진=송 교수팀 제공>
그는 신약후보물질의 복잡한 프로세스 단축을 위한 프로그램을 연구개발 중이다. 사진은 송 교수 논문 일부분.<사진=송 교수팀 제공>
◆ "같은 한국말 맞아?···생물학 전문용어 처음엔 어려웠죠"
 
"관련 연구를 한지도 벌써 4년 가까이 된다. 주제가 생소하고 어려웠지만 연구로 끝나는 것이 아닌 실제 연구자들에게 필요한 시스템이 될 수 있도록 정확도를 높이는데 최선을 다하겠다."
 
"미국에서 바이오인포메틱스 연구를 한 경험이 있지만 정보학 전문가로서 천연물을 대상으로 하는 연구주제가 쉽지만은 않았다"는 송 교수는 바이오라는 전문지식의 부족함을 채우기 위해 다양한 시도를 꾀했다. 그중 하나가 연세대 생물학 석박사 출신인 연구원을 연구랩의 식구로 맞이한 일이었는데, 같은 한국인임에도 불구하고 "서로 어떤 말을 하는지 이해가 되지 않아 애를 먹었다"고 지난 날을 회상했다.
 
이대론 안 되겠다 싶어 시작한 것이 주 1회 스터디였다. 이렇게라도 하지 않으면 과제를 진행할 수 없을 것 같아 지푸라기 잡는 심정으로 시작한 모임이 벌써 4년째, 이제는 연구실 모두가 생물학에 대해 심도있는 논의를 할 정도로 전문가가 됐다.
 
새로운 분야의 도전에 여러 번 고비도 있었지만 앞으로 송 교수는 개발한 프로그램이 연구에 머물지 않고 실제 연구자들이 사용할 수 있도록 개선하는데 몰입할 계획이다.
 
그는 "전통천연물의 효과나 영향에 대한 구체적인 연구가 많이 되어있지 않은 가운데 가치 있는 천연물을 찾아 신약으로서의 가능성을 찾아 우리나라 고유의 기술로 만드는 것이 연구단의 목표"라며 "수많은 의료계 관계자들이 질병 퇴치를 위해 연구를 하는데 있어서 필요한 정보를 모으고 추출함으로써 신약개발 실현을 하도록 하는 것이 우리의 꿈인 만큼 정확도를 높여 실제 연구자가 쓸 수 있는 시스템으로 개발할 것"이라고 포부를 밝혔다.

"우리가 개발 중인 시스템이 실제 신약개발 연구자들에게 필요한 시스템이 될 수 있도록 정확도를 높이는데 최선을 다하겠습니다."<사진=김지영 기자>
"우리가 개발 중인 시스템이 실제 신약개발 연구자들에게 필요한 시스템이 될 수 있도록 정확도를 높이는데 최선을 다하겠습니다."<사진=김지영 기자>
저작권자 © 헬로디디 무단전재 및 재배포 금지