본문 바로가기

알아야 산다/IT 최신 정보

[IT 최신 정보] 전염병을 예측할 수 있다고요? 인공지능, 머신러닝, 빅데이터 등 IT 기술의 맹활약!

 

생각지도 못했던 '코로나19' 바이러스로 몸도 마음도 지치는 요즘입니다. 별일 없이 흘러갔던 평범한 일상이 아득하게 느껴져요. 하루빨리 그때로 돌아갈 수 있기를 바라며, 조금만 더 인내심을 가지고 슬기롭게 이겨내도록 해요! 주변을 둘러보면 추가적인 확산을 막기 위해 곳곳에서 애써주시는 분들이 참 많더라고요. (다시 한번 감사의 마음을 전합니다) 여기에 IT 기술까지 힘을 얹고 있다는 소식을 접수했습니다. 과연 빅데이터나 인공지능, 머신러닝 기술 등은 이러한 상황에서 어떻게 활용될 수 있는지 같이 살펴볼까요?

 

ㅣ 전염병이 돌 때, '데이터'는 어떻게 사용되나요?

 

전염병 확산을 막는데 가장 효과적인 방법은 '정확하고 투명한 정보 공개'라고 해요. 이번 코로나19에 대해 정부는 이례적으로 확진자들의 동선을 비롯한 위치 정보를 제공했는데요, 이는 공공데이터를 통해 전염 경로를 억제하고 확인되지 않은 소문이 불러일으키는 공포감을 해소하려는 목적이었다고 합니다. 민간에서는 시간 순서에 따라 단순한 텍스트로 공개되던 정보를 이용해 보다 즉각적으로 발병 현황을 전달할 방법을 고안했습니다. 어떤 대학생들은 '코로나맵'을 개발해 확진자들이 다녀간 동선을 공개하고 확진자와 접촉할 가능성을 보여주었는데요, 덕분에 위기 대응에 잘 활용할 수 있었어요.

 

ㅣ '인공지능'을 통한 전염병 예측

 

이미지 출처: 블루닷 홈페이지 (이미지 클릭)

 

'코로나맵'의 경우 발병 직후의 확산 경로에 대한 데이터가 담긴다면, 캐나다의 '블루닷'은 코로나19의 발병 초기에 세계적인 확산 가능성을 경고하면서 유명세를 치르고 있습니다. 전염병의 확산을 분석하는 방법은 다양한데요, 블루닷은 다양한 전문 데이터와 사회적 반응을 분석해 전염병 확산을 예측하는 알고리즘으로 주목을 받고 있습니다.

 

그동안은 인터넷 검색, 소셜미디어 언급 빈도를 바탕으로 사람들의 관심사가 늘어나는 것을 전염병의 확산으로 파악하는 경우가 많았던 반면 블루닷은 머신러닝을 이용해 전염병 확산을 예측합니다. 인터넷을 통해 각종 질병에 대한 정보를 수집하고, 전문가들의 논문이나 학회 포럼, 보고서 등을 분석하지요. 이 외에도 사람들이 예민하게 반응하는 부분을 데이터화하고 그 변화를 즉각 캐치하고 있습니다. 이번 코로나19의 분위기가 심상치 않다는 것을 파악하고, 우리나라를 비롯해 일본과 홍콩, 대만 등으로 바이러스가 번질 수 있다는 실마리는 바로 비행기의 티켓팅 정보에서 시작됐다고 해요. 전염병이 퍼지기 시작하면 해당 지역으로의 여행과 비즈니스에 조심스러워지고, 해당 도시와 연결된 다른 지역과 국가로 번져 나갈 것으로 예측했지요. 

 

블루닷은 2003년, 사스(SARS)의 확산을 경험한 감염 내과 전문의인 '캄란 칸'이 전염병 확산 경로를 연구하면서 시작됐습니다. 2009년에는 우리나라를 비롯해 전 세계를 들썩이게 했던 신종 인플루엔자의 확산을 분석, 예측하면서 서서히 자리를 잡았지요. 캄란 칸은 2013년, 이 프로젝트를 비즈니스로 만들고 본격적으로 감염병 예측 솔루션을 개발했습니다. 이후에도 지카 바이러스 등 몇 년을 주기로 세계를 공포에 몰아넣는 전염병을 토대로 실험을 지속했고, 2019년 12월 자체 리포트를 통해 중국 우한 지역의 코로나 바이러스가 인접 도시 및 국가로 번져 나갈 수 있다고 경고했어요.

 

ㅣ 데이터로 질병 읽기! '머신러닝'이 분석해줘요~

 

 

머신러닝은 전염병의 확산뿐 아니라 질병 치료, 신약 개발, 건강 관리 등에도 활발하게 사용되고 있습니다. 머신러닝의 가장 효과적인 역할 중 하나가 데이터의 변화를 민감하게 파악한다는 것이에요. 구글은 내부적으로 텐서플로*를 바탕으로 질병의 초기 진단을 오랫동안 고민하고 있습니다. 그중 가장 확실한 효과를 내고, 대중적으로 인지도도 높은 것이 이미지 분석을 통한 진단이인데요, 방사선 촬영, MRI 등 병원에서 가장 쉽게 이뤄지는 검사 결과를 분석하는 것입니다. 세계적으로 의사 수가 늘 부족하기 때문에 진료 과정에서 환자 한 명에게 집중할 수 있는 시간은 그리 길지 않아요. 구글은 영상검사 결과 이미지를 머신러닝으로 분석해 아주 미세한 진행을 찾아내는 시도를 고민했습니다.

 

*텐서플로(TensorFlow)는 2015년에 오픈 소스로 공개된 구글 브레인 팀의 머신 러닝 시스템으로, 데이터 흐름 프로그래밍을 위한 오픈소스 소프트웨어 라이브러리입니다.

 

구글이 가장 먼저 시도했던 것은 당뇨성 망막 변증 진단이었어요. 망막을 찍은 간단한 사진 한 장이면 당뇨 합병증을 진단할 수 있고, 약을 통해 충분히 관리할 수 있는 질병이라는 점 때문입니다. 구글은 텐서플로로 당뇨성 망막 변증의 패턴을 읽어냈고, 2016년 논문을 통해 훈련받은 일반인 수준의 진단을 내릴 수 있다고 밝혔습니다. 현재는 전문의 수준으로 진단을 내릴 수 있을 만큼 정확도가 높아지면서 인도와 태국 등 동남아시아 국가들의 의료 현장에서 활용되고 있어요. 구글은 이를 바탕으로 폐암과 유방암의 림프절 전이 진단에 이 머신러닝 기술을 확대하고 있습니다. 데이터만 충분히 학습되면 정확도는 꾸준히 높아질 수 있고 의사들의 전문성을 더해 빠른 진단과 조기 치료를 시작할 수 있을 것으로 기대돼요.

 

 

DNA 분석에도 인공지능 기술이 활용됩니다. 악성 종양의 DNA가 어떻게 변이되는지 세밀하게 분석할 수 있다면, 암을 억제하고 치료하는 데 유리하기 때문에 DNA 분석은 의학계의 오랜 숙제이지요. 복잡한 DNA 분석을 위해 막대한 컴퓨팅 파워와 효과적인 데이터 분석 알고리즘이 필요합니다. 막대한 데이터를 분석할 수 있는 클라우드와 머신러닝은 이를 풀어낼 수 있는 효과적인 방법이에요. 구글의 조기 진단법과 마찬가지로 질병의 진행도나 세포의 움직임에는 분명 복잡한 규칙이 있기 때문에, 그 습관을 이해할 수 있다면 치료 효과를 높일 수 있어요. 이를 읽어내는 데에는 예민한 변화와 복잡한 패턴을 판단할 수 있는 머신러닝 기술이 딱이랍니다!

 


l 치료제 개발과 약물 조합에도 '머신러닝'

 

치료제를 개발할 때도 머신러닝 기술이 활용돼요. 약의 효과를 높이기 위해 여러 가지 약물을 섞는 칵테일 치료는 요즘 지속해서 연구되는 분야라고 합니다. 약물의 조합에 따라서 더 큰 효과를 낼 수 있고, 특정 약품에 대한 내성을 줄이는 효과도 있어요. 하지만 많은 실험이 필요하고, 임상 실험 반응을 예리하게 분석해내야 하거든요.

 

 

미국 미시간대학의 연구팀이 개발한 결핵약 최적화 시스템 '인디고'는 환자의 상황에 따라 적절한 약물 조합으로 결핵 치료의 효과를 높일 방법을 찾아냈습니다. 결핵약에 몇 가지 약물을 조합하면 효과가 극대화되는데, 머신러닝을 통해 약물 조합의 결과를 예측해냈어요. 적절한 조합으로 결핵약의 효과도 높이고 복용 기간은 단축했습니다. 결핵약은 독성이 높은 데다가 보통 1년 이상 꾸준히 먹어야하고, 중간에 복용을 게을리하면 내성이 생겨서 치료가 어려워져요. 이런 특성 때문에 세계적으로 결핵약은 늘 부족 현상을 겪고 있는데요, 인디고의 약 조합 덕분에 적은 양으로도 더 큰 치료 효과를 얻어낼 수 있게 되었답니다.

건강 데이터는 이제 '일상'의 영역으로 들어오고 있어요. 아파야 병원을 가는 것이 이제까지의 건강 관리였다면, 앞으로는 일상의 모든 데이터를 실시간으로 파악하고, 정보들을 모아 미리 질병을 예측, 적절히 대응하는 것으로 이동하고 있습니다. 이는 일상의 병원 진료나 입원 등의 데이터뿐 아니라 혈압, 혈당, 운동량, 식습관 등 아주 작은 데이터와도 연결될 수 있지요. 꾸준히 모아 태산처럼 불려놓은 데이터를 기반으로 몹쓸 전염병도 때려잡고, 효과적으로 건강관리를 할 수 있게 된다니 덕분에 든든해진 느낌입니다.

 

※ 자료 출처: 2020 KISA REPORT VOL.2 _ 03 데이터와 헬스케어의 진화 (바로 가기)