희망찬 미래를 보장하는 빅데이터-의학통계

김상진 동아대학교 빅데이터 분석및응용&의학통계 전공 경영정보학과 교수

  • 입력 2021.05.26 15:21
  • 수정 2021.05.27 13:37
  • 기자명 서성원 기자
이 기사를 공유합니다

하루가 다르게 변모하는 AI프로세서는 빅데이터 값을 모아 분석하고 인간의 상상을 초월하는 결과를 빠르게 예측하고 있다. 특히 COVID19의 영향으로 더 많은 특별한 예측섹션을 요구하게 되었고, 세계의 AI프로세스 시장은 요동치고 있다. 이는 일반적인 사업평가나 일부 분야의 프로세스를 뛰어넘어 국가간의 경쟁 시나리오와 동향분석에까지 영향을 주며 전세계 4차 산업의 구도를 360도 바꿔 놓을 것이다.

과감한 전공전환으로 새 출발
애플, 인텔, 삼성, 구글, 페이스북, 화웨이, 알리바바, 아마존 같은 기업의 공통점은 무엇일까? 서로 다른 것 같으면서도 같은 하나의 공통점을 말하라 하면 전 세계 시장동향을 먼저 분석하면서 R&D와 기술집약적 산업으로 세계 시장을 미리 예측해 선도한다고 할 수 있다. 세상은 이제 누구나 가진 스마트폰에서 시작해 웨어러블 전자기기, 자율주행의 전기자동차, 보건의료나 교통, 항공우주나 석유가스 산업까지 모두 디지털 빅데이터로 이뤄져 이를 분석하는 AI 프로세서 중요성이 화두로 옮겨지는 추세다.

김상진 교수는 미국 텍사스 주립대 수리통계학과 전임교수로 근무했던 교수생활을 정리하고 2020년 3월 1일부로 동아대학교 경영정보학과 교수로 부임했다. 김 교수가 다루는 분야는 독특하다. 아직은 한국에서 생소한 빅데이터분석과 알고리즘 개발, 응용 및 의학통계 분야이다. 모교 동아대학교에서 생활을 한 지 이제 1년, 미국에서 첫 생활처럼 생소했지만 이제는 한국생활도 안정을 찾았다.

"학부과정은 모교 동아대에서 졸업했고 건국대학교 대학원에서 국제통상으로 석사과정을 전공했습니다. 사실 제대로 된 공부는 ROTC선배의 초청으로 미국을 방문했다가 다른 전공의 길로 들어선 거죠." 

2000년, 미국에서는 Yahoo 이메일이 한창 유행할 때였다. 뉴욕 내 학교에서 컴퓨터공학을 전공했던 선배는 MS사에서 주는 자격증 공부에 집중하고 있었다. 중간 중간 PC 작업을 하며 이메일을 보내는데 김 교수는 처음 야후이메일을 그 때 접한 뒤 다른 세상과 편리함에 완전히 매료되어 뉴욕에서 생활하며 새롭게 시작하기로 결심했다.
한국의 학력은 제쳐두고 토플부터 다시 공부했다. 컴퓨터 사이언스로 유명한 센터럴 파크 북쪽 뉴욕시립대가 시작점이었다. 28살 군제대후 멀리 이국 땅에서 시작한 유학생활은 삭막했다. 교내에서는 18~19살 된 친구와 함께 경쟁해야 했고 자존심만 세우기에 자신이 가진 게 너무 없었다.

"해외유학은 크게 2가지 길인거 같아요. 도태되어 중간 포기하고 돌아오던가, 끝까지 정신차려서 뭔가를 이루던가. 자신과의 싸움이죠."

새벽까지 이어진 공부에 눈도 제대로 못 뜬 채 아침강의를 들으러 가는 일은 일상이었다. 그러면서도 '아차하면 중도포기할 수 있다. 실패다!'라는 위기감은 항상 머리 위에서 맴돌았다.한국에 있는 친구들은 이미 앞서 달려가고 있다. 대리를 달고 사회에서 뿌리를 내렸다. 여기서 포기하면 아무것도 안 된다... 끝까지 버티자!'
미국 유학 초창기, 김 교수는 스스로 마음을 다지고 마인드 컨트롤 하는 게 습관처럼 되풀이되었다.

조지아 대학과의 인연
석사과정은 Top 20 안에 들어가는 브라운 대학교였다. 보스턴 인근 로드 아일랜드(Rhode Island) 주 프로비던스에 위치한 아이비리그 대학생활은 더욱 힘들어졌다. 1764년 설립돼 미국에서 7번째로 오랜  역사를 자랑하며, 1958년부터 유일하게 IBM 650 기기를 인수한 뒤 경제학 및 응용수학에 몰두해 왔다. 진도를 따라가기 위해 잠자리에 드는 시간은 점차 늦어져 새벽 3~4시였다.

"힘들면서도 중도포기는 할 수 없었습니다. 너무 먼 길을 가 버린거죠. 저 자신과의 약속이었고, 패자의 모습으로 부모님에게 돌아가기 싫었습니다."

브라운대학에서 지도교수 세부전공은 생물정보학이었다. DNA시퀀싱, 즉 알려지지않은 DNA 시퀀싱에 대한 유전자기능을 찿기위해 기존 DNA시퀀싱과 그에대한 유전자기능을 저장해둔데이터베이스를 탐색 및 시퀀싱을 비교해 가장 가까운 유사성을 가진 시퀀싱을 유추 및 기능을 부영하는 연구를 수행했고,  통계학이 당연히 필연적일 수밖에 없었다.

그래서, '코딩 뿐만 아니라 통계학을 하나 더 해 보라'는 교수님의 조언대로 도전했다. 과목이 늘어난 만큼 노력도 배가 되었지만 어렵사리 의학통계 석사를 마쳤다. 박사과정은 조지아 대학(UGA)에서 통계학전공을 하였으며 세부 전공으로 생물 빅데이터 분석 및 알고리즘 개발을 연구하였다. 1785년 설립되어 가장 오래된 공립대 중 하나인 학교는 교내면적만 168평방킬로미터로 470여 개의 건물로 이뤄져 있었다. 캠퍼스라고 하기엔 너무 커서 하나의 지역이었다. 현직 미국 상하원의원, 대사, 주지사, 연방판사들 등의 동문을 자랑하는 학교, 그중 2010년 100주년을 맞은 대학원에서는 다양한 석박사를 배출하고 있어 프라이드와 매력이 가득해 절로 가슴이 설레었다.

김상진 박사의 논문은 특정질병(비만)과 관련된 바이오마커(SNP:스닙)를 추출하는 통계적 방법론>으로 SCI Top5 중 하나인 저널에 실렸다. 2015년부터 2016년까지 이어진 논문은 오우믹스 빅데이터를 기반으로한 질병예측 모델링을 만들어 솔루션으로 웹사이트에 구현하는 일이었다.  통계분석을 통해 질병과 관련된 유전자 변수 및 임상 변수를 추출하여 질병 예측 모델을 구축 함으로써 새로운 환자의 변수들을 측정하여 모델에 입력하면  암환자에 대한 여부를 판별하는데 도움을 주는 연구였다. 이어 운 좋게도 듀크 대학교에서 수잔 할라비(Susan halabi)라는 세계 최고의 생물 통계학・생물정보학자와 함께 2년정도 슈퍼바이저로서의 임상경험을 쌓을 수 있었다.

◼️  천문학적 비용이 들어갔던 유전자 지도 및 보완비용이 이제는 기술의 발전으로 암 체세포 오믹스 데이터 분석을 통해 쉬워졌다.

◼️  오믹스(omics)란 개별 유전자와전사물,단백질,대사물등 생체물질을 포괄하는 총체적인 개념의 데이터세트를 바탕으로 하는 생물학 분야를 말한다. 오믹스데이터셋은 크게 유전체학, 전사체학, 단백질체학, 대사체학 및 표현체학으로 구분된다.
대학 박사후과정중 잡서치를 통해 전 미국대학중 전공과 부합된 7개의 대학에 교수직으로 지원을 마쳤다. 그중 엘파소에 위치한 텍사스 주립대는 스카이프 화상면접을 거쳐 바로 2차로 합격했다. 돌아와 잡서치를 통해 전 미국대학 중 7여개의 대학에 교수로 지원했다. 그중 조지아 주립대는 스카이프 화상면접을 거쳐 바로 1차 합격했다.

"순간 얼마나 흥분했는지 모릅니다. 이메일로 받았지만 마치 최종합격된 듯이 기뻐 최종 합격한 듯이 기뻤죠. '아 나도 이제 세계적인 석학들과 같은 열차를 타는구나'하는 꿈에 부푼 기대감 같은 것이었어요."

2박 3일 동안 진행한 캠퍼스 사이트면접은 인상깊었다. 자연과학대 학장부터 모든 학과장은 물론 관련 전공교수까지 만나 면접을 진행해 전문지식을 면접을 진행하면서 전공관련 연구에 관한 토의를 진행 하였으며 심사위원 및 전공관련 교수을 대상으로 세미나를 진행하였다. 마지막 날은 시티투어로 마무리되었고, 딱 1주일 후 빠르게 최종으로 합격통지가 왔다. 

물론 미국에서 부교수만으로도 종신교수가 되며 6년만으로 평생의 안정을 얻을 수 있었지만 3년간의 미국 대학교 교수생활을 마무리하고 고국행을 택했다. 미래를 바라보며 가족과 의논해 내린 결정이었다.

 

코로나 질병관리, 빅데이터 분석
김상진 교수는 코로나시대를 맞이해 머신러닝을 활용한 질병관리데이터 연구개발데이터 개발로 이슈를 가졌다.

"동아대 LINC+사업단에서 지역시회 공헌 사업을 지원하여 지역사회질병관리를 위한 의료 빅데이터 활용증진 프로그램을 지난 하반기에 실시를 하였습니다. 지역의 일반인을 대상으로 머신러닝/딥러닝을 활용한 질병 빅데이터의 분석 및 예측 모델을 구축하는 특강을 실시 하였습니다. 사업의 목적은 머신러닝/딥러닝을 활용한 질병관련 빅데이터의 분석 및 예측모델을 구축할 수 있는 질병데이터 분석가로서의 기초역량을 갖춘 인재양성이었습니다. 프로그램과정을 거치면서 실질적인 질병 데이터를 분석 및 예측하는 모델을 학습한 강의노트와 프로젝트를 통한 질병예측 알고리즘 및 구축된 모델들을 동아대 병원내의 인공지능연구소에 재능기부를 하였습니다. 그리고, 더 나아가 의료 빅데이터에 국한하지 않고 부산지역 산업 및 서비스 전반에 걸친 다양한 빅데이터를 분석하고 머신러닝/딥러닝 기반의 모델링을 하는 강의를 일반인을 대상으로 계획중에 있습니다. 개인적인 바램이 있다면 부산이 빅데이터를 기반으로한 AI에 강한 도시로 거듭나기를 희망합니다."  

김상진 교수는 AI의 발달에서 기술이 인간을 대체하는게 아니란 점을 강조했다. 의료 영상및 비영상데이터로 만들어진 결과값은 의사가 진단에 대한 의사 결정을 하기위해 도움을주는 도구로서의 역할을 수행하며 최종 진단결정은 의사가 해야한다는 점을 강조했다.

모교 교단에서 서는 기분
현재 김상진 교수는 경영정보학과에서 경영관련 통계과목 및 머신러닝 수업을 가르치고 있다.를 가르치고 있다. 학생은 곧 제자이면서 후배이다. 경영통계학의이해 과목의 책임교수로서 경영통계의 이해를 통해 학생들에게 새로운 학문의 길을 열어주고 2학년에게 R기반통계분석을, 그리고 3학년에게는 데이터마이닝기법을 활용한 전자고객관리데이터(eCRM)분석 수업을 가르치면서 학생들로 하여금 학자나 사회구성원으로서의 역할을 제대로 수행할 기반을 마련해 주고 있다.

"수포자(수학이 싫어 수학을 포기한 학생)로 와서 다시 통계를 해야 하니 많은 고민이 있을 겁니다. 하지만 저 역시 새 길을 개척한 학자로서 어떤 심정인지는 알아요. 분명한 것은 시대는 쉽지 않은 이 길을 걸은 사람을 요구하고 있고, 잠시의 어려움을 극복하고  뛰어 넘으면 국내외 유수회사에서 찾는 기회는 분명히 찾아온다는 겁니다. 미국에서 박사를 마치고 애플로 넘어갈 때는 15만 불에 육박하는 연봉을 받으니 충분히 보상은 달콤하거든요."

교수이기 이전에 선배로서 밝은 미래를 보여주고 싶은 당연한 마음이다.

 

다양한 국가 연구사업에서 활동
김상진 교수는 현재 국내의 다양한 전문가들과 함께 협업을 이어나가는 중이다. 건양대병원의 김종엽 교수, 국립암센터(NCC) 황보율 인공지능사업팀장, 동아대병원의 강도영 교수와 협업을 통해 새로운 일을 모색하고 있습니다. 현재 동아대병원의 강도영교수와 정보화 진흥원(NIA)에서 추진하는 인공지능학습용데이터구축사업부분에서  파킨슨병 의료 인공지능학습용데이터구축사업에 지원을 한 상태로
현재 SCI급 논문 저널중 하나인 MDPI에서 심사위원으로 활약하고 있다.

또한, 그는 과기부 주관으로 이번 4월부터 연말까지 이어지는 "2021년도 사회현안해결 지능정보화 - 스마트 안심 요양 서비스 지원사업"으로 출연받아 과제를 진행 중에 있다.  과제의 주 내용은 요양원으로 부터 획득된 질병 데이터를 분석 및  머신러닝/딥러닝 기반의 최적의 예측 모델을 구축하여 웹서비스를 구현 하는것이다. 

 

<He is...>
부산 태생으로 부모님은 유통판매업을 하시는 평범한 분들이었다. 어린 시절부터 호기심이 많았고 구기 종목은 물론 모든 운동에는 자신있을 정도로 운동신경이 남달랐다. 하지만, 부모님의 높은 교육열로 이리저리 학원을 다녀야 했고 쌍동이 동생과 고민하는 일은 '어떻게 오늘 학원을 빠질 수 있을까'하는 또래의 고민이었다. 부모님의 의지대로 문과를 거쳐 대학진학했으나 적성은 안 맞았다. ROTC 34기로 후방 부대에서 장교로 소중대장 생활을 거치며 자신의 정체성을 깊이 고민했다. 제대 후 인생에서 헤쳐나가야할 미래를 그리다 뉴욕에 거주중인 선배의 초청으로 미국을 방문했다가 야후 e-mail에 매료되어 새 학문의 길을 걷기 시작했다. 현재 국내에서는 보기 드문 <빅데이터 분석&의학통계>분야를 개척하는 선구자이며 학자로서 국가의 발전을 위해 일익하고 있다.

 

저작권자 © 피플투데이 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전