UPDATED. 2024-04-25 11:25 (목)
송태민 삼육대 교수, ‘코로나 위험 예측 인공지능’ 개발
송태민 삼육대 교수, ‘코로나 위험 예측 인공지능’ 개발
  • 하혜린
  • 승인 2021.01.06 10:22
  • 댓글 0
이 기사를 공유합니다

SNS 소셜 빅데이터 수집·분석해 위험신호 포착
한국데이터산업진흥원 ‘데이터 바우처 지원사업’ 우수사례 선정

송태민 삼육대 교수(보건관리학과·사진)가 SNS상의 빅데이터를 분석해 코로나19 위험요인을 예측하는 인공지능(AI)을 개발했다. 

송 교수는 인공지능 개발을 위해 지난해 1월부터 6월까지의 뉴스 사이트, 블로그, 카페, SNS, 인터넷 게시판 등 237개 온라인 채널에서 언급된 코로나 관련 소셜 데이터, 총 4백3만2천883건을 수집했다. 

그는 수집된 데이터를 텍스트 마이닝(Text mining)과 오피니언 마이닝(Opinion mining) 등 빅데이터 기법을 통해 코로나19 감정(위험·안전), 대상, 감염경로, 관련 바이러스, 증상, 대처, 예방활동, 이슈, 산업 등 10개 주제로 분류했다. 

이어 주요 키워드를 ‘단어 빈도’와 ‘문서 빈도’로 나눠 분석했다. 단어 빈도는 한 문서에서 특정 키워드가 나타난 빈도를 집계하는 것으로 그 키워드가 얼마나 중요한지 보여준다. 문서빈도는 전체 문서에서 특정 키워드가 포함된 문서의 수를 집계해 얼마나 폭넓게 등장하는지 알 수 있다. 

송 교수는 이 같은 소셜 빅데이터로 머신러닝 학습 데이터를 생성하고, 모델링 과정을 거쳐 코로나 위험 예측 인공지능을 개발했다. 

이 인공지능은 온라인상에서 특정 키워드의 빈도와 증가율 등을 분석해 ‘잠재 신호→약 신호→강신호→강하지만 증가율이 약한 신호’에 이르는 미래 신호(Future Signal) 흐름을 포착할 수 있다.

가령 코로나 관련 키워드 중 ‘무증상’에 대한 약 신호가 잡히면, 향후 관련 내용이 강신호와 같은 메가트렌드로 확산될 수 있기에 사전에 대응할 수 있다. 

송 교수는 “빅데이터 분석은 방대한 양의 데이터를 활용해 사회적 문제를 예측하고, 현상에 대한 복잡한 연관관계를 보다 정확하게 밝혀낼 수 있다”며 “이 같은 인공지능 개발 방법을 적용함으로써 코로나뿐만 아니라 다양한 사회적 위험요인을 사전 예측하고, 대응체계를 마련할 수 있을 것으로 기대한다”라고 말했다. 

이 연구는 한국데이터산업진흥원이 주관하는 ‘2020년 데이터 바우처 지원사업’의 지원을 받아 수행됐다. 사업의 우수사례로 선정돼 한국데이터산업진흥원장 표장을 받았다. 

하혜린 기자 hhr210@kyosu.net


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.