UPDATED. 2022-06-24 17:42 (금)
1990년대생 박새롬, ‘감성 정보’로 반응을 읽어내다
1990년대생 박새롬, ‘감성 정보’로 반응을 읽어내다
  • 김재호
  • 승인 2021.10.27 09:14
  • 댓글 0
이 기사를 공유합니다

여성과학기술인 이야기 ③ 박새롬 성신여대 교수


한국여성과학기술인육성재단(WISET)은 더 나은 세상을 만들어 나가는 이 시대 여성과학인 소개 캠페인 ‘She Did it’을 펼치고 있다. <교수신문>은 여성과학기술인이 본인의 능력을 충분히 발휘하고 경력 성장을 하기 위한 다양한 이야기를 공동으로 소개한다. 여성과학기술인이 현장에서 겪고 있는 생생한 목소리가 교수사회에 전달되길 기대한다. 세 번째는 박새롬 성신여대 교수(융합보안공학과)이다.

“AI·보안 데이터마이닝 전문가” 박새롬 성신여대 교수(융합보안공학과)를 수식하는 표현이다. 박 교수는 AI에 발생할 수 있는 부족함과 문제에 대해 주목하고 해결을 위해 도전해온 젊은 과학기술인이다. AI·보안 데이터마이닝 전문가인 그는 그저 오래도록 하고 싶은 연구에 매진할 수 있다면 가장 기쁠 것 같다고 말한다.

박 교수는 2018년 서울대 산업공학과에서 공학박사 학위를 취득했다. 그는 이후 서울대 수학기반산업데이터해석 연구센터 연구원을 거쳐 성신여대 교수가 됐다. 박 교수는 인공지능(AI)과 보안, 기계학습, 통계학습, 데이터마이닝 등에 관해 연구하며 독보적인 성과를 내고 있다. 박 교수는 지난해 3월 국내 최연소 카카오 사외이사에 선임됐다.

박새롬 성신여대 교수는 2018년 서울대 산업공학과에서 공학박사 학위를 받았다. 2019년 WISET KIIE 젊은 연구자상 최우수상을 받았다. 사진=WISET

박 교수는 “융합보안은 정보의 수집, 가공, 저장, 검색, 송신, 수신 중에 발생할 수 있는 정보의 훼손, 변조, 유출 등을 방지하기 위한 모든 수단”이라고 설명한다. 박 교수는 박사과정 중에 주로 이미지나 문서 데이터의 분포 정보를 컴퓨터가 학습하여 이를 반영할 수 있도록 하는 ‘표현 학습 방법론’에 관련한 연구를 수행했다. 표현 학습 방법론은 기계학습 모형이 수치적 모형의 형태를 가지기 때문에 이미지 데이터, 문자 데이터 등의 비정형 데이터에 대한 분석에 기계학습 모형을 적용하기 위해서 효과적인 수치 표현을 학습하는 것이다.

박 교수는 박사 학위를 받은 후 서울대 수학기반데이터해석연구센터에서 연구원으로 재직하며 인공지능과 관련한 보안 문제들에 관심을 갖게 됐다. 그는 “인공지능 알고리즘이 가질 수 있는 취약성을 보완하고, 프라이버시 보호를 위한 기계학습 알고리즘 개발을 연구해 오고 있다”라고 말했다.

인공지능 알고리즘 취약성을 보완하다

박 교수는 2019년 ‘WISET KIIE 젊은 연구자상 최우수상’을 받았다. 과연 어떤 연구로 상을 받았을까? 박 교수는 “학습 데이터(소스 데이터)와 테스트 데이터(타깃 데이터)의 분포가 다를 때 생길 수 있는 성능 저하를 보완하는 방법에 대한 연구”라면서 “그때 개발한 것이 커널 함수를 이용해 비슷하지만 정보가 충분한 데이터를 찾아내고, 주어진 소스 데이터와 함께 활용하여 타깃 데이터에 대한 예측 성능을 향상하는 ‘도메인 적응 방법론’”이라고 말했다. 도메인 적응 방법론을 활용하면, 데이터가 부족하거나 레이블 정보가 부족한 경우에도 기계학습 모형 적용이 가능해진다.

또한 박 교수는 최근 컴퓨터과학 분야 SCI급 국제 학술지 『뉴럴 네트워크』에 공저자로 참여해 감정 분석 기술 관련 논문을 발표했다. 기존 방법은 단어 정보의 감성 정보가 제대로 반영되지 못하고, 문서 데이터의 감성 정보를 반영하는 데에도 적합하지 않았다. 박 교수는 논문을 통해 감성 정보를 반영한 문서 수치 표현이 학습될 수 있는 방법론을 제안했다. 박 교수는 “전체 문서 중에 감성 정보가 있는 문서들의 감성 정보를 활용하여 단어와 문서의 수치 표현을 학습할 때 이를 반영할 수 있도록 한 것”이라고 강조했다.

예를 들어, 대통령 선거의 당선 예측에서 후보에 대해 대중이 쓴 수많은 글들을 수집 후 긍정적인지, 부정적인지 정보를 입력한다. 그러면 AI는 긍정·부정에 대한 정보를 주지 않은 글들에 대해서도 긍정적인 글끼리 서로 가까운 수치 벡터로, 부정적인 글끼리 서로 가까운 수치 벡터로 학습
한다. 대통령 당선에 대한 긍정 반응을 알고 싶다면 모든 글들을 읽을 필요 없이 긍정 정보를 줬던 문서의 수치 벡터와 가까운 위치에 존재하는 글들의 분포만 확인해 보면 된다.

 

대통령 당선 예측에 기여하는 분석 기술

학생들 및 여성 과학기술인들에게 전하고 싶은 말에 대해 박 교수는 “아직 경험이 많이 없지만, 살아오면서 내가 도전하지 않으면 아무런 일도 일어나지 않는다는 것을 깨달았다”라며 “스스로 다짐하는 말이기도 하지만, 가능성이 작더라도 가치가 있다고 생각된다면 도전할 수 있는 용기를 갖자”라고 강조했다.

앞으로 계획에 대해 박 교수는 “인공지능의 안정성 및 보안 관련 연구를 계속하며, 혼자 연구하는 것이 아닌 함께 고민하고 공부하고 나아갈 연구 공동체를 만들고 싶다”라며 “제가 좋아하는 공부를 하며 살아가겠지만, 제가 어떻게 세상에 기여하며 좋은 영향력을 끼치며 살 수 있을까도 함께 고민하면서 살아가겠다”라고 답했다.

김재호 기자 kimyital@kyosu.net


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.