UPDATED. 2024-03-29 02:10 (금)
대학이 가진 데이터, 모으고 정제하면 ‘소중한 정보’
대학이 가진 데이터, 모으고 정제하면 ‘소중한 정보’
  • 정민기
  • 승인 2021.09.08 09:05
  • 댓글 0
이 기사를 공유합니다

고려대 ‘AI선배’서비스 개발한 데이터Hub팀
국내 빅데이터 에듀테크의 첫 발, 성공의 비결은 조직력

대학생활은 선택의 연속이다. 전공이나 교양과목 수강 신청, 장학금 신청 등 학생들은 수많은 선택의 기로 앞에 서게 된다. 옛날에는 학과 선배로부터 큰 도움을 받을 수 있었다. 하지만 지금은 선배의 도움만으로는 한계가 있다. 수강할 수 있는 과목의 폭이 넓어지고 유연한 제2전공 제도가 도입되면서 경우의 수가 더 많아졌기 때문이다. 

대학이 빅데이터와 인공지능을 활용해야 하는 이유는 바로 여기에 있다. 매년 수천 명의 졸업생을 배출하는 대학은 데이터의 요람이다. 수강한 강의 기록, 휴학 기록, 장학금 혜택 등 한 학생이 입학부터 졸업까지 학교 시스템에 남기는 데이터의 양은 상당하다. 이를 잘 활용하기만 하면 학생들에게 유용한 정보를 제공하는 서비스를 구축할 수 있다. 

고려대(총장 정진택)는 국내 대학 중에서 처음으로 빅데이터와 인공지능을 활용해 맞춤형 교양과목을 추천하는 서비스 ‘AI선배’를 개발했다. 지난해 7월부터 베타 버전으로 출시된 이 서비스는 지난 20년 간 고려대 선배들의 수강 이력 데이터를 기반으로 학생들에게 맞춤형 강좌 추천을 제공한다.

 

고려대 데이터Hub팀 이진숙 사이언티스트가 지난 8월 24일 7회 KU 혁신 포럼에서 AI선배의 비전을 설명하고 있다. 사진=고려대 제공
고려대 데이터Hub팀 이진숙 사이언티스트가 지난 8월 24일 7회 KU 혁신 포럼에서 AI선배의 비전을 설명하고 있다. 사진=고려대 제공

2년 전부터 데이터 분석 커뮤니티 구성

고려대는 2019년부터 대학혁신지원사업의 일환으로 다양한 프로젝트를 진행해왔다. ‘AI선배’는 바로 사업이 내놓은 첫 번째 결과물이다. 고려대는 2019년 데이터Hub팀을 구축하고 산업경영공학부, 교육학과를 포함한 교내 여러 분야의 교수, 교무처, 교수학습개발원, 학생, 데이터 사이언티스트, 데이터 엔지니어 등으로 구성된 데이터 분석 커뮤니티를 운영해왔다. 

빅데이터를 기반으로 서비스를 구축하는 데 가장 큰 걸림돌은 데이터를 특정 형식에 맞게 정제하는 것이다. 다른 산업과 마찬가지로 현재 대학이 축적해온 데이터 역시 인공지능 개발에 활용하기 위해서는 많은 단계의 전처리 과정을 거쳐야 한다. 애초에 빅데이터 서비스 제공을 목적으로 수집된 데이터가 아니기 때문에 누락된 정보도 많고 깔끔하게 정리되지 않고 산재돼 있기 때문이다. 고려대 데이터Hub팀은 지난 2년 동안 사용할 수 있는 데이터의 맥락을 파악해 선별하고 이를 정제하는 작업을 해왔다.

지난 8월 31일 고려대 데이터Hub팀의 데이터 사이언티스트로 근무하고 있는 이진숙 씨를 인터뷰했다. 이 씨는 “대학이 데이터를 활용해 의사결정을 하거나 학생들에게 서비스를 제공한다는 문화가 이제 막 국내로 들어오고 있다”며 “산재된 데이터를 모으고 정제하는 데 많은 시간과 노력이 들었다”고 말했다. 고려대 데이터Hub팀은 사이언티스트 4명, 데이터 엔지니어 2명, 소프트웨어 엔지니어 3명, AI서비스 PM 과장 1명, 그리고 총괄 팀장 1명 총 11명으로 구성됐다. 

학교의 방대한 데이터를 이용해 서비스를 구축하는데 어떤 어려움이 있었을까. 이 씨는 “만약 데이터Hub팀이 정보처가 아니라 다른 부서에 있었다면 데이터에 접근하기가 어렵고 실시간으로 변화하는 데이터를 즉각적으로 확인하는데 차질을 겪었을 것”이라고 밝혔다. 대학에 빅데이터를 이용하는 서비스를 제공하는 팀을 구축한다면 데이터에 접근하기가 용이한 부서 소속으로 구축하는 것이 효율적이라는 분석이다.

데이터Hub팀, 교육철학적 문제도 고려

대학은 수많은 부서와 학과로 구성되기 때문에 데이터 역시 각 부서에 흩어져 있는 경우가 많다. 이 씨는 “다른 부서에 필요한 데이터가 있을 경우 해당 부서에 연락을 취해서 데이터 공유 협조를 요청해야 했다. 데이터Hub팀의 경우 디지털정보처에서 오래 근무하신 총괄 팀장님과 과장님이 계셨고, 처장님께서 데이터 거버넌스 확보와 AI서비스 활성화를 위해 누구보다 적극적으로 노력해주셨기 때문에 훨씬 수월하게 개발할 수 있었다”고 했다. 또한, 각 부서마다 공개를 꺼려하는 데이터가 있기 마련이다. 이를 위해서는 학교 행정에 능통하고 각 부서와 인적 네트워크를 구축한 교직원이 총괄자 역할을 맡아줘야 할 필요가 있음을 시사한다. 교내 모든 구성원을 고려한 정보 공개 범위를 설정하고 이를 잘 조율하고 타협해 합의를 이루는 과정이 필요하다. 

데이터Hub팀은 교육 철학적인 문제도 고려해야 했다. 이를테면, AI선배 서비스에서 ‘성적 잘 주는 강의’나 ‘과제 적은 강의’에 대한 정보도 제공해야 할까. 고려대는 다양한 분야의 교수들로 구성된 데이터 분석 커뮤니티를 구축했다. 교육학과 교수부터 심리학, 사회학, 경제학, 인공지능 연구진, 교수학습지원팀 등의 전문가들이 2019년부터 2021년 중반까지 주 1회 회의를 했다. 이와 같은 노력을 통해 고려대는 AI선배가 소위 ‘꿀강 추천’ 같은 수월성에 과도하게 집중하지 않는 것이 고려대의 교육철학에 부합한다고 판단했다. 대신, AI선배를 통해 개인 맞춤형 교육 정보를 제공함으로써 학생들이 재학 기간동안 다양한 학문적 경험을 할 수 있도록 돕고자 했다. 

지난 8월 24일 대학혁신지원사업의 일환으로 진행된 ‘제 7회 KU 혁신 포럼’에서 이 씨는 AI선배의 향후 방향성에 대해 4가지 내용을 언급했다. 첫째, AI선배는 앞으로 장학금이나 진로 문제와 관련된 서비스 제공을 검토할 것이다.. 둘째, 강좌 추천 서비스에 수업 강도와 같은 실질적인 세부 정보를 탐색하고 학생들의 학습 성향에 따라 맞춤형 추천을 제공할 것이다. 셋째, 추천 엔진의 정확도를 개선시켜나갈 것이다. 마지막으로, AI선배는 데이터를 이용한 단순 AI 추천 서비스 뿐만 아니라 개개인의 선배들이 직접 후기나 노하우를 후배들에게 남길 수 있는 선후배 교류 커뮤니티로 확장해나갈 것이다. 

정민기 기자 bonsense@kyosu.net
 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.