UPDATED. 2022-12-05 15:35 (월)
컬처마이닝으로 국가별·성별·세대별 감성가치 찾는다
컬처마이닝으로 국가별·성별·세대별 감성가치 찾는다
  • 김봉억 기자
  • 승인 2022.03.23 08:39
  • 댓글 0
이 기사를 공유합니다

‘K-융합연구의 미래’⑤ 융합이 만난 언어뿌리_문화+마이닝
한국연구재단 인문사회연구본부-교수신문 공동기획

융합(Convergence)의 시대다. 장벽과 경계가 사라지고 있다. 인문사회와 과학기술의 지식을 합쳐 새로운 유형의 지식을 창출하는 동시에 우리 사회와 인류가 직면한 문제를 해결해야 한다. 인문사회가 뒷받침되지 않는 첨단 과학기술은 맹목적이고, 과학기술과 분리된 인문사회는 공허하다. 그렇다면 국내 인문사회 기반의 융합연구는 어디까지 와 있을까. 한국연구재단 인문사회연구본부의 융합연구 지원사업을 중심으로 총 10회에 걸쳐 국내 융합연구의 현주소를 살펴보고 K-융합연구의 미래를 진단한다.

① 인문사회 과학기술 만나다
② 융합이 치유하다_사회문화 통합전염병
③ 융합이 만든 안식처_스마트쉘터
④ 융합이 쓰는 미래_新기후 시나리오
⑤ 융합이 만난 언어뿌리_문화+마이닝
⑥ 융합의 새로운 통찰_웰다잉
⑦ 융합의 빅데이터 분석_한국사 권력 메커니즘
⑧ 융합의 색다른 발상_환자 회복 패러다임
⑨ 융합의 연결고리_다문화 의사소통 앱
⑩ 인문사회가 묻고 융합이 답을 하다

감성 가치가 재화와 서비스의 새로운 부가가치를 창출한다. 기능, 품질, 가격 등의 기본적인 경제 가치를 넘어 아름다움, 충족감 등과 같은 감성 가치에 근거해 제품을 선택하고 구매하는 소비 트렌드 현상이 뚜렷하다. 이처럼 감성가치의 중요성이 부각되면서 인간의 문화를 표현하고 있는 다양한 미디어를 분석해 언어별, 세대별, 성별, 지역별 문화를 구성하는 요소와 관계를 발견하는 이른바 ‘컬처마이닝(Culture Mining)’이 중요한 화두로 등장하고 있다.

성결대 문화프레임빅데이터연구소(연구책임자 이준서 글로벌물류학부 교수)는 텍스트와 이미지를 통해 문화요소(Cultural Elements)를 발견하는 연구에 주력해 의미 있는 성과를 도출하고 있다. 연구를 견인한 힘은 인문학과 공학의 융합이다. 

텍스트 기반 CEMS & 이미지 기반 CIFN로 문화요소 발견

성결대 문화프레임빅데이터연구소를 주축으로 진행 중인 융합연구 과제는 ‘문화요소 추출시스템을 활용한 한·중·일 문화이미지프레임 대조연구와 구현’이다. 다국어 텍스트 기반의 문화요소추출시스템(Cultural Element Mining System, CEMS)과 이미지 기반의 문화이미지프레임망(Cultural Image Frame Network, CIFN)을 구축해 언어별, 국가별, 성별, 세대별 문화를 구성하는 특징적인 문화요소를 발견하는 것이 주된 연구목표이다. 

연구진은 우선 문화요소를 찾기 위해 텍스트 기반의 CEMS를 활용했다. 이를 통해 같은 동아시아 문화권에 속한 한국어, 중국어, 일본어의 다양한 텍스트에 내재한 차별화 된 문화요소를 다언어와 다문화 간 비교를 통해 찾는 데 주력하고 있다. 다음으로 연구진은 이미지 기반의 CIFN를 활용해 다국적 인포먼트 그룹의 ‘다수결 투표방식(majority voting)’으로 각국의 특출한 문화요소를 찾아내고 있다. 이러한 텍스트와 이미지 정보를 활용한 컬처마이닝 과정은 객관적인 문화요소 추출을 담보하기 위해 모두 빅데이터를 기반으로 이루어졌다. 

컬처마이닝은 인간의 문화를 표현하고 있는 텍스트, 이미지, 동영상 등 다양한 미디어를 분석해 언어별, 지역별, 성별, 세대별 문화를 구성하는 문화요소와 그들 간의 관계를 발견해나가는 과정이다. 현대 사회에서는 기존의 구어 텍스트와 문어 텍스트, 그리고 SNS, 블로그, 메타버스 등을 통해 생성되는 뉴미디어 텍스트를 비롯해 음성·영상 콘텐츠 등 다양한 형태의 데이터가 기하급수적으로 유통되고 있다. 거의 무한대에 가까운 이러한 텍스트와 콘텐츠를 일일이 고찰하는 것은 사실상 불가능하다. 

연구책임자인 이준서 성결대 교수는 “최근 4차 산업혁명과 관련해 화두가 되고 있는 인공지능(AI), 빅데이터, 사물인터넷(IoT) 등의 기술은 컴퓨터가 인간이 사용하는 자연언어를 얼마나, 어떻게 정확하게 인식할 수 있느냐를 다루는 자연언어처리 연구가 근저에 있다”라며 “인문학과 공학의 융합을 통해 언어 문화권을 뛰어넘는 보다 방대한 자연언어를 통계적으로 연구하고, 컴퓨터그래픽스의 구현을 통해 교육적·실용적 차원에서 다양한 활로를 개척할 수 있는 기틀 마련에 주력했다”라고 밝혔다.   

컬처마이닝 활용해 감성가치 창출 

지난 2019년 한국연구재단 인문사회연구본부의 일반공동연구지원사업에 선정된 이 연구과제는 올해 마지막 3년 차 연구를 진행 중이다. 연구책임자인 성결대 이준서 교수를 비롯해 김혜연 교수(파이데이아칼리지)와 한경수·임상순 교수(컴퓨터공학), 경기대 윤유정 교수(중어중문학), 중앙대 서상현 교수(예술공학 자문위 대표)가 참여하고 있다. 한·중·일 컬처마이닝을 위해 다중언어·다문화, 자연어처리·데이터마이닝, 데이터베이스 구축 및 컴퓨터그래픽스 전문가가 힘을 합쳤다. 그야말로 인문학·공학 융합연구의 전형적인 모델인 셈이다.

이러한 융합 연구를 통해 연구진은 1차년도에서 선행연구를 통해 개발된 한·일 텍스트 문화요소추출시스템(CEMS) 프로토타입을 중국어로 확장했다. CEMS는 한국어, 중국어, 일본어 코퍼스(Corpus, 자연언어 연구를 위해 특정한 목적으로 추출한 언어의 표본 집합)로부터 형태소가 어떤 경향으로 출현하는지 통계적으로 분석한다. 이 통계를 기반으로 언어별 문화요소를 추출하는 방식으로, 기존 데스크톱 애플리케이션에서만 작동하던 시스템을 웹 애플리케이션 형태로 추가 개발했다. 언제나 어디에서나 서버에 접속할 수 있도록 해 연구와 교육 편의성을 크게 높인 것이다.  

이어 2차년도 연구에서는 한·중·일 CEMS의 안정화와 인터페이스 개선 등을 통해 사용자의 편의성을 단계적으로 향상시키는 동시에 ‘비언어 이미지 데이터베이스’를 기반으로 한 문화이미지프레임망(CIFN) 구축에 본격 착수했다. CEMS의 정보는 기존의 특정 코퍼스를 이용해 얻어진 값인 만큼 언어의 동적인 변화를 발견하기 어렵다는 단점이 있다. 이를 극복하기 위한 것이 바로 CIFN이다. 

CIFN은 구글의 검색 엔진에서 제공하는 연관 이미지 검색 서비스에서 얻어내는 이미지를 기반으로 다수결 투표방식의 한·중·일 국가별, 세대별, 성별 문화이미지프레임(CIF)을 선정할 수 있는 플랫폼이다. 한·중·일 CIFN을 통해 해당 단어의 구체적인 의미는 물론 전체 어휘구조에서 해당 단어 간의 연관성과 다른 문화권에서 차별적으로 구현되는 문화 행동의 차이점과 공통점을 구체적으로 확인할 수 있다. 2021년 5월에는 일반인과 학생을 위한 교양도서 『R컬처마이닝』도 출판됐다. 

이준서 교수는 “이번 연구를 통해 각종 텍스트 정보, 이미지 정보, 그리고 이들이 연동된 태킹 정보 등 다양하고 방대한 규모의 빅데이터가 구축되고 있다”라며 “이러한 빅데이터는 자연어처리와 빅데이터 전문가들의 통계적인 처리, 그리고 각 언어 전문가들의 분석과 함께 이번 연구를 통해 독자적으로 구축된 통합 데이터베이스(DB) 서버에 체계적으로 축적되어 언어별, 지역별, 세대별, 성별 문화요소 추출, 즉 컬처마이닝의 기반데이터가 되어 앞으로 다양한 분야에 활용될 수 있을 것”이라고 강조했다.

한편, 연구진은 올해 6월까지 예정된 3차년도 연구를 통해 1차년도와 2차년도 연구에서 구축한 개별 언어의 문화이미지프레임(CIF)과 문화이미지프레임망(CIFN), 여기에 컬처마이닝 DB가 통합된 클라우드컴퓨팅 기반 데이터베이스를 구축할 예정이다. 

특히 3차년도 연구에서 연구진은 다중언어, 다중문화로의 DB 확장과 동시에 메타버스라고 하는 가상세계에서의 컬처마이닝의 연구적·교육적·실용적 발전 가능성을 모색하게 된다.

공동기획팀 editor@kyosu.net
김미혜 한국연구재단 문화융복합단장, 김봉억 교수신문 기자 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.