UPDATED. 2024-04-26 09:20 (금)
신어2020: 코로나 팬데믹 시대의 새로운 언어
신어2020: 코로나 팬데믹 시대의 새로운 언어
  • 김재호
  • 승인 2021.06.24 14:51
  • 댓글 0
이 기사를 공유합니다

남길임 외 8인 지음 | 한국문화사 | 240쪽

코로나 격동기, 한국 사회에는 어떤 말들이 새롭게 만들어지고 사용되었을까?

이 책은 대구에 코로나가 한창이던 작년 3월, 경북대학교 언어정보연구센터 연구진들과 코로나 신어 연구를 위해 코로나 관련 언어 자원을 어떻게 모을지를 논의하던 중에 우연히 기획되었다. 초기 코로나 신어를 수집하기 위해 웹 크롤링이 필요하다는 것, 일정 시기가 지나고 나면 웹 자원은 사라지고 교체되므로, ‘사회적 거리 두기’와 ‘공적 마스크’, ‘살천지’, ‘확찐자’가 나타나기 시작하던 당대의 언어 자원을 즉시 어딘가에 모아둘 필요가 있다는 것이 『신어 2020』 기획의 첫 시작이었다. 다 아는 사실이지만, 네이버나 다음, 구글 등 포털의 언어 정보는 늘 사라졌다 나타나고 역동적으로 움직이고 단 한 시간도 같은 모습을 유지하지 않는다. 먼 훗날 아니 단 며칠 몇 달만 지나도 우리는 코로나 격동기의 언어, ‘2020년 신어’를 제대로 재구해 낼 수 없을지도 모른다는 우려가 2020 신어 수집과 이 저서의 동기가 되었다.

유사한 시기에 영미권, 유럽어권, 중국어 등에서 수행되고 있는 언어권별 코로나 신어 조사 사업을 접하게 된 것도 이 프로젝트의 시작과 깊은 관련이 있다. 독일 IDS(Leibniz-Institut f?r Deutsche Sprache, 이하 IDS)에서는 이미 500여 개 이상의 코로나-19 관련 신어를 수집하고 용례와 뜻풀이를 제공하고 있었고(현 시점에는 무려 1,350여 개로 확인된다!), 영국 옥스퍼드 사전에서도 이미 사전 업데이트를 위해 코로나-19 관련 신어와 관련 주제의 말뭉치 분석을 블로그에 제시하고 있었다. 또 미국의 BYU 말뭉치(English Corpora.org)에서는 전 세계 웹 뉴스를 대상으로 코로나 바이러스 말뭉치(Coronavirus Corpus)를 구축하고 있었는데, 이러한 연구들은 비단 코로나-19뿐만 아니라 매년 나타나는 신어와 사회문화적 주요 이슈와 관련한 언어 자원들을 지속적으로 모으고 있다는 공통점을 가지고 있었다. 우리는 유동적인 웹 언어를 시기별로 수집하고 당대 신어를 충실하게 수집함으로써, 언어를 통해 드러난 인류 역사의 기록으로 사회·문화·경제적 영향을 분석할 수 있다.

『신어 2020』의 특성은 다음과 같은 몇 가지 특성으로 요약된다. 첫째, 『신어 2020』은 신어의 수집과 기술에서 1994년부터 2019년까지 지속되어 온 국립국어원 신어 조사 사업의 신어의 수집 기준과 원칙을 되도록 그대로 유지하고자 하였다. 즉 2012년도부터 신어 조사 사업에 도입된 웹 크롤링 말뭉치의 활용, 대중 매체 출현 기준, 사전 형식의 기술 등이 모두 이전 신어 조사 사업의 방법론을 활용한 것이다. 그간 신어 조사 사업의 결과물은 한국어 신어 연구의 주요 자원으로서 많은 연구자들에게 활용되어 왔는데, 이러한 연구의 연장선상에서 『신어 2020』이 이전 신어 조사 사업의 결과물과 함께 연구될 수 있도록 연구자의 편의를 고려하였다. 단 이 책에는 국립국어원 ‘우리말샘’의 신어 추출기를 활용하지 않은 이유로 발생한, 기존 신어 조사 사업과의 몇 가지 차이점이 있는데, 이는 별도의 지면을 할애하여 그 이유와 의의를 설명하였다.

둘째, 늘 신어는 트렌디하고 새롭지만 특히 올해 신어 목록에서 드러난 코로나 신어의 비중과 경향성은 별도로 언급될 필요가 있다. 전체 405개 중 코로나 신어가 차지하는 비중은 약 230개로 전체의 50% 이상을 차지하며, 이를 제외한 나머지 신어들 역시 코로나 시국과 어느 정도는 관련이 있다고 보아야 할 것이다. 이를 고려하여 『신어 2020』에서는 이번 조사의 핵심어인 ‘코로나19’, 핵심 경향인 ‘코로나19 신어’를 별도로 분류하여 분석하고 색인 역시 ‘코로나19 신어 색인’으로 별도로 제시하였다. 마지막으로 『신어 2020』의 특성은 신어 수집의 포괄성이다. 2019년 신어 조사 사업에서 비교적 엄격한 기준으로 관리되어 왔던 빈도나 고유 명사 포함 여부의 기준을 이번 조사에서는 다소 느슨하게 적용하였다. 예를 들어 일부 고유 명사를 포함하고 있더라도 “유튜버셀러”, “아베노마스크”, “케이방역” 등 당대의 문화적 특성이나 가치를 반영하는 것은 비속어로 쓰이거나 집단 비하의 의미가 없는 한, 올해의 신어 목록에 포함하였다. 이를 통해 연구진의 가치 판단을 최대한 배제한 2020년 신어 목록을 확보하고자 하였다.

『신어 2020』은 일차적으로 그간 주로 조어론, 의미론적 관점에서 신어 연구를 수행해 온 국어학자를 예상 독자로 기획되었지만, 언어를 통해 사회·문화 현상을 연구하고자 하는 연구자나 코로나 시국의 언어를 살펴보고자 하는 대중에게도 유용한 정보를 제공할 것이다. 특히 최근 세계 사전학회에서는 ‘신어와 사전’, ‘코로나 신어’ 등이 주요 기획 주제로 논의되고 있는데, 『신어 2020』의 결과물은 범언어적 맥락에서의 한국어 신어 연구, 코로나 신어의 비교 연구 등에도 주요한 자원으로 활용될 것이다. 본서에서 미처 다루지는 못했지만 말뭉치 혁명과 관련하여 웹상에서 수시로 출현하는 대량의 신어의 수집과 기술 방향에 대한 고민은 차후의 연구 주제로 논의될 필요가 있다. 사전에서의 신어 수용과 관련해서, 2019년 세계사전학회(Globalex)의 기획 주제가 “사전학과 신어”로 논의된 이후 2020년 유럽 사전학회(Euralex), 2021년 오스트레일리아 사전학회(Ausatalex) 등에서도 “코로나 신어(Corona neologisms)” 등이 주요 기획 주제로 준비 중에 있다. 기계번역이나 감성분석 등 자연언어처리에서의 사전의 역할에 대한 관심에 따라 사전의 외연을 인간을 위한 사전이 아닌 기계를 위한 사전으로 확장할 경우, ‘신어’의 개념은 더욱 넓어지며 이에 대한 연구도 필요하다. 언어학적 응용언어학적 활용도를 고려할 때 향후에도 당대의 신어의 수집과 연구는 장기적인 안목을 가지고 논의될 필요가 있다.

『신어 2020』은 경북대학교 언어정보연구센터 신어 연구 조사팀 연구진들의 수고를 통해 완성되었다. 올해는 특별히 코로나-19의 여파로 대면 회의가 어려웠고, 국립국어원의 신어 조사 용역 사업이 없었던 상황에서, 연구진들은 당대 언어 자원 축적에 대한 책임감과 연구에 대한 열정으로 손이 많이 가는 작업에 기꺼이 참여했다. 고도의 언어 처리 기술에도 불구하고, 세계적으로 신어의 수집과 기술은 여전히 인간의 판단과 수집을 필요로 한다. 연구진들의 고된 작업 끝에 『신어 2020』이 빛을 보게 되었다. 연구 일정과 연구실의 크고 작은 프로젝트에도 불구하고, 별도의 시간을 쪼개어 신어 조사 작업에 참여한 연구진들의 학문적 열정과 노고에 깊은 감사의 뜻을 전한다. 

김재호 기자 kimyital@kyosu.net


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.