UPDATED. 2024-04-25 04:50 (목)
데이터 사이언스와 사회과학적 관점이 만나다
데이터 사이언스와 사회과학적 관점이 만나다
  • 이혜인
  • 승인 2020.03.20 10:58
  • 댓글 0
이 기사를 공유합니다

데이터 시대의 사회과학: 한국 사회 해법 찾기│조화순 엮음│한울엠플러스(주)│232쪽

이 책은 최근 활발히 활용되고 있는 빅데이터 분석, 네트워크 분석, 온라인 실험 등의 방법을 적극적으로 활용하여 우리 사회가 직면한 문제를 과학적으로 풀어내는 디지털 사회과학(digital social science)을 추구해 온 성과들이다. 정치학, 사회학, 언론학, 물리학 등 다양한 학문적 배경을 가진 저자들은 최신의 데이터 분석 방법을 활용하여 사회과학자는 물론 시민들 또한 관심을 가지고 있는 우리 사회의 현실적 문제에 접근하고 이를 분석하여 이 책에 담았다.

최근 활용 가능한 데이터는 기하급수적으로 늘었고, 그러한 데이터를 활용할 수 있는 능력도 강력해졌지만, 데이터를 활용해 어떠한 함의를 이끌어내느냐가 무엇보다 중요하다. 바로 디지털 사회과학이 세상에 편재(遍在)하는 데이터를 통해 우리 사회에 유용한 정보와 흥미로운 관점을 제공해 줄 수 있다. 이 책을 통해 독자들이 갖고 있는 빅데이터에 대한 관심이 디지털 사회과학에 대한 관심으로 발전하기를 희망한다.

어떤 현상의 발생 원인을 논리적이고 체계적으로 설명하기 위해 사회과학자들은 사회과학이론을 활용한다. 빅데이터 분석이 활발해지면서 한때는 ‘이론의 종말’을 이야기하는 사람들도 있었지만, 단지 데이터를 분석하는 것만으로는 어떤 데이터를 수집해야 하고 그 결과를 어떻게 해석해야 할지 알기 어렵다. 세상에 아무리 많은 데이터가 존재한다고 하더라도, 문제의 설정과 분석 결과의 해석 과정에서 여전히 사회과학적 관점은 필수적이다. ‘무엇을 관찰해야 할지 결정해 주는 것은 바로 이론’이라는 알버트 아인슈타인(Albert Einstein)의 말이 여전히 유효한 것이다. 주로 데이터를 수집하고 전달하는 역할에 전념하는 데이터 엔지니어(data engineer)나 분석과 설명에 초점을 맞추는 데이터 분석가(data analyst)와는 달리 ‘데이터 과학자(data scientist)’는 바로 우리가 풀어야 할 문제를 제대로 선정하고, 데이터의 분석 결과에 논리적이고 실천적인 해석을 더하여 사회의 문제를 풀어낼 수 있다는 점에서 차이가 있다.

한층 더 형태가 다양해진 데이터, 발전된 데이터 분석 기술과 사회과학이 만난 디지털 사회과학이 기존의 전통적인 연구 방법으로는 충분히 규명하기 어려웠던 문제들을 파헤쳐나가는 모습을 이 책에서 확인할 수 있을 것이다. 데이터를 중심으로 사회문제를 진단하고 해결하는 사회과학적 접근 방식의 발전에 도움이 되고자 한다.

제1장 ‘데이터로 뉴스 댓글과 여론 읽기’는 한국인의 뉴스 소비 생활에서 큰 비중을 차지하는 뉴스 댓글에 대한 분석이다. 거의 모든 뉴스가 포털 사이트를 통해 유통되고 포털 사이트의 뉴스 서비스가 기사에 댓글 서비스를 제공하는 한국의 미디어 환경에서 댓글은 여론 형성에 지대한 영향을 미치고 있다. 실험 결과에 따르면 댓글은 뉴스를 읽는 사람들이 뉴스 내용의 이념적 방향성을 추정하는 사회적 단서로 작용하여 보도의 내용을 적대적으로 인식하게 만든다. 저자들은 뉴스 댓글이 가진 문제점을 해결하기 위해서 중립적인 뉴스 편집 알고리즘과 포털 사이트의 뉴스 서비스 방식 개선, 포털 사이트 뉴스 댓글에 관련된 정책의 보완이 필요하다고 주장한다.

제2장 ‘메갈리아의 두 딸들: 연대에서 분열로’는 한국의 온라인 페미니즘이 발흥했던 공간인 메갈리아라는 커뮤니티에 나타난 담론에 주목했다. 메갈리아가 개설된 날부터 사실상 활동이 중단된 시기까지 사이트 내에 게시된 16만 2000건의 모든 게시물을 분석 대상으로 했다. 메갈리아 내부의 담론을 살펴보기 위해 문서를 특정한 개수의 주제로 나누어주는 기계학습 알고리즘인 구조적 토픽 모형(Structural Topic Model)과, 문장을 구성하는 단어들의 위치를 신경망 구조를 통해 예측하고 각 단어 사이의 관계를 수치화하여 계산하는 워드투벡터(Word2Vec) 기법을 활용했다.

제3장 ‘소셜미디어의 왜곡된 세상과 그 해결법’은 소셜미디어, 인터넷, 빅데이터 등 현대 정보 환경의 중요한 요소들이 인간의 확증편향과 인지부조화 성향을 극복하는 데 도움을 주기보다는 사람들 사이의 소통을 더 편협하게 만들 수 있다고 주장한다. 인간의 인지적 한계는 기술로 보정되기 어렵고, 오히려 기술에 의해 더 커진다는 것이다. 주변 사람의 의견이 나와 같은 의견을 갖고 있다면 내가 옳기 때문에 그렇다고 쉽게 믿어버리기보다는 내가 나와 같은 생각을 가진 사람들에게 둘러싸여 있을 가능성이 있다는 생각해야 하며, 이견을 경청하고 이견을 가진 사람들을 존중하는 태도가 필요하다고 주장한다.

제4장 ‘역겨운 북한사람들?: 한국인의 북한에 대한 감정적 대응’에서는 정치심리학적 관점에서 ‘역겨움(disgust)’이라는 감정의 민감성이 타자에 대한 감정적 대응에 어떤 영향을 미치는지 살펴보았다. 역겨움에 대한 민감성이 높은 사람은 성소수자나 다른 문화권에 속하는 사람과의 접촉을 회피하려는 성향을 나타내며, 사회문화적 현안에 대해 보수적인 성향을 가진다. 이러한 맥락에서 한국에서 북한 사람에 대한 태도도 역겨움에 대한 민감성에 의해 결정될 수 있다. 북한과의 협력 내지는 북한에 대한 원조를 홍보하려 할 때, 북한에 대한 연민을 자극하는 이미지나 메시지가 역겨움을 더 잘 느끼는 사람들에게 역효과를 가져올 수 있다고 주장한다.

제5장 ‘뉴스 미디어에 재현된 정당: 지역 언론의 이슈와 인물’에서는 지역 언론에 나타난 정치 이슈와 정치인들을 살펴보았다. 정치와 언론의 관계를 이야기할 때 한국에서는 대부분 전국적 매체에 주목해 왔다. 그렇다면 지방에서는 어떠한가? 한국언론진흥재단의 빅카인즈(BigKinds) 뉴스 데이터베이스를 분석하여 19대, 20대 국회 시기에 지역 언론에서 나타나는 정당 관련 뉴스의 주제와 지역 정치 인물의 동태성을 살펴봤다. 지역 언론도 당 대표 등 전국적 지명도를 가진 정치인을 중점적으로 다루고 있었으며 충청·경인·영남 지역 언론에서 주로 다루어지는 인물이 지역 간 큰 차이가 없었다. 즉, 지역 언론에서도 중앙 정치가 반복되고 있었다.

제6장 ‘교통 빅데이터로 본 시간과 공간의 사회적 구성’은 대중교통 데이터를 통해 서울의 실질적인 생활권과 직장인의 이동 패턴 등을 분석했고, 내비게이션 목적지 데이터를 분석하여 국민이 명절을 어떻게 보내고 있는지 살펴보았다. 저자들의 분석은 행정구역에 의한 구분이나 단순한 물리적 거리에 의한 구분이 아닌 사람들이 실제로 왕래하는 지역을 기준으로 실질적인 생활권을 보여준다는 데 의미가 있다. 또한 이동 빅데이터 분석이 사람들의 실제 생활에 대해 흥미로운 사실을 알려줄 뿐만 아니라 정책적으로도 유용하게 쓰일 수 있다는 사실을 잘 보여준다.

제7장 ‘청와대 국민청원은 무엇을 놓쳤나?’는 문재인 정부에서 시작된 청와대 국민청원에 어떤 주제의 글이 올라오는지, 어떤 주제가 응답받을 확률이 높은지를 분석했다. 저자들은 2017년 8월부터 2018년 9월까지 약 1년 1개월간 청와대 국민청원에 게시된 모든 청원문서를 수집해 구조적 토픽 모형을 활용하여 분석했다. 저자들은 현행 20만 회 기준으로 운영되는 청와대 국민청원은 자칫 국민의 분노만이 주목받는 공간으로 전락할 수 있으며, 청와대 국민청원을 통해 시민을 정책 결정 과정에 참여시키려는 본래의 취지를 살리기 위해서는 응답 기준이 하향될 필요가 있다고 주장한다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.