UPDATED. 2024-04-26 12:55 (금)
“더 나은 과학 위해 더 나은 공동체 필요하다”
“더 나은 과학 위해 더 나은 공동체 필요하다”
  • 전준
  • 승인 2023.05.31 08:32
  • 댓글 0
이 기사를 공유합니다

과학의 과학 ⑦_빅데이터로 본 과학논문

과학이 생활 전반을 지배하는 사회에서 과연 어떤 안목이 필요할까. 과학은 이해하기 힘들고 때론 소통이 힘들 때도 있다. 이에 화학을 공부하고 과학기술정책학을 전공한 전준 충남대 교수가 ‘과학의 과학’을 연재한다. 이연재는 과학기술을 사회학의 렌즈를 통해 바라보며 성찰 하고자 한다. 일곱 번째는 빅데이터로 본 과학논문이다.

전 교수는 같은 공동연구를 해도 남성은 소통의 능력이 있는 걸로, 여성은 무임승차를 한 것으로 간주하는 경향이 있다고 지적했다. 다음 문장에 눈길이 간다. “남성은 공동연구를 많이 수행할수록 종신교수직 획득 확률이 크게 높아졌지만, 여성은 그렇지 않았다.”

과학이 공동체의 산물이라는 메시지만큼은 명확한 것 같다. 빅데이터를 통해 이제 우리는 한 편의 과학논문이 탄생하기까지 얼마나 많은 사회적 요소가 개입되는지 명백하게 알게 됐다.

지구상의 수많은 과학자들은 얼마나 많은 과학 연구를 수행하고 있을까? 빅데이터 연구자들에 따르면 지난 한 세기 동안 인류가 출간한 과학 논문의 수는 9천만 편에 달한다. 이 많은 논문은 도대체 누가 썼을까? 약 5천300만여 명의 연구자들이 개인 혹은 공동 작업을 통해 지난 한 세기 동안 정열적으로 이 많은 논문들을 써 온 것으로 집계된다.

주목할 사실은 이 과학적 성과물이 선형적으로 증가해온 것이 아니라는 점이다. 20세기 중반은 과학연구 생산성에 변곡점이 발생한 시기였다. 이때를 기점으로 직업 과학자들 사이의 협동연구 네트워크가 본격적으로 작동하기 시작했고, 공동연구의 결과 각각의 과학자들이 독립적으로 연구했을 때보다 훨씬 방대한 양의 연구가 수행되기 시작했다.

20세기 초에는 거의 1에 수렴하였던 과학 논문당 평균 저자의 수가 이제는 4.5로 늘어났다. 당연히 각각의 연구자들이 평생에 걸쳐 생산하는 논문의 평균 수도 증가했다. 연구중심대학의 교수는 평생에 걸쳐 200여 편의 과학논문을 쓴다.

20세기 최고의 과학자로 추앙받는 알베르트 아인슈타인은 평생 248편의 논문을 썼고, 피터 힉스는 단 25편의 논문을 썼다. 오늘날의 과학자가 평균적으로 아인슈타인이나 힉스보다 더 파급력 있는 연구를 수행하는 것은 물론 아니다. 그만큼 과학이 공동체의 집단적 산물로 고착화돼 왔다는 뜻이다. 과학자 사회는 그 자체로 사회의 소우주이다. 

빅데이터로 분석한 과학논문에 따르면, 개인저자에서 공동저자로 경향이 바뀌고 있다. 이미지=픽사베이

 

과학 논문 한 편에 공동저자 평균 4.5명

전 세계의 과학적 연구 결과를 일목요연하게 데이 터베이스화하고 그 편수와 인용 횟수, 공동 연구자 네트워크와 연구 결과의 파급력까지도 측정할 수 있게된 것은 비교적 최근의 일이다. 다국적 기업 클라리베 이트와 엘스비어를 비롯한 출판사가 각종 학술논문을 데이터베이스화하고, 학술적 영향력을 정량화 하면서부터 그런 분석이 가능해졌다. 마이크로소프트도 지금은 운영을 중단한 ‘MAG(Microsoft Academic Graph)’라는 서비스를 통해 과학기술 문헌분석 연구를 지원했다.

대학과 연구자를 평가하는 시스템이 정량화된 영향도 크다. 북미의 연구자들은 대개 정량· 정성평가를 골고루 임용-승진-종신교수직 획득에 활용한다. 한국의 경우 정량평가의 비중이 훨씬 높다. 이 모든 평가 지표는 결국 출판사들이 만들어 놓은 시스템을 활용하여 집계된다. 원하든 원치 않은 모든 학문적 성과는 국제적인 연결망의 맥락에서 평가되고 집계되는 시대가 됐다.

더 나은 과학을 위해선 더 나은 공동체 사회가 필수다. 왜냐하면 과학은 그 사회로부터 파생되기 때문이다. 빅데이터에 기반한 서지분석학으로 과학의 과학 연구가 가능해졌다. 분명 한 건 과학논문이 탄생하기 위해 사회적 자본과 제도적 기반, 협력적 네트 워크 등 사회적 요소들이 개입한다는 사실이다. 사진=픽사베이

 

 

서지분석학으로 ‘과학의 과학’ 연구

사회에 대한 새로운 데이터가 등장하면 사회과학 자들은 새로운 연구영역이 개척된 것으로 보고 앞다 투어 뛰어들기 마련이다. 스스로를 ‘과학의 과학’ 연구자라고 부르는 일군의 학자들이 서지분석학적 접 근을 통해 과학에 대해 연구하기 시작한 것은 비교적 최근의 일이다. 이들은 빅데이터를 활용해 과학 기술의 연구가 수행되는 사회적 구조에서 어떤 패턴을 찾을 수 있는지를 상세하게 드러내는 것을 목표로 한다.

과학자들은 어떤 구조로 협동연구를 수행하고, 그 효과는 무엇일까? 높은 파급력을 가진 논문은 지식 생태계에 어떤 변화를 가져올까? 더 많이 인용되 거나 혹은 더 적게 인용되는 과학자 사이의 공통적인 특징이 있을까? 각국의 다양한 과학자는 각자 얼마나 서로 다른 연구 분야에 매진하고 있을까? 과학 자는 나이가 들수록 연구 생산력이 감소할까? 이들의 가장 영향력 있는 걸작은 어느 시점, 어느 상황에서 탄생할까?

이러한 질문은 일견 개인적이고 소소해 보이는 경향이 있다. 그러나 조금 더 자세히 들여다보면, 과학의 과학 연구자들이 세밀한 데이터와 미시적으로 보이는 현상을 통해 큰 패턴을 찾아내고, 이러한 패턴에 기여하는 지식장의 속성과 사회구조에 대해 연구 하고 있다는 점을 간파할 수 있다. 예를 들어, 과학자의 젠더에 대한 연구를 사례로 살펴보면 성별이 개별 과학자의 커리어와 영향력에 광범위한 영향을 주고 있다는 점을 알게 된다.

미국 하버드대의 사슨스 교수 연구팀은 남성과 여성 연구자가 각각 공동연구로 부터 서로 다른 사회적 보상을 받는다는 사실을 발견했다. 미국 대학에서 종신교수직을 수여받는 경제 학자를 대상으로 분석한 결과, 이들이 종신교수직을 획득하기까지 써야 하는 논문의 수는 성별에 상관없이 비슷했다.

흥미로운 사실은 남성은 공동연구를 많이 수행할 수록 종신교수직 획득 확률이 크게 높아졌지만, 여성은 그렇지 않았다는 것이다. 대신 여성은 독자적으로 연구를 수행할수록 남성에 비해 종신교수직에 이르게 될 확률이 크게 높아지는 것으로 나타났다. 이러한 결과가 의미하는 바는 무엇일까? 한가지 설명은 공동 연구에서 여성 연구자는 의존적이거나 무임승차자인 것으로 여겨지는 경향이 있고, 남성 연구자는 소통과 협력 능력까지 겸비한 연구자인 것으로 여겨지는 경향이 있다고 해석할 수 있다.

캐나다 몬트리올대 라비 에르 교수 연구팀이 이미 10년 전 『네이처』에 발표한 연구 결과에 의하면 여성 과학자가 주요 저자인 제1 저자 혹은 교신저자로 참여한 논문은 그것이 단독 저자 논문이든, 국내의 공동연구이든, 국제적인 공동연 구이든 가리지 않고 더 적게 인용되는 경향이 있다.

이들은 2008년에서 2012년까지 출판된 550만 건의 논문과 2천700만 명의 저자를 대상으로 하여 빅데이터 연구를 수행했는데, 이를 통해 과학계에서 공공연히 여성 과학자를 평가절하하는 경향이 있음을 실증 적으로 증명한 것이다.

이 사례에서 알수 있듯이 과학의 과학은 종신교수 직을 얻는데 얼마나 많은 논문 혹은 공동연구를 수행 해야 하는지, 어떤 연구자가 더 많이 인용되는지 등다양한 ‘사소해 보이는’ 경험연구를 통해 학문장의 현상태에 대한 진단과 더불어 이 안에서 여전히 사회구 조와 맞물려 작동하고 있는 불평등에 대해 이해할 수있게 된다. 이러한 연구의 장점은 무엇보다도 실증적 이고 망라적이라는 데 있다. 명확하게 현 상태를 진단해주기 때문에 정책 영역에서의 활용도도 높다. 빅데이터 연구의 가장 큰 강점이다.

 

 

빅데이터 경향성이 곧 인과관계일까

그러나 한계도 있다. 첫째로, 실증적 데이터를 활용해 인과관계를 증명하는 과정이 더욱 엄밀해져야 한 다. 빅데이터를 통해 특정 경향성이 나타난다고 해서 그것이 곧 인과관계를 의미하는 것은 아니기 때문이 다. 이를 보완하기 위해서는 특정 경향성을 보이는 개인과 조직 차원의 동인과 문화에 대한 질적 연구가 병행돼야 한다. 둘째로, 데이터 불평등이 연구의 불평등과 이어지는 경향이 있다. 다시 말해, 이미 체계적으로 잘 정리된 과학기술 서지정보를 보유한 SCI·SSCI 학술지에 대해서는 연구가 가능하지만 아직 이러한 데이터가 수집되지 않은 수많은 국가의 국내 단위 학술지는 빅데이터 연구의 대상으로 편입되지 못하고 있다. 가령 한국의 KCI 저널만 해도 빅데이터 연구의 대상이 되기 매우 어렵다. 오로지 SCI·SSCI를 출판하는 연구자만 글로벌 지식장의 참여자인 것으로 상정 되고 있는 것이다.

이러한 한계에도 불구하고 과학이 공동체의 산물 이라는 메시지는 명확한 것 같다. 지식의 근본은 내용그 자체가 아니라 행위라는 과학기술학(STS)의 오래된 관점이 더욱 힘을 얻고 있다. 빅데이터를 통해 이제 우리는 한 편의 과학 논문이 탄생하기까지 얼마나 많은 사회적 요소가 개입되는지 명백하게 알게 됐다. △사회적 자본 △제도적 기반 △국가 정책 △젠더 관념 △보상 경쟁 △국가 간 불평등 △협력적 네트워크등 그 요소를 모두 헤아리기도 어려울 정도다.

이것의 함의는 무엇일까? 바로 더 나은 과학을 위해서는 우리가 더 나은 공동체, 더 나은 사회를 만들어야 한다는 것이다. 물론 “더 나은” 과학이 무슨 의미인지, 이를 위해 사회를 어느 방향으로 “더 낫게” 만들 것인가에 대해서는 오랜 토론이 필요할 것이다. 그러나 이러한 토론을 시작할 수 있도록 실증적 자료를 제시 하는 것만으로도 빅데이터는 그 몫을 톡톡히 한 것은 아닐까?

 

 

전준
충남대 사회학과 교수
카이스트 화학과를 졸업하고, 같은 대학원에서 과학기술정책학 석사를 했다. 미국 위스콘신-매디슨대에서 사회학 박사학위를 취득했다. 국회미래연 구원에서 부연구위원으로 일했다. 현재 과학기술사회학, 환경사회학, 사회 이론에 대한 연구를 수행하고 있다.

 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.