UPDATED. 2020-11-26 11:16 (목)
딥러닝과 기후 변화의 융합 연구, 판은 깔렸다
딥러닝과 기후 변화의 융합 연구, 판은 깔렸다
  • 교수신문
  • 승인 2020.11.06 14:58
  • 댓글 0
이 기사를 공유합니다

기후변화와 인공지능_④ 날씨 및 기후예측의 AI 기법 적용 -2) (끝)

범주 간 차이 만드는 데이터에 집중
혹은 가상의 기후 데이터 생성
지구 온난화 증폭 시기 예측 기대

 

기후 예측을 위한 딥러닝 모형을 학습 시키기에 현재까지 확보된 관측 자료의 수는 턱없이 부족하다. 최근 인공 위성을 이용한 전지구 기압 패턴, 해수면 온도, 해수면 높이, 구름, 식생 및 곡물 생산량등 다양한 지구 시스템 요소들의 관측 결과들이 누적되고 있는 것을 생각해보면 자료의 수가 부족하는 것이 언뜻 이해가 되지 않을 수 있지만, 같은 시점에 관측된 지구 시스템 요소들은 서로 연관되어 있기 때문에 독립적이라고 보기 어렵다. 

 

지구 온난화에 딥러닝이 적용될 수 있을까?
함유근 교수는 변화 시점 탐지 기법으로 가능할 수 있다고 내다봤다. 사진 = 픽사베이

 

 

어떤 자료 군집내의 변수들끼리의 상관도가 높을수록 그 군집의 자유도는 낮아지게 되는데, 이 경우 데이터의 양이 방대 하더라도 같은 데이터를 여러번 넣어주는 셈이 되어 실제로는 몇몇 핵심 요소만을 넣어 학습하는 것과 결과적으로는 같다. 독립적인 관측 데이터의 수를 늘리기 위해서는 오랜 기간 관측을 해야만 하는데, 이미 지나가 버린 과거의 지구를 다시 관측할 수도, 미래의 지구 요소들을 미리 관측할 수도 없기 때문에, 관측 데이터 수의 부족은 근본적으로 해결하기 어렵다. 

 

관측 자료 부족 문제를 보완하기 위한 가장 효과적인 대안 중 하나는 전지구 기후 모형의 장기간 모의 시뮬레이션 자료의 활용하는 것이다. 원시 방정식으로 일컬어지는 비선형 미분 방정식에 다양한 모수화 기법이 더해져 프로그래밍된 가상의 지구는 아직까지 실제 지구와 큰 오차가 있지만, 그럼에도 불구하고 전지구 기후 모형이 어느 정도 현실적으로 모의하고 있는 요소들에 대해서는 딥러닝 모형의 학습을 위한 자료로 활용이 가능하다. 

 

예를 들어, 대표적인 기후 현상인 엘니뇨 현상의 모의 성능은 지속적으로 개선되어, 현세대의 전지구 기후 모형들은 강도, 주기, 전지구적 영향등 엘니뇨의 다양한 특징들을 꽤 현실적으로 모의되고 있다. 이는 엘니뇨 예측을 위한 딥러닝 모형 구축에 전지구 기후 모형의 가상 시뮬레이션 결과를 활용할 수 있음을 의미한다. 즉, 전지구 기후 모형 결과를 추가적인 학습 샘플로 활용하여 딥러닝 모형을 구축할 경우, 실제 관측만을 활용하여 구축한 딥러닝 모형에 비해 예측 성능은 유의미하게 상승한다. 

 

독립적 관측 데이터 위한 장기 관측

 

그렇다면, 전지구 기후 모형이 아직까지 현실적으로 모의하지 못하는 기후 현상 예측에 대해 가상 시뮬레이션 자료를 사용하는 것은 어떨까? 쓰던 쓰지 않던 비슷한 수준의 결과를 내거나, 혹은 차라리 안 쓰는 게 나은 결과가 도출될 수도 있다. 

 

예를 들어, 발생 역학이 다양하고 복잡해서 아직까지 대부분의 전지구 기후 모형이 그 메커니즘을 제대로 모의하지 못하고 있지 못한 한반도 여름철 강수량을 보자. 여름철 한반도 강수를 유도할 수 있는 메커니즘은 장마 전선의 발달, 엘니뇨를 비롯한 열대 지역 요란으로 인한 북서태평양 고기압의 확장, 북대서양 및 유라시아 지역으로부터의 원격 상관(지리적으로 떨어진 지역간에 나타나는 상관), 지구 온난화 등으로 매우 다양한데, 현세대 전지구 기후 모형 중 이를 모두 현실적으로 모의하는 모형은 존재하지 않는다. 그렇기 때문에 전지구 기후 모형 학습 샘플을 이용해 딥러닝 모형을 학습 시킨 후 관측된 한반도 강수량을 맞추라고 하는 것은, 조금 과장을 하자면 고등학교까지 국어 공부만 죽어라 하던 학생한테 수학 문제를 풀라고 하는 것과 비슷하다. 불행히도 대부분의 인구가 모여 살고 있는 북반구 대부분의 중위도 지역이 비슷한 상황이라고 볼 수 있다. 

 

그렇다면 방법은 없는 것일까? 아니다. 몇 가지 시도해 볼만한 딥러닝 기법들이 존재한다. 퓨샷 러닝(few shot learning) 의 개념을 활용하면 적은 수의 관측만으로도 딥러닝 모형을 학습 시킬 수 있다. 퓨샷 러닝은 적은 수의 학습 샘플만 사용하여 딥러닝 모형을 학습시킬 수 있는 기법인데, 몇 개의 범주를 구별하는 카테고리 예측에 주로 활용한다. 기존의 딥러닝 기법이 각 범주와 입력 자료가 관련된 정도를 정량화하여 가중치를 결정한다면, 퓨샷 러닝 기법은 범주 간의 차이를 유발하는 입력 자료의 특징을 찾는데 집중한다. 

 

유사성이 아니라 차이에 집중

 

비유를 하자면, 5개의 선택지가 있는 객관식 수학 문제를 푼다고 할 때, 기존의 딥러닝은 정확한 답을 구하기 위해 문제를 푼 후  이에 해당하는  보기를 찾는다면, 퓨샷 러닝은 답을 정확히는 모르고 5개 보기 중에 가장 답에 가까운 게 무엇인지를 찾는 거라고 보면 된다. 입력 자료에서 주어지는 모든 정보와 산출물 사이의 관련성을 찾지 않고, 범주 간의 차이를 만드는 입력 자료 일부에만 집중하기 때문에 상대적으로 적은 수의 학습 샘플로 학습이 가능하다. 

 

다른 방법은 딥러닝을 활용하여 샘플 수를 늘리는 방법이다. 적대적 생성 신경망(Generative Adversarial Network, GAN)이 많이 활용되는데, 학습된 데이터와 같은 특징을 갖는 데이터를 생성할 수 있다. 예를 들어, 성인 남자의 얼굴 사진을 이용하여 적대적 생성 신경망을 학습 시키면, 가상의 성인 남자의 얼굴을 만들어 낼 수 있다. 이를 기후 데이터에 적용하면 가상의 기후 데이터를 생성할 수 있을 것으로 기대하고 있다. 다만, 전지구 기후 모형이 만들어내는 기후 데이터와 비교하여 더 현실적일지의 여부는 검증이 필요하다. 

 

그렇다면 지구 온난화 현상에도 딥러닝 기법이 적용될 수 있을까? 지구 온도 상승 속도뿐만 아니라, 지구 온난화로 인한 강수 특성, 탄소 순환, 폭염 및 한파 발생 빈도 변화 등을 예측하는 데 딥러닝이 활용될 수 있을까? 개인적인 소견으로는 충분히 가능하다. 합성곱 신경망을 활용해 기후 변화로 인해 나타나는 대기 표층 온도 및 강수 특성을 이해하고자 하는 연구가 진행되고 있으며, 변화 시점 탐지 기법을 활용하면 지구 온난화가 증폭되는 시기를 예측할 수 있을 것으로 기대한다. 아쉽게도 아직은 아이디어 수준에 불구하지만, 이제는 하나의 패러다임으로 자리잡은 인공 지능 기법을 바탕으로 기후 연구에도 향후 몇 년 안에 눈부신 발전이 있기를 기대해 본다. 

 

 

 

함유근 전남대 교수·해양학과

서울대에서 대기과학으로 박사학위를 받았다. 그는 현재 인공지능을 이용한 기후예측 기법을 개발하고 있다. 함 교수는 2020년도 차세대 한국과학기술한림원 신입 회원으로 선출됐다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.