UPDATED. 2021-04-15 18:14 (목)
데이터 시각화의 고수…'엑셀로 시작하는 데이터과학 실무'
데이터 시각화의 고수…'엑셀로 시작하는 데이터과학 실무'
  • 김재호
  • 승인 2021.03.04 17:30
  • 댓글 0
이 기사를 공유합니다

화제의 책_『엑셀로 시작하는 데이터과학 실무』 하야마 히로시 지음 | 최서희 옮김 | 영진닷컴 | 272쪽

며칠전 사무실에서 엑셀로 통계값을 비교해야 하는 경우가 생겼다. 세 개의 열을 비교해서 있는 것은 빼고, 없는 것은 추가해야 하는 상황이었는데, 이게 만만치 않은 일이었다. 결국, 회사의 모든 직원이 달려들었고, 간신히 원하는 수치를 얻어낼 수 있었다. 만약 『엑셀로 시작하는 데이터과학 실무』가 있었다면 좀 더 수월하게 작업을 했을 것이다. 

최신간 『엑셀로 시작하는 데이터과학 실무』의 부제는 ‘우리 회사 매출을 증대시키는 통계 활용법’이다. 엑셀은 회사를 운영하는 데 근간이 된다. 진짜다. 요즘엔 거의 모든 게 수치로 요약되기 때문이다. 이 책을 쓴 하야마 히로시는 현재 작가로서 소프트웨어의 기본, 프로그래밍, 인지과학, 데이터과학 등 다양한 분야를 집필하고 있다. 또한 그는 로그 인터내셔널 대표이사로서 여러 대학에 강사로 활동 중이다. 

저자 하야마 히로시는 “사고하는 방법만 이해할 수 있다면, 분석이나 예측을 Excel로도 시행할 수 있습니다”라면서 “이 책에서는 계산 방법뿐만 아니라 데이터를 보는 방법과 특징을 파악하는 방법, 분석하고 사고하는 방법, 기술의 적용 상황, 의외의 함정 등을 상세하게 설명합니다”라고 ‘시작하며’에서 밝혔다. 

기술 적용에서 나타나는 의외의 함정

『엑셀로 시작하는 데이터과학 실무』는 자칫 딱딱할 수 있는 엑셀에 대한 설명을 세 명의 회사원들이 등장해 재미 있게 풀어냈다. 그 주인공들은 바로 차바울 주임(입사 3년 차), 최윤정 대리(경영기획실 팀장), 김경민 부장(영업기획부 부장)이다. 더욱이, 이 책에 줄거리를 담아내 읽는 흥미를 북돋운다. 영진제과라는 가상의 회사에서 사내 콘텐스트를 펼친다. 그러면서 데이터 분석과 사용법에 대한 내용이 자연스레 나온다.

이 책은 다음과 같이 구성돼 있다. 제목만 보아도 큰 줄기를 알아차릴 수 있다. △제1장 데이터 분석에는 확실한 규칙이 있다: 분석 목적ㆍ데이터 형식 △제2장 데이터 분석은 시각화부터 시작하자: 도수분포표ㆍ히스토그램 △제3장 라이벌과의 차이는 수치로 나타내자: 평균값ㆍ중앙값ㆍ표준편차ㆍ분산 △제4장 레벨업의 출발점은 자신의 위치를 아는 것부터: 순위ㆍ편차치ㆍABC 분석 △제5장 관계에서 문제 해결의 실마리를 얻다: 상관관계ㆍ회귀분석ㆍ중회귀분석 △제6장 트렌드나 계절 변화로 미래를 예측한다: 시계열 분석 △제7장 수치의 차이가 정말 의미있는지 확인한다: 평균값 차이 검정ㆍ분산 차이 검정 △제8장 예측에 도움이 되는 것은 어떤 요인인가 판별한다: 독립성 검정ㆍ상관 검정ㆍ중회귀분석 검정.

『엑셀로 시작하는 데이터과학 실무』의 제2장은 데이터 시각화이다. 숫자를 갖고 사내에서 보고하기가 쉽지 않다. 그래서 데이터를 시각화 하는 작업은 매우 중요하다. 엑셀 작업의 단계는 조사-데이터 입력-도수분포표-히스토그램이다. 저자는 ‘도수분포표 혹은 히스토그램 활용이 열쇠’라고 강조한다. 책에 따르면, “도수분포표는 도수, 즉 데이터의 개수가 어떻게 퍼져 있는가를 표로 나타낸 것”이다. 실습파일은 영진닷컴 홈페이지에서 다운받도록 해놓아서 즉각 즉각해볼 수 있다. 

도수분포표로 히스토그램 만들기

히스토그램은 도수분포표를 그래프화한 것이다. 히스토그램 만들기는 매우 쉽다. 데이터를 선택한 채로 계급 설정을 변경하는 것이다. 특히 히스토그램의 계급을 변경하면 계급구간 너비와 계급구간 수 등을 조절할 수 있다. 완성된 히스토그램을 보면 매우 흐뭇할 것이다. 

특히 『엑셀로 시작하는 데이터과학 실무』엔 용어집이 포함돼 있다. 예를 들어, ‘허위상관관계’는 “본래의 요인은 숨겨져 있고, 다른 요인과 표면적으로 상관관계가 있는 것처럼 보이는 것”으로 정의된다. 엑셀뿐만 아니라 수학 관련 용어들도 녹아들어가 있어 엑셀의 근본 원리를 이해할 수 있다. 자, 지금부터 엑셀을 공부하기 위해 『엑셀로 시작하는 데이터과학 실무』를 펼쳐보자. 

김재호 기자 kimyital@kyosu.net


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.