UPDATED. 2024-03-29 07:40 (금)
1972년 초등교육 절대평가 시행 … 결과 보도한 記事 놓고 정부와 신경전 벌이기도
1972년 초등교육 절대평가 시행 … 결과 보도한 記事 놓고 정부와 신경전 벌이기도
  • 이성진 서울대 명예교수·대한민국학술원 회원
  • 승인 2016.05.31 13:53
  • 댓글 0
이 기사를 공유합니다

이성진, 한국행동과학연구소 40년을 말하다_ 7. 연구의 낙수(5)

 

 

한국의 초등교육은 국민생활에 필요한 최소한의 지식·기능·태도 등의 자질을 배양하는 기초교육으로 정의된다. 이렇게 약속한 한국초등교육은 그 목적을 충실히 달성하고 있는가? 방대한 국가예산을 들여 의무교육으로 시행하고 있는 초등교육의 성과에 관심을 갖는 것은 당연하다. 이 질문에 대해 단순한 추측으로가 아니라 객관적 근거로 답을 얻기 위해 한국행동과학연구소(KIRBS)는 1972년 구체적 작업에 나섰다. 연구 결과는 한마디로 실망스러웠다.

교육성과 평가는 과거에 여러 형태로 실시해 왔다. 하지만 대부분 개인·학교·지역 간의 교육성과를 비교하기 위한 상대평가였다. 상대평가는 나름의 역할과 가치가 있지만 국가수준의 평가는 아니다.
우리는 연구에 착수하면서 우선 종래의 상대평가가 우리의 목적을 달성하는 데는 적합하지 않다는 점에 주목하면서 부적합성을 분명히 했다.
종래의 학력평가는 학생들의 학업성취도 개인차를 판별하기 위해 그들의 평균점수를 계산해 학생들 사이의 우열을 비교하는 상대평가였다. 따라서 학교가 달성해야 할 교육목표를 얼마나 성공적으로 달성하고 있는지를 판단하는 데는 한계가 있었다.
둘째, 상대평가로 얻은 결과는 특정 학교나 특정 지역의 학력을 독립적으로 설명하고 비교하게 해줄 뿐이다. 학력을 전국적으로 설명하고 판단할 수 있는 자료라고 할 수 없다.
셋째, 종전의 학력검사 양식이 대개 객관식 4지선다형이어서 검사결과에 추측요인이 작용했을 개연성이 높다는 문제가 있다.

넷째, 검사방법이 대부분 집단검사여서 어떤 특수한 문항의 경우, 질문 의도를 정확하게 모르거나 독서력이 부족한 학생은 자신의 능력을 충분히 발휘하지 못할 수 있다.
다섯째, 지필검사는 발표력이나 그 밖의 동작성 실행능력 등의 평가가 불가능하다.
우리는 한국의 초등학교가 교육의 원래 목적을 얼마나 충실히 달성하고 있느냐를 국가수준에서 따져보려고 했다. 국가수준의 교육 질을 총체적으로 따져 敎育勢를 조사해 우리나라 敎育力을 가늠해보고자 한 것이다.
우리가 채택한 평가방법은 상대평가와는 다른, 당시 새롭게 대두된 절대기준평가(또는 절대평가)라는 것이었다. 절대평가는 학생들이 꼭 알아야 할 필수 지식과 기능을 얼마나 알고 있느냐, 즉 설정된 교육목표를 얼마나 달성했느냐하는 교육목표 달성도 평가가 주된 관심사다. 학생들의 학습성취도를 평가하면서 교육의 아픈 데를 진찰하고 그것을 치유하는 진단을 내리는데 도움이 되는 평가이기도 한다. 이 평가 결과는 국가의 교육계획 수립, 교육과정 개선점 발견과 장학지도에도 크게 도움이 된다.

KIRBS가 이 연구를 진행할 때 채택한 절대평가방법의 특징은 다음 네 가지로 정리할 수 있다.
첫째, 필수 교육목적의 결정·선정을 엄정하게 했다. 우리는 다음 4단계를 거쳐 교육목적을 선정했다. 먼저, 문교부 교육과정에 비춰 타당하고 핵심적인 목표를 평가문항의 구체적 기준이 될 수 있도록 세분화한 뒤 문교부 편수관에게 검토를 맡겼다. 그 다음, 세분화된 목표가 교과내용 체계의 관점에서 후속학습을 위해 필수적인가를 교과전문가인 대학교수들에게 판정토록 했다. 또한 이렇게 세분화된 교육목표가 학교에서 실제로 달성하려고 노력하는 것인가를 초등학교 교사로 하여금 판단하도록 했다. 끝으로, 정리된 교육목표가 사회생활에 실제로 필요한가를 일반 사회인에게 검토할 수 있게 했다.
‘문교부 → 대학 교수 → 초등학교 교사 → 일반인’ 순으로 의견을 종합하는 까다로운 절차에 따라 정갈한 문항이 만들어질 수 있도록 한 것이었다. 이 작업에서 특별한 것은 마지막 단계에서 일반인의 의견을 물었다는 점이다. 이 절차는 그때까지 아무도 시도하지 않았던 우리 연구만의 특징이라고 할 수 있다.

이렇게 해서 우리는 정리된 교육목표를 준칙으로 하여 검사문항을 작성할 수 있었다. 그렇게 만든 문항들 가운데 우리 연구의 특징을 보여주는 교육목표 몇 가지를 예시하면 다음과 같다. ‘사전에서 주어진 내용에 맞는 어휘를 찾을 수 있다’(국어), ‘물건을 사고 우수리를 정확하게 받을 수 있다’(산수),  ‘어떤 영양소가 많이 들어있는 식품을 알 수 있다’(자연) 등이었다.
아무리 시대가 변해도 불변의 교육목표는 있고 꼭 가르쳐야 하는 지식이 있다. 위에 든 교육목표들은 초등학교를 졸업한 사람이라면 ‘적어도’ 이 정도의 ‘상식적인’ 지식은 가지고 있어야 하는 것들과 관계있다.
우리가 채택한 절대평가 절차의 두 번째 특징은 피험자(학생)의 선정방법에서도 찾을 수 있다. 우리나라 초등학교 6학년을 대표하는 학생들을 표집해야 하므로, 母집단은 전국 초등학교 6학년 남·여 학생이다. 표집과정은 4단계 절차를 밟았다. 즉 지역, 학교, 학급, 학생 순으로 표집단계를 좁혀 나가면서 최종 표집을 확보했다.

제1 단계 계층적 군집표집을 통한 지역표집을 거쳐, 제2·3 단계에서는 군집표집을 통한 학교·학급표집에 이르렀고, 마지막 제4 단계에서는 단순무선표집 방법으로 학생표집을 마무리했다. 이렇게 4단계의 표집절차를 밟은 것은 전국적 확률해석을 가능하게 하기 위해서였다.
이 연구의 세 번째 특징은 실제 검사 실시 전략에 있다. 종전의 객관식 4지선다형 지필검사와는 달리 피험자를 10~20명 정도의 소집단 형식으로 유지했고, 검사자가 검사문항과 답지를 일일이 읽어주고 답을 하게 했으며, 각 문항에 충분한 시간을 줬다. 검사 과정에서 발생할지도 모르는 오류를 줄이기 위해 KIRBS는 교육대학 2학년생을 통일된 실시요강으로 철저히 훈련한 뒤 검사요원으로 투입했다.
검사 실시와는 다른 종류의 문제인데, 절대평가를 실시할 때 유념해야 할 것이 있다. 학생들이 시험에서 얻은 점수의 의미에 관한 이슈로서 학력평가에서 사용하는 점수를 어떻게 해석할 것인가의 문제다. 흔히 검사에 동원된 여러 문항에 대한 정답을 합해 전체 점수(총점)로 학생의 학습성취도를 매긴다. 그런데 이 방식은 총점이 실제로 무엇을 의미하는지 불분명하고 막연하다는 문제를 안고 있다. 그래서 우리가 시도한 절대평가에서는 각 목표를 측정하는 문항을 전국의 몇 퍼센트 학생이 맞췄나 하는 것을 제시함으로써 누구나 그 문항에서 얻은 점수의 의미를 분명하고 쉽게 이해할 수 있도록 했다.

최대한 타당하다고 생각되는 절차에 따라 엄밀하고 조심스럽게 실시한 절대기준평가였지만, 학생들의 기준 도달률은 실망스러웠다. 4개 과목의 평가결과는 한국 초등학교 졸업생에 대한 기대 목표 수준에 크게 미달했다. 전국 평균도달률은 국어 50.1%, 산수 40.8%, 사회 45.7%, 자연 38.6%로 나타났다. 또한 지역차·남녀차도 컸다. 도시 지역 학생과 남학생의 도달률이 높았다.  
한국에서 처음 시도한 전국 초등학교 교육의 절대기준평가 연구는 이렇게 끝났다. 연구는 끝났지만 후폭풍이 우리를 기다리고 있었다. 당시 문교부는 우리 연구소가 이 연구를 진행한다는 것을 알고 있었다. 실망스러운 결과였던지 문교부는 연구 결과의 세부적 내용을 발표하기 꺼려했다. 사정이 이렇다보니 연구 결과를 발표할 방법이 없었다. 그러던 중 일이 벌어졌다.
연구보고서 인쇄가 완료될 무렵이었다. <동아일보>의 한 기자가 어떻게 우리 연구를 눈치 채고 연구소에 찾아와서 인쇄 중에 있는 보고서 열람을 요청했다. 당시 연구실무책임자였던 권균 연구원(현 한림대 명예교수)이 동료 연구원들과 의논해 기자와 토론도 하면서 관련 자료를 신문사에 완전히 노출시켰다.

며칠 후 <동아일보> 1면에 “한국행동과학연구소 연구에 의하면~”하고 출처를 밝힌 기사가 대서특필됐다. 기사는 한국 초등교육에 엄청난 문제가 있다는 식의 비판이 주를 이뤘다. 기사는 일주일 동안 계속해서 연속기사 형태로 자세히, 그리고 크게 보도됐다. 끝에 가서는 관련 관심 인사들을 불러 ‘종합토론’까지 개최해 지면에 소개했다. 그때 그 기사를 보도했던 <동아일보>의 기자는 우 아무개였던 것으로 나는 기억한다. 그는 우리 연구소의 연구 결과를 ‘특종감’으로 생각했던 것이다.
연구 결과에 대한 신문기사는 보는 관점에 따라서는 교육당국과 한국 공교육에 대한 비판이고, 문교부를 질책하는 것으로 비쳐질 수 있었다. 아니다 다를까 문교부가 시끄러워졌다. 권 연구원은 당시 부소장이었던 나와 상의하면서 업무를 처리하고 있었는데, 연구보고서가 공개될 당시 마침 나는 외국 출장 중이어서 우리 둘이 어떤 상의를 할 수 있는 상황은 아니었다. 훗날 권 연구원은 자신이 “독단적으로 일을 저질렀다”라고 고백했다.

연구 결과가 예상 밖의 경로로 노출됐지만 연구소는 “이런 연구는 보도돼 국민이 모두 알아야 할 일이다”라는 생각을 은연 중에 하고 있었기 때문에 대수롭지 않게 생각했다. 권 연구원은 사표를 제출하고 피해 다녀야 할 지경이었다. 나중에 문교부 장관이 “그 사람 아직 연구소에 있느냐”고 물었다는데, 멀쩡하게 살아 있다는 말을 듣고 겸연쩍어했다고 들었다.
이런 소동이 벌어졌으나 연구소는 이에 개의치 않고 1980년에 제2차 전국평가를 수행했다. 이번에는 학생들의 학업성취도뿐 아니라 학생들의 학습 환경에 대한 연구도 곁들였다. 연구방법은 제1차 연구와 동일했다. 제2차 연구 결과, 학생 학력은 약간의 차이를 보였지만, 학습 환경은 도시와 농촌 간에 큰 차이를 드러냈다.
첫째, 60점 이상 받은 학생이 국어에서는 약 62%, 자연에서는 26%, 산수에서는 27%로 성취도가 낮았다. 국어와 사회 쪽은 1973년도에 비해 학력이 향상됐다. 그러나 농촌지역 학생의 학력수준은 도시지역 학생보다 현저히 낮았으며, 여학생이 국어를 제외한 산수·사회·자연의 교육목표 달성도에서 현저히 낮은 결과를 보였다.

둘째, 학습 환경 연구 결과, 도시가 농촌에 비해 월등히 양호했고, 여러 차원의 학습동기도 도시 학생이 높은 것으로 밝혀졌다. TV시청, 운동, 놀이 등에 사용하는 시간이 예·복습이나 독서에 보내는 시간보다 더 많은 것으로 나타났으며, 도시학생이 농촌학생에 비해 학급 친구 관계가 소원한 경향을 보였다. 예상되는 바와 같이 전체적으로 농촌학생의 교육 환경이 도시보다 열악한 것으로 확인됐다.
1973년에 발표한 연구는 대규모 절대기준 평가로서는 KIRBS가 최초로 수행한 연구였다. 40년 전의 이야기, 역사 속의 일이지만 당시로서는 참신한 연구였고, 문교부가 놀라고 국민이 놀랐다. 한국 최초의 시도라는 의미가 있어 상세히 기술했다.
시대에 따라 교육철학과 정책, 요구가 달라진다. 교육 연구 방법도 급속도로 발전하고 있다. 더 세련된 연구 디자인으로 이런 연구를 주기적으로 진행해서 그 결과를 국민이 알 수 있도록 발표해야 할 것이다.

이성진 서울대 명예교수·대한민국학술원 회원


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.