교육부 공식 블로그

중학생을 위한 통계로 세상 배우기 본문

교육부 국민서포터즈

중학생을 위한 통계로 세상 배우기

대한민국 교육부 2015. 12. 15. 11:52

중학생을 위한

통계로 세상 배우기



우리는 데이터가 넘쳐나는 시대를 살고 있습니다. 특히 디지털화나 인터넷의 영향으로 세계적으로 데이터가 축적되는 것이 더욱 가속화되고 있죠. 이렇게 축적되는 다양한 형태의 방대한 양의 데이터로 인해 ‘빅데이터’라는 환경이 만들어졌다고 합니다.



빅데이터와 통계

최근 언론 등 각종 매체에서 자주 등장하는 빅데이터란 정확히 무엇을 의미하는 것일까요? 빅데이터의 의미를 찾아보면 ‘기존의 데이터베이스 관리도구로 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형·비정형 데이터의 집합, 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술’이라고 정의하고 있습니다.(출처:위키백과) 


빅데이터에 대한 정의나 빅데이터를 바라보는 관점은 바라보는 주체에 따라 조금씩 다르긴 하지만, <빅데이터가 만드는 세상>이라는 책에서는 ‘빅데이터란 큰 규모를 활용해 더 작은 규모에서는 불가능했던 새로운 통찰이나 새로운 형태의 가치를 추출해내는 일이고, 이 과정에서 시장, 기업 및 시민과 정부의 관계 등 많은 분야에 변화를 가져온다’라고 이야기합니다.

 

이런 빅데이터도 결국은 통계라는 것에 기초하고 있다고 할 수 있는데요. 통계는 초등학교 때 표와 막대그래프로 자료를 표현하는 것에서 시작하여 매년 수학 교과서에 빠지지 않고 등장하는 단원이기도 하죠. 수학 교과서 속에 등장하는 문제 풀이용 통계를 넘어 우리가 사는 세상을 새롭게 바라보기 위한 방법론이기도 한 통계 이야기를 지금부터 하려고 합니다.  

 

통계란 모든 사회 및 자연현상을 나타내주는 의미를 가진 수치라고 합니다.(출처: 통계청) 빅데이터 환경을 사는 요즘은 데이터라는 것이 숫자의 형태를 벗어나 텍스트, 이미지, 영상 등 다양한 형태를 띄고 있지만, 전통적으로 통계라 하면 자료를 수치화하여 다루고 표현하는 것이 일반적이라고 할 수 있겠죠. 우리 주변에서는 5년 마다 실시되는 인구주택총조사나, 선거를 앞두고 여론조사를 통해 각 후보의 지지율을 조사한다던가, 출구 조사를 통해 개표 결과를 미리 예측하는 것에서  통계가 활용되고 있는 것을 잘 알 수가 있을 것입니다. 특히 개표 결과를 예측하는 방송을 보다 보면 화려한 시각화 기술이 더해져 통계 결과 방송을 어떤 프로그램보다도 흥미진진하게 시청하게 되곤 하죠.


통계가 얼마나 흥미로운 학문인지를 더욱 잘 보여주는 TED강연 하나를 소개할게요. 스웨덴 카롤린스카 대학의 한스 로슬링 교수의 강연인데요. 그와 그의 아들이 개발한 Gapminder라는 프로그램을 이용하여 수십 년 간의 통계 자료를 시간의 흐름에 따라 살아 움직이는 자료로 표현하여 주목 받고 있는 영상입니다. 


<한스 로슬링 박사의 통계 관련 TED강연>

https://www.youtube.com/watch?v=NVwB_of8ZYs 



통계에 관한 모든 것, 국가통계포털

초등학교 고학년쯤 되면 사회나 과학보고서를 작성할 때 표나 그래프를 통해 조사자료나 실험자료를 표현하게 되는데요. 저는 중학교 1학년 때 수학교과서 통계 단원에 소개된 통계청 국가통계포털을 알게 된 것이 통계를 가까이 하게 된 계기가 되었습니다. 사실 학생으로서 수집할 수 있는 자료에는 한계가 있죠. 기껏해야 학교나 길거리에서 사람들을 만나 인터뷰하거나 설문지를 돌리는 일이 전부 일 것입니다. 


그런데 국가통계포털에서는 뉴스나 각종 보도 자료에 인용되기도 하는 수많은 공인 통계 자료를 분야별, 주제별로 자유롭게 조회하고 다운로드할 수 있다는 것이 매우 놀라웠습니다. 통계를 활용한 다양한 사례들을 살펴 보다 보면 직접 수집한 자료 외에 다른 사람, 기관의 통계 자료를 인용해 나의 탐구 활동을 더욱 풍성하고 깊이 있는 것으로 활용할 수가 있더라구요. 또한 직접 탐구 활동을 하지 않더라도 각종 통계자료와 지표들을 보면 사회의 다양한 면에 대해 새롭게 파악해 보는 기회가 될 수 있으니 꼭 한 번 방문해 보시기 바랍니다.  


▲ <초·중교과서 속의 통계> (출처:초4-1 수학교과서, 중1 두산동아 수학교과서 직접 촬영)


▲ <통계청 국가통계포털 KOSIS 화면>



학생들에게 있어 통계란

중학생 친구들에게 있어 통계란 무엇이고, 통계에 대해 어떤 생각을 가지고 있을까요? 주위 학생들에게 먼저 통계란 무엇이라고 생각하는지 물어봤습니다.

 

학생들 대부분은 통계하면 가장 먼저 확률이 떠오른다고 했으며, ‘사건을 숫자로 변환해 분포로 나타내는 것’, ‘사건에서 변수에 따라서 각각의 경우를 나눈 도표’, ‘여러 사람들의 생각을 한 눈에 알아 볼 수 있도록 시각화하여 그래프 등으로 나타낸 수치’와 같이 통계를 정의했는데요. 역시 학생이라 교과서에서 배운 통계의 수학적 개념에 충실한 정의가 대부분이었습니다. 또한 통계가 실생활에서 활용되는 사례로 어떤 것이 떠오르냐는 질문에는 '뉴스 보도에 인용되는 경제성장률이나 기업의 매출 실적, 또는 투표 결과와 로또' 같은 경우를 꼽았습니다.

 

 

통계 활용 탐구, 도전해 보세요 

앞서 소개한 국가통계포털에서 2014년도 통계청이 실시한 사회조사 결과, 13세~24세 청소년들이 가장 고민하는 문제에 대한 조사자료를 본 적이 있는데요. 조사에 의하면 청소년들의 가장 큰 고민은 공부, 직업 다음으로 외모이고, 특히 중학생 의 경우 공부와 함께 외모를 가장 큰 고민거리로 생각하고 있었습니다. 또한 한국갤럽의 ‘외모와 성형수술에 대한 인식조사’ 통계 자료를 보고나서 가까운 내 주변의 친구들은 외모에 관해 어떤 생각을 갖고 있는지 통계를 활용하여 객관적으로 파악해 보면 어떨까 하는 생각이 들었습니다.


▲ <청소년이 고민하는 문제(통계청, 2014)> (출처: 통계청 통계포털 KOSIS의 통계표 조회결과)


외모에 대한 관심은 여학생들의 경우 화장이라는 행위로 표출되곤 하죠. 중학교 학생들의 경우, 학년이 올라갈수록 화장하는 친구들이 늘어나고 있는 것을 실감할 수 있는데요. 그래서 여학생들을 대상으로 화장 실태에 대한 전반적인 조사와 함께, 화장 여부에 따른 외모만족도 및 자존감과 전반적인 학교생활에 대한 만족도를 조사하여 서로의 상관관계를 알아보는 통계 분석을 해보았답니다.


가까운 친구 한 명과 교내 3학년 전체 여학생을 대상으로 설문조사를 한 후, 설문 응답을 기초로 한 통계연구를 해 보았는데요. 설문지 문항을 머리를 맞대고 만들어 보고, 설문지를 배포하고 빠짐없이 수거하고, 자료를 분류하고 정리하는 등 통계활용 탐구 활동의 절차를 직접 경험해 보며 통계에 대한 다양한 면을 배울 수 있었답니다. 응답자 개개인의 순수 설문결과를 가지고 통계분석을 통해 청소년 화장이라는 사회현상을 진단해 볼 수 있다는 통계학의 학문적 가치와 확률과 미적분 등 수학적 지식을 바탕으로 하는 배경 논리에 다시 한 번 통계의 매력을 느낄 수가 있었습니다.


<통계활용탐구활동 사례 - 설문지> (출처: 직접 작성 후 촬영)


▲ <통계활용탐구활동 사례 - 결과 분석> (출처: 직접 작성 후 촬영)

 

탐구활동에서 통계를 활용하는 것이 어떤 의미가 있을까요? 가령 화장을 하는 학생과 그렇지 않은 학생 두 집단의 외모만족도와 자존감에 대한 비교 항목에 있어서 통계를 적용하기 전에는 무의식 중 갖게 되는 예상 결과에 대한 선입견이 있었습니다. '화장을 하는 집단의 외모만족도가 떨어지지 않을까?'하는 선입견이죠. 이러한 선입견은 잘못하면 데이터 분석 과정에서 결과를 왜곡하거나 확대 해석하는 오류를 일으킬 수도 있습니다. 하지만 두 집단에서의 평균의 차이가 통계적으로 의미가 있는지를 검증하는 t-검정과 같은 분석 기법을 통한 분석에서 두 집단간의 외모만족도와 자존감은 통계적으로 유의미한 차이가 없다는 결론을 얻을 수 있었습니다. 결국 예상과 다른 결과로 인해 다른 설문 문항을 분석하여 화장에 영향을 주는 요인을 찾아야 했지만, 통계라는 도구를 통해 탐구 결과의 객관성을 확보할 수 있었답니다.


▲ <통계활용탐구활동 사례 - 통계분석 기법 활용> (출처: 직접 작성 후 촬영)



통계, 제대로 알고 쓰자

통계 분석은 책이나 인터넷 자료를 통해 쉽게 따라해 볼 수 있습니다. 하지만 왜 그렇게 하는지 직관적으로 이해하기란 쉽지 않은데요. 통계 기법의 원리를 제대로 이해하고 적용해야 정확하고 신뢰할 수 있는 결론을 얻을 수 있기 때문에 왜 그런 기법이 개발되었는지, 기법이 작동하는 논리적인 근거까지 이해한다면 더욱 좋을 것입니다. 많은 통계학자들은 개념에 대한 깊이 있는 이해 없이 기법만 기계적으로 활용하게 된다면 자칫 자료를 잘못 해석하는 오류를 범할 수 있다고 경고하고 있습니다. 여러 가지 통계 오류를 범하지 않기 위해서라도 체계적인 이해와 접근이 필요할 것입니다. 제가 통계를 공부하며 읽었던 몇 권의 책을 소개해 볼게요.


   『통계 속의 재미있는 세상 이야기』 - 통계청

   『빅데이터가 만드는 세상』 - 빅토르 마이어 쇤버거, 케네스 쿠키어

   『통계의 미학』 - 최제호

   『뉴턴 하이라이트 88.통계와 확률의 원리』

   『세상에서 가장 재미있는 통계학』  - 울코트 스미스


『통계 속의 재미있는 세상 이야기』는 통계의 기본 개념을 아주 쉽게 설명하여 통계와 친숙해지기 위해 가장 먼저 읽으면 좋을 책이랍니다.  또한  『빅데이터가 만드는 세상』과  『통계의 미학』에서는 책에서 소개되는 통계에 관한 방대한 사례를 통해 통계에 관한 폭넓은 지식을 가질 수 있고요.  『뉴턴 하이라이트 88.통계와 확률의 원리』는 얇은 잡지 형태로 많은 그림과 함께 통계와 확률의 몇 가지 주제를 흥미롭게 다루고 있습니다.  『세상에서 가장 재미있는 통계학』은 비록 만화이긴 하지만 통계에 관한 수학적 개념이 꽤 수준 높은 책입니다.


조금 더 수학적 원리에 대한 호기심을 갖고 계신 분들이라면 다음 두 권을 추천하고 싶습니다.


  『기초통계학의 숨은 원리 이해하기』 - 김권현

  『수리통계학』 - 허문열/송문섭 


모든 자료를 한 개인이 수집하기란 불가능하고 비효율적이겠죠. 다음 사이트의 각종 통계표와 통계지표를 활용하면 공신력 있는 방대한 통계자료를 활용하여 더욱 깊이 있는 탐구를 할 수 있을 것입니다. 각종 통계자료를 활용하거나 직접 자료를 수집하여 '전국학생통계활용대회', '생활 속 통계활용 수기공모전', ' 국가승인통계 활용 UCC 공모전'과 같은 통계 관련 대회에도 한번 도전해 보면 좋을 것 같아요.


   <통계 관련 사이트>

   - 통계청 블로그 http://blog.naver.com/hi_nso

   - 통계청 공식 통계포털 KOSIS http://kosis.kr/

   - e-나라지표 http://www.index.go.kr/egams/index.jsp

   - 통계지리정보서비스 SGIS http://sgis.kostat.go.kr/

   - 환경통계포탈 http://stat.me.go.kr/

   - 환경통계 EGIS http://gis.stat.me.go.kr/gis/jsp/main.jsp

   - 통계교육원 http://sti.kostat.go.kr/

   - 센서스앳스쿨 http://www.censusatschool.or.kr

   - 어린이 통계동산 http://kostat.go.kr/community/nkids/index.action

   - 통계청 사이버통계전시관 http://kostat.go.kr/cyber

 

   <통계 관련 대회>

   ○ 전국학생통계활용대회

       주제: 통계 활용 통계 포스터

       대상: 초등학생(4~6학년), 중학생

 

   ○ 생활 속 통계활용 수기공모전 

      주제 : 생활 속에서 통계를 활용했던 사례나 재미있는 경험담 등 통계와 관련된 모든 주제

           ㆍ우리 생활 속 체험적인 수치(통계)와 관련한 이야기

           ㆍ재미있는 통계 이용 또는 성공 사례(개인, 학교, 자영업, 기업 등)

           ㆍ통계로 적용해 본 미래이야기

           ㆍ기타 통계 활용의 중요성에 대한 모든 경험담

      대상: 제한 없음

 

   ○ 국가승인통계 활용 UCC 공모전 

       주제: 통계와 관련된 모든 주제

       대상: 제한 없음 


중학생이라 아직 부족한 부분이 많지만 통계적 사고를 통한 탐구 활동에 도전해 보며, 그 동안 학교에서 배웠던 평균과 기댓값, 분산과 표준편차, 히스토그램과 산포도 등의 개념들이 사회의 흐름을 파악하는데 매우 유용한 학문인 통계의 기본 개념이었다는 것을 새삼 깨닫게 되었는데요. 이런 활동을 통해 우리 주변의 다양한 모습을 통계를 통해 들여다 본다면, 그 동안 인지하지 못했던 사회 현상을 보다 새롭게 인식하는 계기가 될 것입니다.



Comments