본문 바로가기
스마트러닝/스마트러닝

구글트렌드 자료를 활용한 수업시간 데이터 경향 분석 활동

by 민서아빠(과학사랑) 2021. 12. 6.

<구글트렌드를 활용한 경향 분석>


혹자는 정보를 가지고 있는 자가 세상을 지배한다 라고 말한다. 데이터 경향을 파악해서 사람들의 관심사를 미리 알 수 있다면 무엇을 할 수 있을까? 사람들의 관심사를 데이터로 모아, 어떻게 가공하느냐에 따라 이는 엄청난 정보가 될 수 있다.
어느지역 사람들이 어떤 후보를 지지 하는지, 어떤 식량이나 어떤 약품을 필요로 하는지, 무엇에 관심을 갖고 있는지, 이런 것들을 미리 파악할 수 있다면 정책을 세우거나, 사업을 할때도 필요하고, 특히 경향을 분석하고, 미래를 예측하는 살아있는 자료가 될 것이다.
이미 구글은 구글트렌드 사이트를 이용해서 재미있는 실험을 한 적이 있다. 미국 독감이 유행하는 시기를 분석해 낸 것이다. 분석한 자료를 이용하여 미국질병관리 본부보다 1주일 이상 빠르게 독감 유행시기를 예측해 내서 세상을 놀라게 했다.

구글에서 수집된 데이터를 단순하게 본다고 해서 알아낼 수 있는 것은 아니다. 수집되 데이터를 어떻게 해석하고, 분석할 것인지를 알아야 한다. 데이터에 오염을 시킬 수 있는 검색어도 걸러내야 한다. 즉 빅데이터의 논리적 분석이 필요하다. 제대로 분석만 한다면 우리가 알지 못했던 많은 경향을 분석하고 예측할 수 있다.
이런 정보가 특정 세력만 사용할 수 있다면, 사회적 문제를 야기할 수 있지만, 다행히도, 구글트렌드 사이트는 모두에게 공개되어 있다.

<구글트렌드 사이트 수업시간 활용 방법>


가. 구글트렌드 사이트에 접속한다.
https://trends.google.co.kr/

나. 자신이 관심있는 2가지 이상(3가지-4가지)의 단어를 입력하고 비교해 본다.다. 그래프가 그려지면 화면 캡처해서 그래프를 저장한다.

관심단어 : 코로나, 마스크
지역 : 대한민국
기간 : 2019.12.6 – 2021.12.6.
그밖에 어떤카테고리의 어떤 내용에서 검색할 것인지를 세세하게 설정할 수 있다.

다. 그래프가 그려지면 화면 캡처해서 그래프를 저장한다.

라. 저장된 그래프를 보면서 논리적으로 분석해 본다.
급격하게 그래프가 변한 시점에 어떤 일이 있었는지를 분석해 보고, 이에 대한 설명을 그림에 추가로 넣거나 아니면 글로 표현해 본다.
예시) 2020년 초 코로나가 처음 발생했을 때 마스크가 부족해서 마스크 검색도 따라서 늘어난 것으로 보인다. 하지만 그 이후에는 마스크 수급이 안정되어 코로나 유행이 다시 시작되었어도 마스크 검색어는 거의 변화가 없음을 알 수 있다. 등등

마. 분석한 내용을  패들렛이나 띵커보드에 과제로 제출하게 한다.

경향분석을 하는 것이 학교 공부가 아니라 삶의 일부가 되었으면 한다.
참고자료 : https://www.nature.com/articles/nature07634

바. 교실에서 선생님 혼자 진행하는 방법

  시간이 없거나 컴퓨터가 없을 때는 선생님이 구글트렌드 사이트를 화면에 띄워 놓고, 학생들이 원하는 검색어를 입력해서 비교해 주면서 왜 그런지 이야기를 나눠 봐도 좋다. 남학생들은 첫번째 요구가 역시 게임이다. 자신이 하고 있는 게임이 얼마나 인기가 많은지 확인해 보고, 데이터가 잘 맞는 다고 좋아한다. ^^

모둠별로 원하는 검색어를 상의해서 요구하게 할 수도 있다.

두가지 검색어를 입력해서 경향성이 가장 비슷하게 그려지도록 만들게 해 보자.

아니면 한가지 검색어는 선생님이 제시하고, 그것과 경향성이 가장 비슷하게 그려지는 또는 반대로 그려지는 검색어를 찾게 해 봐도 좋다.

데이터를 보고 그래프를 그리고 경향성을 파악하는 것이 왜 중요한지 설명해 주고, 함께 활동해 봐도 좋은 경험이 될 것이다. 

 

<실습>


아래는 구글 트렌드 사이트와 같은 네이버 트랜드(https://datalab.naver.com/keyword/trendSearch.naver)에서 검색한 분석 그래프이다. 코로나로 검색해서 제일 높은 그래프를 얻었다. 그럼 두 번째 세 번째 보이는 그래프 검색어는 무엇일까?

그래프는 상대적인 검색량 까지 고려해서 그려진다. 

제일 낮은 세 번째 그래프는 코로나 검색어에 비해 상대적으로 검색량이 작기 때문에 변화가 거의 보이지 않는다. 이럴 때는 그 검색어만 따로 떼어서 검색하면 좋다. 아래 그 검색어만 다시 검색해서 그려 놓았다. 위 코로나 그래프와 비교하면서 어떤 검색어일지 생각해 보자.

경향성을 보면 코로나와 비슷하게 움직이지만, 마지막 부분이 일치하지 않는다. 어떤 검색어일지 추측해 보고, 그렇게 생각한 이유를 적어 보자.

자신이 궁금한 내용 검색어를 설정하고 실제 트랜드 사이트에 가서 검색해서 그래프를 그려보고 분석해 보자.

 

<고등학교 과학탐구실험 시간 응용>

  고등학교 과학탐구실험 책에는 관측자료를 활용한 한반도 기후변화 경향을 파악하는 내용이 나온다. 수십년간 이산화 탄소 농도의 변화와 평균기온 변화를 비교해 보면, 이산화 탄소의 농도가 증가할수록 지구의 평균기온도 증가한다는 것을 알 수 있다.

그런데 단순히 관측자료를 보는 것으로 끝나는게 아니라 어떻게 해석하는가도 중요하다.
연도별 이산화탄소의 농도변화를 자세히 살펴 보면 일직선이 아니라, 아래 그래프처럼 매년 진동하는 것처럼 보이기도 한다.

왜 이산화탄소 농도가 계절별로 달라지는 것일까?

  같은 자료를 보고도 여러 가지 생각을 할 줄 알아야 한다. 보통 여름에는 이산화탄소 농도가 낮아진다. 여러 가지 요인이 있지만 가장 큰 요인은 식물의 광합성이다. 온도가 올라가고 잎이 무성해지는 여름이 되면 식물의 광합성 작용이 활발해 지면서, 대기중의 이산화탄소 농도가 줄어든다. 그래서 여름과 겨울의 이산화탄소 농도 차이가 나타난다. 그런데 최근에 이 차이가 더 심해지고 있다고 한다. 이유를 알겠는가?
인간을 위한 경작지가 늘어나면서, 인위적으로 재배되는 옥수수와 같은 작물이 늘어나고 있고, 이런 작물들은 가을에 추수가 끝나면 모두 베어 버린다. 그러다 보니, 예전보다 여름과 겨울에 살고 있는 식물의 차이가 더 커졌기 때문이다. 간단한 것도 비판적인 사고력을 가지고 판단하고 분석해 보면 재미있는 것들을 볼 수 있다. 우측 이산화 탄소 배출량 그래프를 보여주면 학생들은 대부분 드디어 이산화탄소 양이 줄어들고 있다는 착각에 빠진다. 이산화탄소의 배출량이 코로나 사태로 줄어들긴 했지만, 그렇다고 지구 대기의 이산화탄소양이 줄어든 건 아니다. 배출량이 줄어든 것이지, 기존에 있던 이산화탄소양에 줄어든 이산화탄소 배출량이 더해지기 때문에, 결국 대기중 이산화탄소의 농도는 작지만 늘어났을 것이다.   

관측자료를 활용한 한반도 기후변화 경향파악 하는 수업을 하다가, 실제로 자신만의 데이터를 가져다 분석을 해 보면 재미있겠다는 생각이 들었다.

그래서 구글트랜드 사이트를 소개하고  지구 기온변화와 관련된 검색어를 생각해서 비교해 보도록 했다.

예) 지구온난화, 빙하, 쓰레기, 북극곰, 전기, 식량, 게임, 석유 등등,

전혀 상관없을 것 같은 단어들을 검색해서 비교해 보고, 나름대로 관련성을 찾아 가는 것도 큰 의미가 있을 것이다.

<학생들에게 위 그래프를 보여주며 했던 말>

마스크 사업을 하고 싶다면 지금 해도 될까? 그럼 언제쯤 마스크 사업에 뛰어 들었다가, 언제쯤 그만 둬야 될까? 간단한 그래프를 보고 경향성을 파악하는게 아무 의미가 없어 보이지만, 어쩌면 우리 삶에 큰 의미가 있을 수 있다.

이런 걸 다룰 줄 아는 사람과 그렇지 못한 사람은 졸업하고 세상에 나갔을 때 어떤 차이가 있을지 생각해 보도록.

이런거 뭐하러 배우냐고? 글쎄... !