the Great World Meson:: 예측의 함정에서 벗어나자

예측의 함정에서 벗어나자 - 구글 트렌드

시스템 잡설 | 2013. 1. 9. 18:57

인간은 기본적으로 예측하고 싶어한다. 예측은 직감이나 정확한 근거없이 이야기하는 범위에서 어느정도 과학적인, 논리적인 근거를 통해서 이야기하는 범위까지 광범위하다. 그러나 어떤 예측이든 그 이유는 아주 간단하다. 심리적으로 인간은 다가오지 않은 미래에 대한 공포와 동시에 자신에게 다가오기 바라는 기대가 공존하고 있기 때문이다. 항상 보편적 인간의 기본적인 반응은 대부분 공포와 탐욕(Fear & Greed)를 통해서 설명이 가능하다. 자신에게 닥칠 위험이나 무서움을 미리 대비하기 위해서, 반대로 자신에게 다가올 이로움을 미리 맞이하기 위해서 예측은 인간에게 있어 매일의 일상이고 그 일상을 통해 우리는 안타갑게도 미래를 대비하며 준비하게 된다.

만약 확실한 결과가 정해졌다면 우리는 그 결과에 대해서 더이상 실망하거나 기대하지 않는다. 오히려 정확한 결과에 대해서는 우리는 무관심하게 된다. 문제는 얼마나 근거있게 예측하느냐에 따라서 우리에게 다가올 피해나 이익에 대비할 수 있게 된다. 예방과 대비를 위한 모든 작업은 기본적으로 다가올 위험의 최소화, 이익의 최대화를 위한 일들이다.

( 긴 서론이 불필요하다고 생각하신다면... 쭈우욱 아래로 내려가서 구글 트렌드 내용만 봐주세요 )

그렇다면 우리에게 근거가 될 수 있는 것은 무엇인가? 가장 기본적인 것은 자연 법칙이다. 예를 들어 열을 가하면 물체가 뜨거워질 것이라는 것은 쉽게 예측할 수 있다. 자연 법칙은 우리가 예측하는데 가장 큰 기여를 하는 근거가 되는 것을 생활 속에서 느낄 수 있다. 쉽게 말해 우리가 어떤 예측을 하는데 우리가 배워 알고 있는 지식을 통해서 알게 된다. 즉, 일반적인 정보를 통해 내가 알고 싶은 결과를 예측해 본다. 다양한 정보를 수집하고 그 수집된 정보를 '종합적'으로 판단하여 어떤 결론이 나오겠다는 일종의 '귀납적 인식'을 하게 되는 것이다. 누군가 나를 향해 손을 올리는 모습을 보게 되면 과거의 경험과 기억을 통해서 그 행동이 나를 때리게 될 것이다. 그럼 아프다란 예측을 막기 위해 우리는 어떤 방어적인 행동을 취할 수 있다. 그러나 우리의 행동이 그렇게 모두 귀납적 인식을 통해서만 가능하지 않다는 것은 모두 잘 안다. 그리고 아주 간단해 보이는 인식의 과정 안에서도 우리는 무의식, 의식, 그리고 구별하기 힘든 과정의 혼재 안에서 우리는 어떻게든 예측을 통해서 '잠정적 결론'을 내려고 한다.

귀납적 인식

개인적으로 상당히 중요하다고 생각하지만 풀어나갈 이야기가 아니기 때문에 잠시 접어두고 잠시 설명했던 귀납적 인식을 생각해본다. 귀납적 인식이란 인식의 모든 과정이 귀납적 논리를 따르기 때문이 아니다. 앞서 이야기한대로 우리가 무엇인가 예상을 할 때 무의식, 의식의 요소를 적절하게 섞어가면 판단을 하게 된다. 예를 들어 오늘 내가 가진 주식이 오를까 내릴까의 결정을 내릴 때, 예측의 결과는 아주 간단하다. 오른다 아니면 내린다 둘 중 하나로 귀결될 것이다. 어느정도, 약간 오른다 혹은 많이 오른다의 판단은 그 다음의 문제이다. 그렇다면 주식 보유자가 오른다 내린다의 예측을 하기 위한 근거는 무엇이 있을까? 가장 대표적인 것은 아마도 주식의 변동 그래프일 것이다. 그리고 보유주에 영향을 미칠 수 있는 뉴스 내용 혹은 관련주 회사의 뉴스 등을 종합해서 볼 수 있고 전체적인 분위기 등도 중요하게 영향을 미칠 것이다.

문제는 여기에 있다. 우리가 아무리 많은 근거를 가지고 예측을 하여도 그 근거를 어떻게 바라보냐에 따라서 우리의 해석은 달라질 수 있다. 누군가는 올라가는 추세의 그래프를 보고 오늘도 올라간다고 볼 수 있고, 누군가는 이제 올라갔으니 오늘은 내려가는 날이라고 볼 수 있다는 것이다. 그런데 우리는 우리가 가지는 근거 자료들이 내 예측을 잘 뒷받침 해주는 자료라고 이야기한다. 결론적으로 이야기하자면 자신이 가지는 지식이 모든 상황을 고려하지 못한다면 예측은 신뢰가 떨어지고, 뿐만 아니라 객관적 시각으로 판단할 수 있는 근거란 생각보다 거의 존재하지 않는다는 안타가운 사실을 인정해야 한다. 안타갑게도 우리가 아무리 귀납적 사고에 의해 가지고 철저하게 논리적으로 분석할 수도 없고 자기 확신에 의해 그렇게 귀납적 사고를 했다고 해도 우리의 결론은 상당히 엉뚱한 결론에 도달한다. 따라서 여기에서 밝히고 싶은 귀납적 인식이란 귀납적 사고에 의해 논리적으로 인식하는 과정이 아니라는 점이다. 즉, 귀납적 인식 = 귀납적 사고들의 집합이 아니다.

∴ 귀납적 인식이란 예측하고자 하는 사람이 "내가 귀납적 사고 상태에서 결론을 내고 있다"는 가정하는 상태를 말한다.

조금 강하게 표현하면 우리의 예측 가운데 귀납적 사고에 따르는 명확히 논리적인 결론은 거의 보지 못했다는 점이다. 그렇다면 이런 귀납적 인식은 불필요한 것인가?

연역적 인식

그렇다면 우리의 예측은 어떻게 이루어지는 것일까? 우리가 확신할 수 있는 근거는 통계 자료가 이렇다, 시세가 어떻게 변했다. 오늘 호재가 있다와 같은 정보가 아니다. 왜냐면 아무리 고급 정보라고 하더라도 그 정보가 내가 예측하는 결과에 어떤 영향을 주는지에 대한 정보가 부족하거나 그 정보를 임의로 해석하는 과정이 있기 때문이다. 그런 임의성은 조금 예쁘게 포장해서 표현하면 "연역적 인식"이라고 표현할 수 있을 것 같다. 인정하기 싫지만 우리는 다양한 근거 앞에 어떤 결과가 나오기를 바란다는 선호도(preference)를 가지고 시작한다. 절대적 중립이란 쉽지 않다. 순수한 마음으로 자연과학을 접하던 어린 시절에는 과학은 이런 절대적 중립성을 가지고 있다고 생각했고 내가 가진 대전제 (가설; hypothesis) 를 증명하면 맞는 가설이다 틀린 가설이다 결론을 내려줄 것이라고 믿었다. 그러나 관찰자의 시선에 따라서 그리고 심지어 관찰된 내용을 가지고 해석하는 과정에서 전혀 다른 결론이 나와서 오히려 더 큰 분란을 일으키는 분야가 자연과학이라는 것을 점점 느껴간다. 영화 랴쇼몽 (羅生門; Rashomon)과 같이 같은 사건에 대해서 바라보는 시선과 해석하는 차이에 따라서 전혀 다른 결론을 내놓는 것이다. 결국 연역적 인식은 연역적 논리를 따라 내가 알고 싶은 것의 참, 거짓을 찾아내는 과정이라기 보다는, 내가 믿고 싶은 결론을 향해 달려가는 증거들을 찾으려는 성격이 더 강하다.

그렇다면 연역적 인식이 우리에게 아무런 도움을 주지 않는다는 것인가? 쉽게 말하면 우리는 이미 정한 결론을 향해 자신의 논리를 끼워 맞춰가는 것인가? 라는 생각이 들 수 있다. 그러나 한가지 생각해볼 중요한 점이 있다. 연역적 사고를 대표하는 철학자 데카르트가 남긴 말을 통해 생각해보자.

나는 생각한다, 고로 존재한다. - Cogito ergo sum

연역적 사고의 대표적인 명언은 바로 데카르트의 '생각한다 고로 존재한다'일 것이다. 우리가 다소 명확히 판단할 수 있는 한가지 근거, 최소한 내가 가정한 가설 혹은 결론이 맞다 틀리다를 결정할 수 있는 어느정도 결정적 증거가 될 수 있는 대상의 성격이다. 존재한다, 존재하지 않는다이다. 존재와 부재는 서로 양립하기 힘든 성질이다. 가장 대표적인 예로 '사람은 죽는다' 라는 대전제에 죽는다는 죽지 않으면, 살아 있는 것이고 그 중간의 성질은 생각하기 힘들다. (누군가 좀비를 이야기하신다면 여기서 글을 그만 읽으셔도 괜찮습니다. 슬프다...) 따라서 사람은 모두 죽는다는 대전제에 비추었을 때 나는 죽는가? 라는 예측에 대해, 나는 사람이기 때문에 죽게 된다는 예측에 신뢰성이 강해지는 것이다. 이렇게 0 아니면 1 의 확실한 구분이 가능한 성질이 자신의 예측에 결정적 근거가 되는 순간 우리의 예측은 좀더 정확해지기 쉽다.

주가의 예로 돌아가면, 아무리 시세가 오르는 추세이고, 주가에 좋은 영향을 주는 뉴스가 나오고 모든 상황이 오른는 것 같아도 만약 주식을 보유한 대형 기관이 주식을 판다면 그 모든 근거에도 결정적 근거가 되어 주식이 떨어질 것으로 예측하게 될 것이다. 추세나 상황의 문제가 아닌 실제 어떤 일이 일어났다(1), 안 일어났다(0) 다른 표현으로 존재했다(1), 존재하지 않는다(0)를 통해 상당한 영향을 줄 수 있다.

∴ 연역적 인식이란 내가 미리 예측한 결론을 뒷바침하는 정보를 찾으려는 과정과 예측을 결정적으로 무효화할 수 있는 존재적 사건(있다 없다)을 찾는 상태이다.

트렌드란 무엇일까?

긴 설명이지만 결론적으로 우리는 상당히 논리적인 것처럼 비논리적으로 인식하고 예측하는 동물이 아닐까. 인간의 논리가 완벽하지 못하다는 것이 아니라 인간의 불완전성에 의해 어쩔 수 없는 인식의 한계성이 아닐까? 잠시 이야기 주제를 트렌드로 넘어간다. 트렌드(trend)의 사전적 의미는 "여론 사태 등의 동향 대세 추세"이다. 패션 트렌드란 패션의 대세를 이야기한다. 많은 사람들이 취하고 있는 패션이란 뜻이다. 그런데 조금은 이상하지만 트렌드란 말을 들으면 마치 미래지향적 단어를 떠올리게 된다. 그렇지만 트렌드는 현재를 나타내는 말이고 오히려 과거의 여러가지 인과과정을 통해서 현재에 이르게 된 동향이 더 강하다. 그런데 IT 트렌드란 말을 사용하며 마치 미래의 예측, 혹은 앞으로 필요한 내용으로 포장되는 것은 아닌가 생각한다.

물론 현재의 대세와 동향을 통해서 미래를 예측한다는 것이 부적절하거나 도덕적으로 문제가 되지 않는다. 그러나 앞서 귀납적 인식과 연역적 인식을 통해서 인간은 이미 인식의 한계성을 가지고 있는데도 불구하고 마치 예측을 상당히 충분한 과학적 근거에 의해서 설명하는 것처럼 포장한다. 전혀 근거없이 쌩뚱맞은 예측이라면 사람들의 무시를 당하겠지만 현재의 트렌드를 반영하며 마치 미래에 이렇게 될 것이다 라는 근거를 대며 상당히 신뢰성 있는 예측이고 그렇게 믿게 한다.

그러나 다시 강조하지만 트렌드는 과거에서 부터 현재까지 쌓여온 동향의 추이일 뿐이다. 그리고 우리의 예측이 얼마나 부족한 과정인지 길고 긴 서론을 통해서 설명했다. 문제는 여기에서 시작한다. 만약 예측, ① 예측을 통해서 정치적인 방향성을 결정하거나, 그런 ② 예측을 통해 예측이 사실인 것처럼 믿게 만들게 하거나, ③ 예측의 결과에 대해 상당한 피해를 보아도 누구도 책임지지 않는다면 우리는 예측을 통해서 사람들을 속이고 기만하는 행동을 거듭하는 것이다.

우리의 판단을 흐리는 요소들

여론, 언론의 측면에서 생각해보면 이런 문제의 심각성은 우리의 현실에 직접적이다. 쉽게 정리하기 위해서 여론, 언론이 예측을 통해서 대중을 속이는 과정을 설명하기 위해 앞서 설명한 두가지 큰 착각(duo-magna hallucinations)^[각주:1]을 통해서 살펴보자.

¶ 귀납적 인식을 이용한 여론

아주 간단하다. 우리가 판단을 내리고 우리가 예측할 수 있는 근거가 될 수 있는 정보들을 보여주지 않는 것이다. 정보를 취사선택해서 사용자들에게 보여줄 내용, 보여주지 말아야 하는 내용을 선택하는 것이다. 먼저 보여주지 말아야 할 내용은 쉽다. 사용자들이 검색하는 내용을 차단하거나 임의적으로 사용자들이 보기 힘든 우선순위로 잘 보이지 않게 하는 것이다. 보여줄 내용은 사용자가 검색엔진과 만나는 화면의 구성을 통해서 충분히 가능하다. 내가 별 관심이 없어도 실시간 검색 순위, 추천 검색어 그리고 광고 등을 통해서 우리는 우리가 찾고 싶어하는 내용에 집중하기 전 화려한 움직임에 더 끌리기 쉽다. 내가 찾고 싶은 것만 찾는 사람들도 있는데? 라고 할 수 있지만 우리는 은근히 실시간, 일간, 주간 검색 순위에 상당한 관심을 가진다. 그러나 그것이 정말 투명하게 내용을 보여주는 것인가? 투명하게 보여준다면 상관없겠다고 할 수 있지만 근본적인 문제는 그런 화면 구성 자체이다. 우리가 아무리 유혹에 끌리지 않고 내가 원하는 정보만 찾으려고 한다고 해도 앞서 설명한 화면 구성은 언제든 임의로 조작할 수 있는 개연성을 가지는 화면 구성이라는 것이다.

따라서 우리는 제한된 검색 결과와 화면 구성을 통해서 정보들이 가공이 되어 있다면 우리는 충분히 귀납적 인식 과정을 따라도 부족하고 편향된 정보의 불균형에 의해서 여론몰이가 가능하다는 것이다. 귀납적 인식의 가장 큰 장점이자 가장 큰 단점은 바로 우리가 얻지도 못한 정보는 근거로 쓰일 수 조차 없다는 것이다.

¶ 연역적 인식을 이용한 여론

가장 대표적인 예가 바로 경제 보고서 같은 내용이다. 이미 과학적이고 다양한 통계적 결과로 앞으로 어떻게 될 것이라는 예측을 이미 내리는 것이다. 이미 프레임에 의한 인식의 한계성(※참조: 프레임 - 인식의 한계성)에 의해 누군가 예측을 그럴듯이 하게 되면 그 예측에 대해 적절하게 반박하기 이전에 일단 수용하는 비율이 증가할 것이다. 대부분 이런 내용들은 앞서 설명한 존재론적 사건(있다 없다)에 근거해서 연역적으로 차분히 설명하기 보다는 대부분의 근거들이 이렇게 해석해도 되고 전혀 반대의 해석도 가능한 상당히 중립적인 근거들이 많다는 것이다. 경제연구소에서 나오는 보고서는 이런 연역적 인식의 한계성을 이용해서 이미 내려야 할 결론을 먼저 상정을 하고 그 논리에 따라 여론을 만들어가는 과정을 하는 것은 아닌지 의심스럽다. 결론이 전혀 다른 결과가 나와도 특별한 책임이 따르지도 않지만 환율, 금리 등과 같이 민간의 경제에 직접적으로 미치는 수치는 민감할 수 밖에 없다. 기본적으로 예측 능력의 부족이라고 볼 수 있지만 KIKO사태와 같이 환율에 의해 막대한 손해를 받을 수 있는 상황에도 불구하고 영업 판매 등을 목적으로 금융에서 저환율이 유지될 것이라는 예측을 하게 하고 그 예측에 맞춰 자신의 상품을 팔았다면 이미 저환율을 예측한 결론을 앞세워 사람들의 공포심을 이용한 탐욕적 과정이라고 볼 수 있다. 누가 알겠어? 하며 책임을 회피했지만 추정치로만 4조 5천억원의 손해를 본 것이다.

따라서 사적 이익, 기업의 탐욕적 이익을 위해서 편향된 예측을 미리 이야기해서 반대의 상황이나 무효화할 수 있는 결정적 근거를 보여주지 않는 과정은 연역적 인식을 이용한 것이다. 연역적 인식의 장점이자 가장 큰 단점은 이미 보여지는 결론에 대해 알수 없는 안심과 소위 밑도 끝도 없는 신뢰를 형성한다는 점이다.

종합

당연하지만 어느 한가지만 이용하지는 않는다. 물론 여론몰이의 결과가 모두에게 이익이 되는 좋은 결론이라면 좋겠지만 그렇지 않고 여론몰이로 특정 집단, 개인의 사적 목적, 이익을 위해서 이용된다면 그만큼 위험하고 무서운 것이 존재할까? 일단 우리는 인정해야한다. 우리가 그렇게 똑똑한 존재도 아니고 그리고 우리가 모든 정보를 균형잡힌 상태로 찾아낼 수 있지 않다는 것을... 그리고 그 반대에 여론을 조정하고 한쪽 방향으로 몰아갈 수 있는 좋은 시스템이 존재한다면 그 시스템에 대한 철저한 감시가 필요하지만 우리는 그냥 일개 사용자로 그 시스템이 주는 달콤함에 빠져 맹목적으로 신뢰하게 될 수 있다. 좀 더 다양한 여론몰이의 문제점에 대해서 이야기하고 싶지만 사용자 개인의 고민에 맡기고 우리의 예측이 좀더 우리의 인식에 도움이 될 수 있는 방법에 대해서, 조금은 의미있는(그럴 가능성이 높은) 신내림을 위해 어떻게 정보를 찾아 낼 수 있을까 소개하고 싶다.

구글 트렌드 (Google Trends)

소개는 구글 트렌드를 통해서 하지만 국내 업체에서도 기능상으로는 동일한 서비스를 제공한다. 자신이 신뢰하는 검색엔진, 혹은 원한다면 사용하는데 비용이 발생하지 않으니 모두 사용해보는 것도 나쁘지 않을 것이다. 구글 트렌드는 검색되어진 키워드와 관련 키워드의 연관도를 종합해서 지역별, 기간별 검색량을 보여주는 서비스이다. 사람들의 주목을 이끈 사건은 바로 미국 대선 결과를 사용자들의 지역별, 기간별 검색량을 보여주어 대선이 다가올 수록 어떤 대통령이 당선될 가능성이 높다는 것을 보여주었다. 뿐만 아니라 이러한 예측 정확도를 지난 3번의 대선을 통해서도 보여주었다.

초기 구글 트렌드 (Google Trends) 화면

검색엔진의 진화 - 플랫폼을 통한 인식의 진화 을 통해 마지막에 소개했던 Google Flu Trends 도 예가 될 것이다. 그러나 단순히 지역별 검색량만으로 독감의 위험도를 표시하는 것은 고려해봐야 한다. 이유는 아주 간단하다. 인터넷을 사용할 수 있는 사용자 환경의 밀도 등에 따라서 검색량은 차이가 나기 때문이다. 즉, 인터넷 접속 용이성이 모두 다르기 때문이다. 또한 각 지역마다 독감의 증상과 관련된 언어적 보정 등이 필요할 것이다. 이처럼 초기 검색되어지는 원본 데이터 (raw data)와는 다르게 이를 우리에게 의미있는 데이터로 가공하는 것이 바로 모델링이다. 즉, 특정 지역의 데이터가 가지는 의미를 분석해서 그 데이터가 전체적인 지역적 가중치로 보았을 때 어느정도인지, 그리고 무엇보다 중요한 것은 시간에 따른 변화량, 증가 속도 등을 고려해서 그에 따라서 표시해줘야 한다.

§ 미국 대선을 구글 트렌드로 예측한 내용에 대한 기사 - 원문보기

What Google Trends Reveals about the Presidential Election

§ 국내 대선을 구글 트렌드로 분석한 블로그 기사 - 원문보기

인물로 완패한 대선

구글 트렌드는 지금은 구글 인사이트 (Google Insights) 의 하나의 툴로 소개되며, 구글 인사이트는 검색된 데이터를 통하여 자신에게 필요한 데이터를 가공하여, 현실적 의미를 가지는 정보로 보여주는 다양한 툴들의 집합체이다. - 참조: Think Insights with Google

결정을 자동으로 해주는 정보를 준다는 것은 거의 불가능이다. 그건 말그대로 인간도 힘들어 하는 예측을 해주는 것인데, 결국 인간의 한계성을 가지는 예측이 인간이 구현한 시스템을 통해 완벽해진다는 것은 더욱 더 어려울 것이다. 다만, 중요한 것은 앞서 설명한 귀납적 인식의 한계를 보완할 수 있는 방법을 제시해줄 수 있다는 것이다. 구글 트렌드는 자신의 검색어를 입력하면 해당 검색어와 관련이 되는 검색어를 제시해준다. 따라서 내가 생각하지 못한 정보의 범위를 확대할 수 있는 기회를 제공해준다. 별도로 구글에는 Google Keywords Tool 이 있다. 지금은 AdWords™ 의 광고 관련 툴로 포함되어 키워드 광고를 할때 인기있는 (소위 지금 트렌드인) 검색어를 찾아서 해당 검색어로 자신의 블로그나 홈페이지를 꾸민다면 관련 광고가 더 노출될 가능성이 높아지기 때문이다.

연역적 인식의 한계를 보완하는 방법은 특히 과학적 연구에 있어 유용한 방법을 제시해준다. 예를 들어 간염 종류에는 A형, B형, C형 간염이 있는데 각각의 질환이 서로 연관 관계가 있을까 하는 가설을 생각할 수 있다. 질환 원인은 다를 수 있지만 그래도 어떤 연관 관계가 있지 않을까 하는 것이다. 물론 환자의 실제 수치를 통해서 얻을 수 있지만 통계 자료의 접근이 어려울 수 있고, 그전에 연구 가설을 진행할 필요 있는 확인하는 단계에서 살펴보면,

추이적인 변화는 비슷하게 보이는 것을 알 수 있지만 어느 시점에서 B형간염과 C형 간염의 검색 비율이 변화하는 것을 확인할 수 없다. 물론 이 그래프가 실제 환자의 수치를 표현한다고 할 수 없지만 대부분 환자나 보호자들이 걱정이 되거나 더 알기 위한 검색이 많아진다고 가정을 한다면 단순히 무시할 수 있는 변화는 아니라는 것이다. 그리고 지역적 분포를 보면 A형간염의 경우 남미의 페루, B형간염의 경우 아프리카의 가나가 검색량이 많다는 것을 알 수 있다. 이처럼 처음의 가설에 의해 검색어를 입력하지만 내 가설에 반대되는 현상, 혹은 가설의 방향을 변화시키리 수 있는 새로운 가설을 설계할 수 있다. 따라서 새로운 궁금증으로 왜 유독 해당 국가에서 해당 질환이 검색량이 많은지 확인하는 새로운 과정으로 새로운 가설, 연구 방향을 잡을 수 있는 도구가 될 수 있다는 것이다.

구글 트렌드의 입력은 아주 간단하다. 구글의 기본 검색어 입력 방식과 동일하지만 비교하고자 하는 대상을 구별할 때 컴마(,)로 구별해주면 된다. 위의 내용을 검색할 때도 "hepatitis A", "hepatitis B", "hepatitis C" 와 같이 묶음 표시(")로 검색 대상임을 구별해준다. 검색 이후, 지역, 관련 검색어, 기간 등을 설정해서 살펴볼 수 있다.

그냥 재미삼아(?) diet 와 cholesterol 에 대한 내용을 검색해보았다. 그래프에서 알 수 있듯이 다이어트에 대한 검색량이 절대적으로 많은 것을 알 수 있다. 그래서 어떤 경쟁 구도를 가지는 검색어가 아니고 실제로, 개인적 가설 속의 내용에서 생각했던 두 단어일 뿐이다. 더 엄밀히 말하면 두개의 검색어는 위상이 서로 다른 검색어이기 때문에 건강을 생각하지 않는 미용의 목적의 다이어트에 대한 검색량을 적절하게 뽑아내지 않는다면 적절한 비교 검색이 아닐 것이다. 그러나 재밌는 사실은 매년 항상 관심이 끊이지 않을 것 같은 다이어트 검색어가 계절적 변화(seasonal trends)를 가진다는 것이다. 무엇이 이런 계절적 변화의 요인인지, 지역별로 알아보거나, 다양한 내용을 유추할 수 있지만 일단 어떤 영감(inspiration)을 줄 수 있는 계기는 될 수 있을지 모르겠다.

적절한 비교 대상으로 갑상선암과 임파선암을 한번 비교해보자. 두 질환은 유사할 정도로 비슷한 경향을 보여준다. 이런 결과를 통해서 새로운 가설의 영역을 생각해본다. 두개의 유사한 경향성(시간적, 공간적 모두 고려했을 때)을 보인다면 아마도 두 암 영역의 치료 방법이 밀접한 관계가 가질 수 있거나 다양한 가설을 생각해볼 수 있을 것이다. 다시 넘어와 연역적 사고를 통해서 지역적 경향성이 일반적인 경향성과 다른 지역(예를 들어 어떤 특정 지역에서 케냐를 한번 보며...)에서 무슨 일이 있었는지 환경적 영향을 통해서 개별 암에 영향을 주는 환경적 요소를 찾아내는 방법으로도 사용할 수 있을 것이다.

이처럼 과거의 검색량을 통해서 어떤 결론 혹은 예측을 한다는 것은 분명 어리석은 일이다. 그러나 과거의 검색량이라는 그래도 어느정도 신뢰할만한 데이터의 축적이 존재한다면, 이를 무시하고 결정하는 것보다는 이를 이용하는 것이 현명한 방법일 것이다. 다시 인식에 대한 이야기로 넘어온다면, 우리는 어떤 정확한 예측을 하기 위해 구글 트렌드와 같은 도구를 사용하는 것이 아니다. 앞서 예제를 통해서 살펴본 것과 같이 우리가 가진 생각의 범위를 넓히고, 우리가 잘못 생각할 수 있는 예외적인 부분을 통해서 생각하지 못한 원리나 현상을 위해 영감을 줄 수 있는 도구(inspiration driving tool)란 것이다.

몇가지 다른 예로 즐거운 가설을 세워보는 과정을 공유해본다.

첫번째는 국내 검색엔진에 대한 트렌드 비교 분석이다.

역시나 예상대로 네이버 검색엔진의 검색량이 우위를 가진다. 그런데 여기서 재밌는 것 하나는 특정 시점에서 갑자기 검색량 자체가 줄어드는 현상에 대한 부분이다. 기본적으로 구글 트렌드의 데이터는 실제 계수(count) 데이터가 아니라 각 데이터의 최고값을 100으로 놓고 상대적인 값이다. 그리고 어떤 시점에서 알파벳으로 표시된 부분이 있는데 해당 시점에서 관련 뉴스를 연결해 놓았다. 따라서 트렌드 변화의 이유나 혹은 근거를 생각해볼 수 있도록 도움을 주는 것이다. 그림에 표시한 것처럼 2010년쯤 네이버에 무슨 일이 일어났는지 따로 검색을 해보는 것도 즐거운 일이 될 수 있을 것 같다.

어떤 검색에서는 처음의 의도와 전혀 다른 사실에 접하게 된다. 예를 들어 일본의 원전 사고 이후 일본에서의 방사능에 대한 걱정과 불안을 생각해서 방사능(radioactivity)을 입력하면 일본 지역과 그 주변 지역이 짙게 검색될 것이라고 생각했다. 그런데 결과는 조금 의외였다.

일본은 너무 조용하고 의외로 아프리카의 나이지리아가 가장 많은 검색량이 나왔다. 도대체 나이지리아엔 방사능과 무슨 관계가 있다는 것일까? 이후 검색은 개인의 몫으로 맡긴다.

연구 방향이나, 과제의 가설 설정에 있어 구글 트렌드는 참 좋은 벗이 분명하다. 단순히 예측의 강력한 도구로 보이는 경향이 크지만 사실 예측을 위한 도구라기 보다는 모든 예측은 실패할 가능성이 높기 때문에 조심하라고 하는 예측을 함부로 하지 말라는 도구가 더 적절한 도구의 성격인 듯 하다. 따라서 선택은 사용자의 몫이다. 그러나 귀납적 인식으로 진실이 아닌 자신에게 유리한 근거를 위해 찾거나 연역적 인식을 위해 이미 결론을 내고 균형감없는 근거를 찾는 것을 경계하며 사용한다면, 구글 트렌드는 우리의 인식을 좀더 다양한 영역과 사고의 다양한 과정을 보여주는 좋은 도구가 될 것이다.

본 글에서 나오는 귀납적 인식, 연역적 인식 등 새로운 용어는 필자의 개인적 용어임을 밝힙니다. [본문으로]

저작자표시 비영리 변경금지

'시스템 잡설' 카테고리의 다른 글

그래프서치 - 관계 중심형 검색엔진을 꿈꾸다 (3)	2013.02.01
정보의 가공 및 개인화 - 논문 작성을 중심으로 (2)	2013.01.18
개인 데이터 백업 - 웹에 퍼진 내 정보들 (0)	2013.01.11
인터넷 보안 - 나의 계정을 지키자 (0)	2013.01.03
앱 다이어트 - 돈주고 살만한 안드로이드 앱 (1)	2013.01.01
백업, 동기화 & 클라우드 (1)	2012.06.21