블로그를 운영하면서 느끼는 포털, 그리고 검색 서비스에 대한 이야기로 지난 번(1부 네이버, 다음 그리그들의 영향력 (부제: 검색시장에서의 정보 가판대))에 이은 2부입니다. ^^


3. 구글 google.com : 
유독 우리나라에서 기를 펴지 못하는 검색 엔진. 하지만 정보성은 최고


참고로, 나는 네이버 지식인 검색을 거의 하지 않는다. 물론 일부 답변은 믿을만하긴 하지만, 내가 구하고자 하는 질문에는 정확한 답변이 없는 경우가 많았다. 지극히 한국적인 정보, 예컨대 부동산 등기세금이라든지, 법률적인 절차 같은 질문은 네이버를 이용하긴 하지만, 그 외에 대부분의 지식 갈증은 구글에서 해결하는 편이다. 


(구글은 정보 검색도 짱짱맨이지만, 세계적으로 Gmail로 대표되는 이메일 계정에서도 독보적인 존재이다.)


모두가 알고 있듯이 구글은 영문검색에서 탁월한 성능을 발휘한다. 구글의 검색엔진 개념자체가 서지 정보 인용(논문을 쓸 때 제일 뒤에 선행 연구들을 언급하는 것처럼)으로 출발했기 때문에, 가장 유의성 높은 정보가 상위에 노출된다. 예컨대, 누군가가 쓴 어떤 자료가 다른 사람에게 많이 인용되면 인용될수록 검색에서 가장 상위에 노출된다는 이야기이다.


어떤 방식으로 인용을 detect하고, 어떤 알고리즘을 이용하는지는 매번 기준이 조금씩 바뀌기 때문에 정확히 알 수도 없지만,  구글 검색에서는 일반적으로 좋은 자료이면, 시간이 지날수록 그 정보의 영향력은 커지는 경향이 있다. 반대로 이야기하면, 결과적으로 구글은 아무리 좋은 글이라고 해도, 일정 수준의 인용이 없는 초반에는 검색에 노출되지 않는 경향이 있다. 이와는 반대로 네이버는 현재 자료에 더 가중치를 주는 경향이 있는 듯하다. 


네이버가 정보성을 배제하는 것은 아니지만, 글의 시의성, 뉴스성에 조금 더 포커스를 맞추고 있다고 평가한다면, 구글은 정보성에 훨씬 더 초점을 맞추어 검색을 제공하는 것 같다는 느낌이 든다. 실제로, 구글의 글은 상위 글 몆개만 읽어보아도 지식의 갈증이 해결되는 경우가 많은 반면, 네이버는 이곳 저곳 클릭하면서 읽어야만 정보의 갈증이 해결된다.


이는 검색 엔진의 철학에 기반하는 것 같은데, 네이버나 다음과 같은 포털은 뉴스의 가판대 같은 역할을 하기에, 시의성있는 정보가 있어야만 "사람을 끌 수 있다"는 관점에서 정보를 다루는 것 같다. 매일 매일 새로운 것을 노출하고, 최신의 정보를 제공함으로써 독자들의 관심을 끄는 전략인 셈이다. 그에 반해, 구글은 도서관과 같은 관점에서 정보를 제공하고자 하는 철학을 가지고 있는 것 같다. 뉴스성은 없지만, 누군가가 필요한 정보를 객관적으로 제공하는 것으로 독자들의 관심을 끄는 전략. 처음에는 재미가 없을 수 있지만, 정보성이라는 reputation이 쌓인 이후에는 강력한 파워를 갖는 검색 엔진이 그들의 전략인 것 같고, 구글은 벌써 검색 엔진으로reputation을 쌓고도 남았다. 


(구글에서 의과학자를 키워드로 검색하면 우리가 제일 위에 뜬다.)


얼마전부터 우리 블로그가 의과학자로는 많은 reputation을 얻었는지, 다행히도 키워드 "의과학자"를 구글에서 검색하면 우리 블로그가 최상위에 노출된다. 기존에는 없었던 일인데, 무슨 일이든 꾸준히 하면 성과가 있다는 것을 확인한 사례라서 개인적으로 감회가 새롭다. 아직까지도 가야할 산과 넘어야할 고개가 많기는 하지만, 자주쓰는 검색엔진에서 주제와 관련한 키워드로 상위에 오르는 것은 아주 재미있고 유쾌한 경험인 것만큼은 사실이다. 


하지만, 안타깝게도 구글에서 들어오는 검색 유입은 생각보다 저조한 편이다. 전체 대비 15% 내외인 것으로 관찰되는데, 이는 한국 검색 엔진에서 구글의 위상을 유추할 수 있는 간접적 자료라 할 수 있겠다. (그래도 블로그 내 순위로 따지자면 다음보다 더 높은 2위 유입.) 개인적으로 결론내리기에는 구글은 네이버와는 달리, 완벽하게 "한글"이라는 언어의 키워드를 접수하고 있지 못한 것 같다.


검색에서 가장 핵심적인 것은 글에 이용된 제목, 내용,문장, 단어 등을 정확하게 파악해서 쪼갠 이후, 단위 키워드를 기준으로 정보를 필요로 하는 사람에게 적절히 분석해서 제공하는 것인데, 이 때 이용된 단어, 제목, 내용 등에 들어간 어구의 맥락을 그 나라의 언어 입장에서 제대로 파악하지 못하면, 전혀 엉뚱한 검색 결과를 제공할 수 있게 된다. 엉뚱하다기보다는 최선의 결과를 보여주지 못하게 되고, 상대적으로 좋은 정보를 누락하게 될 가능성이 커지게 된다. 예컨대 아래와 같은 "의 과학자"가 그 예이다.


(구글에서 의과학자를 검색하면, 다양한 나라"의 과학자"가 등장한다.)


현재, 우리 블로그의 글이 아직 구글에 많이 노출되지 않아서 그런 것도 있고, 의과학자라는 용어의 대중성이 이제 막 시작단계라는 점도 있지만, 개별 글 자체의 인용도가 아직까지 구글의 검색엔진에는 강력하게 반영되지 않았다고 결론을 내리고 있다. 아울러, 구글을 이용하는 사용자들이 상대적으로 적다는 점도 구글 유입이 적은 이유 중 하나라고 보고 있다. 하지만, 구글의 특성상 지속적으로 정보성이 있는 글을 제공하면, 누적된 reputation이 블로그 인지도를 높여주는 역할을 한다고 생각하고 꾸준히 노력할 셈이다.


4. 페이스북 facebook.com 그리고 트위터 twitter.com : 정보의 휘발성[각주:1]이란 바로 이런 것!!!


생각보다 많은 양의 유입이 가끔씩 페이스북을 통해서 들어온다. 필자는 트위터를 하고 있지는 않지만, 트위터에서 들어오는 유입량도 가끔 있다. 하지만, 특징적인 것은, 이들의 유입은 4일을 채 가지 못한다는 사실이다. 갑작스럽게 유입이 확 왔다가, 갑자기 확 빠져 버린다. 마치 바닷가에서 밀물처럼 들어왔다가 썰물처럼 나가는 것처럼.... 블로그 유입에서 갑작스러운 surge[각주:2]가 있으면, 어김없이 우리 블로그의 글을 파워블로거 혹은 네트워크상에서 영향력있는 누군가가 글을 인용한 것을 알 수 있었다. 


(우리 블로그로 한꺼번에 유입되는 페이스북, 트위터)


페이스북 유입을 보면서 두가지를 깨달았는데, 하나는 인터넷 정보도 휘발성이 있다는 사실이고, 또 하나는 파워 유저의 영향력은 아주 상당하다는 사실이다.


페이스북에서 이용되는 정보는 3-5일 정도의 휘발성을 가지고 있다가 소멸하는 경향을 띠는 것 같다. 대략 3일 정도 있다가 유입수가 정상화되는 것을 보면 이를 유추할 수 있다. 이런 패턴을 보면, 페이스북과 트위터는 정보의 시의성에 완벽한 초점을 두고 있는 것 같다. 이들 소셜네트워크 사이트(SNS)는 정보성도 중요하지만, 누군가에게 회자되고 있는 정보가 가장 중요한 정보라는 핵심 명제에 따라 정보를 다루는 듯한 경향이 강하다. 


정말 언급되고 회자되는 그 당시에만 딱 들어오고, 그 이후에는 전혀 유입이 없다. 따라서, 네이버, 구글, 다음과 같이 DB화되어서 지속적으로 정보를 제공하는 패턴으로는 기록을 거의 남기지 않음을 알 수 있다. 이는 역설적으로 급하게 필요한 정보를 찾기 위해서는 페이스북이나 트위터를 이용할 필요가 없다는 것이기도 하다. 당연하다. 누가 정보를 찾기 위해서 페이스북이나 트위터를 하겠는가!  페이스북도 이것의 장점(정보의 휘발성)을 깨닫고, 끊임없이 짧은 시기의 광고 상품을 만들고 있는 것 같다. 주기가 짧으면, 짧은 만큼 지속적으로 광고를 유치할 수 있으니깐, 페이스북 입장에서도 정보의 휘발성은 전혀 나쁜 것이 아니고 오히려 이 것을 지속적으로 권장하면서 광고에 적합한 환경을 만들어 가는 느낌이 들 정도다. 


(facebook만 생각하면, Zuckerberg 주커버그가 생각난다)


아울러, SNS 서비스에서 파워 유저는 상당한 영향력을 가진다는 사실이다. 이른바 페북 친구가 많거나, 트위터 팔로워가 많은 사람이 한번 리트윗을 날리면, 적어도 500명 이상의 유입이 생기는 것 같다. 그리고 또 다른 사람이 더 리트윗을 하면 기하급수적인 유입이 생긴다. 이는 네이버나 다음에서 이슈가 되었을 때 유입되는 양보다는 적지만, 불특정 다수가 아니라, 그 분야에 연관된 사람에 트윗을 날린다는 사실을 감안한다면, 그 파워는 포털보다 더 강한 느낌이 든다. 무언가 공유를 한다는 개념에서 접근하는 페이스북은 글이 한 번 올라오면, 3일 정도만 친구들에게 노출되는 것 같다. 이로 인해서 3일의 기한이 정보의 유통기한이 되는 것 같아 씁쓸하긴 하지만, 파워 유저가 이런 것이구나...를 많이 깨닫게 된다. 


개인적으로 페이스북을 하긴 하지만, 정보 생산자라기 보다는 다른 사람들 글을 소비하는 소비자 입장이 강한 것 같고(블로그 글을 옮기긴 한다), 페북 친구도 그리 많지 않다. 트위터는 예전에 오픈만 하고 사실상 방치 상태이다. 가끔씩 페이스북과 트위터를 아주 잘 꾸려나가는 분들을 보는데, 정말 대단하다는 생각을 하고 있지만, 과연 모든 것을 시시콜콜하게 이야기하는 것이 좋을까 라는 의문은 항상 가진다. 이 가치에 대해서는 이론이 있을 수 있고, 정보가 휘발성을 가지긴 하지만, 단시간에 주는 강력한 영향력이라는 측면에서는 SNS 서비스는 분명히 점수를 줘야하겠다. 가끔씩 이런 현상을 볼 때마다, 15 minutes of fame[각주:3]이 생각나는 것은 나만의 착각일까?


그런 면에서 페이스북은 뉴스 가판대나 도서관이라기보다는 소규모 친목 모임같은 성격을 가진다. 그리고 파워 유저는 모임 회장같은... 따라서, 이런 곳에서는 소문이 퍼져나가기 쉬운 구조이기에 언행을 조심하는 것이 좋을 것 같다는 것이 내 개인적인 지론이긴 하다. 


(Facebook의 빨간색 알림 버튼을 가끔 기대하기도 한다 ^^)


우리 팀블로그에서 페이스북은 유입이라는 측면에서 본다면, 가끔씩 빵빵 터지는, 혹은 여름에만 가끔 먹는 별미 콩국수 같은 느낌이다. 그다지 신경을 쓰지는 않지만, 많이 유입되면 기분이 좋은, 그런 느낌. 그럼에도 불구하고 많은 수의 사람이 유입되고, 페이스북에서 회자되는 글의 패턴이 있는데, 그건 바로, 비교적 잘 쓴 글만이 선택되고, 그 글들만이 사람들에게 공유된다는 사실이다. (이 것이 조금 더 글을 쓰는데 신중하고, 신경을 쓰는 이유가 되기도 한다.)


다시 말하면, 페이스북은 사람들이 자신의 주관에 따라 "선택"한 정보를 기준으로 노출한다는 사실이다. 이는 페이스북이 "구글의 검색 알고리즘"과는 전혀 다른 철학을 가지고 서비스를 한다는 것을 의미한다. 즉, 글이 아주 좋다면, 사람들이 당연히 그 글을 읽고 공유하고 싶은 생각이 들 것이다. 페이스북에서는 그런 글을 누군가가 발견했을 때, 공유할 수 있는 서비스가 가능하게끔 플랫폼을 제공하는 역할인 셈이다. 누군가가 읽은 글이 의미가 있거나, 그 글을 공유한 사람을 좋아한다(?)면 "공유 혹은 좋아요"를 누를 것이다. 그럼 페이스북은 그 공유나, 좋아요 패턴만 분석하면 어느 정보가 중요한지, 아닌지를 쉽게 판가름할 수 있다.


여기서 핵심은, 구글과는 달리 중요하거나, 정보성있는 글을 페이스북이 기계적으로 굳이 감지할 이유가 없는 것이다. "좋아요나 공유" 정보량만 판단하면, 그 글의 중요성을 간접적으로 알 수 있다. 즉, 페이스북은 사람들이 무언가를 읽고 좋아보이면 공유를 통해, 페이스북에게 알릴 것이라는 가정을 깔아놓고 서비스를 제공한다. 이 부분에 페이스북의 스마트함이 있는 것 같다. 하지만 반대로, 아무런 의미가 없고 허접한(?) 글이지만, 연예인이나 팔로워가 많다는 이유로도 전파가 많이 되는 기형적인 글이 양산될 가능성도 있다. (글이 좋아서 누른 "좋아요"와 그 사람이 좋아서 누르는 "좋아요"를 컴퓨터는 구분할 수 없으니깐 - 물론 DB가 쌓이면 그 것조차도 충분히 가려낼 수 있을 것이다.). 


구글이 기계적으로 정보를 취합하고, "인용도"로 좋은 글을 취사선택하는 것과는 달리, 페이스북은 좋은 글을 찾아 내는 부분을 유저에게 아웃소싱하는 셈이다. 물론 유저 모르게. ^^ 그리고 결과적으로 그 정보는 처음 그 글을 읽은 사람이 느끼는 것처럼, 기계와는 달리, 사람의 기준에서 의도치 않게 자동적으로 읽을만한 가치가 있는 글만 남게 되는 것이다. 물론, 휘발성이 있긴 하지만. 


5. 마무리.


사람들은 모두 똑같이 24시간을 살고, 그 시간동안 다양한 경험을 한다. 그리고 그 경험들은 소중하고, 그 사람들과 이야기를 하다보면, 그 사람의 경험을 간접적으로 알게 된다. 추가로, 내가 접한 경험은 그 자체로 노하우가 되는데, 어느 순간부터 사람은 "망각"이라는 것을 하게 되기에, 특정 시점에 정리를 해 두지 않으면, 정보로서의 가치가 떨어질 수 있다. 그래서 사람들이 책을 쓰는 것이고, 글을 쓰는 것이고, 기록을 남기는 것이다.


검색 서비스들은 필요한 정보를 찾고자 하는 사람에게 타인이 문자로 기록된 정보들을 보여주는 서비스이다. 각 검색 서비스마다 검색패턴은 다르지만, 그런 정보를 제공하는 대가로 광고를 유치하고 돈을 번다. 그리고 그들이 버는 돈은 상상을 초월한다. 혹자는 이를 가지고 "봉이 김선달"식 사업이라고 매도하기도 한다. 정작 정보를 생산하고 있지 않으면서, 정보를 생산하는 사람들만 이용한다고..


하지만, 만약 검색 서비스들이 존재하지 않았다면, 정보를 찾는데 아주 많은 시간이 필요했을 것이다. 인터넷의 발전은 정보량의 축적이 원동력이긴 하지만, 다양한 정보를 적절히 찾아내는 검색 서비스의 발전이 없었다면, 오늘날과 같은 인터넷 대중화는 불가능했을 것이다. 생각해보라. 인터넷이 없었던 중세 시대에도 도서관에는 많은 정보가 있었지만, 도서관에 접근하는 것도, 그리고 그 안에서 자신이 필요한 정보를 찾는 것도 아주 어려웠다.


나는 소위 말하는 IT 가이도 아니고, 블로그를 전업으로 하는 사람도 아니다. 우리 "블로그 유입"을 비교 분석하면서 다양한 사이트(네이버, 다음, 구글, 페이스북, 트위터 등)에 대한 생각을 정리해 두고, 이 글 역시, 검색 서비스에 기록될 수 있는 정보의 하나로 저장해 두려고 한다. 검색 서비스가 없었더라면, 우리 블로그를 찾기 위해서 웹 주소에 mdphd.kr을 클릭해야만 글을 볼 수 있었을 것이다. 각기 다른 특징과 유입 패턴이 있지만, 블로그를 운영하고, 온라인에 글을 쓰고 정보를 공유하는 사람으로, 모든 검색 서비스들을 운영하는 사람들의 노고에 큰 박수를 보내면서 글을 마치고자 한다.


  1. 정보의 휘발성 - 내가 조합한 용어이긴 한데, 쓰고 있는 용어인지도 모르겠다. 블로그를 하면서 마치 실험실에 뚜껑을 열어두고 한참 지나면, 증발하는 에탄올처럼, 갑자기 들어왔다가 사라지는 유입을 보고, 생각한 용어이다. [본문으로]
  2. surge : 급등 - 의과학에서 호르몬 등의 이상 급등에서 자주 쓰는 용어 [본문으로]
  3. 앤디 워홀이 한 말로, 누구나 한 번 쯤은 15분 정도 동안 스타나 유명인이 될 수 있다는 것으로, 미디어의 짧은 생명성을 의미할 때 쓰인다. 자세하게 참고할 분은 http://en.wikipedia.org/wiki/15_minutes_of_fame 을 찾아 가면 자세히 알 수 있다. [본문으로]

+ Recent posts