
'서치데이 2008'서 NHN-다음-야후코리아-나루닷컴 책임자 참여
24일 삼성동 코엑스에서 열린 ‘서치데이 2008’ 기조연설 직후 진행된 공개 토크쇼에는 김병학 NHN 검색개발센터장, 손경완 다음 검색본부장, 박수정 온네트(나루닷컴) 이사, 김봉균 야후코리아 이사가 참여해 대본 없이 약 1시간 동안 한국의 검색엔진 시장에 대해 자유 토론했다. 전병국 검색엔진마스터 대표는 사회자로 참여했다.
다음은 주요 대화 내용 중 검색엔진 관련 부분을 줄여 정리한 것이다.전병국 - 검색이 일상적인 것이 됐다. 직접적으로 느끼시는지.
김병학(NHN) - 특이한 쿼리들이 많이 올라온다. 대부분 방송 등과 관련 됐을 거라고 본다. 아침 10시가 되면 집에서 아주머니들이 토크쇼를 보며 등장 인물이 항상 검색어에 뜬다. 생활과 밀접한 관련이 있다는 의미다.
전병국 - 우리나라 검색 시장 독특하다. 아시아권과도 차이가 있다. 직접 서비스들 총괄하면서 문화적인 특성이 다르다는 것을 느낀 적이 있나.
김봉균(야후코리아) - 저는 예전부터 말하길, 한국 검색시장은 외국과 다르지 않다. 좀 더 앞서 나갈 뿐이다고 했는데, 2~3년 전만 하더라도 외국에서 이런 얘길 하면 웃기지 말라고 했지만, 이제는 한국 내에서만 일어나는 검색 특징은 거의 없는 것 같다. 정도의 차이는 있지만 한국은 앞서 나가는 검색이다. 우리나라 사람들이 좁은 나라에 살면서 동기화되는 게 심해서 쿼리 분포를 보면 롱테일 보다는 톱티어에 집중되는 현상이 심하다.
손경완(다음) - 국가의 웹의 발전 역사에 영향을 많이 받는 것 같다. 미국의 경우 문화적으로도 다양하고, 웹 롱테일이 매우 풍부하다. 웹 검색이 당연히 발전할 수 밖에 없다. 중국은 웹이 크게 발전하지 못한 상황이지만, 싼 노동력 때문에 야후의 디렉토리 검색과 같은 형태가 발전하는 것 같다. 일본은 모바일 검색 상당히 발전하기 때문에 웹의 중요성이 상대적으로 부각되지 못했다. 야후의 디렉토리 검색이 시장 점유율 70%에 이른다. 한국은 특이한 곳인데, 웹 발전 과정을 보면 2000년까지는 야후 디렉토리 검색 주를 이뤘는데, 웹이 풍부하지 못해서 사용자들의 쿼리가 대부분 네비게이션 쿼리였다. 웹문서 검색을 굳이 할 필요가 없는 시점이었다. 구글 등 정보검색이 해외서 태동하는 2000년도의 경우, 한국의 다음 카페의 커뮤니티 서비스가 한국 문화적 서비스 잘 반영했다고 본다. 그 전에 있었던 홈페이지 수준의 서비스가 분화되다가 다음으로 넘어갔다. 포털이 생각지도 못했던 콘텐츠를 소유하게 됐다. 그 후 NHN이 매우 잘했다는 것이, 디비딕의 가능성을 높게 보고, 다음카페의 폐쇄성을 잘 잡아내 지식인 서비스를 내놨다.
전병국 - (다음에 근무하시는데) 직접적으로 폐쇄성이라고 이야기하시네요.
손병완(다음) - 폐쇄성이 있다. 회원 가입해야지 볼 수 있었고, 가페 접근 할 경로가 전혀 없었기 때문이다. NHN 지식인 서비스 런칭했는데, 즉답형 질문에 대해 답을 하는 플랫폼을 만들면서 콘텐츠 플랫폼을 소유하게 된 것이다. 콘텐츠 플랫폼을 소유한 뒤, 다른 콘텐츠 플랫폼 수요가 분화되니, 카페 이외에 뉴스, 영화, 음악 등 여러 가지 선택형 서비스 추가하면서 하나의 인터페이스에서 보여 주기 위해서는 통합 검색 방법 밖에 없었다고 본다. 어떻게 보면 웹의 생태계를 파괴했다고도 보지만, 어떻게 보면 우리나라 웹의 발전의 가속화시켰다는 의미를 같이 내포하고 있는 것 같다. 우리니라 웹의 발전 과정을 살펴보면 그렇게 특이한 건 없는 것 같다. 인터넷의 역사에 따라 어쩔 수 없지 않았나 싶다.
전병국 - 중요한 포인트로서, 웹과 서비스의 균형관계와 폐쇄성 등이 한국적인 검색에 밀접한 관련이 있는 것 같다. 우리나라 포털들이 검색이나 인터넷 환경을 만들고, 사람들의 스타일이 통합검색 스타일을 만들어 냈는지 많은 얘기가 필요하겠다. 대화를 바꿔서 포털들이 웹에 있는 것 보다 자기 내부 서비스에만 주로 관심을 가지고 있다는 비판에 대해서는 어떻게 생각하나.
박수정(온네트) - 글로벌 기업인 야후도, 토종 기업인 다음도 한국형 검색에 큰 차이가 없다고 하는데, 제가 볼 때는 분명히 큰 차이가 있다. 해외보다 한국 사람들은 더 많이 펌질을 하는 것 같다. 콘텐츠가 포털 내부에 같혀 있고, 카페나 지식인에 있지만 또 다른 콘텐츠들은 외부 블로그에 있다. 외부에 더 좋은 콘텐츠가 있을 수 있는데, 이런 것들을 발굴하고 보여주려는 노력이 적다. 포털들이 블로그에 스크랩을 더 쉽게 할 수 있도록 하기 위해 도구를 많이 제공했다.
전병국 - ‘원클릭 펌질 시스템’
박수정(온네트) - 이런 도구들을 많이 제공해서 차이가 있는 것 아닌가 싶다.
손경완(다음) - 포털 펌질은 우리나라의 사회 보편적인 특성이다. 실제로 글을 쓰는 교육을 어릴 때부터 받지 못해서 펌질을 통해 돌려보기에 대한 죄책감이 없다. 남들도 다 하는 일반적인 것이라고 생각한다. 그렇다고 다음의 입장에서 보면 외부 블로거와 내부 블로거의 차별을 둬서 외부 블로거에 대해 패널티를 주는 것은 없는 것 같다. 다만 뚜렷한 방법을 못 찾는 것이다.
전병국 - 차별이 없다는 것은 다음의 공식적인 말씀인가. NHN은 차별이 없으시죠?
김병학(NHN) - 우리의 경우 현재 외부 블로그는 따로 검색에 노출되도록 하고 있어서, 차별이 없다고는 할 수 없다. 조만간 해결하려고 한다. 실제로 외부 블로그에 대한 신뢰성이 없는 이유가, 내부에서는 철저히 통제할 수 있지만, 외부에 대해서는 믿을 수 없는 측면도 좀 있다. 또한 수집할 수 없는 데이터가 너무 많은 것 같다. 내부는 펌질 흐름을 모두 파악할 수 있지만, 외부 블로그는 RSS로 자료를 가져오는데, 그 자료만으로는 너무 적다. 이 사람이 어뷰저(검색을 망치는 스팸 콘텐츠)라고 판단하는 것은 너무 힘들다. 이런 사람들이 검색 퀄리티를 확 떨어뜨린다. 조만간 해결책 나올 것이다.
전병국 - 초창기에 다음 카페나 지식검색 등장했을 때 웹 데이터가 부실했다고 하는 게 설득력이 있다. 그러나 2008년 지금 상황을 봤을 때 여전히 포털들이 말하는 것처럼 웹이 부실한 상태인가. 지금도 검색할 만한 콘텐츠가 없다고 할 수 있겠는가. 블로그 등을 살펴보면 충분히 데이터가 있다고 보는데, 이미 굳어진 틀 자체가 활성화된 정보들이 충분히 발현될 수 없도록 하고 있다. 2008년 상황에서 웹의 데이터가 검색의 데이터베이스로서 역할은 어느 정도라고 할 수 있겠나.
김봉균(야후코리아) - 실제로 우리 회사의 경우 웹 검색이 검색결과 페이지 가치가 절반 정도 된다. 예를 들면 얼마 전 블로그 및 정보확산 관련 논문 검색을 해 보니 원본은 찾을 수 없고, 펌질을 한 블로그 등에서 발견할 수 있었다. 펌질을 하는 것이 한국 네티즌의 특성이라고 하는데, 너무 네티즌들을 매도하는 것 같다. 실제로 검색 사업자는 정보 유통에 대해 어느 정도 책임을 지는 업체다. 중복된 정보 중에서 원본을 찾아내는 역할을 해 줘야 왜곡된 정보 유통 환경을 바로잡을 수 있다. 웹에서는 8억 개 문서 가지고 있는데 절반도 못 하고 있다는 것은, 실제로 크롤링을 다 못하는 경우도 있고, 외국계 검색엔진도 한국화 하는 작업이 필요하다.
박수정(온네트) - 검색 쿼리의 30% 정도는 블로그로 유입되는 것이 아닌가 본다. 한국 네티즌들이 다양한 콘텐츠 생산하고 있다고 하는데, 포털들이 더 발전시킬 수 있는 방향으로 이끌어내지 못하는 게 아닌가. NHN이 지난해 2월에 퍼간 글은 뉴스에 더 가중치를 두고, 블로그에서는 원본 데이터가 상위 랭크되도록 공식화 했다. 1년이 지난 상황에서 여전히 시간이 더 필요하다고 한다. 그런데 검색 결과 내에 원본과 퍼간 글이 같이 나오는데, 네이버 공식 블로그 자료보다 퍼간 글이 더 상위에 나오는 경우까지 있었다. 더 좋은 콘텐츠를 만들어 내면 포털뿐만 아니라 블로거들도 수익을 내는 에코시스템이 필요하다.
전병국 - 저도 글을 쓰면 제 글의 반응을 판단하는 기준으로 얼마나 많이 퍼갔는지 확인해 본다. 펌질에 대한 필터링을 못하는 원인 중 하나가 통합검색이 아니겠는가. 구조적인 문제가 문제 해결을 막고 있지 않나.
김봉균(야후코리아) - 기술적으로 막을 수 있을텐데, 사업자 측면에서 우선 순위가 떨어진다고 보는 것 같다.
김병학(NHN) - 막고 있긴 한데, 실제로 사용자들도 막고 있다는 걸 안다. 그래서 또 다른 새로운 방법으로 펌질을 한다. 펌질이나 스팸을 막는 방법들이 고도화되고 있고 대처를 하고 있지만 항상 그런 문제가 발생한다. 그 관점에서 펌글이 자동으로 완전하게 걸러지려면 많은 노력이 필요하다. 실제로 우리도 작업을 진행하고 있는데, 사용자들도 계속 변한다.
전병국 - 펌질이라는 구조가 생산성으로 보면 안좋은 구조다. 내 글을 퍼가서 카페 등에 올리는 경우가 적지 않다.
김병학(NHN) - 블로그나 지식인에 비해 웹검색에 신경을 못 쓰고 있다. 한국의 웹검색 20억개 문서 중 긁어 올 수 있는 것이 10억 개 정도다. 데이터가 점점 풍부해 지는데, 사용자들이 답을 빨리 받고 싶어 하는 구조 때문에 웹이 늘고 있는 것 같다.
정리 = ITViewpoint.com 떡이떡이
소제목을 '만담'이라고 다셔서, 뭔가 익살스럽게 이야기가 오간걸까 하는 느낌이 살짝 들었는데. 한번 동영상 집에 가서 봐야겠네요 :$