Yeti는 설인 또는 눈사람이라는 뜻의 네팔 단어입니다. 일본 네이버 http://www.naver.jp/ 검색크롤러의 명칭이죠. 첫눈이 연상되는 로봇이네요^^ 다들 아실겁니다. 사실, 원래 있던 네이버봇은 지나치게 자주 크롤링을 해서 일본 인터넷 업계에서 악명이 높았습니다. 하지만 Yeti는 좀 나아졌다고 합니다.

http://itviewpoint.com/44605
http://itviewpoint.com/45306

초기 네이버 봇 http://ja.wikipedia.org/wiki/NaverBot - 글 내용을 보시면 악명 그 자체..
위 링크에서 당시 기사를 확인하실 수 있습니다.


同検索エンジンの2代目のクローラーとして、2007年に運用が開始された。国際標準規格である「robots.txt[1]」および「METAタグ」に対応している。初代のNaverBotとは構造自体が異なり、ウェブ上の情報を効率よく収集できるよう設計されているとされる。
동검색 엔진의 2대째의 크롤러로서 2007년에 운용이 개시되었다. 국제표준규격인「robots.txt[1]」 및「META 태그」에 대응하고 있다. 초대의 NaverBot와는 구조 자체가 달라, 웹상의 정보를 효율적으로 수집할 수 있도록 설계되고 있다고 여겨진다.
http://ja.wikipedia.org/wiki/Yetibot

Yeti의 공식 정보에 대해서는 아래 자료를 더 참고하시죠.

http://help.naver.com/robots/yetibot.html

ロボットは、どのくらいの頻度でアクセスするのですか?
로봇은, 어느 정도의 빈도로 액세스 합니까?

一般的なウェブサイトの場合、どんなに早くてもアクセスには数秒の間隔を開けることを原則としています。過剰なアクセスはサーバに負荷を与えてしまう危険性があるからです。
일반적인 웹 사이트의 경우, 아무리 빠르고도 액세스에는 몇 초의 간격을 여는 것을 원칙으로 하고 있습니다. 과잉인 액세스는 서버에 부하를 주어 버리는 위험성이 있기 때문입니다.

しかしながら、ネットワークによる問題やサーバの問題などで、短期的にアクセスが集中してしまうこともあります。
그렇지만, 네트워크에 의한 문제나 서버의 문제등에서, 단기적으로 액세스가 집중해 버리기도 합니다.

万が一、弊社ロボットのアクセス頻度について、ご指摘・お困りの点がありましたらyetibot@naver.comまでご連絡ください。
만일, 폐사 로봇의 액세스 빈도에 대해서, 지적·난처하신 점이 있으시면 yetibot@naver.com까지 연락해 주십시오.

현재 한국에선 네이버봇도 함께 운영하고 있습니다.
http://help.naver.com/customer_webtxt_01.jsp


일본에서 활동중인 검색로봇 세 가지
http://neojjang.egloos.com/1844043


참고로 일본 네이버는 여전히 채용 중 ㅎㅎ
http://rikunabi-next.yahoo.co.jp/rnc/docs/cp_s01800.jsp?rqmt_id=0006303723
http://www.itviewpoint.com/64807


**** 일본 현지의 반응들

아래는 일본에서의 반응입니다. 네이버봇보다는 좀 나은 것 같은데 여전히 신통치는 않네요.

最近サーバが少し重かったので調べてみると
최근 서버가 조금 무거웠기 때문에 조사해 보면

Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt daily and follow it)
Yeti/0. 01(nhn/1 noon, yetibot@naver.com, check robots.txt daily and follow it)

という UserAgent が激しくアクセスしていました。このボットはあまり行儀のよいボットではないようですのでブロックすることにしました。
그렇다고 하는 UserAgent가 격렬하게 액세스 하고 있었습니다. 이 보트는 너무 예의범절이 좋은 보트는 아닌 것 같므로 블록 하기로 했습니다.

http://www.syuhari.jp/blog/archives/197


世の中いくつクローラーがいるのか…とりあえずNaverだけはIPごと弾いてます。Navar(・∀・)カエレ!
세상 몇크롤러가 있는 것인가…우선 Naver만은 IP 마다 연주하고 있습니다. Navar(·∀·) 카에레!

http://www.tailtame.com/private/memo/bot.html


webalizerを見ていたら、見慣れないUSERAGENTからの大量のアクセスがあった。
webalizer를 보고 있으면, 낯선 USERAGENT로부터의 대량의 액세스가 있었다.

Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt dai...
Yeti/0. 01 (nhn/1 noon, yetibot@naver.com, check robots.txt dai...

とある。どうやら韓国のnaver.comのロボットらしい。
어떤. 아무래도 한국의 naver.com의 로봇답다.
韓国のサーチエンジンにインデックスされてもメリットはないし、サーバーの負荷になるだけなのでアクセスを拒否しておきました。
한국의 써치엔진에 인덱스 되어도 메리트는 없고, 서버의 부하가 될 뿐(만큼)이므로 액세스를 거부해 두었습니다.

ちなみに「Yeti/0.01」のほかに「Yeti/0.01i」というロボットもきていました。こっちは携帯コンテンツ用かな?
덧붙여서「Yeti/0. 01」외에「Yeti/0. 01 i 」라고 하는 로봇도 오고 있었습니다. 여기는 휴대 컨텐츠용일까?

http://kawama.jp/archives/2007/09/yeti001.html


**** Yeti봇의 활동 기록 예시들

Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt daily and follows it)
1回日本に上陸しましたけど、撤退しましたよね。
1회 일본에 상륙했습니다만, 철퇴했군요.
http://zerosp.com/mt/archives/bot-crawler.php


2009/1/6(Tue) 12:41 - 61.247.222.55 - Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/
http://www5.airnet.ne.jp/wiz/acceread.html


管理人 > 61.247.222.54さん、おいでやすぅ。 Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/)(1/21(水)0:58 61.247.222.54)
http://www6.plala.or.jp/subaru/botchat/


Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/) 7  12.9 %
http://www.torworld.com/analyze.cgi?mode=more&os=Unknown

naver.jpg

Share
이 글과 가장 관련이 있는 글을 자동으로 추천해 드립니다
profile

안녕하세요. ITViewpoint 스타터이자 공동 에디터 '서명덕 기자' 입니다. 닉네임은 떡이떡이 입니다.

 

이 곳은 블로그미디어이며, 개인 공간은 http://itviewpoint.thoth.kr/ 을 메인으로 옮겨 갈 생각입니다.


개인적인 목적이라면 콘텐츠 막펌을 전면 허용 http://itviewpoint.com/blog/54971 합니다. 다만 비상업적인 용도에 한하며, 상업적인 용도라면 별도로 문의하세요. RSS http://itviewpoint.com/blog/rss 는 전문 제공합니다.