encyclopedia −用語集ー

・crawler (クローラー)
 検索ロボット
ウェブ上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムである。
ボット(Bot)」、「スパイダー」、「ロボット」などとも呼ばれる。

主に検索エンジンのデータベース、インデックス作成に用いられているほか、統計調査などの目的にも利用される。
近年では電子メールアドレス収集業者などもクローラを利用して、スパムの送信効率を上げている。

一般にクローラは、既知のHTML文書の新しいコピーを要求し、
文書中に含まれるリンクをたどり別の文書を収集するという動作を繰り返す。
新しい文書を見つけた場合はデータベースに登録する。
また、既知のファイルが存在しないことを検出した場合はデータベースから削除する。

サイトの履歴を解析プログラムで見ると、アクセスの半数近くがクローラーによるものだったりする。



ツイートする

参考サイト:フリー百科事典 ウィキペディア



BACK

TOP

にほんブログ村 PC家電ブログ 自作PCへ
にほんブログ村

blogram投票ボタン