「Google サイトマップ」 → 「Google ウェブマスター ツール」

いつのまにか、なんか改名しているっぽい。
まぁ、ヘルプはこんなんだけど。

Google サイトマップでは、最も重要なページやページの更新日など、サイト内のすべてのページに関する情報を Google に送信して、クロールの効率を高め、検索結果に最新のコンテンツを簡単に反映できます。

Google サイトマップ (Beta)

で、久々にログインして様子を見てみたら「登録しているサイトマップ(・A・)イクナイ」って出てる。
しょうがないので、サイトマップを作り直し。

まず、wget でサイト全体を取得。

wget -D www.hoge.domain -T 5 -nc -r -np -l 0 -k -x http://www.hoge.domain/

? とか % とかは @ に置換されたファイル名になってるっぽい。

次に、Linux の tree コマンドで ディレクトリ以下のファイすべてのフルパスを取得。

tree -f -i > tree.txt

フルパスのリストから http:// ではじまるURL のリストを作って、UTF-8 のテキストファイルに保存して Webmaster Tools に登録すればOK.

以前にも、同じことしてるんじゃないかと思ったら、やっぱりしてた。
Ref. NI-Lab.'s ヅラッシュドット: テキストファイル形式のサイトマップを作成して Google Sitemaps に登録する

Ref. Google ウェブマスター ツール

追記: 2006-09-22

20万件のURLを記述したサイトマップを使ったらエラーが出た(^_^;
Google ウェブマスターツールのメッセージは、こんな感じ。

URL の制限数超過
サイトマップに含まれる URL の数が制限を越えています。 1 つのサイトマップに含まれる URL が 50,000 件以下になるよう、複数のサイトマップを作成し、すべてのサイトマップを再送信してください。

URLは5万件以内で。


コメント

NI-Lab.たちが、広いフルなどを反映するの?

tags: zlashdot Internet

Posted by NI-Lab. (@nilab)