技術関連のガイドライン・記事一覧
HTML構造を確認
Lynx などのテキスト ブラウザを使用してサイトを確認する。ほとんどの検索エンジン スパイダーは、クロール時に Lynx に表示される形式で各サイトを認識します。 テキスト ブラウザで、Javascript、cookie、セッション ID、フレーム、DHTML、Flash などの特殊な機能を使用して作成されたサイトの一部が表示されない場合は、検索エンジンスパイダーがサイトをクロールするときに問題が発生する可能性があります。
動的URLに注意2
セッション ID やサイト内のパスを追跡する引数がなくても、検索ロボットがサイトをクロールできるようにする。 これらのテクニックは個々のユーザーの動きを追跡する場合に便利ですが、ロボットがアクセスするパターンとはまったく異なります。 これらのテクニックを使用すると、一見異なっているようで実際は同じページにリンクしている URL をロボットが排除できず、そのサイトのインデックスが不完全なものになる可能性があります。
サーバーマスター宛注意事項
ウェブ サーバーが If-Modified-Since HTTP ヘッダーに対応していることを確認する。 この機能を使用すると、Google が前回サイトをクロールした後にコンテンツが変更されたかどうかを、サーバーからクローラに通知し、 帯域幅や負荷を軽減できます。
クローラ防止の方法
ウェブ サーバーの robots.txt ファイルを活用する。 このファイルでは、クロールを実行するディレクトリと実行しないディレクトリを指定できます。 誤って Googlebot クローラがブロックされることのないよう、このファイルにサイトの最新の状態が反映されていることを確認してください。 サイトへのロボットのアクセスを制御する方法については、次の URL (英語) をご覧ください。 http://www.robotstxt.org/wc/faq.html
コンテンツ管理システムについて
コンテンツ管理システムを導入する場合は、検索エンジン スパイダーがサイトをクロールできるように、システムからコンテンツをエクスポートできることを確認する。
"&id=" パラメータは使わない
URL で "&id=" パラメータを使用しない。このパラメータを含むページは Google のインデックスに登録されません。
>>トップページのメニューへ
>>トップページへ
現在相互リンクを募集しています。
当サイトは全ページリンクフリーです。なにかありましたらこちらへどうぞ。
問い合わせフォーム
© 2006 affi-suke.All rights reserved.