XHTML/CSS・トップ | HP編・目次

●ロボット型検索エンジンとメタタグ

 検索エンジンはサーチエンジンとも呼ばれ、ディレクトリ(カテゴリ)型検索サービス、ロボット型検索サービスに大別されますが、現在は二つを併せた複合型が主流となっています。また、ロボット型検索エンジンはWebページの情報を収集するスパイダーまたはクローラーと呼ばれるプログラムを使って、ウェブを自動巡回させています。会員制でパスワード認証を設定しているサイト以外にもページ情報を収集されたくない場合、してもらいたい場合もあるでしょう。ここでは検索ロボットへのページ情報収集(ページ検索)の許可、拒否をチューニングするメタタグを中心に解説します。

 メタタグはHTMLファイルの<head>〜</head>間に記載しますが、title要素(<title>〜</title>)などで日本語が現れる部分よりも前に配置します。ほかのメタタグ(または要素内容を含めたメタ要素)と並べて配置するか、メタタグの一番最初に配置しても良いでしょう。以下に代表的なまたは実用的な検索ロボットと関係のあるメタタグを記載します。


<meta name="keywords" content="キーワード,キーワード,キーワード">

 ↑ホームページと関係のあるキーワードを半角のカンマ(,)で区切り、複数入力します。本来、アクセスアップ目的の検索キーワード用ですが、現在のロボットエンジンは高性能で、キーワード設定(挿入)とは無関係にページ情報を収集します。ただし、価値の薄い(アクセスのない)ページは無視される傾向にあるようです。

<meta name="description" content="サイトの紹介文">

 ↑通常はサイトの紹介文を記載します。または検索結果として表示されるコメントを記載します。内容がそのまま掲載されることもありますので簡素に書きます。30字〜50字以内が目安ですが、検索エンジン、リンク集によって制限文字数がさまざまです。意外と重要なのでトップページに記載しておくと良いでしょう。


■検索ロボット用メタタグ↓

<meta name="robots" content="index, follow">

 ↑ロボットが訪れているページ情報とリンクされている全てのページの検索を許可します。なにも指定していない場合はこの設定になっています。

<meta name="robots" content="index, nofollow">

 ↑ロボットが訪れているページ情報のみ許可し、そのページからのリンク情報は拒否します。必要時、トップページに配置すると便利でしょう。

<meta name="robots" content="noindex, follow">

 ↑ロボットが訪れたページ情報は収集しませんが、ページ内のリンク先は巡回します。

<meta name="robots" content="noindex, nofollow">

 ↑ロボットが訪れているページ情報、リンク先情報の検索のすべてを拒否します。下の"none"と同じですが、通常はこちらを指定します。

<meta name="robots" content="none">

 ↑ロボットが訪れているページ情報、リンク先情報の検索のすべてを拒否します。(none=noindex+nofollow)


■そのほか↓

<meta name="robots" content="noimageindex">

 ↑ロボットが訪れているページ内の画像が検索対象となるのを拒否します。

<meta name="robots" content="noimageclick">

 ↑ロボットが訪れているページ内の画像への直接リンクを拒否します。

<meta name="GOOGLEBOT" content="noindex, nofollow">

 ↑Googleロボットエンジンのみページ情報、リンク先情報収集のすべてを拒否します。このようにGoogleの検索エンジンにインデックスのMETAタグをチューニングしたい場合は、"robots"の代わりに"GOOGLEBOT"とします。ただし、ほかの検索エンジンに対しては有効です。


■まとめ↓

 一度、検索結果に反映されたウェブページに拒否関係のメタタグを貼り付けてもしばらくは検索結果に表示され続けます。少なくても即効性はないと思ったほうが良いでしょう。また、許可といってもメタタグを貼り付ければ無条件に検索ロボットに登録されるわけでもありません。

■関連ページ

XHTML/CSS・目次 | HP編・目次

Copyright (C) 2005 http://www.xml.vc/