HTML-METAタグ



HTML METAタグとは

METAタグは、ロボット型検索エンジンにおいて「クローラ」と呼ばれるプログラムにWEBサイトの情報を拾わせるためのHTML記述情報です。

WEBコンテンツの制作者やキーワード等の情報をname属性で定義して、 content属性でその値を指定します。

METAタグはページ内容の説明やキーワード、ファイル情報などを記載しますが、直接ブラウザに表示されるわけではありません。


クローラ (Crawler)とは

クローラ (Crawler) は、ネットワーク上を巡回し、WEBサイトコンテンツを周期的に取得し、自動的にデータベース化するプログラムです。

発見したページのHTML文書の中からMETA情報やキーワードを拾い集め、URLを検索ページに反映させます。

クローラは「ボット(Bot)」、「スパイダー(Spider)」、「ロボット」などとも呼ばれます。


METAタグの記述

<meta>タグは<head>~</head>の中に記述します。

meta要素の指定には、name属性、http-equiv属性、charset属性のいずれか指定します。

また、name属性、http-equiv属性を指定する際にはcontent属性を記述し、メタデータの定義と内容を関連付けます。


name属性 メタデータの名前を指定
http-equiv属性 プラグマ指示子を指定
content属性 メタデータの値などを指定
charset属性 HTML文書の文字エンコーディングを指定

プラグマ指示子について

「http-equiv属性」を指定すると、そのmeta要素はプラグマ指示子(pragma directive)となります。

プラグマ指示子とは「実行命令の指示」を意味し、エージェント(ブラウザ)に対して文書の「状態や処理動作」を指示する役割があります。

http-equiv属性の値には、以下の4つのキーワードを指定することができます。


content-language コンテンツ言語の指定
content-type ファイルタイプや文字エンコーディングの指定
default-style デフォルトスタイルの指定
refresh リダイレクト・再読み込みの指定


主要METAタグ

利用頻度が高いものについて以下に記載します。


作者情報

文書の作者を表記します。

<meta name="author" content="capm-network">

著作権情報

文書の著作権を表記します。

<meta name="copyright" content="capm-network">

文字コード

文書の文字コードを明示します。

文字コードを指定することは文字化け防止に有用です。

なお、文字コードの指定は、<TITLE>~</TITLE>内などで日本語が現れる前に行う必要があります。

charsetはSJISの場合「shift_jis」、 EUCの場合「euc-jp」とします。

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

文書における言語の指定

日本ならば「ja」とします。

英語文書の場合「en」とします。

<meta http-equiv="Content-Language" content="ja"> 

文書の説明

文書の概要を短文で定義します。

このMETA情報は、多くの検索エンジンで利用されており、検索結果に影響します。

<meta name="description" content="HTML METAタグ">

文書のキーワード

文書がどのような内容であるか端的に示すキーワードを定義します。

このMETA情報は、多くの検索エンジンで利用されており、検索結果に影響します。

複数のキーワードを指定する場合には、半角カンマ(,)区切りで指定します。

<meta name="keywords" content="HTML,META,タグ">

基準スタイルシート言語

文書のデフォルトのスタイルシート言語を指定します。

タグに直接style属性でスタイルシートを指定する場合などに、ここで指定した定義種類であると解釈されます。

本項目は指定しなくてもブラウザ側で自動的に判断しますが、誤動作を避けるために記述しておく方がよいといえます。

<meta http-equiv="Content-Style-Type" content="text/css">

基準スクリプト言語

文書のデフォルトのスクリプト言語を指定します。

本項目は指定しなくてもブラウザ側で自動的に判断しますが、誤動作を避けるために記述しておく方がよいといえます。

<meta http-equiv="Content-Script-Type" content="text/javascript">

閲覧者のブラウザのキャッシュを制御する

ページがブラウザ側にキャッシュされるのを防ぎ、アクセスする度に最新のページを読み込ませる事ができます。

<meta http-equiv="pragma" content="no-cache">

文書を作成情報

文書作成に使用したツールやソフトウェアを記述します。

WEBコンテンツ生成ツールを使用するなど、ページが自動生成をされた場合にツール自身がページのhead要素内に挿入するものです。

<meta name="generator" content="stw">

イメージツールバーを表示させない

イメージツールバーを表示させない設定です。

イメージツールバーはIEなどのブラウザで、一定以上のサイズの画像の上にマウスカーソルを合わせると表示されます。

<meta http-equiv="imagetoolbar" content="no">

検索ロボットの制御

robotsメタ情報は、検索ロボットに対して登録制御方法を指定しています。

この指定はすべての検索ロボットに対して有効ではなく、この情報を参照する検索ロボットに対してのみ有効です。

<meta name="robots" content="noindex,nofollow">

contentには以下のキーワードを指定します。

none 当該ぺージとそこからリンクしているページの両方とも巡回拒否します。
index,nofollow 当該ぺージのみ登録し、リンクを辿るのは拒否します。
index そのページの登録を許可します。
noindex リンクを辿ることを許可するが、当該ページに対する指定は拒否します。
all 下部階層ページの巡回を許可します。
index,follow 当該ページとリンクされている全てのページの検索を許可します。
noindex,follow 当該ページを登録しないが、ページ内のリンク先は巡回を許可する。
noimageindex 当該ページ内の画像が検索対象となることを拒否します。
noimageclick 当該ページ内の画像への直接リンクを拒否します。

検索ロボットに後日、再巡回させる

ロボットが訪れた際に後日再度訪問させたい場合に記述します。

<meta name="revisit_after" content="15 days">


関連

HTML





スポンサード リンク