8. html/sitemap.xml

 
8.1 sitemap.xml とは
8.2 自動生成ツール
8.3 記述方法

8.1 sitemap.xml とは

 いまや、ウェブを管理するとなると、コンテンツの他に、今まで述べたもののようなものや、ここで説明する sitemap.xml のように余分に作らなければならないものがあるので、大変なのです。  sitemap.xml は、コンテンツディレクトリにおいて、ディレクトリツリーの優先度やら更新頻度やらを定義して「検索エンジンさま」に理解してもらって効率よくクロールしてもらったり、検索結果に表示してもらうためのものです。

8.2 自動生成ツール

 ダウンロードしてきて、自分のサイトで使用するタイプのものや、必要な項目を入力してウェブ越しにクロールして作成するもの等々、いろいろなものがあります。  わたしがここのサイトを作成した際は、下記のサイトのものを使ったような気がします(すみません、よく覚えていないんです)。

8.3 記述方法

 以下、Yahoo Japan の「Sitemapsの記述方法」のほぼ丸写しですが、
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE urlset>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

  <url>
    <loc>①「URL」</loc>
    <lastmod>②「最終更新日」</lastmod>
    <changefreq>③「更新頻度」</changefreq>
    <priority>④「優先度」</priority>
  </url>

</urlset>

 文字コードは UTF-8 で記述します。

 先頭の3行と末尾の1行は固定です。

 コンテンツツリーが複数存在する場合は、ツリーの数ごとに <url> ~ </url> を繰り返して書いていきます。

 ①「URL」の箇所には、http または https ではじまる、サイトの URL をフルスペルで記述します。

 ②「最終更新日」の箇所には、YYYY-MM-DD の形式で最終更新日を記述します。時刻まで記述できるようですが、面倒なので、日付までをおすすめします。
 動的コンテンツの場合。前項のような自動生成ツールでは、正しい最終更新日を取得できないことがありますので、手書きで記入しなおした方がいいかと思います。

 ③「更新頻度」には、コンテンツの更新頻度を記述します。検索エンジンがクロールする頻度の目安にはするでしょうが、あてにはなりません。っていうか、これが省略可能とは知らなかった。
 で以下、頻度に定義可能な記述がまさに Yahoo Japan の丸写しになります。

記述意味
always アクセスする都度更新
hourly 毎時
daily 毎日
weekly 毎週
monthly 毎月
yearly 毎年
never 更新なし
 実は、今回調べるまで、dailyweeklymonthly、以外を使えることを知らなかったのです。  ④「優先度」には、優先度を 0.0 ~ 1.0 の範囲(大きいほど優先度が高い)で記述します。デフォルトが 0.5 だそうな。  サイト内の優先度なので、全部に 1.0 をつけるような馬鹿な真似をしても意味はありません。