- 1. 概要
- 2. やりたいこと(方針変更)
- 3. 使用するモジュール
- 4. 更新状況
1. 概要
元々は、HTML 関係の話で「HTML - RSS・Atom」からここの作業へ来ました。
「library rss (Ruby 2.5.0)」を参考に RSS を作成するモジュールを作ってみます。
「ruby - ウェブスクレイピング」で作成したモジュールの使いまわしができそうです。
2. やりたいこと(方針変更)
本サイトのドキュメントルートから、定期的(1日に1回程度でしょうか)に巡回して、RSS を作成・更新すること。
2018年10月19日、方針を変更することとしました。
ウェブスクレイピングは、ruby でやるとして、コンテンツの内容を取得したうえで、データベースへ登録することとします。
データベースから必要な情報を取得して、吐き出すのは、php の方が良さそうなので、そちらでやることにします。
3. 使用するモジュール
RSS を作成するわけです。
RSS のライブラリを使用することになります。
「library rss (Ruby 2.5.0)」
「RSS1.0,RSS2.0,ATOM のフォーマット・仕様・構造 - Amarronの日記」
を参考にしていましたが、方針変更に伴い、こちらでやることは RSS のモジュールを使わずに、コンテンツの読込後、必要事項をデータベースへ登録することにします。
よって、必要なのは postgreSQL へのアクセスを可能にするものです。
4. 更新状況
2018年11月08日、基本的な動作は出来るようになりました。
これらの一連の処理は cron に組み込んで、1日に一回は更新するように考えています。
今後、このプログラムで、tree 構造を生成して、.html 形式のサイトマップを作成しようと思っています。
案外簡単にできました。
次節に書くことにします(2018年11月09日)。
|
|