サンプルのHTMLテキスト
そして、このページから生成された
RSSフィード
(A)テキストの列挙からフィードが生成される例
2024/04/15 先頭に存在する最新項目です。
2024/04/05
Happyou.infoを作っています。
もうすぐ完成です。
2024/04/04
今日も作っています。画像つき
2024/04/03
大量にクロールしています。
2024/04/02 リンクが抜けていてもフィードが生成できる例です。
2024/04/01
異なる日付フォーマットが2024年04月05日記述されてても正しくパターンが生成できる確認。
2024/04/01
始まりです。リンク先はすべてダミーです。
(B)ブロック繰り返しの項目認識
2024/04/05
今日の更新は2項目です。
毎日お仕事ご苦労様です。
2024/04/04
今日は1件のニュースがあります。
2024/04/02
今日は3件のニュースです。FinalScraperを現在開発中です。
その他のプログラムも現在開発中です。
複雑な構造も認識することができます
(C)テキストエリアからRSSフィードが生成される例
◆2024/04/17 このように、テキストエリアにお知らせを埋め込んでいるサイトが世の中にはまだ多数存在します。 ◆2024/04/16 ウェブサイトを更新しました。 ◆2024/04/15 新製品を発売しました。
(D)HTMLテーブルからRSSフィードが生成される例
04月17日
ここをクリック
今日はFinalScraper用のサンプルファイルを書きました。
1
HTMLテーブルの記述方法はこれでいいだろうか
04月07日
ここをクリック
FinalScraperはHTMLのテーブルからもRSS2.0のフィードを生成することができます。
2
なぜなら構造化されたパターンを抽出しているからです。
リンク
を記述しても、パターンの認識には影響を与えないはずです。
04月06日
ここをクリック
検索結果を表示する際にHTMLテーブルを用いられているケースが多々あります。
3
FinalScraperは幅広い分野にご利用いただけると確信しています。
(E)日付を持たない繰り返しパターン
ビジネスマン1
ビジネスマン2
ドクター
男性1
男性2
男性3
男性4
男性5
女性1
女性2
女性3
女性4
エージェント
労働者