はてなダイアリー見出し抽出スクリプト

一応できたので公開
http://www2.airnet.ne.jp/phoenix/cgi-bin/hatena/hmidashi.cgi


[フォーム]*1

■ 抽出モード選択(※必ず選択してください。)
見出し抽出
画像抽出
キーワード抽出
■ 条件入力
id(ex.hatenadiary):
日付(ex.200404):
検索語:
■ 見出し抽出用オプション
小見出しのみ表示
日付非表示
タイムスタンプ非表示
■ 画像抽出用オプション
サムネイルで表示
画像タイトルを表示
日記にリンクしない
画像用クラスを付加しない(class=photo、class=hatena-photo)
表示形式
 なにもしない
 <br>をつけて<p>で囲う
 listにする(サムネイル時のみ)

目的

  • 指定した日記の見出しを一覧表示する
  • 指定した日記の画像を一覧表示する*2関連ページ
  • 指定した日記のキーワードを一覧表示する*3関連ページ

mkomiyaさん制作の見出し一覧との相違点

  • 自分の日記内に貼り付けやすいよう整形したものも表示(相対リンク)
  • キーワード、カテゴリーなどへのリンク・タグは削除
  • 任意の検索語で抽出可能(1ワードのみ)
  • 小見出しのみの表示、日付非表示 、タイムスタンプ非表示などを指定可能
  • javascript出力には非対応*4

使用方法

  • フォームより対象の日記のid、日付、各種オプションを入力する
  • オプションを手入力しての使用も可能(?で始め、複数は&で接続)

例)http://www2.airnet.ne.jp/phoenix/cgi-bin/hatena/hmidashi.cgi?id=hatenadiary&hizuke=200404&mode=midashi&komidashihyoji=1&hizukehyoji=1&jikanhyoji=1&word=%A4%CF%A4%C6%A4%CA

mode:必須、mode=midashiで見出し表示、mode=photoで画像抽出、mode=linkでキーワード抽出
id:対処日記のはてなid、省略時はsakichin
hizuke:一覧にしたい日記の日付、200404、200501など、省略時は最新の日記を表示
word:検索語指定、1ワードのみ、見出し抽出の場合は見出しと小見出しに有効、画像の場合は画像の表題に有効、日本語の場合はEUC-JPでURLエンコードが必要

以下見出し抽出用オプション
komidashihyoji:1で小見出しのみ表示を有効
hizukehyoji:1で日付非表示を有効
jikanhyoji:1でタイムスタンプ非表示を有効

以下画像抽出用オプション
psize:1でサムネイルで表示
ptitlehyoji:1で画像タイトルを表示
plink:1で日記にリンクしない
pclass:1で画像用クラスを付加しない(class=photo、class=hatena_photo)
pkeishiki:1で<br>をつけて<p>で囲う
pkeishiki:2でlistにする(サムネイル時のみ)

未修整の問題点など
idに"keyword"を、hizukeにはてなキーワードを指定するとはてなキーワード内の見出し、画像の抽出が可能だが、リンクがおかしい

*1:2004.6.4追加、転載可

*2:2004.6.3追加

*3:2004.6.5追加

*4:サーバーの都合上あえて対応しません。また、負荷が大きすぎる場合は公開を停止することがあります。