トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

Plagger/Publish-EntryFullText/assets

[Plagger]

asetts

OpenSpace更新情報

# http://www.openspc2.org/blog/
# http://www.openspc2.org/blog/index.xml
author: suVene
handle: http://www\.openspc2\.org/blog/archives/\d+/\d+/.+\.html
extract: <div class="content">.*?</h3>(.*<p class="posted">.*?</p>)
extract_capture: body
  • 追加 - suVene (2008年10月13日 23時10分00秒)

JavaScript++かも日記

# http://jsgt.org/mt/01/index.rdf
# http://jsgt.org/mt/01/
author: suVene
handle: http://jsgt\.org/mt/archives/
extract_xpath:
  body: //div[@class="blogbody"]
  • 追加 - suVene (2008年10月06日 23時10分00秒)

japan.internet.com

japan_internet_com.yaml

athor: suVene
handle: http://japan\.internet\.com/\w+/(\d+/)?\d+\.html
extract: (<font size="\+1\".*?)<iframe
extract_capture: body
  • 追加 - これは結構適当 - suVene (2008年07月31日 22時27分51秒)

markezine.jp

markezine_jp.yaml

# http://rss.rssad.jp/rss/markezine/new/20/index.xml
# http://markezine.jp/
author: suVene
handle: (http://markezine\.jp/a/article/aid/\d+\.aspx|http://markezine\.jp/article/detail/\d+)
extract_xpath:
  body: //div[@id="article"]
  • 追加 - articleの後ろにdetailがついたのと、classがidになったのを対応 - suVene (2008年07月31日 22時27分21秒)

heartbreaking.

blog_goo_ne_jp_funamushi2.yaml

# http://blog.goo.ne.jp/funamushi2/index.rdf
# http://blog.goo.ne.jp/funamushi2/
author: suVene
handle: http://blog\.goo\.ne\.jp/funamushi2/
extract_xpath:
  body: //div[@class="entry-body"]
  • 追加 - suVene (2008年07月19日)

世界びっくりニュース | エキサイトニュース

excite_co_jp_odd.yaml

# http://www.excite.co.jp/News/xml/rss_excite_news_odd_index_utf_8.dcg
# http://www.excite.co.jp/News/odd/
author: suVene
handle: http://www\.excite\.co\.jp/News/odd/\d+\.html
extract_xpath:
  body: id("story_content")
  • 追加 - suVene (2008年04月27日)

ish☆サイボーグだから電気羊を数えます

cyborg_relove_org.yaml

# http://cyborg.relove.org/feed
# http://cyborg.relove.org/
author: suVene
handle: http://cyborg\.relove\.org/.+/.+\.html$
extract: ol\.footnotes\{font(?:.*)?\}(.*?)Trackbacks
extract_capture: body

ちょっと適当

  • 追加 - suVene (2008年04月25日)

永井孝尚のMM21 : ITmedia オルタナティブ・ブログ

cyborg_relove_org.yaml

# http://blogs.itmedia.co.jp/mm21/index.rdf
# http://blogs.itmedia.co.jp/mm21/
author: suVene
handle: http://blogs\.itmedia\.co\.jp/mm21/\d{4}/\d{2}/.*html
extract: トップ(.*)trackback\(\d+\)
extract_capture: body
  • 追加 - suVene (2008年04月25日)

CodeZine

codezine_jp.yaml

# http://rss.rssad.jp/rss/codezine/new/20/index.xml
# http://codezine.jp/
author: suVene
handle: http://codezine\.jp/a/article/aid/\d+\.aspx
extract_xpath:
  body: //div[@class="bodyformattedpage"]

cf.Markezine.jpのEFTとAutoPagerize SITEINFOを更新した - otsune's SnakeOil - subtech

  • 追加 - suVene (2008年04月26日)

真性引き篭もり

sinseihikikomiri_bblog_jp.yaml

# http://sinseihikikomori.bblog.jp/index.rdf
# http://sinseihikikomori.bblog.jp/
author: suVene
handle: http://sinseihikikomori\.bblog\.jp/entry/\d{6}/
extract_xpath:
  body: //div[@class="entrybody"]
  more: //div[@class="entrymore"]
extract_after_hook: |
  $data->{body} = $data->{body} . $data->{entrymore};
  • 追加 - suVene (2008年04月07日)

CNET Japan

cnet_japan.yaml

# 
author: suVene
handle_force: http://(?:feeds\.japan\.cnet\.com/|feeds\.feedburner\.jp/cnet|japan\.cnet\.com/(?:news|column|special|sp|interview))
extract: <div class="article_header .*?">.*?(\d{4}/\d\d/\d\d \d\d:\d\d)&nbsp;&nbsp;.*?<div class="leaf_body.*?">(.*)</div>.*?<!--TrackBack-->
extract_capture: date body
extract_date_format: %Y/%m/%d %H:%M
  • 追加 - suVene (2008年04月03日)

asahi.com

asahi_com.yaml

# http://www3.asahi.com/rss/index.rdf
author: suVene
handle_force: http://(www|rss)\.asahi\.com
extract_xpath:
  body: //div[@class="BodyTxt"]
  • 追加 - suVene (2008年04月07日)

Link

お名前: コメント:

最終更新時間:2009年06月12日 23時53分50秒