- 追加された行はこのように表示されます。
- 削除された行は
このように表示されます。
{{category Plagger}}
!!!asetts
!![asahi.com|http://www.asahi.com/]
asahi_com.yaml(lastmodified 2008/04/07)
# http://www3.asahi.com/rss/index.rdf
!![OpenSpace更新情報|http://www.openspc2.org/blog/]
# http://www.openspc2.org/blog/
# http://www.openspc2.org/blog/index.xml
author: suVene
handle_force: http://(www|rss)\.asahi\.com
extract: <!-- End of Headline --><p class="date">(.*?)</p>(.*?)<!-- google_ad_section_end
extract_capture: date body
{{comment}}
handle: http://www\.openspc2\.org/blog/archives/\d+/\d+/.+\.html
extract: <div class="content">.*?</h3>(.*<p class="posted">.*?</p>)
extract_capture: body
*追加 - suVene (2008年10月13日 23時10分00秒)
!![CNET Japan|http://japan.cnet.com/]
cnet_japan.yaml(lastmodified 2008/04/03)
#
!![JavaScript++かも日記|http://jsgt.org/]
# http://jsgt.org/mt/01/index.rdf
# http://jsgt.org/mt/01/
author: suVene
handle_force: http://(?:feeds\.japan\.cnet\.com/|feeds\.feedburner\.jp/cnet|japan\.cnet\.com/(?:news|column|special|sp|interview))
extract: <div class="article_header .*?">.*?(\d{4}/\d\d/\d\d \d\d:\d\d) .*?<div class="leaf_body.*?">(.*)</div>.*?<!--TrackBack-->
extract_capture: date body
extract_date_format: %Y/%m/%d %H:%M
{{comment}}
handle: http://jsgt\.org/mt/archives/
extract_xpath:
body: //div[@class="blogbody"]
*追加 - suVene (2008年10月06日 23時10分00秒)
!![真性引き篭もり|http://sinseihikikomori.bblog.jp/]
sinseihikikomiri_bblog_jp.yaml(lastmodified 2008/04/07)
# http://sinseihikikomori.bblog.jp/index.rdf
# http://sinseihikikomori.bblog.jp/
!![japan.internet.com|http://japan.internet.com/]
japan_internet_com.yaml
athor: suVene
handle: http://japan\.internet\.com/\w+/(\d+/)?\d+\.html
extract: (<font size="\+1\".*?)<iframe
extract_capture: body
*追加 - これは結構適当 - suVene (2008年07月31日 22時27分51秒)
!![markezine.jp|http://markezine.jp/]
markezine_jp.yaml
# http://rss.rssad.jp/rss/markezine/new/20/index.xml
# http://markezine.jp/
author: suVene
handle: http://sinseihikikomori\.bblog\.jp/entry/\d{6}/
handle: (http://markezine\.jp/a/article/aid/\d+\.aspx|http://markezine\.jp/article/detail/\d+)
extract_xpath:
body: //div[@class="entrybody"]
more: //div[@class="entrymore"]
extract_after_hook: |
$data->{body} = $data->{body} . $data->{entrymore};
{{comment}}
body: //div[@id="article"]
*追加 - articleの後ろにdetailがついたのと、classがidになったのを対応 - suVene (2008年07月31日 22時27分21秒)
!![CodeZine|http://codezine.jp/]
codezine_jp.yaml(lastmodified 2008/04/26)
# http://rss.rssad.jp/rss/codezine/new/20/index.xml
# http://codezine.jp/
!![heartbreaking.|http://blog.goo.ne.jp/funamushi2]
blog_goo_ne_jp_funamushi2.yaml
# http://blog.goo.ne.jp/funamushi2/index.rdf
# http://blog.goo.ne.jp/funamushi2/
author: suVene
handle: http://codezine\.jp/a/article/aid/\d+\.aspx
handle: http://blog\.goo\.ne\.jp/funamushi2/
extract_xpath:
body: //div[@class="bodyformattedpage"]
cf.[Markezine.jpのEFTとAutoPagerize SITEINFOを更新した - otsune's SnakeOil - subtech|http://subtech.g.hatena.ne.jp/otsune/20071030/markezine]
{{comment}}
body: //div[@class="entry-body"]
*追加 - suVene (2008年07月19日)
!![永井孝尚のMM21 : ITmedia オルタナティブ・ブログ|http://blogs.itmedia.co.jp/mm21/]
cyborg_relove_org.yaml(lastmodified 2008/04/25)
# http://blogs.itmedia.co.jp/mm21/index.rdf
# http://blogs.itmedia.co.jp/mm21/
!![世界びっくりニュース | エキサイトニュース|http://www.excite.co.jp/News/odd/]
excite_co_jp_odd.yaml
# http://www.excite.co.jp/News/xml/rss_excite_news_odd_index_utf_8.dcg
# http://www.excite.co.jp/News/odd/
author: suVene
handle: http://blogs\.itmedia\.co\.jp/mm21/\d{4}/\d{2}/.*html
extract: トップ(.*)trackback\(\d+\)
extract_capture: body
{{comment}}
handle: http://www\.excite\.co\.jp/News/odd/\d+\.html
extract_xpath:
body: id("story_content")
*追加 - suVene (2008年04月27日)
!![ish☆サイボーグだから電気羊を数えます|http://cyborg.relove.org/]
cyborg_relove_org.yaml(lastmodified 2008/04/25)
cyborg_relove_org.yaml
# http://cyborg.relove.org/feed
# http://cyborg.relove.org/
author: suVene
handle: http://cyborg\.relove\.org/.+/.+\.html$
extract: ol\.footnotes\{font(?:.*)?\}(.*?)Trackbacks
extract_capture: body
ちょっと適当
{{comment}}
*追加 - suVene (2008年04月25日)
!![世界びっくりニュース | エキサイトニュース|http://www.excite.co.jp/News/odd/]
excite_co_jp_odd.yaml(lastmodified 2008/04/27)
# http://www.excite.co.jp/News/xml/rss_excite_news_odd_index_utf_8.dcg
# http://www.excite.co.jp/News/odd/
!![永井孝尚のMM21 : ITmedia オルタナティブ・ブログ|http://blogs.itmedia.co.jp/mm21/]
cyborg_relove_org.yaml
# http://blogs.itmedia.co.jp/mm21/index.rdf
# http://blogs.itmedia.co.jp/mm21/
author: suVene
handle: http://www\.excite\.co\.jp/News/odd/\d+\.html
extract_xpath:
body: id("story_content")
{{comment}}
handle: http://blogs\.itmedia\.co\.jp/mm21/\d{4}/\d{2}/.*html
extract: トップ(.*)trackback\(\d+\)
extract_capture: body
*追加 - suVene (2008年04月25日)
!![heartbreaking.|http://blog.goo.ne.jp/funamushi2]
blog_goo_ne_jp_funamushi2.yaml(lastmodified 2008/07/19)
# http://blog.goo.ne.jp/funamushi2/index.rdf
# http://blog.goo.ne.jp/funamushi2/
!![CodeZine|http://codezine.jp/]
codezine_jp.yaml
# http://rss.rssad.jp/rss/codezine/new/20/index.xml
# http://codezine.jp/
author: suVene
handle: http://blog\.goo\.ne\.jp/funamushi2/
handle: http://codezine\.jp/a/article/aid/\d+\.aspx
extract_xpath:
body: //div[@class="entry-body"]
{{comment}}
body: //div[@class="bodyformattedpage"]
cf.[Markezine.jpのEFTとAutoPagerize SITEINFOを更新した - otsune's SnakeOil - subtech|http://subtech.g.hatena.ne.jp/otsune/20071030/markezine]
*追加 - suVene (2008年04月26日)
!![markezine.jp|http://markezine.jp/]
markezine_jp.yaml(lastmodified 2008/07/22)
# http://rss.rssad.jp/rss/markezine/new/20/index.xml
# http://markezine.jp/
!![真性引き篭もり|http://sinseihikikomori.bblog.jp/]
sinseihikikomiri_bblog_jp.yaml
# http://sinseihikikomori.bblog.jp/index.rdf
# http://sinseihikikomori.bblog.jp/
author: suVene
handle: (http://markezine\.jp/a/article/aid/\d+\.aspx|http://markezine\.jp/article/detail/\d+)
handle: http://sinseihikikomori\.bblog\.jp/entry/\d{6}/
extract_xpath:
body: //div[@id="article"]
*articleの後ろにdetailがついたのと、classがidになったのを対応 - suVene (2008年07月31日 22時27分21秒)
{{comment}}
body: //div[@class="entrybody"]
more: //div[@class="entrymore"]
extract_after_hook: |
$data->{body} = $data->{body} . $data->{entrymore};
*追加 - suVene (2008年04月07日)
!![japan.internet.com|http://japan.internet.com/]
japan_internet_com.yaml(lastmodified 2008/07/22)
athor: suVene
handle: http://japan\.internet\.com/\w+/(\d+/)?\d+\.html
extract: (<font size="\+1\".*?)<iframe
extract_capture: body
{{comment}}
!![CNET Japan|http://japan.cnet.com/]
cnet_japan.yaml
#
author: suVene
handle_force: http://(?:feeds\.japan\.cnet\.com/|feeds\.feedburner\.jp/cnet|japan\.cnet\.com/(?:news|column|special|sp|interview))
extract: <div class="article_header .*?">.*?(\d{4}/\d\d/\d\d \d\d:\d\d) .*?<div class="leaf_body.*?">(.*)</div>.*?<!--TrackBack-->
extract_capture: date body
extract_date_format: %Y/%m/%d %H:%M
*追加 - suVene (2008年04月03日)
!![asahi.com|http://www.asahi.com/]
asahi_com.yaml
# http://www3.asahi.com/rss/index.rdf
author: suVene
handle_force: http://(www|rss)\.asahi\.com
extract_xpath:
body: //div[@class="BodyTxt"]
*追加 - suVene (2008年04月07日)
!!!Link
*[coderepos.org /lang/perl/plagger/assets/plugins/Filter-EntryFullText|http://svn.coderepos.org/share/lang/perl/plagger/assets/plugins/Filter-EntryFullText/]
*[github|http://github.com/suvene/plagger/tree/master]