トップ 一覧 検索 ヘルプ RSS ログイン

Plagger/Publish-EntryFullText/assetsの変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
{{category Plagger}}
!!!asetts
!![asahi.com|http://www.asahi.com/]
asahi_com.yaml(lastmodified 2008/04/07)
 # http://www3.asahi.com/rss/index.rdf

!![OpenSpace更新情報|http://www.openspc2.org/blog/]
 # http://www.openspc2.org/blog/
 # http://www.openspc2.org/blog/index.xml
 author: suVene
 handle_force: http://(www|rss)\.asahi\.com
 extract: <!-- End of Headline --><p class="date">(.*?)</p>(.*?)<!-- google_ad_section_end
 extract_capture: date body
{{comment}}
 handle: http://www\.openspc2\.org/blog/archives/\d+/\d+/.+\.html
 extract: <div class="content">.*?</h3>(.*<p class="posted">.*?</p>)
 extract_capture: body
*追加 - suVene (2008年10月13日 23時10分00秒)

!![CNET Japan|http://japan.cnet.com/]
cnet_japan.yaml(lastmodified 2008/04/03)
 # 
!![JavaScript++かも日記|http://jsgt.org/]
 # http://jsgt.org/mt/01/index.rdf
 # http://jsgt.org/mt/01/
 author: suVene
 handle_force: http://(?:feeds\.japan\.cnet\.com/|feeds\.feedburner\.jp/cnet|japan\.cnet\.com/(?:news|column|special|sp|interview))
 extract: <div class="article_header .*?">.*?(\d{4}/\d\d/\d\d \d\d:\d\d)&nbsp;&nbsp;.*?<div class="leaf_body.*?">(.*)</div>.*?<!--TrackBack-->
 extract_capture: date body
 extract_date_format: %Y/%m/%d %H:%M
{{comment}}
 handle: http://jsgt\.org/mt/archives/
 extract_xpath:
   body: //div[@class="blogbody"]
*追加 - suVene (2008年10月06日 23時10分00秒)

!![真性引き篭もり|http://sinseihikikomori.bblog.jp/]
 sinseihikikomiri_bblog_jp.yaml(lastmodified 2008/04/07)
 # http://sinseihikikomori.bblog.jp/index.rdf
 # http://sinseihikikomori.bblog.jp/
!![japan.internet.com|http://japan.internet.com/]
japan_internet_com.yaml
 athor: suVene
 handle: http://japan\.internet\.com/\w+/(\d+/)?\d+\.html
 extract: (<font size="\+1\".*?)<iframe
 extract_capture: body
*追加 - これは結構適当 - suVene (2008年07月31日 22時27分51秒)

!![markezine.jp|http://markezine.jp/]
markezine_jp.yaml
 # http://rss.rssad.jp/rss/markezine/new/20/index.xml
 # http://markezine.jp/
 author: suVene
 handle: http://sinseihikikomori\.bblog\.jp/entry/\d{6}/
 handle: (http://markezine\.jp/a/article/aid/\d+\.aspx|http://markezine\.jp/article/detail/\d+)
 extract_xpath:
   body: //div[@class="entrybody"]
   more: //div[@class="entrymore"]
 extract_after_hook: |
   $data->{body} = $data->{body} . $data->{entrymore};
{{comment}}
   body: //div[@id="article"]
*追加 - articleの後ろにdetailがついたのと、classがidになったのを対応 - suVene (2008年07月31日 22時27分21秒)

!![CodeZine|http://codezine.jp/]
 codezine_jp.yaml(lastmodified 2008/04/26)
 # http://rss.rssad.jp/rss/codezine/new/20/index.xml
 # http://codezine.jp/
!![heartbreaking.|http://blog.goo.ne.jp/funamushi2]
blog_goo_ne_jp_funamushi2.yaml
 # http://blog.goo.ne.jp/funamushi2/index.rdf
 # http://blog.goo.ne.jp/funamushi2/
 author: suVene
 handle: http://codezine\.jp/a/article/aid/\d+\.aspx
 handle: http://blog\.goo\.ne\.jp/funamushi2/
 extract_xpath:
   body: //div[@class="bodyformattedpage"]
cf.[Markezine.jpのEFTとAutoPagerize SITEINFOを更新した - otsune's SnakeOil - subtech|http://subtech.g.hatena.ne.jp/otsune/20071030/markezine]
{{comment}}
   body: //div[@class="entry-body"]
*追加 - suVene (2008年07月19日)

!![永井孝尚のMM21 : ITmedia オルタナティブ・ブログ|http://blogs.itmedia.co.jp/mm21/]
 cyborg_relove_org.yaml(lastmodified 2008/04/25)
 # http://blogs.itmedia.co.jp/mm21/index.rdf
 # http://blogs.itmedia.co.jp/mm21/
!![世界びっくりニュース | エキサイトニュース|http://www.excite.co.jp/News/odd/]
excite_co_jp_odd.yaml
 # http://www.excite.co.jp/News/xml/rss_excite_news_odd_index_utf_8.dcg
 # http://www.excite.co.jp/News/odd/
 author: suVene
 handle: http://blogs\.itmedia\.co\.jp/mm21/\d{4}/\d{2}/.*html
 extract: トップ(.*)trackback\(\d+\)
 extract_capture: body
{{comment}}
 handle: http://www\.excite\.co\.jp/News/odd/\d+\.html
 extract_xpath:
   body: id("story_content")
*追加 - suVene (2008年04月27日)

!![ish☆サイボーグだから電気羊を数えます|http://cyborg.relove.org/]
 cyborg_relove_org.yaml(lastmodified 2008/04/25)
cyborg_relove_org.yaml
 # http://cyborg.relove.org/feed
 # http://cyborg.relove.org/
 author: suVene
 handle: http://cyborg\.relove\.org/.+/.+\.html$
 extract: ol\.footnotes\{font(?:.*)?\}(.*?)Trackbacks
 extract_capture: body
ちょっと適当
{{comment}}
*追加 - suVene (2008年04月25日)

!![世界びっくりニュース | エキサイトニュース|http://www.excite.co.jp/News/odd/]
 excite_co_jp_odd.yaml(lastmodified 2008/04/27)
 # http://www.excite.co.jp/News/xml/rss_excite_news_odd_index_utf_8.dcg
 # http://www.excite.co.jp/News/odd/
!![永井孝尚のMM21 : ITmedia オルタナティブ・ブログ|http://blogs.itmedia.co.jp/mm21/]
cyborg_relove_org.yaml
 # http://blogs.itmedia.co.jp/mm21/index.rdf
 # http://blogs.itmedia.co.jp/mm21/
 author: suVene
 handle: http://www\.excite\.co\.jp/News/odd/\d+\.html
 handle: http://blogs\.itmedia\.co\.jp/mm21/\d{4}/\d{2}/.*html
 extract: トップ(.*)trackback\(\d+\)
 extract_capture: body
*追加 - suVene (2008年04月25日)

!![CodeZine|http://codezine.jp/]
codezine_jp.yaml
 # http://rss.rssad.jp/rss/codezine/new/20/index.xml
 # http://codezine.jp/
 author: suVene
 handle: http://codezine\.jp/a/article/aid/\d+\.aspx
 extract_xpath:
   body: id("story_content")
{{comment}}
   body: //div[@class="bodyformattedpage"]
cf.[Markezine.jpのEFTとAutoPagerize SITEINFOを更新した - otsune's SnakeOil - subtech|http://subtech.g.hatena.ne.jp/otsune/20071030/markezine]
*追加 - suVene (2008年04月26日)

!![真性引き篭もり|http://sinseihikikomori.bblog.jp/]
sinseihikikomiri_bblog_jp.yaml
 # http://sinseihikikomori.bblog.jp/index.rdf
 # http://sinseihikikomori.bblog.jp/
 author: suVene
 handle: http://sinseihikikomori\.bblog\.jp/entry/\d{6}/
 extract_xpath:
   body: //div[@class="entrybody"]
   more: //div[@class="entrymore"]
 extract_after_hook: |
   $data->{body} = $data->{body} . $data->{entrymore};
*追加 - suVene (2008年04月07日)

!![CNET Japan|http://japan.cnet.com/]
cnet_japan.yaml
 # 
 author: suVene
 handle_force: http://(?:feeds\.japan\.cnet\.com/|feeds\.feedburner\.jp/cnet|japan\.cnet\.com/(?:news|column|special|sp|interview))
 extract: <div class="article_header .*?">.*?(\d{4}/\d\d/\d\d \d\d:\d\d)&nbsp;&nbsp;.*?<div class="leaf_body.*?">(.*)</div>.*?<!--TrackBack-->
 extract_capture: date body
 extract_date_format: %Y/%m/%d %H:%M
*追加 - suVene (2008年04月03日)

!![asahi.com|http://www.asahi.com/]
asahi_com.yaml
 # http://www3.asahi.com/rss/index.rdf
 author: suVene
 handle_force: http://(www|rss)\.asahi\.com
 extract_xpath:
   body: //div[@class="BodyTxt"]
*追加 - suVene (2008年04月07日)

!!!Link
*[coderepos.org /lang/perl/plagger/assets/plugins/Filter-EntryFullText|http://svn.coderepos.org/share/lang/perl/plagger/assets/plugins/Filter-EntryFullText/]
*[github|http://github.com/suvene/plagger/tree/master]