Filtrera och blanda många RSS-flöden?

Här diskuteras programmering och utveckling
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Konservburk skrev:
ubot skrev:Det kan ju bli en himla massa definitioner då om jag ska ha kanske 500 RSS-flöden som ska filtreras till kanske 10-50 nya RSS-flöden!
De flesta har nog inga special-definitoner. Om du vill så går det att parsa fram dem automatiskt. Men sen att sortera ut vilka som behövs måste nog göras för hand. Antagligen finns det många som är i princip likadana så att det räcker med en av dem, men troligtvis inte tillräckligt likadana för att lätt kunna sortera bort dem automatiskt.
Jaha, ja, hur gör man för att para fram dom automatiskt då, det kanske är lika bra?
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Filtrera och blanda många RSS-flöden?

Inlägg av Konservburk »

ubot skrev:
Konservburk skrev:
ubot skrev:Det kan ju bli en himla massa definitioner då om jag ska ha kanske 500 RSS-flöden som ska filtreras till kanske 10-50 nya RSS-flöden!
De flesta har nog inga special-definitoner. Om du vill så går det att parsa fram dem automatiskt. Men sen att sortera ut vilka som behövs måste nog göras för hand. Antagligen finns det många som är i princip likadana så att det räcker med en av dem, men troligtvis inte tillräckligt likadana för att lätt kunna sortera bort dem automatiskt.
Jaha, ja, hur gör man för att para fram dom automatiskt då, det kanske är lika bra?
Samma kod som förut, med några små justeringar. Alla xml-huvuden finns nu uppradade i filen /tmp/rss_heads.xml

Kod: Markera allt

#!/bin/bash

rss=(
"http://feeds.gawker.com/lifehacker/full"
"http://feeds.feedburner.com/weblogsinc/downloadsquad"
)

trap 'rm -f /tmp/rss_head.xml /tmp/rss_body.xml /tmp/rss_foot.xml' EXIT
for rss in "${rss[@]}"
do wget -qO- "$rss" |
   sed ':1;N;s/\r//g;s/\n//g;b1' |
   sed '
      s/<[Ii][Tt][Ee][Mm][^>]*>/\n\0/g
      s/<\/[Ii][Tt][Ee][Mm][^>]*>/\0\n/g
   ' >/tmp/rss.xml
   if ((i++))
   then
      sed -n '1p' </tmp/rss.xml >>/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >>/tmp/rss_body.xml
   else
      sed -n '1p' </tmp/rss.xml >/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >/tmp/rss_body.xml
      sed -n '$p' </tmp/rss.xml >/tmp/rss_foot.xml
   fi
done
sed 's/></>\n</g' </tmp/rss_head.xml >/tmp/rss_heads.xml

filter_rss() {
   cat <(head -n1 /tmp/rss_head.xml) <(
      mawk "$1" /tmp/rss_body.xml |
      sed -n 's/.*<[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>\([^<]*\)<\/[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>.*/date -d "\1" +%s; cat <<\\EOF\n\0\nEOF/p' |
      bash |
      sed '/^[0-9]\+$/{N;s/\n//}' |
      sort -nr |
      sed 's/^[0-9]\+//'
   ) /tmp/rss_foot.xml
}

filter_rss '/linux/ && /windows/' >/tmp/rss_linux_and_windows.xml
filter_rss '/linux/ || /windows/' >/tmp/rss_linux_or_windows.xml
filter_rss '/linux/ && !/windows/' >/tmp/rss_linux_but_not_windows.xml
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Konservburk skrev:
ubot skrev:
Konservburk skrev:
ubot skrev:Det kan ju bli en himla massa definitioner då om jag ska ha kanske 500 RSS-flöden som ska filtreras till kanske 10-50 nya RSS-flöden!
De flesta har nog inga special-definitoner. Om du vill så går det att parsa fram dem automatiskt. Men sen att sortera ut vilka som behövs måste nog göras för hand. Antagligen finns det många som är i princip likadana så att det räcker med en av dem, men troligtvis inte tillräckligt likadana för att lätt kunna sortera bort dem automatiskt.
Jaha, ja, hur gör man för att para fram dom automatiskt då, det kanske är lika bra?
Samma kod som förut, med några små justeringar. Alla xml-huvuden finns nu uppradade i filen /tmp/rss_heads.xml

Kod: Markera allt

#!/bin/bash

rss=(
"http://feeds.gawker.com/lifehacker/full"
"http://feeds.feedburner.com/weblogsinc/downloadsquad"
)

trap 'rm -f /tmp/rss_head.xml /tmp/rss_body.xml /tmp/rss_foot.xml' EXIT
for rss in "${rss[@]}"
do wget -qO- "$rss" |
   sed ':1;N;s/\r//g;s/\n//g;b1' |
   sed '
      s/<[Ii][Tt][Ee][Mm][^>]*>/\n\0/g
      s/<\/[Ii][Tt][Ee][Mm][^>]*>/\0\n/g
   ' >/tmp/rss.xml
   if ((i++))
   then
      sed -n '1p' </tmp/rss.xml >>/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >>/tmp/rss_body.xml
   else
      sed -n '1p' </tmp/rss.xml >/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >/tmp/rss_body.xml
      sed -n '$p' </tmp/rss.xml >/tmp/rss_foot.xml
   fi
done
sed 's/></>\n</g' </tmp/rss_head.xml >/tmp/rss_heads.xml

filter_rss() {
   cat <(head -n1 /tmp/rss_head.xml) <(
      mawk "$1" /tmp/rss_body.xml |
      sed -n 's/.*<[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>\([^<]*\)<\/[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>.*/date -d "\1" +%s; cat <<\\EOF\n\0\nEOF/p' |
      bash |
      sed '/^[0-9]\+$/{N;s/\n//}' |
      sort -nr |
      sed 's/^[0-9]\+//'
   ) /tmp/rss_foot.xml
}

filter_rss '/linux/ && /windows/' >/tmp/rss_linux_and_windows.xml
filter_rss '/linux/ || /windows/' >/tmp/rss_linux_or_windows.xml
filter_rss '/linux/ && !/windows/' >/tmp/rss_linux_but_not_windows.xml
Ok, tackar, vänligt! Det är väl iofs troligt att det dyker upp något huvud som inte finns med i koden ännu, bland mina övriga drygt 500 RSS-flöden, menar jag? När jag kör skriptet på min förra lista så får jag upp det här i head-xml-filen:

Kod: Markera allt

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="http://feeds.gawker.com/~d/styles/rss2full.xsl" type="text/xsl" media="screen"?>
<?xml-stylesheet href="http://feeds.gawker.com/~d/styles/itemcontent.css" type="text/css" media="screen"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">	<channel>		<title>
<![CDATA[Lifehacker]]>
</title>		<image>			<url>http://cache.gawker.com/assets/base/img/thumbs140x140/lifehacker.com.png</url>			<title>
<![CDATA[Lifehacker]]>
</title>			<link>http://lifehacker.com</link>		</image>		<link>http://lifehacker.com</link>		<description>
<![CDATA[Computers make us more productive. Yeah, right. Lifehacker recommends the software downloads and web sites that actually save time. Don't live to geek; geek to live.]]>
</description>		<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://www.lifehacker.com/index.xml" type="application/rss+xml" />
<feedburner:browserFriendly>This is an XML content feed. It is intended to be viewed in a newsreader or syndicated to another site.</feedburner:browserFriendly>
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feeds.feedburner.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">
<channel>
<title>Download Squad</title>
<link>http://www.downloadsquad.com</link>
<description>Download Squad</description>
<image>
<link>http://www.downloadsquad.com/</link>
<url>http://www.downloadsquad.com/media/feedlogo.gif</url>
<title>DownloadSquad</title>
</image>
<language>en-us</language>
<copyright>Copyright 2008 Weblogs, Inc. The contents of this feed are available for non-commercial use only.</copyright>
<generator>Blogsmith http://www.blogsmith.com/</generator>
<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://www.downloadsquad.com/rss.xml" type="application/rss+xml" />
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feeds.arstechnica.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feeds.arstechnica.com/~d/styles/itemcontent.css"?>
<rss xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">  <channel>    <title>Ars Technica</title>    <link>http://arstechnica.com/index.ars</link>    <description>    </description>    <atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://arstechnica.com/index.ars/rss" type="application/rss+xml" />
<feedburner:browserFriendly>This is an XML content feed. It is intended to be viewed in a newsreader or syndicated to another site.</feedburner:browserFriendly>
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feedproxy.google.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feedproxy.google.com/~d/styles/itemcontent.css"?>
<!-- generator="wordpress/2.6.2" -->
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">
<channel>	<title>Mashable!</title>	<link>http://mashable.com</link>	<description>Social software and social networking 2.0.</description>	<pubDate>Fri, 10 Oct 2008 20:25:47 +0000</pubDate>	<generator>http://wordpress.org/?v=2.6.2</generator>	<language>en</language>	<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />		<thespringbox:skin xmlns:thespringbox="http://www.thespringbox.com/dtds/thespringbox-1.0.dtd">http://feedproxy.google.com/Mashable?format=skin</thespringbox:skin>
<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://feedproxy.google.com/Mashable" type="application/rss+xml" />
<feedburner:emailServiceId>9m6h8omben53fuj7ghgrctkjc8</feedburner:emailServiceId>
<feedburner:feedburnerHostname>http://feedburner.google.com</feedburner:feedburnerHostname>
<feedburner:feedFlare href="http://add.my.yahoo.com/rss?url=http%3A%2F%2Ffeedproxy.google.com%2FMashable" src="http://us.i1.yimg.com/us.yimg.com/i/us/my/addtomyyahoo4.gif">Subscribe with My Yahoo!</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.newsgator.com/ngs/subscriber/subext.aspx?url=http%3A%2F%2Ffeedproxy.google.com%2FMashable" src="http://www.newsgator.com/images/ngsub1.gif">Subscribe with NewsGator</feedburner:feedFlare>
<feedburner:feedFlare href="http://feeds.my.aol.com/add.jsp?url=http%3A%2F%2Ffeedproxy.google.com%2FMashable" src="http://o.aolcdn.com/favorites.my.aol.com/webmaster/ffclient/webroot/locale/en-US/images/myAOLButtonSmall.gif">Subscribe with My AOL</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.rojo.com/add-subscription?resource=http%3A%2F%2Ffeedproxy.google.com%2FMashable" src="http://blog.rojo.com/RojoWideRed.gif">Subscribe with Rojo</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.bloglines.com/sub/http://feedproxy.google.com/Mashable" src="http://www.bloglines.com/images/sub_modern11.gif">Subscribe with Bloglines</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.netvibes.com/subscribe.php?url=http%3A%2F%2Ffeedproxy.google.com%2FMashable" src="http://www.netvibes.com/img/add2netvibes.gif">Subscribe with Netvibes</feedburner:feedFlare>
<feedburner:feedFlare href="http://fusion.google.com/add?feedurl=http%3A%2F%2Ffeedproxy.google.com%2FMashable" src="http://buttons.googlesyndication.com/fusion/add.gif">Subscribe with Google</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.pageflakes.com/subscribe.aspx?url=http%3A%2F%2Ffeedproxy.google.com%2FMashable" src="http://www.pageflakes.com/ImageFile.ashx?instanceId=Static_4&fileName=ATP_blu_91x17.gif">Subscribe with Pageflakes</feedburner:feedFlare>
<feedburner:browserFriendly>This is an XML content feed. It is intended to be viewed in a newsreader or syndicated to another site, subject to copyright and fair use.</feedburner:browserFriendly>
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/rss2full.xsl" type="text/xsl" media="screen"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/itemcontent.css" type="text/css" media="screen"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">
<channel>	<title>Life Rocks! 2.0</title>		<link>http://www.nirmaltv.com</link>	<description />	<pubDate>Fri, 10 Oct 2008 20:10:09 +0000</pubDate>	<generator>http://wordpress.org/?v=abc</generator>	<language>en</language>			<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://feeds.feedburner.com/LifeRocks20" type="application/rss+xml" />
<feedburner:emailServiceId>789548</feedburner:emailServiceId>
<feedburner:feedburnerHostname>http://www.feedburner.com</feedburner:feedburnerHostname>
<feedburner:feedFlare href="http://add.my.yahoo.com/rss?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://us.i1.yimg.com/us.yimg.com/i/us/my/addtomyyahoo4.gif">Subscribe with My Yahoo!</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.newsgator.com/ngs/subscriber/subext.aspx?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.newsgator.com/images/ngsub1.gif">Subscribe with NewsGator</feedburner:feedFlare>
<feedburner:feedFlare href="http://feeds.my.aol.com/add.jsp?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://o.aolcdn.com/favorites.my.aol.com/webmaster/ffclient/webroot/locale/en-US/images/myAOLButtonSmall.gif">Subscribe with My AOL</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.rojo.com/add-subscription?resource=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://blog.rojo.com/RojoWideRed.gif">Subscribe with Rojo</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.bloglines.com/sub/http://feeds.feedburner.com/LifeRocks20" src="http://www.bloglines.com/images/sub_modern11.gif">Subscribe with Bloglines</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.netvibes.com/subscribe.php?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.netvibes.com/img/add2netvibes.gif">Subscribe with Netvibes</feedburner:feedFlare>
<feedburner:feedFlare href="http://fusion.google.com/add?feedurl=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://buttons.googlesyndication.com/fusion/add.gif">Subscribe with Google</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.pageflakes.com/subscribe.aspx?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.pageflakes.com/ImageFile.ashx?instanceId=Static_4&fileName=ATP_blu_91x17.gif">Subscribe with Pageflakes</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.plusmo.com/add?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://plusmo.com/res/graphics/fbplusmo.gif">Subscribe with Plusmo</feedburner:feedFlare>
<feedburner:feedFlare href="http://my.feedlounge.com/external/subscribe?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://static.feedlounge.com/buttons/subscribe_0.gif">Subscribe with FeedLounge</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.thefreedictionary.com/_/hp/AddRSS.aspx?http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://img.tfd.com/hp/addToTheFreeDictionary.gif">Subscribe with The Free Dictionary</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.bitty.com/manual/?contenttype=rssfeed&contentvalue=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.bitty.com/img/bittychicklet_91x17.gif">Subscribe with Bitty Browser</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.newsalloy.com/?rss=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.newsalloy.com/subrss3.gif">Subscribe with NewsAlloy</feedburner:feedFlare>
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

plus...

Kod: Markera allt

<feedburner:feedFlare href="http://www.live.com/?add=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://tkfiles.storage.msn.com/x1piYkpqHC_35nIp1gLE68-wvzLZO8iXl_JMledmJQXP-XTBOLfmQv4zhj4MhcWEJh_GtoBIiAl1Mjh-ndp9k47If7hTaFno0mxW9_i3p_5qQw">Subscribe with Live.com</feedburner:feedFlare>
<feedburner:feedFlare href="http://mix.excite.eu/add?feedurl=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://image.excite.co.uk/mix/addtomix.gif">Subscribe with Excite MIX</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.yourminis.com/subscribe.aspx?u=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.yourminis.com/images/addtoyourminisbadge.gif">Subscribe with Yourminis.com</feedburner:feedFlare>
<feedburner:feedFlare href="http://download.attensa.com/app/get_attensa.html?feedurl=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.attensa.com/blogs/attensa/WindowsLiveWriter/BadgeredintoBadges_10C02/attensa_feed_button5.gif">Subscribe with Attensa for Outlook</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.webwag.com/wwgthis.php?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.webwag.com/images/wwgthis.gif">Subscribe with Webwag</feedburner:feedFlare>
<feedburner:feedFlare href="http://hub.netomat.net/account/account.autoSubscribe.jspa?urls=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.netomat.net/blogger/images/icon_netomat_feedbutton.gif">Subscribe with netomat Hub</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.dailyrotation.com/index.php?feed=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.dailyrotation.com/rss-dr2.gif">Subscribe with Daily Rotation</feedburner:feedFlare>
<feedburner:feedFlare href="http://www.podcastready.com/oneclick_bookmark.php?url=http%3A%2F%2Ffeeds.feedburner.com%2FLifeRocks20" src="http://www.podcastready.com/images/podcastready_button.gif">Subscribe with Podcast Ready</feedburner:feedFlare>
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feedproxy.google.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feedproxy.google.com/~d/styles/itemcontent.css"?>
<rss xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">   <channel>      <title>ReadWriteWeb</title>      <link>http://www.readwriteweb.com/</link>      <description />      <language>en</language>      <copyright>Copyright 2008 Richard MacManus</copyright>      <managingEditor>readwriteweb@gmail.com</managingEditor>      <lastBuildDate>Fri, 10 Oct 2008 10:50:24 -0800</lastBuildDate>      <generator>http://www.sixapart.com/movabletype/?v=4.1</generator>      <docs>http://blogs.law.harvard.edu/tech/rss</docs>             <atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://www.readwriteweb.com/rss.xml" type="application/rss+xml" />
<feedburner:emailServiceId>bh8m03d07dnj95a0qa1ma5k32c</feedburner:emailServiceId>
<feedburner:feedburnerHostname>http://feedburner.google.com</feedburner:feedburnerHostname>
<feedburner:browserFriendly>This is an XML content feed. It is intended to be viewed in a newsreader or syndicated to another site. The content of this feed is copyright Richard MacManus.</feedburner:browserFriendly>
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feedproxy.google.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feedproxy.google.com/~d/styles/itemcontent.css"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">
<channel>	<title>Online Tech Tips</title>		<link>http://www.online-tech-tips.com</link>	<description>Computer tutorials, technology news, software reviews, and personal computing tips.</description>	<pubDate>Fri, 10 Oct 2008 10:39:33 +0000</pubDate>	<generator>http://wordpress.org/?v=2.6.1</generator>	<language>en</language>			<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://feedproxy.google.com/ComputerTipsFromAComputerGuy" type="application/rss+xml" />
<feedburner:emailServiceId>k6p3td1acuj93eud1hh2eigdkk</feedburner:emailServiceId>
<feedburner:feedburnerHostname>http://feedburner.google.com</feedburner:feedburnerHostname>
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/rss2full.xsl" type="text/xsl" media="screen"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/itemcontent.css" type="text/css" media="screen"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
<channel>	<title>Quick Online Tips</title>		<link>http://www.quickonlinetips.com/</link>	<description>Technology Bits and Blogging Tips.</description>	<pubDate>Fri, 10 Oct 2008 18:29:03 +0000</pubDate>	<generator>http://wordpress.org/?v=2.6.2</generator>	<language>en</language>			<image>
<link>http://www.quickonlinetips.com</link>
<url>http://www.quickonlinetips.com/images/quicktext1.gif</url>
<title>Quick Online Tips</title>
</image>
<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://feeds.feedburner.com/QuickOnlineTips" type="application/rss+xml" />
<feedburner:emailServiceId xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0">42958</feedburner:emailServiceId>
<feedburner:feedburnerHostname xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0">http://www.feedburner.com</feedburner:feedburnerHostname>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://add.my.yahoo.com/rss?url=http%3A%2F%2Ffeeds.feedburner.com%2FQuickOnlineTips" src="http://us.i1.yimg.com/us.yimg.com/i/us/my/addtomyyahoo4.gif">Subscribe with My Yahoo!</feedburner:feedFlare>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.newsgator.com/ngs/subscriber/subext.aspx?url=http%3A%2F%2Ffeeds.feedburner.com%2FQuickOnlineTips" src="http://www.newsgator.com/images/ngsub1.gif">Subscribe with NewsGator</feedburner:feedFlare>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://feeds.my.aol.com/add.jsp?url=http%3A%2F%2Ffeeds.feedburner.com%2FQuickOnlineTips" src="http://o.aolcdn.com/favorites.my.aol.com/webmaster/ffclient/webroot/locale/en-US/images/myAOLButtonSmall.gif">Subscribe with My AOL</feedburner:feedFlare>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.rojo.com/add-subscription?resource=http%3A%2F%2Ffeeds.feedburner.com%2FQuickOnlineTips" src="http://blog.rojo.com/RojoWideRed.gif">Subscribe with Rojo</feedburner:feedFlare>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.bloglines.com/sub/http://feeds.feedburner.com/QuickOnlineTips" src="http://www.bloglines.com/images/sub_modern11.gif">Subscribe with Bloglines</feedburner:feedFlare>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.netvibes.com/subscribe.php?url=http%3A%2F%2Ffeeds.feedburner.com%2FQuickOnlineTips" src="http://www.netvibes.com/img/add2netvibes.gif">Subscribe with Netvibes</feedburner:feedFlare>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://fusion.google.com/add?feedurl=http%3A%2F%2Ffeeds.feedburner.com%2FQuickOnlineTips" src="http://buttons.googlesyndication.com/fusion/add.gif">Subscribe with Google</feedburner:feedFlare>
<feedburner:feedFlare xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" href="http://www.live.com/?add=http%3A%2F%2Ffeeds.feedburner.com%2FQuickOnlineTips" src="http://tkfiles.storage.msn.com/x1piYkpqHC_35nIp1gLE68-wvzLZO8iXl_JMledmJQXP-XTBOLfmQv4zhj4MhcWEJh_GtoBIiAl1Mjh-ndp9k47If7hTaFno0mxW9_i3p_5qQw">Subscribe with Live.com</feedburner:feedFlare>
Det här är ju en jäkla massa kod, haha.
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Filtrera och blanda många RSS-flöden?

Inlägg av Konservburk »

ubot skrev:Ok, tackar, vänligt! Det är väl iofs troligt att det dyker upp något huvud som inte finns med i koden ännu, bland mina övriga drygt 500 RSS-flöden, menar jag?
Jo, antagligen. Men om du börjar med vad du har nu och snickrar ihop hur du vill att ditt xml-huvud ska se ut så kan du lätt utöka det sen om det behövs, varje gång du lägger till en ny rss-länk.
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Filtrera och blanda många RSS-flöden?

Inlägg av Konservburk »

ubot skrev:Det här är ju en jäkla massa kod, haha.
Jo, jag vet. Men antagligen går det att kasta det mesta.

Edit: Börja med att hålla utkik efter <?xml>- och <rss>-taggar.
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Konservburk skrev:
ubot skrev:Det här är ju en jäkla massa kod, haha.
Jo, jag vet. Men antagligen går det att kasta det mesta.

Edit: Börja med att hålla utkik efter <?xml>- och <rss>-taggar.
Ok, ska ske!

Edit:

Nu har jag raderat lite i koden så jag tycker att jag har sparat alla xml och rss-taggar.

Kod: Markera allt

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="http://feeds.gawker.com/~d/styles/rss2full.xsl" type="text/xsl" media="screen"?>
<?xml-stylesheet href="http://feeds.gawker.com/~d/styles/itemcontent.css" type="text/css" media="screen"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feeds.feedburner.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feeds.arstechnica.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feeds.arstechnica.com/~d/styles/itemcontent.css"?>
<rss xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">  
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feedproxy.google.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feedproxy.google.com/~d/styles/itemcontent.css"?>

<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/rss2full.xsl" type="text/xsl" media="screen"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/itemcontent.css" type="text/css" media="screen"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feedproxy.google.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feedproxy.google.com/~d/styles/itemcontent.css"?>
<rss xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">   

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="http://feedproxy.google.com/~d/styles/rss2full.xsl"?>
<?xml-stylesheet type="text/css" media="screen" href="http://feedproxy.google.com/~d/styles/itemcontent.css"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/rss2full.xsl" type="text/xsl" media="screen"?>
<?xml-stylesheet href="http://feeds.feedburner.com/~d/styles/itemcontent.css" type="text/css" media="screen"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
Dock så raderade jag alla sådana här kodsnuttar:

Kod: Markera allt

<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" href="http://feedproxy.google.com/Mashable" type="application/rss+xml" />
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Konservburk, har du gett upp? :'(
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Filtrera och blanda många RSS-flöden?

Inlägg av Konservburk »

ubot skrev:Konservburk, har du gett upp? :'(
Självklart! Jag ger alltid upp precis innan något är klart. :P

Nej, men allvarligt... när du redigerade inlägget så markerades det inte som oläst, så jag såg inte att du hade kommit med något nytt.

Jag är fortfarande osäker på vad som måste finnas i xml-huvudet för att rss-en ska bli giltig. Det ska nog till att börja med bara finnas en enda <rss>-tagg, men den måste ha alla olika "xmlns:"-argument som de olika rss-länkarna har i den taggen från början.

Om vi till att börja med gör att försök att bara plocka alla dessa "xmls:"-argument och bygga ett helt eget xml-huvud i övrigt:

Kod: Markera allt

#!/bin/bash

rss=(
"http://feeds.gawker.com/lifehacker/full"
"http://feeds.feedburner.com/weblogsinc/downloadsquad"
"http://feeds.arstechnica.com/arstechnica/BAaf"
"http://feedproxy.google.com/Mashable"
"http://feeds.feedburner.com/LifeRocks20?format=xml"
"http://feedproxy.google.com/readwriteweb"
"http://feeds.feedburner.com/ComputerTipsFromAComputerGuy"
"http://feeds.feedburner.com/QuickOnlineTips"
)

trap 'rm -f /tmp/rss.xml /tmp/rss_head.xml /tmp/rss_body.xml' EXIT
for rss in "${rss[@]}"
do wget -qO- "$rss" |
   sed ':1;N;s/\r//g;s/\n//g;b1' |
   sed '
      s/<[Ii][Tt][Ee][Mm][^>]*>/\n\0/g
      s/<\/[Ii][Tt][Ee][Mm][^>]*>/\0\n/g
   ' >/tmp/rss.xml
   if ((i++))
   then
      sed -n '1p' </tmp/rss.xml >>/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >>/tmp/rss_body.xml
   else
      sed -n '1p' </tmp/rss.xml >/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >/tmp/rss_body.xml
   fi
done
sed 's/>\s*</>\n</g' /tmp/rss_head.xml >/tmp/rss.xml
cat >/tmp/rss_head.xml <(
   echo '<?xml version="1.0" encoding="UTF-8"?>'
   echo '<rss'
   sed -n '/^<[Rr][Ss][Ss] /{s///;s/>//;s/\s*\([Xx][Mm][Ll][Nn][Ss]:[^=]*="[^"]*"\)\s*/\n\1\n/g;p}' /tmp/rss.xml |
   grep -i '^xmlns:' |
   sort -u
   echo 'version="2.0"><channel>'
   echo '<title>...</title>'
   echo '<link>http://example.com</link>'
   echo '<description>...</description>'
)

filter_rss() {
   cat /tmp/rss_heads.xml <(
      mawk "$1" /tmp/rss_body.xml |
      sed -n 's/.*<[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>\([^<]*\)<\/[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>.*/date -d "\1" +%s; cat <<\\EOF\n\0\nEOF/p' |
      bash |
      sed '/^[0-9]\+$/{N;s/\n//}' |
      sort -nr |
      sed 's/^[0-9]\+//'
      echo '</channel></rss>'
   )
}

filter_rss '/linux/ && /windows/' >/tmp/rss_linux_and_windows.xml
filter_rss '/linux/ || /windows/' >/tmp/rss_linux_or_windows.xml
filter_rss '/linux/ && !/windows/' >/tmp/rss_linux_but_not_windows.xml
Om det fortfarande finns saker som inte validerar ordentligt så antar jag att vi måste börja titta på alla specialdefinitoner; "<atom10:", "<feedburner:", osv.
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Konservburk skrev:
ubot skrev:Konservburk, har du gett upp? :'(
Självklart! Jag ger alltid upp precis innan något är klart. :P

Nej, men allvarligt... när du redigerade inlägget så markerades det inte som oläst, så jag såg inte att du hade kommit med något nytt.

Jag är fortfarande osäker på vad som måste finnas i xml-huvudet för att rss-en ska bli giltig. Det ska nog till att börja med bara finnas en enda <rss>-tagg, men den måste ha alla olika "xmlns:"-argument som de olika rss-länkarna har i den taggen från början.

Om vi till att börja med gör att försök att bara plocka alla dessa "xmls:"-argument och bygga ett helt eget xml-huvud i övrigt:

Kod: Markera allt

#!/bin/bash

rss=(
"http://feeds.gawker.com/lifehacker/full"
"http://feeds.feedburner.com/weblogsinc/downloadsquad"
"http://feeds.arstechnica.com/arstechnica/BAaf"
"http://feedproxy.google.com/Mashable"
"http://feeds.feedburner.com/LifeRocks20?format=xml"
"http://feedproxy.google.com/readwriteweb"
"http://feeds.feedburner.com/ComputerTipsFromAComputerGuy"
"http://feeds.feedburner.com/QuickOnlineTips"
)

trap 'rm -f /tmp/rss.xml /tmp/rss_head.xml /tmp/rss_body.xml' EXIT
for rss in "${rss[@]}"
do wget -qO- "$rss" |
   sed ':1;N;s/\r//g;s/\n//g;b1' |
   sed '
      s/<[Ii][Tt][Ee][Mm][^>]*>/\n\0/g
      s/<\/[Ii][Tt][Ee][Mm][^>]*>/\0\n/g
   ' >/tmp/rss.xml
   if ((i++))
   then
      sed -n '1p' </tmp/rss.xml >>/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >>/tmp/rss_body.xml
   else
      sed -n '1p' </tmp/rss.xml >/tmp/rss_head.xml
      sed '1d;$d' </tmp/rss.xml >/tmp/rss_body.xml
   fi
done
sed 's/>\s*</>\n</g' /tmp/rss_head.xml >/tmp/rss.xml
cat >/tmp/rss_head.xml <(
   echo '<?xml version="1.0" encoding="UTF-8"?>'
   echo '<rss'
   sed -n '/^<[Rr][Ss][Ss] /{s///;s/>//;s/\s*\([Xx][Mm][Ll][Nn][Ss]:[^=]*="[^"]*"\)\s*/\n\1\n/g;p}' /tmp/rss.xml |
   grep -i '^xmlns:' |
   sort -u
   echo 'version="2.0"><channel>'
   echo '<title>...</title>'
   echo '<link>http://example.com</link>'
   echo '<description>...</description>'
)

filter_rss() {
   cat /tmp/rss_heads.xml <(
      mawk "$1" /tmp/rss_body.xml |
      sed -n 's/.*<[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>\([^<]*\)<\/[Pp][Uu][Bb][Dd][Aa][Tt][Ee][^>]*>.*/date -d "\1" +%s; cat <<\\EOF\n\0\nEOF/p' |
      bash |
      sed '/^[0-9]\+$/{N;s/\n//}' |
      sort -nr |
      sed 's/^[0-9]\+//'
      echo '</channel></rss>'
   )
}

filter_rss '/linux/ && /windows/' >/tmp/rss_linux_and_windows.xml
filter_rss '/linux/ || /windows/' >/tmp/rss_linux_or_windows.xml
filter_rss '/linux/ && !/windows/' >/tmp/rss_linux_but_not_windows.xml
Om det fortfarande finns saker som inte validerar ordentligt så antar jag att vi måste börja titta på alla specialdefinitoner; "<atom10:", "<feedburner:", osv.
Jag tänkte att du kanske hade tröttnat på en amatör som mig. :)

Ok, jag ska testa den nya koden, men om den inte fungerar så har jag en idé. Går det inte att testa att slå ihop lite RSS-flöden (typ 10-20 st) via en site som gör sådant åt en och sedan se hur <rss>-taggen ser ut i det resulterande RSS-flödet som siten spottar ut?
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Filtrera och blanda många RSS-flöden?

Inlägg av Konservburk »

ubot skrev:Ok, jag ska testa den nya koden, men om den inte fungerar så har jag en idé. Går det inte att testa att slå ihop lite RSS-flöden (typ 10-20 st) via en site som gör sådant åt en och sedan se hur <rss>-taggen ser ut i det resulterande RSS-flödet som siten spottar ut?
Det är en riktigt bra idé. Just själva <rss>-taggen tror jag att jag har koll på hur den ska se ut. Det är mer alla andra konstiga special-taggar som <atom10:>, <feedburner:> och liknande som jag inte vet om de egentligen behövs, eller ens bör vara med.
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Konservburk skrev:
ubot skrev:Ok, jag ska testa den nya koden, men om den inte fungerar så har jag en idé. Går det inte att testa att slå ihop lite RSS-flöden (typ 10-20 st) via en site som gör sådant åt en och sedan se hur <rss>-taggen ser ut i det resulterande RSS-flödet som siten spottar ut?
Det är en riktigt bra idé. Just själva <rss>-taggen tror jag att jag har koll på hur den ska se ut. Det är mer alla andra konstiga special-taggar som <atom10:>, <feedburner:> och liknande som jag inte vet om de egentligen behövs, eller ens bör vara med.
Ok, jag ska testa att slå ihop en bunt RSS-flöden via någon site och klistra in RSS-flödet som kommer ut.

Kod: Markera allt

<?xml version="1.0" encoding="UTF-8"?>
<!-- OPML generated by Feed Rinse - http://feedrinse.com/ -->
<opml version="1.1">
<head>
<title>Rinsed Feeds by feedrinse.com</title>
</head>
<body>
<outline text="Download Squad *" title="Download Squad *" description="Download Squad" type="rss" version="RSS" htmlUrl="http://www.downloadsquad.com" xmlUrl="http://feedrinse.com/services/rinse/?rinsedurl=bf8a9a535a846b6ce7ea8c636c8e11d3"/>
<outline text="Life Rocks! 2.0 *" title="Life Rocks! 2.0 *" description="" type="rss" version="RSS" htmlUrl="http://www.nirmaltv.com" xmlUrl="http://feedrinse.com/services/rinse/?rinsedurl=06e5affcc8c9bbb947feacdea092df7d"/>
<outline text="Mashable! *" title="Mashable! *" description="Social software and social networking 2.0." type="rss" version="RSS" htmlUrl="http://mashable.com" xmlUrl="http://feedrinse.com/services/rinse/?rinsedurl=98be58789d93848fdac34b38985953d5"/>
<outline text="Online Tech Tips *" title="Online Tech Tips *" description="Computer tutorials, technology news, software reviews, and personal computing tips." type="rss" version="RSS" htmlUrl="http://www.online-tech-tips.com" xmlUrl="http://feedrinse.com/services/rinse/?rinsedurl=084ac57c170a0193d28b7def37bfd3de"/>
<outline text="Quick Online Tips *" title="Quick Online Tips *" description="Technology Bits and Blogging Tips." type="rss" version="RSS" htmlUrl="http://www.quickonlinetips.com/" xmlUrl="http://feedrinse.com/services/rinse/?rinsedurl=878132bbcf77c04fff5f6dbd87d1c6e7"/>
<outline text="ReadWriteWeb *" title="ReadWriteWeb *" description="" type="rss" version="RSS" htmlUrl="http://www.readwriteweb.com/" xmlUrl="http://feedrinse.com/services/rinse/?rinsedurl=727db67e4c58478d3ad4cf9316f8220c"/>
<outline text="FeedRinse.com Announcments" description="Announcments regarding FeedRinse.com" title="Feed Rinse Announcments" type="rss" version="RSS" htmlUrl="http://feedrinse.com/" xmlUrl="http://feedrinse.com/announcements/feed/?mid=cc823b8f1c307b292c42b8d70c7a1714"/>
</body>
</opml>
Det här gav ju inte något väl? Det riktiga RSS-flödet döljs av Feed Rinse. Jag får försöka hitta en annan tjänst.
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Det gick bättre med Yahoo Pipes. Det är inte en så himla dum tjänst faktiskt. Det blev en massa innehåll i rss-filen förstås, jag undrar om informationen ger något överhuvudtaget. Jag laddade upp filen på RapidShare iaf.

Här är länken:

http://rapidshare.com/files/155077968/y ... s_rss.html

Vad tror du, innehåller det det vi söker?

Jag testade också din nya kod och fick felmeddelande igen:

Kod: Markera allt

XML-tolkningsfel: prefix inte bundet till en namnrymd
Adress: file:///home/mrx/Skrivbord/rss_linux_and_windows.xml
Radnummer 1, Kolumn 4692:
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Filtrera och blanda många RSS-flöden?

Inlägg av Konservburk »

ubot skrev:Jag testade också din nya kod och fick felmeddelande igen:

Kod: Markera allt

XML-tolkningsfel: prefix inte bundet till en namnrymd
Adress: file:///home/mrx/Skrivbord/rss_linux_and_windows.xml
Radnummer 1, Kolumn 4692:
Och vad finns på rad 1, kolumn 4692?
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Filtrera och blanda många RSS-flöden?

Inlägg av Konservburk »

ubot skrev:Det gick bättre med Yahoo Pipes. Det är inte en så himla dum tjänst faktiskt. Det blev en massa innehåll i rss-filen förstås, jag undrar om informationen ger något överhuvudtaget. Jag laddade upp filen på RapidShare iaf.

Här är länken:

http://rapidshare.com/files/155077968/y ... s_rss.html

Vad tror du, innehåller det det vi söker?
Om den ska kunna användas till något vettigt så vill jag ha två testfiler...
* En som mitt skript skapat.
* En som yahoo-pipes skapat.

I mitt skript måste du använda ett filter som fångar allt:
filter_rss '/./' >/tmp/rss_allt.xml

* Du måste använda samma rss-länkar i yahoo-pipes som du gör i mitt skript.
* Du måste skapa de ihopslagna xml-filerna så samtidigt som möjligt.

* Om du lyckas med allt ovan, och xml-filen från mitt skript ger validerings-fel, medan den från yahoo-pipes är helt ok... då har vi något vettigt att jämföra och jobba mot.
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Re: Filtrera och blanda många RSS-flöden?

Inlägg av ubot »

Jag får tacka dig för hjälpen så här långt Konservburk! Jag har pausat det här projektet på obestämd tid. Jag har nämligen hittat en alternativ lösning som gör att jag plockar ut intressanta inlägg manuellt på ett smidigt sätt istället för automatisk filtrering. Det gör att jag får lägga ner mer tid på att filtrera RSS-flödena, men å andra sidan väljer jag helt fritt vad jag ska ha med. Tack för alla hjälp så här långt ändå!
Skriv svar

Återgå till "Programmering och webbdesign"