Another great RSS feed is scraped at scrapedfeeds.com
Earth Observatory Images
sattelite images from the eart. Awesome feed to see in your RSS reader !
Another great RSS feed is scraped at scrapedfeeds.com
Earth Observatory Images
sattelite images from the eart. Awesome feed to see in your RSS reader !
Entertainment, roddel, achterklap, celebrity. En onzin ..
Dus als je een RSS feed ergens van wil hebben: mail me, dan kijk ik wat ik voor je kan doen !
Zat een beetje te klooien .. Fark.com heeft geen eigen officiele feed maar wel een aantal ‘onofficiele’ rss feeds. Och waarom scrapedfeeds.com dan niet.
Dus vanaf vandaag ook in dit theater: Fark! rss feed
Interessant: een mailinglijst voor users die RSS gebruiken. Maar of nu echt de ‘gebruiker’ hier zich op subscribed…
Leuk: yahoogroups heeft al tijden RSS feed mogelijkheden op de mailinglijst.
Wauw.. syndicatie is toch erg kewl aan het worden.
Zo scrape ik al tijden David Letterman’s top 10 in rss formaat
en ik zie op scrapedfeeds niet zoveel subscribers. Zit ik net mijn apache log door te nemen zie ik dat Livejournal deze feed oppikt en er zijn zo’n 20 subscribers… Kewl .. Scrapedfeeds wordt meer en meer gebruikt.
Gemiddels gebruik 31Mb per dag, zo’n 1GB per maand.
Scrapedfeeds.com draait als virtuele server op mijn Sun Qube3
Vandaag heb ik een nieuwe versie van de Scrapedfeeds.com engine (myheadlines) geinstalleerd. Meer Backend logging om server abuse te monitoren. Ik heb nu de mogelijkheid gebruikers te bannen alsmede een XML feed voor te schotelen als de feed niet meer bestaat of dat men tevaak zit te checken of de feed is geupdated. Tevens is er nu een betere XML/RSS feed voor het laatste nieuws.
Onderstaand een voorbeeld van een invalide feed request.
Zag via een remote sessie naar mijn machine thuis dat Joost om een ‘weerbericht’ rss feed vroeg. Erg actueel nu met al die sneeuwbuien (al zie ik hier in Amersfoort momenteel een heldere lucht met een lekker zonnetje).
KNMI ligt plat, Meteoconsult zuigt. Dan maar even bij Piet Paulusma kijken.
Zijn nieuwsbericht was makkelijk te scrapen in RSS vorm.
In testfase, want ik heb geen idee of het blijft werken. De feed kan zomaar breken als het niet in een standaard opmaak geplaatst wordt, maar dat zien we in de loop van de week wel.
Vandaag gaan we afscheid nemen van de ANP/Novum feeds die te zien waren op scrapedfeeds via Compuserve.nl. Compuserve heeft een nieuwe layout en zorgt er nu voor dat de de links niet meer werken.
Nieuws.nl heeft de Novum feed en die wordt al gescraped voor xml/rss
Omdat er teveel duplicates (headlines) waren heb ik gezocht naar een ‘zuivere’ ANP feed en gevonden op @home.
Dus: graag al je ANP / NOVUM nieuws feeds richting Compuserve verwijderen, alle URL’s zijn broken nu ivm wijziging van de pages @ compuserve.
Voor ANP feeds kan je nu alles pakken vanaf deze URL
Voor Novum feeds kun je de feeds van deze URL gebruiken
Met de nieuwe scrapes richting @home heb ik Novum en ANP nieuwsfeeds beter gescheiden.
Damn. Ik kom er net achter dat Compuserve haar webpagina’s veranderd heeft. Op ScrapedFeeds heb ik een aantal feeds beschikbaar met nieuws van ANP en Novum. Helaas werken de URL’s niet meer ;-(
De server genereerd een Error 500 op de request die de scraper stuurt.
Liefhebbers van de feeds: iemand een URL beschikbaar voor deze feeds die geen fouten genereren? (alles mbt *.asp exentsie op compuserve.nl is niet ok)
** ben in afwachting van Mike, om te horen of de scraper de server kan ‘foppen’. **