Omdat dit een serversided probleem is (en ik geen trap onder mijn kont van NMe wil
) stel ik bij deze mijn vraag in deze rubriek.
Het zit als volgt: ik haal rss feeds om de 5 uur binnen op mijn website en cache deze op de server in xml bestanden. Dit werkt allemaal prima.
Het gebeurt echter wel eens dat de content van sommige websites onveranderd is gebleven in die 5 uur, de rss is dan ook logischerwijs onveranderd. In die omstandigheden is het dan zonde om een rss feed weg te schrijven naar de server, terwijl de content exact hetzelfde is gebleven, je verliest dan toch voor niets een stukje datalimiet.
Kortom: rss updaten alleen wanneer nodig.
Om dit 'probleem' te verhelpen, bedacht ik om gewoon de opgehaalde content te vergelijken met de bestaande content, mocht er geen verschil tussen bestaan, dan wordt er ook niks weggeschreven!
Ik heb hier gelukkig genoeg voorbeelden van kunnen vinden op internet, dus daar zal ik jullie niet mee lastigvallen
Maaarrrrrr, het valt me ook op, dat sommige websites toch hun rss feed updaten terwijl er qua content niets veranderd is... (ik vermoed dat dit automatisch gebeurt in sommige CMS). Het enige wat dan wel verandert is de <lastbuilddate>... terwijl alles voor de rest precies hetzelfde is. Probleem: dit bestand wordt tòch weggeschreven op de server omdat het toch niet helemaal hetzelfde is met het opgeslagen cache bestand... nietwaar?
Tja, hoe los je dàt dan op?
Zou het misschien een idee zijn om de content ook op bestandsgrootte te vergelijken? Maar ik neem aan dat enige verandering van <lastbuilddate> toch ook een *minieme* afwijking in bestandsgrootte oplevert, waardoor vergelijken op bestandsgrootte ook niet zal werken...
Het zit als volgt: ik haal rss feeds om de 5 uur binnen op mijn website en cache deze op de server in xml bestanden. Dit werkt allemaal prima.
Het gebeurt echter wel eens dat de content van sommige websites onveranderd is gebleven in die 5 uur, de rss is dan ook logischerwijs onveranderd. In die omstandigheden is het dan zonde om een rss feed weg te schrijven naar de server, terwijl de content exact hetzelfde is gebleven, je verliest dan toch voor niets een stukje datalimiet.
Kortom: rss updaten alleen wanneer nodig.
Om dit 'probleem' te verhelpen, bedacht ik om gewoon de opgehaalde content te vergelijken met de bestaande content, mocht er geen verschil tussen bestaan, dan wordt er ook niks weggeschreven!
Maaarrrrrr, het valt me ook op, dat sommige websites toch hun rss feed updaten terwijl er qua content niets veranderd is... (ik vermoed dat dit automatisch gebeurt in sommige CMS). Het enige wat dan wel verandert is de <lastbuilddate>... terwijl alles voor de rest precies hetzelfde is. Probleem: dit bestand wordt tòch weggeschreven op de server omdat het toch niet helemaal hetzelfde is met het opgeslagen cache bestand... nietwaar?
Tja, hoe los je dàt dan op?
Zou het misschien een idee zijn om de content ook op bestandsgrootte te vergelijken? Maar ik neem aan dat enige verandering van <lastbuilddate> toch ook een *minieme* afwijking in bestandsgrootte oplevert, waardoor vergelijken op bestandsgrootte ook niet zal werken...