Ik heb een stukje content. Hierin zitten diverse links verwerkt, en deze wil ik indexeren om vervolgens een link checker mee te bouwen.
Om links uit een anchor tag te halen kun je simpel door de hele collectie loopen, maar ik loop tegen een ander probleempje aan. Onclick, location.href, location.replace, css files, etc. etc.
Nu zou ik dit serverside kunnen doen, lekker makkelijk, maar met een hoop concurrent users op een systeem levert dit een shitload aan performance hits op. Met de huidige werkstations leg ik deze indexering liever aan de client kant.
Eigenlijk komt het hier op neer, hoe maak ik zo effectief mogelijk een indexering aan van alle mogelijke verwijzingen naar een url, zowel absoluut als relatief, aan.
Nog mooier zou zijn als het wiel al was uitgevonden, maar ik kon helemaal niets vinden dat zo ver ging. Wellicht dat de huidige browser engines kunnen worden aangesproken om een indexering terug te krijgen van de links, en anders wordt het lomp zoekwerk met indexOf en wat loop werk.
Om links uit een anchor tag te halen kun je simpel door de hele collectie loopen, maar ik loop tegen een ander probleempje aan. Onclick, location.href, location.replace, css files, etc. etc.
Nu zou ik dit serverside kunnen doen, lekker makkelijk, maar met een hoop concurrent users op een systeem levert dit een shitload aan performance hits op. Met de huidige werkstations leg ik deze indexering liever aan de client kant.
Eigenlijk komt het hier op neer, hoe maak ik zo effectief mogelijk een indexering aan van alle mogelijke verwijzingen naar een url, zowel absoluut als relatief, aan.
Nog mooier zou zijn als het wiel al was uitgevonden, maar ik kon helemaal niets vinden dat zo ver ging. Wellicht dat de huidige browser engines kunnen worden aangesproken om een indexering terug te krijgen van de links, en anders wordt het lomp zoekwerk met indexOf en wat loop werk.