Beste mede-tweakers,
Nu ik vorder met mijn zoekmachine zit ik nu met het volgende probleem.
Elke keer dat er een nieuwe pagina wordt opgehaald door mijn script haal hij alles netjes uit elkaar en haalt hij ook netjes de body tussen de <body> en </body> tags op. Het probleem wat ik nu heb is dat ik wel heel leuk de body in me database heb staan maar die moet voor de tijd gestript worden van alle html tags, eventuele <script> en <style> blokken enzovoort.
De kernvraag is nu: Hoe doe ik dit zo snel mogelijk op een effectieve manier?
P.s de reden waarom ik dit wil is 1. De database wordt kleiner. 2. Om zo een samenvatting van de site te kunnen geven bij de resultaten waar het woord gevonden wordt.
Alvast bedankt.
Nu ik vorder met mijn zoekmachine zit ik nu met het volgende probleem.
Elke keer dat er een nieuwe pagina wordt opgehaald door mijn script haal hij alles netjes uit elkaar en haalt hij ook netjes de body tussen de <body> en </body> tags op. Het probleem wat ik nu heb is dat ik wel heel leuk de body in me database heb staan maar die moet voor de tijd gestript worden van alle html tags, eventuele <script> en <style> blokken enzovoort.
De kernvraag is nu: Hoe doe ik dit zo snel mogelijk op een effectieve manier?
P.s de reden waarom ik dit wil is 1. De database wordt kleiner. 2. Om zo een samenvatting van de site te kunnen geven bij de resultaten waar het woord gevonden wordt.
Alvast bedankt.