Hallo,
Ik zit over het volgende na te denken:
Ik heb een website waarbij nu hier en daar door een bepaalde database tabel gezocht kan worden. Het gaat dan om LIKE '%$zoek%' in de query.
Ik wil nu echter een algemene zoekfunctie voor meer tabellen in 1 keer. Verder wil ik gebruik maken van een zogenoemde 'fuzzysearch'. Het gaat in de database om soms best grote lappen tekst (nieuwsberichten, forumberichten, faq, handleiding) en er zijn op dit moment in totaal zo'n 1000 records.
Voor de fuzzysearch wilde ik
gaan gebruiken en boven een bepaald percentage het zoekresultaat weergeven.
Je kunt echter op je vingers natellen dat als je eerst alle data uit de database haalt en vervolgens hieruit alle kernwoorden haalt (filter lidwoorden etc.) en dan per woord een similar_text check doet de server hier te lang mee bezig is.
Een andere mogelijkheid is het aanmaken van een steekwoorden tabel die bijhoud welke woorden in welke tabellen staan onder welke id's. Maar dit is natuurlijk best bewerkelijk. Helemaal omdat ik dan op verschillende plaatsen op de site en in de admin moet gaan inbouwen dat de steekwoorden tabel wordt geupdate bij een post. Hierdoor ben ik niet zo happig om dit helemaal te gaan opzetten.
Heeft iemand hier ervaring mee of ideeen over die hij/zij met me zou willen delen?
Is er een andere en of betere aanpak?
Alvast bedankt
Ik zit over het volgende na te denken:
Ik heb een website waarbij nu hier en daar door een bepaalde database tabel gezocht kan worden. Het gaat dan om LIKE '%$zoek%' in de query.
Ik wil nu echter een algemene zoekfunctie voor meer tabellen in 1 keer. Verder wil ik gebruik maken van een zogenoemde 'fuzzysearch'. Het gaat in de database om soms best grote lappen tekst (nieuwsberichten, forumberichten, faq, handleiding) en er zijn op dit moment in totaal zo'n 1000 records.
Voor de fuzzysearch wilde ik
code:
1
| int similar_text ( string first, string second [, float &percent] ) |
gaan gebruiken en boven een bepaald percentage het zoekresultaat weergeven.
Je kunt echter op je vingers natellen dat als je eerst alle data uit de database haalt en vervolgens hieruit alle kernwoorden haalt (filter lidwoorden etc.) en dan per woord een similar_text check doet de server hier te lang mee bezig is.
Een andere mogelijkheid is het aanmaken van een steekwoorden tabel die bijhoud welke woorden in welke tabellen staan onder welke id's. Maar dit is natuurlijk best bewerkelijk. Helemaal omdat ik dan op verschillende plaatsen op de site en in de admin moet gaan inbouwen dat de steekwoorden tabel wordt geupdate bij een post. Hierdoor ben ik niet zo happig om dit helemaal te gaan opzetten.
Heeft iemand hier ervaring mee of ideeen over die hij/zij met me zou willen delen?
Is er een andere en of betere aanpak?
Alvast bedankt