Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

[FEATURE] zoeken in tijd verfijnen / letters gelijkstellen

Pagina: 1
Acties:
  • 257 views

  • Edmin
  • Registratie: Januari 2006
  • Laatst online: 21-11 10:19

Edmin

Crew Council

get on my horse!

Topicstarter
LD,

Ik zocht vandaag naar posts over de beruchte 'vogelscene' voor HTPCs en CPU load, blablabla. Daarbij zocht ik op 'vogelscene' (zonder accent). Result:

http://gathering.tweakers...ata%5Bsearchtimeout%5D=30

Punt is dat ik eerder in de HTPC BBG het woord met accent heb zien staan, maar deze wordt niet meegenomen in de resultaten, omdat het trefwoord niet matched. Nu blijkt dat sommigen het met accent spellen en anderen zonder (waarschijnlijk omdat bijzondere karakters een extra handeling vergen).
Mijn eerste vraag is dan ook: zou het mogelijk zijn dat voor een zoekslag de 'e' en de 'è' gelijkwaardig worden gesteld? (ook voor andere letters en accenten uiteraard)

Verder blijkt dat wanneer ik mijn zoekslag specificeer op een tijdsperiode, de searchengine de datum topicstart als uitgangspunt neemt. Als ik op zoek ben naar recente posts over een onderwerp en bijv. zoek van 0 tot 30 dagen, dan komen 'grote' topics vaak niet bovendrijven, omdat zij langer geleden geopend zijn.
Mijn tweede vraag is dan ook: zou het mogelijk zijn om de tijdsperiode verder te specificeren? Dus zoek op posts van 0-30dgn, ipv alleen topicstarts?

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Edmin schreef op donderdag 01 mei 2008 @ 22:58:
Mijn eerste vraag is dan ook: zou het mogelijk zijn dat voor een zoekslag de 'e' en de 'è' gelijkwaardig worden gesteld? (ook voor andere letters en accenten uiteraard)
Dat doet de Nederlandse snowball stemmer al, en die wordt gebruikt om de woorden te normaliseen. Alle, behalve één... en je kan wel raden welke. Helaas is dat niet triviaal aan te passen en vergt het ook nog eens een complete herindexatie (die al gauw twee dagen duurt). Ik zal proberen na te gaan waarom de è anders behandelt wordt.
Mijn tweede vraag is dan ook: zou het mogelijk zijn om de tijdsperiode verder te specificeren? Dus zoek op posts van 0-30dgn, ipv alleen topicstarts?
Het was tot voor kort in de onderliggende zoekmachine niet mogelijk om op verschillende datumvelden te kunnen zoeken. Ik geloof dat dat nu wel kan, dus het is inderdaad interessant om ook de datum van de laatste reactie als zoekfiltering aan te bieden.
Maar overigens is dat ook door de vereiste herindexatie geen triviale wijziging.

  • Edmin
  • Registratie: Januari 2006
  • Laatst online: 21-11 10:19

Edmin

Crew Council

get on my horse!

Topicstarter
Dank voor je respons. Ik begrijp dat zeker de laatste vraag niet erg eenvoudig te implementeren is, maar ik ben blij dat er in ieder geval aandacht voor is. 10q

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Zoeken in tijdsperiode is ondertussen uitgebreid, de letters nog meer gelijkstellen is niet echt te doen zo.

Dit topic is gesloten.