Black Friday = Pricewatch Bekijk onze selectie van de beste Black Friday-deals en voorkom een miskoop.

[BUG]Hoofdlettergevoeligheid zoeken

Pagina: 1
Acties:

  • alex3305
  • Registratie: Januari 2004
  • Laatst online: 15:06
Bij het zoeken op de site valt me op dat het zoekveld (soms) hoofdlettergevoelig lijkt te zijn. Om wat voorbeelden aan te kaarten:

Broadcom:
http://tweakers.net/zoeken?keyword=Broadcom (338 resultaten)
http://tweakers.net/zoeken?keyword=BroadCom (163 resultaten)

Rocksmith:
http://tweakers.net/pricewatch/zoeken/?keyword=Rocksmith (3 resultaten)
http://tweakers.net/pricewatch/zoeken/?keyword=RockSmith (0 resultaten)

Met merken zoals Apple of Microsoft zijn de verschillen natuurlijk nog groter. Dit lijkt mij, ongewenst gedrag. Althans soms kan iemand iets met hoofdletters spellen terwijl het niet hoort of andersom. Misschien is het dus handig om deze gevoeligheid uit te schakelen.

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Het probleem is dat mensen soms ook spaties gebruiken waar normaliter camelcase wordt gebruikt... Denk aan 'power shot' wat in werkelijkheid meestal 'PowerShot' heet. Of je RockSmith voorbeeld zou vast ook wel als rock smith geprobeerd worden (wat in dit geval natuurlijk ook geen hits oplevert, tenzij de producten RockSmith zouden heten).

Het is dus niet zozeer een bug, maar een feature dat woorden met camelcasing (en andere overgangen in karaktertype) anders behandeld worden dan hetzelfde woord in volledige lowercase. Maar we kunnen nog kijken of er effectief een 'volledige term OR opgehakte termen' gedaan kan worden (zou vziw zelfs al zo moeten zijn, maar blijkbaar niet).

Overigens is e.e.a. dus niet zozeer hoofdlettergevoelig, maar karaktertype-overgang-gevoelig :P

[ Voor 6% gewijzigd door ACM op 25-10-2012 09:40 ]


  • alex3305
  • Registratie: Januari 2004
  • Laatst online: 15:06
Nou ACM, ik snap het idee. Maar het maakt het er niet gemakkelijker op :). Ik zou inderdaad kiezen voor dezelfde termen en opgehakte termen, maar deze wel beiden naar lowercase zetten zodat er toch wat makkelijker gefiltered kan worden. Als voorbeeld:
code:
1
2
3
4
Power Shot == power shot
PowerShot  == power shot OR powershot
Powershot  == powershot
powershot  == powershot

Qua technische implementatie lijkt me dit ook het gemakkelijkst en je zult de meeste relevante zoekresultaten krijgen.

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

alex3305 schreef op donderdag 25 oktober 2012 @ 15:04:
maar deze wel beiden naar lowercase zetten zodat er toch wat makkelijker gefiltered kan worden.
Dat gebeurt sowieso al :)
Maar het is helaas niet zo triviaal om het opdezelfde plek als waar dit ophakken gebeurt te doen. Gelukkig is Lucene vrij goed zelf aan te passen, dus we gaan er zeker naar kijken.