Zoekproblemen genegeerd

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Rickets
  • Registratie: Augustus 2001
  • Niet online

Rickets

Finger and a shift

Topicstarter
Er bestaan wat problemen met de search, zoals blijkt uit problemen betreffende zoeken in GoT. De topicstarter, zijn manier van reageren en het op slot gooien laat ik buiten beschouwing. Wat ik wel belangrijk vind, is dat hij een probleem aankaart waarvan ik duidelijk kan zien dat het bestaat en blijkbaar een paar andere gebruikers met mij. Helaas wordt dit probleem niet erkend en genegeerd. Ik wil er op terugkomen; niet via e-mail, want dat is te eenzijdig; het is immers een forum, waar men feedback kan verwachten.

Als ik het probleem bekijk, ziet dat er als volgt uit:
• Iemand vult een of meerdere relevante kernwoorden in in het quicksearch-formulier
• De zoekmachine doet haar werk en laat de resultaten zien
• Tussen de resultaten staan topics die weliswaar de kernwoorden bevatten, maar verder geen nut hebben doordat ze meteen na de topicstart gesloten zijn, vrijwel alleen bestaan uit poging van andere gebruikers om de topicstarter te corrigeren, gesloten zijn met weer een verwijzing naar andere zoekresultaten, etc. Samengevat: resultaten die niet getoond moeten worden.

Het probleem is dus dat kostbare tijd van de gebruiker verspild wordt. Die zit voor niets te klikken op links die vervolgens niet relevant blijken te zijn. De oplossingen en verklaringen die daarvoor aangedragen worden zijn:
• De doelgroep bestaat uit gebruikers die geacht worden verstand van computers te hebben
• Gebruik niet de quicksearch, maar de uitgebreide versie
• Doe meer moeite

De doelgroep mag dan wat meer kennis hebben van computers, maar is dat een reden om haar op te zadelen met ongemakkelijkheden? Het argument 'de doelgroep' wordt nu gebruikt om de gaten in het gebruiksgemak achter te verstoppen. Er worden onmenselijke dingen verwacht van de gebruiker. Bijvoorbeeld: als je een topic open hebt staan, is de quicksearch veranderd. Er zijn twee opties bijgekomen ten opzichte van de quicksearch op de homepage. Die nieuwe opties vallen totaal niet op, ook niet bij gebruikers die tot de doelgroep behoren, zoals ik. Ik las er over in het topic waar ik eerder naar verwees, maar ik had geen idee waar je in een topic kon zoeken. Ik moest er echt naar op zoek voor ik het zag. Zoeken naar zoekfunctionaliteit is niet handig.

Dan moeten we de uitgebreide versie van de zoekmachine maar gebruiken (als je die eenmaal gevonden hebt in het weggestopte menu). Met andere woorden, met de quicksearch krijg je eigenlijk niet de resultaten die je wilt; je moet namelijk eerst instellingen veranderen in de uitgebreide versie. De quicksearch werkt dus niet goed. Bovendien kom je er niet met de instellingen die je kan veranderen in de uitgebreide versie; je wilt namelijk niet altijd gesloten topics uitsluiten. Veel topics zijn gesloten omdat ze vol waren, niet omdat ze niet getolereerd werden.

Als laatste zou er meer moeite gedaan moeten worden. Dat vind ik een slecht uitgangspunt, en staat in mijn ogen gelijk aan het minachten van je bezoekers. De zoekmachine zou er moeten zijn om het zoeken te vergemakkelijken, niet om nieuwe ongemakkelijkheden te introduceren. De doelgroep staat hier los van, want iedereen (ook de gebruikers met meer kennis) heeft er last van.

Ik wil hier niet mee zeggen dat ik of iemand anders nu de search niet weet te gebruiken. Uiteindelijk kom je er wel, maar het moet toch veel makkelijker kunnen. Waarom zou je als webbeheerder niet proberen om het je doelgroep zo plezierig mogelijk te maken?

If some cunt can fuck something up, that cunt will pick the worst possible time to fucking fuck it up, because that cunt’s a cunt.


Acties:
  • 0 Henk 'm!

  • Glashelder
  • Registratie: September 2002
  • Niet online

Glashelder

Anti Android

Ik stel voor je een oplossing probeert te bedenken dan. Het probleem is namelijk niet zo 1,2,3 op te lossen.

Een knopje dat een topic genegeerd moet worden door de search lijkt me ook niet praktisch, er bestaan al tienduizenden topics tenslotte. En daarnaast zou je topics uit kunnen sluiten waarnaar gezocht wordt..

Bijvoorbeeld dat eigen evil topic uit je posthistory, wil je misschien ook nog wel een keer opzoeken :+

PV 4915wp op oost, 2680 wp op west, 1900 wp op zuid. pvoutput - AUX 8 kW bi bloc


Acties:
  • 0 Henk 'm!

  • moto-moi
  • Registratie: Juli 2001
  • Laatst online: 09-06-2011

moto-moi

Ja, ik haat jou ook :w

Het heet niet voor niets een quicksearch :)
Maar het is misschien wel een idee om daarbij standaard de gesloten topics te negeren. Dat zal een groot gedeelte van je probleem wel oplossen lijkt me?

God, root, what is difference? | Talga Vassternich | IBM zuigt


Acties:
  • 0 Henk 'm!

  • Rickets
  • Registratie: Augustus 2001
  • Niet online

Rickets

Finger and a shift

Topicstarter
Glashelder schreef op woensdag 31 augustus 2005 @ 22:58:
Ik stel voor je een oplossing probeert te bedenken dan. Het probleem is namelijk niet zo 1,2,3 op te lossen.

Een knopje dat een topic genegeerd moet worden door de search lijkt me ook niet praktisch, er bestaan al tienduizenden topics tenslotte. En daarnaast zou je topics uit kunnen sluiten waarnaar gezocht wordt..

Bijvoorbeeld dat eigen evil topic uit je posthistory, wil je misschien ook nog wel een keer opzoeken :+
Ik constateer alleen een probleem; ik heb nog niet nagedacht over oplossingen. Ik kan ook niet achter de scherm kijken wat er mogelijk is. Voordat er over oplossingen gedacht kan worden, moet men de intentie hebben er iets aan te doen. Ik heb ook niet gezegd dat je topics helemaal onvindbaar moet maken, integendeel.
moto-moi schreef op woensdag 31 augustus 2005 @ 23:01:
Het heet niet voor niets een quicksearch :)
Ja, maar het staat er heel miniscuul boven ;) Maar goed, bij een quicksearch verwacht ik op een snelle manier alleen relevante topics. Het snelle gedeelte lukt, het relevante nog niet helemaal.
Maar het is misschien wel een idee om daarbij standaard de gesloten topics te negeren. Dat zal een groot gedeelte van je probleem wel oplossen lijkt me?
De vraag is of je de inhoud van die goede gesloten topics buiten de quicksearch wilt houden, maar dat kan ik niet goed beoordelen; dat laat ik aan jullie over.
Overigens vormt dat maar een deel van de usability-problemen die ik opnoemde (ik ben er vast nog een paar vergeten).

If some cunt can fuck something up, that cunt will pick the worst possible time to fucking fuck it up, because that cunt’s a cunt.


Acties:
  • 0 Henk 'm!

  • Glimi
  • Registratie: Augustus 2000
  • Niet online

Glimi

Designer Drugs

(overleden)
Glashelder schreef op woensdag 31 augustus 2005 @ 22:58:
Ik stel voor je een oplossing probeert te bedenken dan. Het probleem is namelijk niet zo 1,2,3 op te lossen.

Een knopje dat een topic genegeerd moet worden door de search lijkt me ook niet praktisch, er bestaan al tienduizenden topics tenslotte. En daarnaast zou je topics uit kunnen sluiten waarnaar gezocht wordt..
Oplossingen zijn pas relevant als, zoals Rickets zegt, het probleem erkent wordt en men er tijd voor vrij wil maken om er over na te denken. Dat is nu nog niet aan de orde als ik dion_b in "problemen betreffende zoeken in GoT" mag geloven.
moto-moi schreef op woensdag 31 augustus 2005 @ 23:01:
Het heet niet voor niets een quicksearch :)
Maar het is misschien wel een idee om daarbij standaard de gesloten topics te negeren. Dat zal een groot gedeelte van je probleem wel oplossen lijkt me?
Het zou problemen oplossen, maar ook introduceren. Topics met 1000 posts zijn vaak gesloten en soms ook relevant voor een zoekquery. Ik zou meer heil vinden in categorisering (dus per forum weergeven) maar zoals ik boven al stel: Wat is het probleem precies, wordt het erkent en is men bereid er tijd in te investeren?

Acties:
  • 0 Henk 'm!

  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Eerlijk gezegt gebruik ik die quicksearch bijna nooit aangezien die mij te veel beperkt. Immers elke keer als ik iets zoek dan stel ik in dat ik de volgorde van de topics op een andere manier wil en eventueel alleen "open" topics. Zou het daarom niet handiger zijn als de search deze "settings" onthoud en die automatisch zo selecteren dat het standaard is, ook voor die quicksearch. Ik geef toe het lost het probleem niet echt op, maar het zal er wel toe bij kunnen dragen :)

Acties:
  • 0 Henk 'm!

  • moto-moi
  • Registratie: Juli 2001
  • Laatst online: 09-06-2011

moto-moi

Ja, ik haat jou ook :w

Glimi schreef op woensdag 31 augustus 2005 @ 23:26:
Oplossingen zijn pas relevant als, zoals Rickets zegt, het probleem erkent wordt en men er tijd voor vrij wil maken om er over na te denken. Dat is nu nog niet aan de orde als ik dion_b in "problemen betreffende zoeken in GoT" mag geloven.
Ik hoef jou als ex-crewlid toch niet te vertellen dat de search niet gerunned wordt door een mod he ? ;)
Het zou problemen oplossen, maar ook introduceren. Topics met 1000 posts zijn vaak gesloten en soms ook relevant voor een zoekquery. Ik zou meer heil vinden in categorisering (dus per forum weergeven) maar zoals ik boven al stel: Wat is het probleem precies, wordt het erkent en is men bereid er tijd in te investeren?
Je vergeet het laatste punt: Is de feature die men voor ogen heeft wel beschikbaar in omega ?

Verder ben ik zeer benieuwd naar wat men precies verwacht van de search, want het systeem wat google gebruikt (o.a. tellen van het aantal links naar een bepaalde pagina) zit volgens mij niet in Omega, maar dat weet ACM vast wel, da's de searchbob :P

God, root, what is difference? | Talga Vassternich | IBM zuigt


Acties:
  • 0 Henk 'm!

  • Pearl
  • Registratie: September 2002
  • Laatst online: 27-09 09:45
Nu heb ik gisteravond al geprobeerd op het topic hierover weer open te krijgen met als gevolg dat de mijne ook op slot gaat.

De manier waarop dit gebeurd is niet een manier om een probleem, die meerdere gebruikers van dit forum hebben,op te lossen.

Je hoeft inderdaad dit forum niet te gebruiken omdat alle problemen die je hebt via Google gewoon op te lossen zijn, oftewel, GoT is helemaal niet nodig, je kunt gewoon zonder, maar mensen zoeken altijd iets met een wij gevoel.

En daar kan natuurlijk wel iets mee gedaan worden, snap dan ook niet dat deze aanleidingen om dit forum een beter/leuker/vermakelijker en prettiger aanzien te geven zo boers de grond wordt ingetrapt met een verhaaltje erbij dat juist de TS dit doet. 8)7

Nogmaals, ga eens in de schoenen staan van de TS en bekijk het niet zo kortzichtig, want zo komt het allemaal wel over. :?

Een specialist weet alles van niks en een generalist weet niks van alles.


Acties:
  • 0 Henk 'm!

  • Glimi
  • Registratie: Augustus 2000
  • Niet online

Glimi

Designer Drugs

(overleden)
moto-moi schreef op woensdag 31 augustus 2005 @ 23:38:
Ik hoef jou als ex-crewlid toch niet te vertellen dat de search niet gerunned wordt door een mod he ? ;)
Als user zie ik een moderator reageren, die dit neerlegt en het topic gaat op slot. Einde discussie. Als dat niet zo is, dan moet dat gecommuniceerd worden.
Je vergeet het laatste punt: Is de feature die men voor ogen heeft wel beschikbaar in omega ?

Verder ben ik zeer benieuwd naar wat men precies verwacht van de search, want het systeem wat google gebruikt (o.a. tellen van het aantal links naar een bepaalde pagina) zit volgens mij niet in Omega, maar dat weet ACM vast wel, da's de searchbob :P
Die features vallen dan vast af bij de analyse voor een bepaalde oplossing, maar dat is stiekem een beetje vooruit lopen op de zaken, vind ik.

  • moto-moi
  • Registratie: Juli 2001
  • Laatst online: 09-06-2011

moto-moi

Ja, ik haat jou ook :w

Glimi schreef op woensdag 31 augustus 2005 @ 23:50:
Als user zie ik een moderator reageren, die dit neerlegt en het topic gaat op slot. Einde discussie. Als dat niet zo is, dan moet dat gecommuniceerd worden.
Als ik elke onwaarheid die in elke sluitpost over serverbeheer moet gaan weerleggen heb ik er een dagtaak bij, ik knutsel liever met de server, if you don't mind ;)
Die features vallen dan vast af bij de analyse voor een bepaalde oplossing, maar dat is stiekem een beetje vooruit lopen op de zaken, vind ik.
Nou, zo erg wil ik het ook niet stellen :P
Ik bedoel meer dat een totale clone van de features van google geen haalbare kaart zal zijn ;)
Maar als iemand een helder verhaal inelkaar kan typen over wat er precies fout is aan de huidige implementatie van de quicksearch kan er allicht naar gekeken worden. Al hebben we voornamelijk php devvers in dienst, en zal fulltime hacken in de c++ code van omega geen haalbare kaart zijn ;)
(Tis trouwens gpled software geloof ik, dus ik hou niemand tegen om naar xapian toe te stappen en zelf de features erin ge fix0ren die erin missen ;) )
Pearl schreef op woensdag 31 augustus 2005 @ 23:46:
Nogmaals, ga eens in de schoenen staan van de TS en bekijk het niet zo kortzichtig, want zo komt het allemaal wel over. :?
Waar reageer ik kortzichtig :?

God, root, what is difference? | Talga Vassternich | IBM zuigt


  • NMe
  • Registratie: Februari 2004
  • Laatst online: 09-09 13:58

NMe

Quia Ego Sic Dico.

Volgens mij doelt ie meer op de eerdere topics over het "zoekprobleem" die gesloten zijn.

Is het geen optie om standaard alle gesloten topics met minder dan 500 posts uit te sluiten van weergave wanneer de quicksearch gebruikt wordt, en alle gesloten topics met 500 posts of meer weer wèl te laten zien? Op die manier filter je de goede topics die gesloten zijn wegens "vol" niet uit de zoekresultaten. Of het mogelijk is weet ik niet, just my 2 cents. :P

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.


  • Glimi
  • Registratie: Augustus 2000
  • Niet online

Glimi

Designer Drugs

(overleden)
moto-moi schreef op donderdag 01 september 2005 @ 00:03:
Als ik elke onwaarheid die in elke sluitpost over serverbeheer moet gaan weerleggen heb ik er een dagtaak bij, ik knutsel liever met de server, if you don't mind ;)
offtopic:
Dat is niet wat ik bedoel, sorry. Ik bedoel: het topic wordt gesloten en de vraag of hij open mag gaat ook dicht. Daarmee, mede door de aangegeven reactie, lijkt er dus een conclusie te zijn getrokken dat het geen probleem is of dat er geen tijd ingestoken zal worden.

Verwijderd

Ik heb dit idee al eerder geopperd, maar waarom niet het eens andersom aanpakken? Dus ipv. topics uit te sluiten van de search, het juist mogelijk maken bepaalde topics voorrang te geven in de search?

Voordeel: stickies kun je hoog in de resultaten houden (FAQ's ed) en je kunt het invoeren zonder dat je oude topics moet gaan herwaarderen.

Het idee is imo retesimpel. Er komg voor modjes gewoon een 'opwaardeer' knopje bij alle topics te staan. Een modje kan dan, als hij daar goesting in heeft, een topic 'opwaarderen' waardoor het hoger in de search terecht zal komen indien gematched.

Verwijderd

Wellicht een mogelijkheid om via search gevonden topics een relevant-o-meter mee te geven waarin de user kan aangeven hoezeer het topic voldeed aan waar hij naar op zoek was. (Zo'n ding wat je op veel support-sites ook tegenkomt; "This page was helpful" met een aantal radiobuttons)

Nou is natuurlijk niet ieder "goed" topic ook relevant voor de gedane search, maar na een tijdje zal hierdoor toch een behoorlijke schifting ontstaan als genoeg mensen een topic gewaardeerd hebben. Ik vermoed dat vooral de zeer goede topics vrij snel hoge cijfers halen, terwijl de echt slechte topics snel wegzakken.

  • Varienaja
  • Registratie: Februari 2001
  • Laatst online: 14-06 16:43

Varienaja

Wie dit leest is gek.

Glashelder schreef op woensdag 31 augustus 2005 @ 22:58:
Ik stel voor je een oplossing probeert te bedenken dan. Het probleem is namelijk niet zo 1,2,3 op te lossen.
Geen idee hoe dat gaat met performance enzo, maar een vinkje dat je korte op-slotte topics met een levensduur van maximaal 4 uur wilt negeren lijkt me afdoende. Dan zitten alle lange op-slotte topics wel in je zoekresultaat, en dan zijn de onzintopics voor 99% verdwenen.

Siditamentis astuentis pactum.


  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

[quote]Rickets schreef op woensdag 31 augustus 2005 @ 22:51:
• Tussen de resultaten staan topics die weliswaar de kernwoorden bevatten, maar verder geen nut hebben doordat ze meteen na de topicstart gesloten zijn, vrijwel alleen bestaan uit poging van andere gebruikers om de topicstarter te corrigeren, gesloten zijn met weer een verwijzing naar andere zoekresultaten, etc. Samengevat: resultaten die niet getoond moeten worden.
Maar hoe weet "het systeem" dat zo'n topic irrelevant is? Wie weet wil de zoeker een overzicht van op slot gegane topics om een "er gaat te veel op slot in $forum"-topic in LA te onderbouwen ;)
Door de verschillende typen zoekopdrachten kunnen we niet zomaar bepaalde topics uitsluiten. Eventueel is er natuurlijk wel een goede default mogelijk, die vervolgens uitgeschakeld kan worden.
Het probleem is dus dat kostbare tijd van de gebruiker verspild wordt. Die zit voor niets te klikken op links die vervolgens niet relevant blijken te zijn. De oplossingen en verklaringen die daarvoor aangedragen worden zijn:
Bij mijn weten worden zowel het aantal reacties als het type topic (op slot, open, faq) getoond in de zoekresultaten. Een topic met 1a2 reacties dat op slot gegaan is zou je dan al niet hoeven te proberen. Tenzij je bang bent dat je niet de beste zoekwoorden hebt gebruikt, dan zijn die gesloten topics vaak juist wel handig doordat er vaak een aantal hints voor zoekwoorden voorgesteld worden die je wellicht zelf nog niet gebruikt had.
Er worden onmenselijke dingen verwacht van de gebruiker. Bijvoorbeeld: als je een topic open hebt staan, is de quicksearch veranderd. Er zijn twee opties bijgekomen ten opzichte van de quicksearch op de homepage. Die nieuwe opties vallen totaal niet op, ook niet bij gebruikers die tot de doelgroep behoren, zoals ik. Ik las er over in het topic waar ik eerder naar verwees, maar ik had geen idee waar je in een topic kon zoeken. Ik moest er echt naar op zoek voor ik het zag. Zoeken naar zoekfunctionaliteit is niet handig.
En enig idee hoe we dat duidelijker kunnen maken? Bovenaan de pagina een ding dat roept "zoeken" staat er tenslotte al... Moet ie groter? Fellere kleuren? Knipperen?
We hebben expres de quicksearch bovenaan de pagina gezet, dat zou tenslotte het eerste moeten zijn dat je doorgaans ziet. Bovendien is om de "zoek in topic"-functionaliteit een beetje extra te accentueren al standaard aangezet als je in een topic kijkt. Maar jij ziet dat blijkbaar als iets onmenselijks?
Moet ie nog duidelijker? Grote pijlen erop richten?

Ik overdrijf een beetje met mijn voorstellen voor verbetering, maar als er iemand concrete verbeteringen weet hoe we de zoekfunctionaliteit duidelijker kunnen aanbieden... Zeg dat dan, want wij hebben er niet zoveel ideeen meer over.
Dan moeten we de uitgebreide versie van de zoekmachine maar gebruiken (als je die eenmaal gevonden hebt in het weggestopte menu).
"weggestopt"? Je klikt op het woord 'SEARCH' en je krijgt hem. Je typt wat in de quicksearch in je komt sowieso in de normale zoekinterface terecht: dus als je niet bij de quicksearch gelijk al de resultaten naar je wens kreeg, ben je al op de pagina die ervoor kan zorgen dat je de boel verder kan bijschaven.
Als laatste zou er meer moeite gedaan moeten worden. Dat vind ik een slecht uitgangspunt, en staat in mijn ogen gelijk aan het minachten van je bezoekers. De zoekmachine zou er moeten zijn om het zoeken te vergemakkelijken, niet om nieuwe ongemakkelijkheden te introduceren. De doelgroep staat hier los van, want iedereen (ook de gebruikers met meer kennis) heeft er last van.
Maar de zoekmachine kan niet voor de gebruiker denken. Als jij "windows werkt niet" als zoekopdracht geeft verwacht je dan dat je fatsoenlijke resultaten krijgt?
Ik wil hier niet mee zeggen dat ik of iemand anders nu de search niet weet te gebruiken. Uiteindelijk kom je er wel, maar het moet toch veel makkelijker kunnen. Waarom zou je als webbeheerder niet proberen om het je doelgroep zo plezierig mogelijk te maken?
Dat proberen we. De quicksearch is juist om die reden erbij gekomen. De "zoek in topic" is er om die reden bijgekomen. Sterker nog de zoekmachine is uberhaupt om die reden zo uitgebreid.

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Glimi schreef op woensdag 31 augustus 2005 @ 23:26:
Oplossingen zijn pas relevant als, zoals Rickets zegt, het probleem erkent wordt en men er tijd voor vrij wil maken om er over na te denken.
Dus er moet helemaal gezegd worden dat het probleem erkent is, zodat er dan pas naar oplossingen gezocht mag worden?
Rickets ziet een probleem, ongeacht of wij dat probleem zien kan je toch wel alvast met concrete voorstellen komen?

Magoed, speciaal voor jullie: Ja, er zijn zoekresultaten die we "ruis" noemen. Bij sommige zoekopdrachten kan de hoeveelheid ruis vervelende aantallen aannemen.

Uitsluiten van ruis is erg lastig omdat je niet weet wat ruis is bij de huidige zoekopdracht. Term-technisch zijn het namelijk op zich hele goede resultaten, maar inhoudstechnisch vaak niet.

Maar hoe weet je of de inhoud niet voldoet? Zoals ik eerder zei, ook de gesloten topics kunnen je helpen bij het bedenken van andere termen. Je moet natuurlijk wel in de gaten houden dat je een topic bij aangepaste termen niet opnieuw opent (die linkjes krijgen niet voor niets een andere kleur) en dat je sowieso al geen hoge verwachtingen hebt bij topics die op slot zijn en weinig reacties hebben.
Het zou problemen oplossen, maar ook introduceren. Topics met 1000 posts zijn vaak gesloten en soms ook relevant voor een zoekquery. Ik zou meer heil vinden in categorisering (dus per forum weergeven) maar zoals ik boven al stel: Wat is het probleem precies, wordt het erkent en is men bereid er tijd in te investeren?
Ja, men is bereid er tijd in te investeren. Althans, voor haalbare oplossingen natuurlijk. Zeker als ze zonder wijzigingen aan Omega uitgevoerd kunnen worden, want dat ga ik niet eens zelf proberen.

Zo ben ik tegen elke vorm van "sla dit topic niet eens op in de zoekdatabase", ze moeten er dus op zoekquery-niveau uit te sluiten zijn.

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Verwijderd schreef op donderdag 01 september 2005 @ 01:32:
Ik heb dit idee al eerder geopperd, maar waarom niet het eens andersom aanpakken? Dus ipv. topics uit te sluiten van de search, het juist mogelijk maken bepaalde topics voorrang te geven in de search?
Dat is vooralsnog technisch onmogelijk in omega. Maar bovendien weet ik niet zeker of het wel zo'n goede oplossing is.
Vaak zat dat bepaalde zoektermen wel in een FAQ staan, maar niet uitgebreid genoeg behandeld worden om jouw resultaten te beschrijven. En dan staat ie ten onrechte bovenaan.
Verwijderd schreef op donderdag 01 september 2005 @ 06:43:
Nou is natuurlijk niet ieder "goed" topic ook relevant voor de gedane search, maar na een tijdje zal hierdoor toch een behoorlijke schifting ontstaan als genoeg mensen een topic gewaardeerd hebben. Ik vermoed dat vooral de zeer goede topics vrij snel hoge cijfers halen, terwijl de echt slechte topics snel wegzakken.
Met zo'n 1 miljoen topics ben ik bang dat het gros van de goede topics nooit een oordeel krijgt. Dan zou je ten onrechte oudere topics uitsluiten van je opdracht terwijl die heel wel precies kunnen bieden wat je nodig hebt.
Bovendien, als het oordeel geveld wordt door iemand die een heel ander probleem had. Krijg jij ten onrechte dat goede topic voorgeschoteld.

Het blijft dus ook met zulk soort oordelen erg lastig om te stellen dat het topic dan ook daadwerkelijk meer relevant is.

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Varienaja schreef op donderdag 01 september 2005 @ 07:43:
Geen idee hoe dat gaat met performance enzo, maar een vinkje dat je korte op-slotte topics met een levensduur van maximaal 4 uur wilt negeren lijkt me afdoende. Dan zitten alle lange op-slotte topics wel in je zoekresultaat, en dan zijn de onzintopics voor 99% verdwenen.
Aangezien dit bepaald kan worden op het moment dat het topic geindexeerd wordt en het in de zoekopdracht dan een kwestie is van een "boolean"-term erbij plakken is dit iets dat ten opzichte van de oplossingen van hezik en Floppus bijzonder triviaal is.

We zouden dan zo'n soort markering kunnen opstellen. En standaard de quicksearch die "sluit de snel gesloten topics uit"-markering mee laten geven, combineren we dat nog met een "zoek in de laatste 500 dagen" en het aantal zoekresultaten is behoorlijk ingekrompen en met grote kans dat de relevante zaken er nog steeds tussen staan.


edit:

Ik ben me van het bestaan van de edit-knop bewust, maar heb expres de losse delen waar ik op reageerde apart genomen. Dit is dan ook gelijk een voorbeeld voor de toekomst als iemand later stelt dat je geen twee reacties achter elkaar mag plaatsen, maar dat dat auto-edits moeten worden :+

[ Voor 14% gewijzigd door ACM op 01-09-2005 08:34 ]


  • Remy
  • Registratie: Februari 2002
  • Laatst online: 11-06 08:13

Remy

I usually get 100% accuracy

ACM: even 2 vraagjes van mij: is het mogelijk een topic een rating mee te geven in React, of is dat in te bakken? Dat er bij wijze van spreken net zoals op funda.nl een tophuis, hier op GoT een 'top'topic bovenaan de search komt te staan als je 35862 resultaten krijgt? Dat topic kan die ene ideale oplossing bevatten voor iemand, maar ondergesneeuwd raken door al die andere resultaten. En als zijn probleem net even anders is, kan hij toch nog gewoon een topic openen natuurlijk :) Dit hoeft natuurlijk niet voor alle topics maar gewoon voor zaken die (heel) veel langskomen: GoT is niet zoals een aantal andere fora direct 'oplossingsgericht' ;)

Tweede vraag: als een rating technisch of waarom dan ook niet mogelijk of zinvol is, is een nieuwe status een optie? Nu kan je bij de search filteren op open/gesloten/alle/sticky topics. Mogelijk dat moderators via een TR zien dat een topic een fijne oplossing bevat voor een probleem, dan een topic een status mee kunnen geven. ipv gesloten kan hij dan 'solved' oid gaan heten, en die 'solved' optie kan je dan uiteindelijk gebruiken in de search. Veel extra werk zal dit niet opleveren voor moderators aangezien dit een status > solved en verstuur wijzigingen zal zijn.

Zoiets:

Afbeeldingslocatie: http://crew.tweakers.net/Remy/solved.gif

In plaats van honderden of duizenden 'overbodige' resultaten waar men doorheen moet waden komen er slechts een paar bovenaan de resultaten te staan die als status 'solved' hebben, met eventueel de rest eronder als je 'alle' hebt gekozen :)

LinkedIn
Instagram


  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Remy schreef op donderdag 01 september 2005 @ 08:54:
ACM: even 2 vraagjes van mij: is het mogelijk een topic een rating mee te geven in React, of is dat in te bakken?
Momenteel kan het nu niet en hoewel het in te bouwen is heb ik hierboven al aangegeven waarom zoiets wellicht niet zo'n beste oplossing is.
Dat er bij wijze van spreken net zoals op funda.nl een tophuis, hier op GoT een 'top'topic bovenaan de search komt te staan als je 35862 resultaten krijgt? Dat topic kan die ene ideale oplossing bevatten voor iemand, maar ondergesneeuwd raken door al die andere resultaten.
Ik neem aan dat die 35862 een voorbeeld is, maar als je daadwerkelijk zoveel resultaten krijgt moet je toch echt aan je zoektermen gaan sleutelen. De meeste "toptopics" die je met zulke hoeveelheden resultaten krijgt zullen ook niet enorm relevant zijn.
Maar nogmaals dan: wie bepaald wanneer iets een toptopic is? En is het dat dan ook voor de zoeker?
En als zijn probleem net even anders is, kan hij toch nog gewoon een topic openen natuurlijk :) Dit hoeft natuurlijk niet voor alle topics maar gewoon voor zaken die (heel) veel langskomen: GoT is niet zoals een aantal andere fora direct 'oplossingsgericht' ;)
Sja, dat is sowieso mogelijk. Sommigen lijken we te denken dat het verboden is topics te openen, maar dan zouden we het 'new topic'-knopje wel weggelaten hebben.
Tweede vraag: als een rating technisch of waarom dan ook niet mogelijk of zinvol is, is een nieuwe status een optie? Nu kan je bij de search filteren op open/gesloten/alle/sticky topics. Mogelijk dat moderators via een TR zien dat een topic een fijne oplossing bevat voor een probleem, dan een topic een status mee kunnen geven. ipv gesloten kan hij dan 'solved' oid gaan heten, en die 'solved' optie kan je dan uiteindelijk gebruiken in de search. Veel extra werk zal dit niet opleveren voor moderators aangezien dit een status > solved en verstuur wijzigingen zal zijn.
Dan moeten alle opgeloste dingen wel de status solved krijgen, anders is het niet erg zinvol lijkt me. En dan zit je met het probleem dat je dus weer met terugwerkende kracht die topics op solved moet zien te zetten. Maar een discussie is al nooit opgelost, terwijl ie wel nuttige informatie kan bevatten.

Hoewel het kwa programmeerwerk vrij weinig werk is, is het kwa configuratie wel een behoorlijke sloot. Bovendien is het dus niet duidelijk of dat wel echt bijdraagt aan de kwaliteit van de resultaten.
In plaats van honderden of duizenden 'overbodige' resultaten waar men doorheen moet waden komen er slechts een paar bovenaan de resultaten te staan die als status 'solved' hebben, met eventueel de rest eronder als je 'alle' hebt gekozen :)
Sowieso vind ik het erg moeilijk om te bepalen of een resultaat dat niet je oplossing wel bevat, ook gelijk maar overbodig is... Als je alleen maar resultaten krijgt die niet je oplossing bevatten, maar je wel hints opleveren hoe je je zoekopdracht aan kan passen, dan waren ze toch relevant?

  • Remy
  • Registratie: Februari 2002
  • Laatst online: 11-06 08:13

Remy

I usually get 100% accuracy

ACM schreef op donderdag 01 september 2005 @ 09:07:
[...]

Momenteel kan het nu niet en hoewel het in te bouwen is heb ik hierboven al aangegeven waarom zoiets wellicht niet zo'n beste oplossing is.
Ok, prima :)
Ik neem aan dat die 35862 een voorbeeld is, maar als je daadwerkelijk zoveel resultaten krijgt moet je toch echt aan je zoektermen gaan sleutelen. De meeste "toptopics" die je met zulke hoeveelheden resultaten krijgt zullen ook niet enorm relevant zijn.
Mja dat was 1 cijfertje teveel, bedoelde 3586. Zijn nog veel resultaten, maar niet iedereen kan even specifiek zoeken op een probleem als niet precies duidelijk is -wat- er aan de hand is :) Als je dan een stel toptopics krijgt met 3 verschillende oplossingen, kan je die 3 iig al proberen :)
Maar nogmaals dan: wie bepaald wanneer iets een toptopic is? En is het dat dan ook voor de zoeker?
Dat is dan voor de zoeker zelf om uit te maken of dat voor hem/haar ook geldt: er wordt aangegeven door de moderators die daarop gewezen worden via TR (of anders) dat een topic een correcte oplossing bevat (al dan niet aangegeven door de topicstarter). Zodoende is het relevant voor de zoeker die het dan kan gebruiken.
Sja, dat is sowieso mogelijk. Sommigen lijken we te denken dat het verboden is topics te openen, maar dan zouden we het 'new topic'-knopje wel weggelaten hebben.
Mja, die topicstartvrees is wel wat vreemd, maarja :P
Dan moeten alle opgeloste dingen wel de status solved krijgen, anders is het niet erg zinvol lijkt me. En dan zit je met het probleem dat je dus weer met terugwerkende kracht die topics op solved moet zien te zetten. Maar een discussie is al nooit opgelost, terwijl ie wel nuttige informatie kan bevatten.
Over terugwerkende kracht: daar is een 'peildatum' voor in te stellen, dat je gewoon een vaste datum neemt om vanaf dat moment topics op solved te zetten, en mogelijk wat 'belangrijke' topics van daarvoor nog. Discussies zijn niet van belang daarin, want die zijn niet oplossingsgericht en dus ook niet als 'solved' aan te geven ;) De nuttige informatie is er dan gewoon via de relevantie-rating in % uit te halen: dan komt zo'n discussietopic ook wel redelijk hoog in de resultaten.
Hoewel het kwa programmeerwerk vrij weinig werk is, is het kwa configuratie wel een behoorlijke sloot. Bovendien is het dus niet duidelijk of dat wel echt bijdraagt aan de kwaliteit van de resultaten.
Tja, die sloot aan configuratie, moet dat op de hele database? Of kan dat per subforum misschien? Dan kan 1 bepaald subforum van GoT even als proeftuin gebruikt worden om te kijken of het uberhaupt wel werkt. Zoniet, dan hebben we het tenminste geprobeerd en kunnen we zoeken naar een andere oplossing ( :+ ) en zoja, dan kan het uitgebreid worden naar heel GoT :)
Sowieso vind ik het erg moeilijk om te bepalen of een resultaat dat niet je oplossing wel bevat, ook gelijk maar overbodig is... Als je alleen maar resultaten krijgt die niet je oplossing bevatten, maar je wel hints opleveren hoe je je zoekopdracht aan kan passen, dan waren ze toch relevant?
Jazeker, die resultaten komen dan ook direct onder je toptopics te staan, net zoals nu al het geval is als je bij het zoeken 'Alle' aangeeft: de meest relevante topics krijgen het hoogste percentage.

LinkedIn
Instagram


  • Glimi
  • Registratie: Augustus 2000
  • Niet online

Glimi

Designer Drugs

(overleden)
ACM schreef op donderdag 01 september 2005 @ 08:23:
Dus er moet helemaal gezegd worden dat het probleem erkent is, zodat er dan pas naar oplossingen gezocht mag worden?
Rickets ziet een probleem, ongeacht of wij dat probleem zien kan je toch wel alvast met concrete voorstellen komen?
Ik ga niet (veel) tijd investeren in het lezen van artikelen en afwegen van concrete oplossingen als de kans nog bestaat dat het topic dicht gaat of doodbloed met de mededeling dat de gebruiker maar wat meer moeite moet doen. Ik ga graag effectief met m'n tijd om, dus ik snap je licht sarcastische toon niet helemaal.

edit:
Echter de strekking van je post is wel dat er wat aan gedaan kan worden, dus ik zal even aan de gang gaan met lezen

[ Voor 10% gewijzigd door Glimi op 01-09-2005 10:27 ]


Verwijderd

ACM schreef op donderdag 01 september 2005 @ 08:29:
[...]

Met zo'n 1 miljoen topics ben ik bang dat het gros van de goede topics nooit een oordeel krijgt. Dan zou je ten onrechte oudere topics uitsluiten van je opdracht terwijl die heel wel precies kunnen bieden wat je nodig hebt.
Bovendien, als het oordeel geveld wordt door iemand die een heel ander probleem had. Krijg jij ten onrechte dat goede topic voorgeschoteld.

Het blijft dus ook met zulk soort oordelen erg lastig om te stellen dat het topic dan ook daadwerkelijk meer relevant is.
Het idee is niet om resultaten uit te sluiten; het idee is om "hoger gewaardeerde" topics een hoger plekje op de ranglijst te geven. Dat hierbij een groot deel van de berg oudere topics waarschijnlijk geen waardering krijgt maakt niet uit.
Ik ben ook van mening dat een usefulness-rating niet aan topics gehangen moet worden terwijl dat topic loopt, maar alleen aan oudere topics (14 dagen geen reply b.v.) die mensen met de search gevonden hebben.

Degenen die de search gebruiken zorgen er op die manier dus zelf voor dat die search langzamerhand verbetert. Nou heb ik de technische uitwerking van deze functies op de diverse support-sites niet bekeken, maar ik vermoed dat die net zo werken met het sorteren op een door users opgebouwde usefulness rating.

Uiteraard zijn dit soort dingen ook te tunen dat een usefulness rating pas meegenomen wordt in de sortering als er door > X users een rating is gegeven, en andere filters waardoor je de impact van een enkele user inperkt (frontpage moderatie anyone?)
Glimi schreef op donderdag 01 september 2005 @ 09:49:
[...]

Ik ga niet (veel) tijd investeren in het lezen van artikelen en afwegen van concrete oplossingen als de kans nog bestaat dat het topic dicht gaat of doodbloed met de mededeling dat de gebruiker maar wat meer moeite moet doen. Ik ga graag effectief met m'n tijd om, dus ik snap je licht sarcastische toon niet helemaal.
Denken jullie niet dat het heen en weer gooien van verwijten en het vermelden van niet bereid zijn tot inzet tenzij resultaat gegarandeerd is nu juist de oorzaak zijn van het eindigen van dit soort topics met een bezoekje van de slotenmaker?

[ Voor 29% gewijzigd door Verwijderd op 01-09-2005 10:18 ]


  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Remy schreef op donderdag 01 september 2005 @ 09:26:
Over terugwerkende kracht: daar is een 'peildatum' voor in te stellen, dat je gewoon een vaste datum neemt om vanaf dat moment topics op solved te zetten, en mogelijk wat 'belangrijke' topics van daarvoor nog. Discussies zijn niet van belang daarin, want die zijn niet oplossingsgericht en dus ook niet als 'solved' aan te geven ;) De nuttige informatie is er dan gewoon via de relevantie-rating in % uit te halen: dan komt zo'n discussietopic ook wel redelijk hoog in de resultaten.
In disucssie topics kunnen heel goed oplossingen staan voor verschillende problemen, of wat ik vaker zie gebeuren, uit een topic met een vraag komt een mooie discussie op gang, wat wil je met die topics dan doen?
Er van uit gaande dat een user die een probleem zoekt alleen topics wil vinden waar het probleem "solved" is zou je hiermee direct alle oude topics "weggooien" want die heeft de betreffende user eruit gefilterd.
Jazeker, die resultaten komen dan ook direct onder je toptopics te staan, net zoals nu al het geval is als je bij het zoeken 'Alle' aangeeft: de meest relevante topics krijgen het hoogste percentage.
zolang het maar niet zichtbaar is dat het een (door een mod aangegeven) "top topic" is, want zo'n status zegt niks over de daadwerkelijke oplosbaarheid van het probleem van de zoekende user :)

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Remy schreef op donderdag 01 september 2005 @ 09:26:
Tja, die sloot aan configuratie, moet dat op de hele database? Of kan dat per subforum misschien? Dan kan 1 bepaald subforum van GoT even als proeftuin gebruikt worden om te kijken of het uberhaupt wel werkt. Zoniet, dan hebben we het tenminste geprobeerd en kunnen we zoeken naar een andere oplossing ( :+ ) en zoja, dan kan het uitgebreid worden naar heel GoT :)
Dat is alleen forum-wide uit te voeren.
Jazeker, die resultaten komen dan ook direct onder je toptopics te staan, net zoals nu al het geval is als je bij het zoeken 'Alle' aangeeft: de meest relevante topics krijgen het hoogste percentage.
Wat ik bedoel is dat het voor de beoordelaar relevant is, maar is het dan ook relevant voor de zoeker relevant? Maar toch dwing je die topics tot de top.
Glimi schreef op donderdag 01 september 2005 @ 09:49:
Ik ga niet (veel) tijd investeren in het lezen van artikelen en afwegen van concrete oplossingen als de kans nog bestaat dat het topic dicht gaat of doodbloed met de mededeling dat de gebruiker maar wat meer moeite moet doen.
Dat topic was mede (of vooral?) door de houding van de topicstarter al niet erg handig. Dus verwacht in dat soort gevallen ook van ons niet te veel moeite meer. Overigens had ik dat topic nog niet echt doorgenomen en zag ik vanochtend dat ie op slot was en Rickets een vernieuwde poging had gedaan.
Ik ga graag effectief met m'n tijd om, dus ik snap je licht sarcastische toon niet helemaal.
Sarcastische toon? Nou, die had ik er niet in getikt hoor.
Maar bovendien, als je probleem beschrijft is het nuttig als je er gelijk een oplossing bij noemt. Het uitsluiten van domweg gesloten topics was al door Rickets zelf terecht afgeschoten, het geven van ratings is niet echt handig met terugwerkende kracht uit te voeren en is nogal bewerkelijk. Het idee van Varienaja is dan weer goed uitvoerbaar en lijkt me een nuttige toevoeging.

Maar het is niet a la minute in te voeren, dus kunnen we beter nog even op zoek naar (vrijwel) net zo haalbare, maar nog betere oplossingen. Of veel betere, maar lastiger te implementeren oplossingen.

  • Motrax
  • Registratie: Februari 2004
  • Niet online

Motrax

Profileert

Als we het hebben over het zoeken verbeteren heb ik twee kleine puntjes:
- Waarom kan er niet op topictitle worden gezocht? Vooral bij het zoeken naar 'grote deel xx' onderwerpen komt er veel ruis terug. O-)
- Is er ergens een lijst te vinden met fouten in de search, uitzonderingen enz? C++ wordt wel geindexeerd volgens de manual, maar zijn er ook meer dingen?

Ow en verder vind ìk de search wél goed. Zelfs als ik naar de tweede pagina moet (99 berichten p.p.) dan nog weet ik mijn antwoord op de vraag te vinden, zeker sinds 'Alleen berichten in dit topic met trefwoorden tonen' erin zit. Natuurlijk zit er veel ruis tussen, maar boeiend? Ruis pik je er zelf al heel snel uit, maar dat is mijn mening.

[ Voor 3% gewijzigd door Motrax op 01-09-2005 13:42 ]

☻/
/▌
/ \ Analyseert | Modelleert | Valideert | Solliciteert | Generaliseert | Procrastineert | Epibreert |


  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Motrax schreef op donderdag 01 september 2005 @ 13:35:
Als we het hebben over het zoeken verbeteren heb ik twee kleine puntjes:
- Waarom kan er niet op topictitle worden gezocht? Vooral bij het zoeken naar 'grote deel xx' onderwerpen komt er veel ruis terug.
gebruik het keyword "title:" staat er zelfs achter als een knop ;)

http://gathering.tweakers...XF8-XF9---A&select_forum=

  • Motrax
  • Registratie: Februari 2004
  • Niet online

Motrax

Profileert

Erkens schreef op donderdag 01 september 2005 @ 13:39:
[...]

gebruik het keyword "title:" staat er zelfs achter als een knop ;)

http://gathering.tweakers...XF8-XF9---A&select_forum=
Het staat zelfs in de searchmanual zie ik nu :X

☻/
/▌
/ \ Analyseert | Modelleert | Valideert | Solliciteert | Generaliseert | Procrastineert | Epibreert |


  • Fire69
  • Registratie: Juni 2001
  • Laatst online: 20:41
Ik snap eigenlijk het ganse probleem niet.
Als jij in google iets opzoekt, en je krijgt 10 miljoen hits, ga je dan ook naar Google mailen dat hun search moet aangepast worden? :?

  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Fire69 schreef op donderdag 01 september 2005 @ 13:59:
Ik snap eigenlijk het ganse probleem niet.
Als jij in google iets opzoekt, en je krijgt 10 miljoen hits, ga je dan ook naar Google mailen dat hun search moet aangepast worden? :?
google kan je niet vergelijken natuurlijk, aangezien je niet "verplicht" bent om google te gebruiken maar de search hier wel als je een (probleem) topic wilt openen :)

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Motrax schreef op donderdag 01 september 2005 @ 13:35:
- Is er ergens een lijst te vinden met fouten in de search, uitzonderingen enz? C++ wordt wel geindexeerd volgens de manual, maar zijn er ook meer dingen?
Niet dat ik weet. Maarja, wanneer is iets fout? Door de stemming gaat een deel van de woordafbreking strict genomen fout (bomen wordt geloof ik bom en bom blijft bom), maar doordat dat zowel bij het zoeken als het indexeren gebeurt is het relatief onschuldig.
C#, J# en nog een paar worden trouwens sinds kort ook goed geindexeerd, maar niet met terugwerkende kracht. Dus bij alle topics van voor de laatste software-update is het niet goed.
Er komt vast wel weer een nieuwe reden om de boel compleet opnieuw te indexeren, dus dat gaat wel weer een keer goedkomen.
Fire69 schreef op donderdag 01 september 2005 @ 13:59:
Ik snap eigenlijk het ganse probleem niet.
Als jij in google iets opzoekt, en je krijgt 10 miljoen hits, ga je dan ook naar Google mailen dat hun search moet aangepast worden? :?
Maar als je ze mailt met een goed voorstel hoe ze het kunnen verbeteren, gaan ze daar echt wel naar kijken. Hier net zo goed.

  • JHS
  • Registratie: Augustus 2003
  • Laatst online: 16-09 16:02

JHS

Splitting the thaum.

Fire69: Als de gedachte bestaat dat het beter zou moeten kunnen, en het is iets waarvan verwacht wordt dat het regelmatig is, en als het iets is waar je jezelf verbonden mee voelt, ja, dan wel :) .

Overigens vind ik "solved" de verkeerde benaming, zoals al eerder is langsgekomen, het gaat láng niet alleen om oplossingen van de TS, GoT is geen helpdesc...

Maar ik denk dat er drie dingen zijn die redelijk nuttig zijn, en waarvan te verwachten is dat het niet al te extreem veel werk is. Het argument dat bij deze opgaat dat we het dan pas vanaf nu gaan doen maakt niet uit. Dan gaat het bij recente topics tenminste beter, en over een jaar hebben we veel betere resultaten :) .

[list=1]• Varienaja's idee: je verwacht erg effectief: zo filter je alle te oude en alle naar alle waarschijnlijkheid baggertopics eruit.
• Een "Bagger" status: zo weet je tenminste dat de inhoud van een topic weinig, of erg beperkt, nut heeft :) . En met de accesskey alt-b is dat voor de moderatoren ook niet veel werk ;) .
• Een "Valuable" status: Als je wíl kan je eerst daar op zoeken, of als je heel veel zoekresultaten hebt. Zo heb je in een keer veel minder resultaten waarvan de kans veel groter is dat het wat zinnigs is. En ook dat is met een accesskey makkelijk makkelijker te maken :P.

DM!


  • Glimi
  • Registratie: Augustus 2000
  • Niet online

Glimi

Designer Drugs

(overleden)
Ik ga uit van de probleemomschrijving zoals in [1] omschreven is.
Most current web search engines tend to provide a list of search results to users' queries according to the relevance score of each document to the query. This paradigm is very useful when users' information needs(...) are clear and they care more about precision than recall in the returned results. Unfortunately, many of the queries presented to a web search engine nowadays are ambigious and the user's actual information needs are unkown. Users may suffer from the vast number of redundant and yet not very relevant documents that are related to a few most popular topics listed in the top of search results.
Ik zou ruis dus zien als 3 dingen
• topics die redundant zijn, topics waarin feitelijk hetzelfde staat.
• topics welke niet relevant zijn, doordat ze bijvoorbeeld gesloten zijn
• topics welke niet relevant zijn, doordat ze niet niet passen bij de information needs.

Over punt 1 heb ik weinig informatie gevonden. Het lijkt me vrij moeilijk om te kijken of twee topics gelijksoortig zijn qua inhoud en in hoeverre ze verschillen. Hier zou ik geen mogelijkheid tot weten

Punt twee, zoals iedereen al opmerkte, is een probleem omdat gesloten topics ook boeiend kunnen zijn en we niet kunnen classificeren of een gesloten topic relevant is. Ook deze sla ik over dus.

Over punt drie is veel literatuur over te vinden. Google is er mee bezig [2] en enkele search engines hebben het al geïmplementeerd: categorisering.
Het probleem hier is dat per document bekeken moet worden in welke categorie het valt. Gelukkig zijn hier al implementaties van ([1], [2]) maar dit zijn wel algoritmes welke aanpassingen vereisen in de search-engine Omega, vrij zware aanpassingen ook, welke de search minstens een dag plat zouden helpen omdat alle topics opnieuw geindexeerd moeten worden. Dit lijkt mij niet de voorkeur genieten. Echter opzich heeft een forum al een categorisering, topics worden immers in een forum van een bepaalde categorie gezet. Een als het over een Warthog gaat in NOS is het zeer onwaarschijnlijk dat het om het beest gaat. Het is dan wel een hele grove categorisering, maar ik denk dat het wel nut zou hebben.

Mijn voorstel zou dan ook zijn om de search resultaten te groepen op Forum, relevantie. Dit lijkt me redelijk te implementeren, Omega levert de resultaten op gesorteerd op relevantie, en vervolgens sorteer je deze resultaten weer op forum. Mits je een stable sort gebruikt, krijg je dan de voorgestelde volgorde.

Over het hoe en wat van meerdere pagina's en de UI moet ik allemaal nog even nadenken. Ik wacht eerst de reacties wel even af.

Refs
  1. Improving Web Search Results Using Affinity Graph, Zang, Li, Liu, Ji, Xi, Fan, Chen, Ma, SIGIR'05, August 15-19, 2005, Salvador, Brazil
  2. Acquisition of Categorized Named Entities for Web Search, Marius Pasca, CIKM'04, November 8-13, 2004, Washington DC, USA.
ACM schreef op donderdag 01 september 2005 @ 11:01:
Dat topic was mede (of vooral?) door de houding van de topicstarter al niet erg handig [...]
Het gaat niet om het topic maar om het algemeen. Ik vind het pas nuttig voor mezelf om mee te gaan denken en input te leveren als duidelijk is dat er behoefte naar is. Dit geld alleen voor mezelf. Als andere mensen dit wel willen doen, dan is dat perfect, het is dan immers mijn tijd niet.
Sarcastische toon? Nou, die had ik er niet in getikt hoor.
Een zin als
Magoed, speciaal voor jullie: Ja, er zijn zoekresultaten die we "ruis" noemen.
deed mij een beetje anders vermoeden. Als ik hem hardop lees, hoor ik de zucht :+ Maar als dat niet zo is, dan mijn excuses.
Maar bovendien, als je probleem beschrijft is het nuttig als je er gelijk een oplossing bij noemt. [...]
In mijn optiek is het pas 'een' probleem als dit aan beide kanten als zodanig gezien wordt. Anders blijft het 'jou' probleem zeg maar. Maar dit is allemaal detailwerk, hierboven staat meer constructiever geneuzel.

  • Superdeboer
  • Registratie: December 2002
  • Niet online

Superdeboer

Sa-weee-tah

Maar Glimi, zoeken in slechts de door jou te definieren subfora (dus de grove categorieen) is toch gewoon mogelijk met Omega? Dat kan toch nu al?
Nu hoor ik jou zeggen: tsja, maar dat werkt niet als je de quicksearch gebruikt... maar ook dan kom je toch gewoon uit in de uitgebreide zoekfunctie alwaar je wel die verfijning aan kunt brengen?

Of zou je dan een default fora-sortering uit de quicksearch willen zien rollen? M.a.w., wat valt er in jouw ogen dan precies verder te verbeteren aan die selectie op categorien? :)
Als ik zoek op een term waarbij ik resultaten uit een techforum verwacht, en ik zie in mijn results wat resultaten uit SG... dan klik ik die link niet aan. Dat kost mij niet erg veel tijd extra en het maakt dus ook niet veel uit dat die ertussen staat.

Het feit dat door de search uitgespuugde topics niet aansluiten bij de werkelijke information need, wordt naar mijn mening niet echt opgelost door de fora waar ze instaan duidelijker aan te geven: dat is een schifting die de gebruiker op basis van de resultlist nu al vlot kan maken. Ik zit niet zo in de wetenschap van zoekmachines om aan te geven wat ik precies bedoel, maar het komt erop neer dat volgens mij het probleem is, dat je als zoekende gebruiker eerst 10 teruggegeven topics (*wel* in het juiste subforum dus) moet openen, waarvan je afgaande op titel en relevantiescore meent dat daarin staat wat je nodig hebt, maar die dan na scannen of grondige lezing *toch* niet blijken te zijn wat je zoekt.

De oplossing daarvoor is denk ik een stuk complexer... wat niet zo raar is als je ziet dat het probleem zelf al lastig te definieren is. :)
Als je dus kijkt naar oplossingen met groot effect, dan moet je IMO wel kijken naar de problemen die het zwaarst wegen. Ik hoop dat ik goed duidelijk maak wat ik precies bedoel. :)

When I write my code, only God and I know what it means. One week later, only God knows.
Hell yes it's a Cuban Cigar, but I'm not supporting their economy, I'm burning their fields.


  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

[quote]Glimi schreef op donderdag 01 september 2005 @ 14:48:
Ik zou ruis dus zien als 3 dingen
• topics die redundant zijn, topics waarin feitelijk hetzelfde staat.
• topics welke niet relevant zijn, doordat ze bijvoorbeeld gesloten zijn
• topics welke niet relevant zijn, doordat ze niet niet passen bij de information needs.
Eens, ook grofweg met je argumentatie over de drie punten. 1 is lastig te herkennen, bovendien zijn alle duplicaten in principe relevant. Vooral omdat ze elkaar vaker aan zullen vullen dan echt herhalen. 2 is moeilijk, ik zit sowieso sterk te neigen naar een extra boolean-zoek-mogelijkheid om alle topics die binnen 4 uur dichtgingen uit te sluiten.
Daarmee gaat meer dan 1/3e van alle gesloten topics uit de lijst van mogelijke zoekresultaten.
Je verliest wel de mogelijkheid tot aanpassing van de zoekresultaten, dus het blijft sowieso een keuzemogelijkheid dan.
Het probleem hier is dat per document bekeken moet worden in welke categorie het valt. Gelukkig zijn hier al implementaties van ([1], [2]) maar dit zijn wel algoritmes welke aanpassingen vereisen in de search-engine Omega, vrij zware aanpassingen ook,
We zijn geen tegenstander van aanpassingen aan Xapian (en/of de omega-frontend), maar wel onthand op het gebied van de technische kennis. De meeste van dergelijke algoritmes zijn behoorlijk lastig uit te voeren lijkt me, naast het feit dat we geen C++-developers hier in huis hebben.
Overigens hoeft zo'n wijziging niet per se kostenloos te gebeuren, mits er een wezenlijke verbetering en duidelijke planning voor te geven is.
welke de search minstens een dag plat zouden helpen omdat alle topics opnieuw geindexeerd moeten worden. Dit lijkt mij niet de voorkeur genieten.
De herindexatie hoeft niet per se op de live database te gebeuren. We hebben voldoende hardware bruikbaar die niet rechtstreeks nadelige gevolgen voor de website op performance-gebied oplevert bij zware belasting.
Mijn voorstel zou dan ook zijn om de search resultaten te groepen op Forum, relevantie. Dit lijkt me redelijk te implementeren, Omega levert de resultaten op gesorteerd op relevantie, en vervolgens sorteer je deze resultaten weer op forum. Mits je een stable sort gebruikt, krijg je dan de voorgestelde volgorde.
Maar hoe weet je dan welk forum het belangrijkste is om bovenaan te zetten? Moet de gebruiker dat zelf aangeven? Want in dat laatste geval kan ie wellicht beter enkel in dat forum zoeken, toch?
Over het hoe en wat van meerdere pagina's en de UI moet ik allemaal nog even nadenken. Ik wacht eerst de reacties wel even af.
Als je het als een alternatieve sortering binnen Omega/Xapian ontwikkelt maak je gebruik van de paging die daar al in zit. ik meen ten minste dat je zelf een sorter kan implementeren ervoor. Wegingsschema's behoren ook tot de mogelijkheden.
Het gaat niet om het topic maar om het algemeen. Ik vind het pas nuttig voor mezelf om mee te gaan denken en input te leveren als duidelijk is dat er behoefte naar is. Dit geld alleen voor mezelf. Als andere mensen dit wel willen doen, dan is dat perfect, het is dan immers mijn tijd niet.
Dat is wel begrijpelijk. Maar globaal ideeen opperen kan natuurlijk sowieso vanaf het begin en daar leek het ook een beetje aan te schorten.
Een zin als
Hmm, ja dat was idd wel wat sarcastisch. De enige uit die posting trouwens :)
Maar dit is allemaal detailwerk, hierboven staat meer constructiever geneuzel.
Waarvoor alvast dank.

  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

ACM schreef op donderdag 01 september 2005 @ 15:24:
Maar hoe weet je dan welk forum het belangrijkste is om bovenaan te zetten? Moet de gebruiker dat zelf aangeven? Want in dat laatste geval kan ie wellicht beter enkel in dat forum zoeken, toch?
Wellicht een optie om niet per forum maar per hoofdgroep te sorteren, het is sowieso al lastig om bijvoorbeeld alleen software gerelateerde problemen te zoeken (je moet dan in de search expliciet al die fora selecteren).

  • BreadFan
  • Registratie: Oktober 2001
  • Niet online
Remy schreef op donderdag 01 september 2005 @ 08:54:
Tweede vraag: als een rating technisch of waarom dan ook niet mogelijk of zinvol is, is een nieuwe status een optie? Nu kan je bij de search filteren op open/gesloten/alle/sticky topics. Mogelijk dat moderators via een TR zien dat een topic een fijne oplossing bevat voor een probleem, dan een topic een status mee kunnen geven. ipv gesloten kan hij dan 'solved' oid gaan heten, en die 'solved' optie kan je dan uiteindelijk gebruiken in de search. Veel extra werk zal dit niet opleveren voor moderators aangezien dit een status > solved en verstuur wijzigingen zal zijn.

Zoiets:

[afbeelding]

In plaats van honderden of duizenden 'overbodige' resultaten waar men doorheen moet waden komen er slechts een paar bovenaan de resultaten te staan die als status 'solved' hebben, met eventueel de rest eronder als je 'alle' hebt gekozen :)
Soms werkt het toevoegen van het woordje "opgelost" aan de zoekopdracht erg goed voor mij. :)

Ik geef toe, niet altijd. ;) Het werkt natuurlijk alleen als de Topicstarter een keer uitbundig "Joechei \o/ door deze tip is het opgelost!!" roept ofzo :)

[ Voor 9% gewijzigd door BreadFan op 01-09-2005 15:42 ]


  • Glimi
  • Registratie: Augustus 2000
  • Niet online

Glimi

Designer Drugs

(overleden)
Superdeboer schreef op donderdag 01 september 2005 @ 15:14:
Of zou je dan een default fora-sortering uit de quicksearch willen zien rollen? M.a.w., wat valt er in jouw ogen dan precies verder te verbeteren aan die selectie op categorien? :)
Als ik zoek op een term waarbij ik resultaten uit een techforum verwacht, en ik zie in mijn results wat resultaten uit SG... dan klik ik die link niet aan. Dat kost mij niet erg veel tijd extra en het maakt dus ook niet veel uit dat die ertussen staat.
Een sortering is niet genoeg, je komt dan niet meer boven met resultaten met een hoog scorecijfer, maar uit een bepaalde categorie, terwijl je juist het aantal relevante resultaten op de voorste pagina wilt maximaliseren. Door categoriën te gebruiken (denk niet alleen sortering, maar aan misschien aan uitklapvakken, zodat er een x aantal topics worden weergegeven per categorie ), zou je dit wel tot zekere hoogte kunnen bepalen. Je neemt dan op de pagina (vanaf een bepaald aantal resultaten) categoriën op, waardoor mensen kunnen zoeken in de resultaten.

Voorbeeld: Je wilt zoeken op X. X blijkt voor te komen in veel fora. Echter X blijkt populairy in forum Y, dus deze domineert de relevantielijst. Echter we denken het niet in Y te vinden. Dan staat de pagina met results door vol met resultaten die we niet nodig hebben. Om dit te bereiken met de huidige search moeten we alle fora selecteren en zo 1 voor 1 afvinken waar het zeker niet in kan staan.
Het kan nu dus wel, maar makkelijk is anders.

En een fora kan te overlappend zijn of te beperkend, maar het kwam in me op als makkelijk implementeerbaar. Dat is wat met 0 kennis van react iig vermoed.
Het feit dat door de search uitgespuugde topics niet aansluiten bij de werkelijke information need, wordt naar mijn mening niet echt opgelost door de fora waar ze instaan duidelijker aan te geven: dat is een schifting die de gebruiker op basis van de resultlist nu al vlot kan maken. Ik zit niet zo in de wetenschap van zoekmachines om aan te geven wat ik precies bedoel, maar het komt erop neer dat volgens mij het probleem is, dat je als zoekende gebruiker eerst 10 teruggegeven topics (*wel* in het juiste subforum dus) moet openen, waarvan je afgaande op titel en relevantiescore meent dat daarin staat wat je nodig hebt, maar die dan na scannen of grondige lezing *toch* niet blijken te zijn wat je zoekt.

De oplossing daarvoor is denk ik een stuk complexer... wat niet zo raar is als je ziet dat het probleem zelf al lastig te definieren is. :)
Als je dus kijkt naar oplossingen met groot effect, dan moet je IMO wel kijken naar de problemen die het zwaarst wegen. Ik hoop dat ik goed duidelijk maak wat ik precies bedoel. :)
Ik snap wel wat je bedoelt echter het is nog steeds categorisering, alleen dan hele fijne categorisering. Het is wel mogelijk, maar lijkt me weinig practisch, omdat jou oplossing wel een hele specefieke categorie is. Of denk ik nu de verkeerde kant op?
ACM schreef op donderdag 01 september 2005 @ 15:24:
Eens, ook grofweg met je argumentatie over de drie punten. 1 is lastig te herkennen, bovendien zijn alle duplicaten in principe relevant. Vooral omdat ze elkaar vaker aan zullen vullen dan echt herhalen. 2 is moeilijk, ik zit sowieso sterk te neigen naar een extra boolean-zoek-mogelijkheid om alle topics die binnen 4 uur dichtgingen uit te sluiten.
Daarmee gaat meer dan 1/3e van alle gesloten topics uit de lijst van mogelijke zoekresultaten.
Je verliest wel de mogelijkheid tot aanpassing van de zoekresultaten, dus het blijft sowieso een keuzemogelijkheid dan.
Het lijkt me een mooie mogelijkheid!
We zijn geen tegenstander van aanpassingen aan Xapian (en/of de omega-frontend), maar wel onthand op het gebied van de technische kennis. De meeste van dergelijke algoritmes zijn behoorlijk lastig uit te voeren lijkt me, naast het feit dat we geen C++-developers hier in huis hebben.
Overigens hoeft zo'n wijziging niet per se kostenloos te gebeuren, mits er een wezenlijke verbetering en duidelijke planning voor te geven is.
Dat is ook een reden waarom ik er niet over doorgelezen heb, het lijkt me gewoon zo 1-2-3 niet erg praktisch en mede omdat ik zelf ook niet alle ins en outs van zoektechnologie ken.
Maar hoe weet je dan welk forum het belangrijkste is om bovenaan te zetten? Moet de gebruiker dat zelf aangeven? Want in dat laatste geval kan ie wellicht beter enkel in dat forum zoeken, toch?
Ik zou het forum bovenin zetten met het hoogste relevantiecijfer, hoewel je dan wel je eerst je lijst van resultaten moet doorlopen voordat je alle fora's ge-extraheerd hebt (of is daar een andere optie voor?)
Als je het als een alternatieve sortering binnen Omega/Xapian ontwikkelt maak je gebruik van de paging die daar al in zit. ik meen ten minste dat je zelf een sorter kan implementeren ervoor. Wegingsschema's behoren ook tot de mogelijkheden.
Als ik tijd heb, ga ik me daar eens inlezen voor een Proof of Concept.
Waarvoor alvast dank.
Jij bedankt voor je uitgebreide reply.
Pagina: 1