Toon posts:

Relevantie?

Pagina: 1
Acties:

Verwijderd

Topicstarter
Arjen :

- Hoe bepaalt Topix eigenlijk de relevantie bij een search?

Door het aantal keer dat de string voorkomt in de topic, of iets anders ofzow? Ik neem aan dat er geen geavanceerde AI bij aan te pas komt :)

Verwijderd

Over het algemeen wordt dit bepaald aan de hand van hoe vaak het keyword in de doorzochte text voorkomt. Komt dit niet voor dan wordt een woord opgesplitst, want het kan ook een verkleinwoord zijn. Zo krijg je de relevantie van een search. :)

  • Tom
  • Registratie: Juni 1999
  • Niet online

Tom

Doet Topix niet, maar MySQL:
http://www.mysql.com/doc/M/y/MySQL_full-text_search.html
MySQL uses a very simple parser to split text into words. A ``word'' is any sequence of letters, numbers, `'', and `_'. Any ``word'' that is present in the stopword list or just too short (3 characters or less) is ignored.

Every correct word in the collection and in the query is weighted, according to its significance in the query or collection. This way, a word that is present in many documents will have lower weight (and may even have a zero weight), because it has lower semantic value in this particular collection. Otherwise, if the word is rare, it will receive a higher weight. The weights of the words are then combined to compute the relevance of the row.

  • Onno
  • Registratie: Juni 1999
  • Niet online
Arjen heeft net gisteren uitgelegd dat het zoeken op inhoud juist niet gebruikt maakt van de MySQL full text search Tom... :)