Beste GoTters,
Aangezien de GoT search op Xapian/Omega draait/draaide (weet 't nu niet precies) leek dit me wel een plek waar enige xapian expertise was.
Ik ben net begonnen met het opzetten van een Xapian zoekmachine voor een forum, dit omdat full text search gewoon niet de goed genoeg is en Google niet de oude resultaten indexeert.
Nu zit ik met 't volgende. Ik indexeer de losse berichten, en maak daar losse documents van. En zet vervolgens de docid in een veld bij een message voor terugkoppeling. Maar dat levert een aantal problemen bij de resultaten op.
Als ik de resultaten lijst opmaak geef op ik van hoeveel tot hoeveel resultaten ik wil zien, nu zijn dit berichten, en ik wil dit graag groeperen per topic. Ik zou die lijst met opgehaalde berichten kunnen verwerken en aan een topic kunnen kopelen, en dat presenteren. Maar als ik dan in Xapian $matches = $enquire->get_mset(0, 100); gebruik klopt deze 100 resultaten niet meer. Dit wordt dan een aantal minder (afhankelijk van de verspreiding over topics) en om nu 0, 1000000 te doen en dat in PHP te gaan verwerken lijkt me niet verstandig.
Via Google kon ik weinig hierover vinden (kan aan mijn zoekwoorden liggen) en ook de docs zijn wat dit betreft (verwerking sowieso) heel summier.
Kan iemand mij hier bij helpen? Het aanpassen van mijn indexeringsmechanisme kan ook nog (dus geheel topic) maar ik denk niet dat dat de kwaliteit van 't zoeken verbetert..
Alvast dank.
Aangezien de GoT search op Xapian/Omega draait/draaide (weet 't nu niet precies) leek dit me wel een plek waar enige xapian expertise was.
Ik ben net begonnen met het opzetten van een Xapian zoekmachine voor een forum, dit omdat full text search gewoon niet de goed genoeg is en Google niet de oude resultaten indexeert.
Nu zit ik met 't volgende. Ik indexeer de losse berichten, en maak daar losse documents van. En zet vervolgens de docid in een veld bij een message voor terugkoppeling. Maar dat levert een aantal problemen bij de resultaten op.
Als ik de resultaten lijst opmaak geef op ik van hoeveel tot hoeveel resultaten ik wil zien, nu zijn dit berichten, en ik wil dit graag groeperen per topic. Ik zou die lijst met opgehaalde berichten kunnen verwerken en aan een topic kunnen kopelen, en dat presenteren. Maar als ik dan in Xapian $matches = $enquire->get_mset(0, 100); gebruik klopt deze 100 resultaten niet meer. Dit wordt dan een aantal minder (afhankelijk van de verspreiding over topics) en om nu 0, 1000000 te doen en dat in PHP te gaan verwerken lijkt me niet verstandig.
Via Google kon ik weinig hierover vinden (kan aan mijn zoekwoorden liggen) en ook de docs zijn wat dit betreft (verwerking sowieso) heel summier.
Kan iemand mij hier bij helpen? Het aanpassen van mijn indexeringsmechanisme kan ook nog (dus geheel topic) maar ik denk niet dat dat de kwaliteit van 't zoeken verbetert..
Alvast dank.
|>