Ik heb na dagenlang de beperkte documentatie en de onoverzichtelijke mailinglistarchieven doorgepluisd te hebben eindelijk een werkende basis omega/xapian-zoeksysteem opgebouwd.
Deze is uiteindelijk bedoeld om de searchfunctionaliteit van mijn site te dienen.
Deze maakt gebruik van een zelfgemaakte perlscript+scriptindex (omega) om een index op te bouwen vanuit mysql. Voor een forum heb ik bijvoorbeeld per topic een document opgebouwd met title, url, sample, firstpost en rest_posts. Waarbij de weight op title, dan firstpost dan restpost zit.
De hele website is php/mysql-based. Alle (relevante) content zitten ook in de database, daarom wil ik enkel de DB-indexeren zodat echt relevante dingen naar voren komen.
Nu een aantal vragen waarvan ik geen antwoord kan vinden.
Hoe kan ik permissies in de search opbouwen met omega?
Aan de hand van de groep gebruikers moeten ze uiteraard sommige dignen niet vinden.
Ik heb hiervoor deze topic gevonden, die weer verwijst hier naar toe. Aleen begrijp ik niet hoe ik dit in de praktijk moet toepassen. Als het gewoon een queryopbouw is zoals (<QUERY>) AND (XWORLD:yes OR XUSER:bill OR XGROUP:users OR XGROUP:wheel)
dan kan een gebruiker toch gewoon zeggen (<QUERY>) AND (XWORLD:yes XGROUP:wheel) zeggen en dan krijgt ie toch alles voor zijn kiezen?
Incremental indexing
Hoe kan ik voor incremental indexing zorgen? Als er een nieuw topic/post wordt gemaakt, dat enkel deze worden toegevoegd in de index. Ik zat te denken om bij te houden welke topic zijn aangepast (post toegevoegd) en dan batchgewijs deze nogmaals te indexeren. Maar er moet toch wel een betere oplossing zijn?
Algehele re-indexering
Wordt er op GOT oude topics nog herindexed (en verwijderde dus ook uit de index wordt gehaald)? Of alleen nieuwe dingen? Moet ik dus helemaal geen re-indexering doen, of tenminste op gezette tijden (1 maal per jaar of zo)
Ik wil omega/xapian ook thuis gebruiken om mijn documenten te indexeren, maar nu moet ik met omindex elke keer alles herindexeren. Kan er ook alleen nieuwe documenten geindexed worden?
Omega of xapian
Moet ik gebruik maken van omega en dan xml-spullen uitlezen of kan ik beter gebruik maken van de php-bindings om direct de index aan te spreken (en eventueel ook postings direct te verwerken?)
Deze is uiteindelijk bedoeld om de searchfunctionaliteit van mijn site te dienen.
Deze maakt gebruik van een zelfgemaakte perlscript+scriptindex (omega) om een index op te bouwen vanuit mysql. Voor een forum heb ik bijvoorbeeld per topic een document opgebouwd met title, url, sample, firstpost en rest_posts. Waarbij de weight op title, dan firstpost dan restpost zit.
De hele website is php/mysql-based. Alle (relevante) content zitten ook in de database, daarom wil ik enkel de DB-indexeren zodat echt relevante dingen naar voren komen.
Nu een aantal vragen waarvan ik geen antwoord kan vinden.
Hoe kan ik permissies in de search opbouwen met omega?
Aan de hand van de groep gebruikers moeten ze uiteraard sommige dignen niet vinden.
Ik heb hiervoor deze topic gevonden, die weer verwijst hier naar toe. Aleen begrijp ik niet hoe ik dit in de praktijk moet toepassen. Als het gewoon een queryopbouw is zoals (<QUERY>) AND (XWORLD:yes OR XUSER:bill OR XGROUP:users OR XGROUP:wheel)
dan kan een gebruiker toch gewoon zeggen (<QUERY>) AND (XWORLD:yes XGROUP:wheel) zeggen en dan krijgt ie toch alles voor zijn kiezen?
Incremental indexing
Hoe kan ik voor incremental indexing zorgen? Als er een nieuw topic/post wordt gemaakt, dat enkel deze worden toegevoegd in de index. Ik zat te denken om bij te houden welke topic zijn aangepast (post toegevoegd) en dan batchgewijs deze nogmaals te indexeren. Maar er moet toch wel een betere oplossing zijn?
Algehele re-indexering
Wordt er op GOT oude topics nog herindexed (en verwijderde dus ook uit de index wordt gehaald)? Of alleen nieuwe dingen? Moet ik dus helemaal geen re-indexering doen, of tenminste op gezette tijden (1 maal per jaar of zo)
Ik wil omega/xapian ook thuis gebruiken om mijn documenten te indexeren, maar nu moet ik met omindex elke keer alles herindexeren. Kan er ook alleen nieuwe documenten geindexed worden?
Omega of xapian
Moet ik gebruik maken van omega en dan xml-spullen uitlezen of kan ik beter gebruik maken van de php-bindings om direct de index aan te spreken (en eventueel ook postings direct te verwerken?)
One thing's certain: the iPad seriously increases toilet time.. tibber uitnodigingscode: bqufpqmp