Dat is ook nog een idee, hoewel het technisch waarschijnlijk wat uitdagender wordt en het vooral voor dit soort zoekopdrachten werkt. Er zullen ook zoekopdrachten zijn waar je weinig tot niets aan een groot topic hebt en je vooral de individuele reacties zou willen zien.
Als we dan altijd bepaalde soorten topics enorm pushen... dan gaat dat weer averechts werken voor die zoekopdrachten.
Misschien is het een idee om voor dit soort problemen van het mathematische model af te stappen en relevantie te bepalen aan de hand van factoren die een bezoeker op Tweakers relevant vindt.
Het is bijzonder lastig om vooraf te herkennen of we met 'dit soort problemen' te maken hebben of met een 'gewone' zoekopdracht.
Bovendien hebben alle door lezers/bezoekers/handmatige schifting beinvloedde zoektechnieken die ik gezien ook mathematische algoritmes nodig om te werken. Veelal nog aanzienlijk complexere dan wat wij nu gebruiken (standaard lucene's versie van tf/idf)

Het volgende proces zou volgens mij wel tot een verbetering moet leiden.
1. Probeer intern te bepalen wat de definitie van "relevant" moet zijn
2. Verifieer of vul dit aan met input van gebruikers
Die is helaas in potentie per bezoeker en/of per zoekopdracht verschillend. Vergeet niet dat we te maken hebben met vele duizenden verschillende zoekopdrachten, niet iedereen zoekt op mooie termen als 'galaxy s4'. En we willen op al die zoekopdrachten een bruikbaar antwoord geven.
Het meest relevant is tenslotte datgene dat je zoekt. Maar dat aan de hand van een paar korte woordjes vertalen naar een lijst resultaten is nou net het moeilijk deel.
Dus je moet dan bepalen
waarom iets relevant is... en dan krijg je zaken als "het gaat over dat onderwerp".
Waarna je de taak krijgt om te bepalen wat 'dat onderwerp' is dat met die zoekopdracht werd beschreven en "het gaat erover" af te leiden voor alle topics/reacties. Beide zijn niet zo makkelijk als je wellicht denkt.
Vervolgens zit je nog met de vraag welke gaat "er" dan het
meeste "over" (want die is het meest relevant)

3. Voeg handmatig regels toe zodat de het "relevant"-algoritme de zelfgestelde definitie van "relevant" zo goed mogelijk dekt.
Handmatige regels zijn alleen bij te houden als je voor een "handjevol" zoekopdrachten dit wil doen. En ik zie liever dat we het zoeksysteem toekomstbestendig (nieuwe onderwerpen) en zo onderhoudsvrij (nieuwe topics over een bestaand onderwerp) mogelijk houden... anders blijven we - letterlijk - bezig.
Ik denk dat het onmogelijk (of nodeloos ingewikkeld) is om te hopen dat één formule afdoende is. Er zijn ontzettend veel factoren die je mee kunt nemen in je defintie van relevant (pageviews, gemiddelde leestijd in het topic, etc.).
Ik weet zelfs bijna zeker dat dat ene algoritme voor elk voorbeeld van "goed gedrag" ook een voorbeeld oplevert van "slecht gedrag"

Hoewel gelukkig niet altijd even erg "slecht".
Desalniettemin denk ik wel dat jij onderschat hoe ingewikkeld een goed werkende zoekmachine die op basis van gebruikersinvoer werkt. Zeker als we dat vervolgens moeten combineren met zoekopdrachten die niet vooraf waren voorzien van relevante resultaten of die iets afwijken van de zoekopdracht die gebruikt werd ten tijde van een gebruiker die ons probeerde te helpen met het markeren van meer of minder relevante resultaten.
Wat doe je bijvoorbeeld als iemand "galaxy s4 hoes" invoert? Ga je dan alle resultaten die we dan voor "galaxy s4" hebben verzameld negeren? Of gaan we ze dan toch op een of andere manier meewegen? En zoja, hoe?
Moet een nieuw topic waar "galaxy s4" in voorkomt direct zichtbaar zijn bij die zoekopdracht? En als dat niet het geval is, hoe kan ie dan uberhaupt ooit beschikbaar komen als relevant topic voor "galaxy s4"?
Dit zijn overigens geen vragen waar jij een antwoord op hoeft te hebben, maar die naar voren komen als je zoiets probeert te bouwen

Ook zou je er aan kunnen denken om bij elk zoekresultaat de gebruikers de mogelijkheid te geven welk zoekresultaat ze wel relevant vinden en welk zoekresultaat ze niet relevant vinden, op die manier krijg je een soort zelflerend systeem

. Daarnaast kan je leren van het klikgedrag van gebruikers. Als je ziet dat het 45e zoekresultaat op de 10e plek staat op de ranglijst van topics die geopend worden na een bepaaldzoekresultaat, dan kan je je voorstellen dat gebruikers dat zoekresultaat veel belangrijker vinden dan wat Tweakers denkt.
In ieder geval, er is volgens mij van alles mogelijk

.
Dit zijn inderdaad dingen die door de grote jongens (zoals Google) worden toegepast. Het is alleen allemaal niet zo simpel om goed uit te werken

Besef daarbij dat Google voor dit soort problemen hele teams aan programmeurs en onderzoekers hebben die dat uitwerken. Wij hebben die mankracht niet en zullen dat ook nooit krijgen, de techniek inkopen is niet altijd mogelijk of in die gevallen dat dat wel kan erg duur (dan heb je het al gauw over tonnen en miljoenen).
We roeien met de riemen die we hebben. En daarbij proberen we zeker de resultaten zo goed mogelijk aan te laten sluiten bij zoekopdrachten van gebruikers. Dat gaat af en toe niet goed en dan gaan we kijken of er een oplossing voor is.
Blijf vooral meedenken, maar de heel spectaculaire wijzigingen zullen we niet zo gauw (kunnen) doorvoeren