F_J_K schreef op donderdag 30 juni 2005 @ 19:09:
offtopic:
Tuurlijk, k9 werkt in de basis niet heel erg anders (al scheelt het nogal dat er Bayes gebruikt wordt ipv dat er een lange statische lijst is). Maar dat verschil is erg groot als je naar de resultaten kijkt.
Maar goed, een lijst heb ik niet.
Dat is inderdaad het enige verschil

Trouwens zou je in theorie een lijst kunnen genereren door een app. te trainen en dan naar de resulterende lijst woorden te kijken. Maar ik vraag me af of dat goed werkt.
Spamassassin slaat ook nog andere dingen op bij de woorden, hoe vaak het woord voorkwam, of het spam was volgens de gebruiker etc., dus aan zo'n lijst heb je niets, je bent langer bezig met het uitelkaar pluizen van de database dan een eigen lijst maken
Wat je wel zou kunnen doen als je perse met alle geweld een lijst wilt hebben, is een tekstdump maken van een spamfolder in je emailprogramma, daarvan alle woorden tellen, en kijken welke woorden het meeste voorkomen en te maken hebben met viagra enzo.
Maar ik vraag me af of dat wel zinvol is als er zoveel betere systemen beschikbaar zijn