[spamassassin] verdere configuratie

Pagina: 1
Acties:

  • codemann
  • Registratie: Oktober 2002
  • Laatst online: 31-01 15:04
Ik ben een mail server aan het opzetten en ik probeer uiteraard mijn spam filters zo goed mogelijk te configureren.

Mijn mail server gebruikt spamassassin hiervoor en de resultaten vallen wel mee, alleen merk je onmiddellijk dat er nog heel wat uitschieters zijn en dat er nog verdere configuratie mogelijk is.
Zo komen er nog heel veel mails van wat mailing lijsten zoals van bijvoorbeeld magazines binnen met een score van 10. Het is een vrij standaard spamassassin configuratie trouwens.

Hoe zou ik dit best oplossen? Door met Bayesian Filters de SPAM en HAM mails uit elkaar te halen? Gaat spamassassin dit zo afleren?
Maar aangezien er meerdere mensen op deze mail server een mailbox hebben kunnen zij weer op heel andere mailing lijsten zijn ingeschreven en het valt me echt op dat er veel mailing lijsten onmiddellijk met een score van 10 gemarkeerd worden.

Een beetje in de war dus, ik zie even door de bomen het bos niet meer...

  • Equator
  • Registratie: April 2001
  • Laatst online: 16-02 13:40

Equator

Crew Council

#whisky #barista

Move naar NOS :)

Verwijderd

een spamfilter moet worden opgevoed.

dat is erg lastig, je kan de mensen vragen om alle mailinglist aan een white list toe te voegen

  • codemann
  • Registratie: Oktober 2002
  • Laatst online: 31-01 15:04
Verwijderd schreef op woensdag 25 oktober 2006 @ 20:39:
een spamfilter moet worden opgevoed.

dat is erg lastig, je kan de mensen vragen om alle mailinglist aan een white list toe te voegen
Dat idee was ook al bij me opgekomen, maar dit kan je nooit perfect doen en is dus niet de beste oplossing. Wat kan ik voor de rest nog doen om hem op te voeden? Ik heb al een aantal dingen bijgehouden :
- hp nieuwsbrief : score : 10,00 - HTML_MESSAGE,HTML_TAG_EXISTS_TBODY,BAYES_90,NO_RDNS2,J_CHICKENPOX_73,URIBL_SURBLA
- pixmania nieuwsbrief : score : 10,00 - HTML_MESSAGE,HTML_TAG_EXISTS_TBODY,BAYES_995,SARE_FROM_SPAM_WORD3,NO_RDNS2,LONGWORD,MR_STRANGE_QUESTION,J_CHICKENPOX_14,J_CHICKENPOX_24,J_CHICKENPOX_52
- club nokia : score : 6,70 - HTML_MESSAGE,HTML_TAG_EXISTS_TBODY,BAYES_995,NO_RDNS2,SARE_FROM_SPAM_WORD4
Ik vermoed dat BAYES_... de grote reden gaat zijn dat deze mails zo'n hoge score krijgen. Ik kan mijn bayesian filters gaan "leren" door een spam en een ham filter te maken in mijn IMAP account.
De mail server gaat hier dan 1x per dag over gaan en zichzelf verbeteren. En hopelijk heeft dit dan effect op meerdere nieuwsbrieven en niet alleen op de aparte nieuwsbrieven die ik als HAM toevoeg, want anders schiet het nog niet op.

Of ziet er iemand nog een andere mogelijke werkwijze?


PS : waarom moest dit naar NOS ? SpamAssassin is iets wat zowel op Linux als Windows werkt, dit gaat trouwens over een Mail Server op een Windows systeem.

[ Voor 5% gewijzigd door codemann op 26-10-2006 10:58 ]


  • zomertje
  • Registratie: Januari 2000
  • Laatst online: 16-02 15:33

zomertje

Barisax knorretje

Ik denk dat ie dus beter thuis is in een Windows forum :)

Bump > WSS

het ultieme jaargetijde.... | #!/usr/bin/girl | Art prints and fun


Verwijderd

Zal ff uitleggen hoe ik het thuis heb (draait wel op linux):

(Spamassassin draait hier wel niet op usernivo maar op direct op binnenkomende mail)

Beheerder Account Folders.

FoundSpam -> komen alle gevonden spam mails in
IsNoSpam -> slepen we false positives in

Shared Folder (over alle accounts)
IsSpam -> slepen we alle false negatives in

paar keer per week draait SA-Learn over de folders IsNoSpam & IsSpam en wordt zodoende steeds wijzer.
Ga nu no het zelfde doen met 2 folders voor WhiteList en Blacklist

[ Voor 9% gewijzigd door Verwijderd op 26-10-2006 12:00 ]


  • stappel_
  • Registratie: Augustus 2000
  • Laatst online: 16-01 12:25
je kan ook de autolearn aanzetten (of id dat nu al standaard aan). dat werkt ook al goed na een aantal dagen. Hij krijgt dan snel door wat voor woorden er veel gebruikt worden.

tevens zie ik 3 keer NO_RDNS2. dat is geen standaard spamassassin of sare rule. hij is erg gevoelig voor een dns probleem. ik zou hem weg halen.

tevens heb ik voor meerdere sites de default bayes iets aangepast:

score BAYES_00 0 0 -4.901 -4.900
score BAYES_60 0 0 3.515 1.0
score BAYES_80 0 0 3.608 2.0
score BAYES_95 0 0 3.514 3.0
score BAYES_99 0 0 5.400 5.400

Ubero: #2, Euler: #1, GOT: #1, Des: #1, Zeta: #1, Eon: #3, OGR-24: #3, OGR-25: #7,
LM: #7, AP: #5, DF: #19, D2OL: #37, SOB: #50, TSC: #63, RC5: #96

Pagina: 1