Als hobby ben ik een eigen spamfilter aan het maken voor Outlook 2003.
Principe dat ik wil nabouwen is bekend. Installeert een add-in voor outlook. Deze scan't je inkomende mailtjes, en kijkt in een lijst op een server of deze daar als spam bekend staan. Iedereen kan via de add-in een mailtje als spam classificeren en zo helpt iedereen om elkaar's mailbox schoon te houden.
Alles gaat prima, alleen weet ik voor een onderdeel niet wat de beste oplossing is.
Hoe maak ik een 'vingerafdruk' van een emailtje?
Als ik een md5 hash van de body van de mail maak, komt deze vaak niet overeen met dezelfde mail naar andere gebruikers als de naam van de persoon gebruikt wordt in de body (bv Dear Philip).
Ik kan zoeken op dear en hi en die regels schrappen, maar dan kan er nog steeds ergens in de body een random iets staan om zo'n hash om zeep te helpen.
Ik wil graag iets van een hash gebruiken omdat dit lekker snel is.
Principe dat ik wil nabouwen is bekend. Installeert een add-in voor outlook. Deze scan't je inkomende mailtjes, en kijkt in een lijst op een server of deze daar als spam bekend staan. Iedereen kan via de add-in een mailtje als spam classificeren en zo helpt iedereen om elkaar's mailbox schoon te houden.
Alles gaat prima, alleen weet ik voor een onderdeel niet wat de beste oplossing is.
Hoe maak ik een 'vingerafdruk' van een emailtje?
Als ik een md5 hash van de body van de mail maak, komt deze vaak niet overeen met dezelfde mail naar andere gebruikers als de naam van de persoon gebruikt wordt in de body (bv Dear Philip).
Ik kan zoeken op dear en hi en die regels schrappen, maar dan kan er nog steeds ergens in de body een random iets staan om zo'n hash om zeep te helpen.
Ik wil graag iets van een hash gebruiken omdat dit lekker snel is.