- Door
- Veenman
- geplaatst op
- 2 september 2008 08:04 uur
Op vrijwel elk denkbaar e-mail adres komt spam binnen, dat in de meeste gevallen uit de stroom met legitieme e-mail gefilterd wordt. Sommige mensen lijken echter meer spam te krijgen dan anderen en dat wordt vaak toegeschreven aan het later “slingeren” van je e-mail adres op internet. Echter uit een onderzoek (PDF) van Professor Richard Clayton van de Universiteit van Cambridge blijkt er ook een correlatie te bestaan tussen de hoeveelheid spam en de eerste letter van het e-mail adres waar de spam op binnen komt.
Voor zijn onderzoek had Clayton de beschikking over 8 weken aan log files (1 februari tot 27 maart 2008) van de mailservers van de Britse ISP Demon (Thus PLC) die in die periode totaal 550.596.270 e-mails ontvingen (zo’n 8.94 miljoen per dag) en waarvan 56.0 procent spam is, het percentage spam is mogelijk nog hoger gezien geblackliste IP-adressen aan de poort geweigerd werden en hun e-mail sowieso niet konden afleveren.
Uit het onderzoek van Clayton blijkt dat alle e-mail die geadresseerd was aan een e-mail adres dat begint met een A totaal 50,2 procent spam is, terwijl dat bij alle e-mail adressen die beginnen met een Z zelfs 74,3 procent spam is. Echter als er gekeken wordt naar e-mail adressen die ook echt bestaan en waarbij de e-mail ook daadwerkelijk aankomt (tenzij er uiteraard een catch-all e-mail adres bestaat) zijn de rollen omgedraaid. Totaal is zo’n 30 procent van alle e-mail die binnenkomt op e-mail adressen met een A spam en ‘maar’ zo’n 20 procent van alle e-mail die binnenkomt op e-mail adressen met een Z spam.
Een mogelijke verklaring voor dit verschijnsel ziet Clayton in het feit dat spammers het deel voor de @ van werkende e-mail adressen combineren met andere domeinnamen en dat dergelijke lijsten die door spammers worden gebruikt in alfabetische volgorde worden gesorteerd. Al lukte het Clayton niet om dit met behulp van zijn onderzoek te onderbouwen.
Wel concludeert Clayton dat er een grote slag kan worden gemaakt wanneer spamfilter bewust zijn van welke e-mail adressen echt bestaan en welke niet, omdat ruim de helft van de e-mails die de Demon mailservers bereikten niet voor een bestaande e-mail adres bestemd waren.