neprihlásený Sobota, 20. apríla 2024, dnes má meniny Marcel
Porovnávali sme protispamový filter Gmailu a Thunderbirdu + SpamAssassinu

Protispamový filter Gmailu je veľkou časťou jeho užívateľov považovaný za jednu z veľkých predností tejto webmailovej služby a nepochybne je jedným z najkvalitnejších protispamových filtrov u zdarma dostupných webmailových služieb. V dnešnom teste budeme porovnávať jeho kvalitu s výsledkami dosahovanými voľne dostupným open-source protispamovým riešením nasaditeľným na ľubovoľný email.

DSL.sk, 18.12.2007


Protispamový filter webmailovej služby Gmail je vo všeobecnosti považovaný za jeden z najkvalitnejších u webmailov. A hoci v súčasnosti je jeho výhody možné využívať aj na vlastných emailoch pri presmerovaní alebo hostovaní celej domény, pre veľa užívateľov je táto možnosť neakceptovateľná.

Zvyčajnými dôvodmi sú napríklad problémy s dostupnosťou služby respektíve rozličné medializované incidenty so stratou pošty alebo jej zneprístupnením, strata kontroly nad zabezpečením dostupnosti ale často aj obavy z uloženia dát na serveroch tretej strany.

V aktuálnom teste sme tak porovnali kvalitu protispamového riešenia Gmailu s kvalitou open-source protispamového riešenia používaného DSL.sk.

Protispamové riešenie používané DSL.sk

Redakcia DSL.sk používa ako protispamové riešenie kombináciu dvoch voľne dostupných open-source nástrojov, SpamAssassin a Thunderbird, v pomerne štandardnej konfigurácii.

SpamAssassin filtruje poštu ešte na emailovom serveri a detekovaný spam presúva do zvláštneho priečinku Spam_SA naďalej prístupného užívateľovi napríklad cez IMAP. Predmet ani telo emailu nemodifikuje, dopĺňa do jeho hlavičky špecifické X-Spam informácie.

SpamAssassin je nastavený s vyššou prahovou hodnotou spamu, required_hits na úrovni 8, pre minimalizáciu chybného označenia regulárnych emailov za spam. Na väčšine účtov nedosahuje samostatne dostatočnú účinnosť, jeho cieľom je email predfiltrovať a spraviť pohodlnejším prístup napríklad z mobilných klientov bez podpory detekcie spamu.

Bayesiánsky filter SpamAssassina používa globálnu databázu pre celý emailový server. Prvotné učenie prebehlo na veľkej vzorke približne 10 tisíc emailov, ďalšie spresňovanie je už len automatické bez spätnej väzby užívateľa.

Väčšina užívateľov používa ako emailový klient Thunderbird. Tento filtruje spam, ktorý SpamAssassinu unikol a dostal sa do Inboxu, ale tiež priečinok Spam_SA so spamom vytriedeným SpamAssassinom. Thunderbird nemá nastavenú explicitnú dôveru označeniu emailov SpamAssassinom. Email je automaticky za spam považovaný až pri jeho nezávislom označení Thunderbirdom, ostatné emaily v priečinku Spam_SA musí užívateľ manuálne preveriť.

Väčšina definitívne automaticky nedetekovaného spamu sa pri takomto riešení v používanej konfigurácii nachádza v priečinku Spam_SA, kde užívateľa obťažuje menej, keďže tento priečinok môže byť kontrolovaný menej častejšie.

Riešenie podľa našich skúseností nepomáha znižovať celkovú mieru falošných pozitívnych označení regulárneho emailu za spam oproti použitiu iba Thunderbirdu, nesprávne označený regulárny email ale častejšie zostáva v priečinku Spam_SA, ktorý si užívateľ pravidelne kontroluje.

Test

Pre porovnanie kvality Gmailu a kombinácie SpamAssassinu a Thunderbirdu sme vytvorili emailový účet, na ktorý boli nasmerované viaceré mnoho rokov používané emailové adresy. Na tieto adresy vzhľadom na ich dlhú históriu respektíve štandardný uhádnuteľný formát v súčasnosti prichádza výrazne viac spamu ako regulárnych emailov.

Emaily nasmerované na tento účet boli ešte pred kontrolou SpamAssassinom preposielaný transparentne aj na Google účet. U oboch účtov boli pravidelne užívateľom označované nedetekované spamy aj chybne označené regulárne emaily.

Test hodnotil efektívnosť filtrov u emailov, ktoré prišli na emailový server 17. decembra 2007, od 0:00 do 23:59. Testu predchádzalo približne šesť týždňov trénovania Gmailu aj Thunderbirdu.

Výsledky

V pondelok 17. decembra bolo na testovací účet doručených celkom 4 164 emailových správ, z ktorých bola absolútna väčšina spamových.


Členenie prijatých správ podľa typu



Regulárnych bolo celkovo 73 emailových správ, z ktorých 61 bolo špecifických rozpoznaných pravidlami podľa odosielateľa a príjemcu a zatriedených do vlastných priečinkov.


Výsledky dosiahnuté jednotlivými protispamovými riešeniami



Gmail chybne nerozpoznal celkovo viac spamu, uniklo mu 16 správ voči 12 správam pri riešení Thunderbirdu a SpamAssasina. V tomto riešení navyše len dva nedetekované spamy skončili v Inboxe, zvyšných 10 detekoval aspoň SpamAssassin a dostali sa do priečinka Spam_SA.

Chybne boli za spam spolu označené len dva regulárne emaily, oba v prípade Gmailu. Paradoxne išlo o emaily klasifikované existujúcimi pravidlami a prejavila sa tak často užívateľmi kritizovaná vlastnosť Gmailu. Gmail totiž kontroluje a potenciálne označuje za spam aj správy, ktoré vyhovujú nadefinovaným pravidlám užívateľa. Hoci v niektorých prípadoch môže mať takáto kontrola význam, pravdepodobne vo väčšine prípadov môže len škodiť.

Celkovo tak pri teste dosahovala o niečo lepší výsledok kombinácia SpamAssassina a Thunderbirdu, čím sa potvrdili naše skúsenosti z prípravného obdobia testu. Rovnaké výsledky samozrejme nemusia byť dosahované v každom prípade a pri ľubovoľnom inom zložení emailovej komunikácie, keďže o účinnosti rozhoduje aj viacero premenlivých faktorov ovplyvnených vlastným obsahom komunikácie.

V súčasnosti pripravujeme aj porovnávací test medzi Gmailom a samostatne použitým Thunderbirdom bez SpamAssassinu. V tomto prípade sa dá ale pravdepodobne očakávať, že Gmail bude dosahovať o niečo lepšie výsledky, keď pri kombinovanom použití SpamAssassin pomáha detekovať Thunderbirdu spam, ktorý iba na základe bayesiánskej štatistickej analýzy nie je možné alebo je len veľmi ťažké detekovať.


      Zdieľaj na Twitteri


Akého typu je Váš hlavný email? (hlasov: 802)

Voľne použiteľný klasický webmail      55%
Iný verejný email, napríklad od ISP      12%
Firemný / univerzitný email      13%
Email na vlastnom emailovom serveri      19%


Najnovšie články:

NASA otestuje nový vesmírny pohon v podobe solárnej plachty
V najbližších dňoch bude spustený nový vysielač digitálneho rádia
Seriál Fallout podľa počítačovej hry bude mať pokračovanie
Budúci týždeň budú vydané dve dôležité linuxové distribúcie
Špehovacie satelity SpaceX už snímkujú Zem, s vyšším rozlíšením ako doterajšie
Linux si na PC drží podiel 4%
AI výkon tohtoročnej generácie Intel CPU bude vyšší ako 100 teraops/s
Apple bude mať nový seriál o alternatívnom sovietskom vesmírnom programe, predĺžila For All Mankind
Pôsobivého dvojnohého robota Atlas nahradí úplne nová elektrická verzia
O2 spustilo predaj na diaľku. Namiesto eID sa fotí tvár a občiansky, nedá sa objednať eSIM ani predplatenka


Diskusia:
                               
 

SA a TB... Dve veci zbytočne. Gmail stačí :)
Odpovedať Známka: -3.3 Hodnotiť:
 

si dobra lama...
Odpovedať Známka: 7.3 Hodnotiť:
 

ja suhlasim som zatrial ten stastny komu pride za mesiac >100 spamov takze zatial gmail premerovany na moj mail na vlastnom servery
Odpovedať Známka: 4.3 Hodnotiť:
 

sak to mu neberiem, ale preco by mal byt TB zbytocna vec?
Odpovedať Známka: 0.0 Hodnotiť:
 

TB je skvela vec, skoda ze na jeho vyvoj sa moc nedba.
Odpovedať Známka: 8.2 Hodnotiť:
 

si stastny ze ti chodi viac ako 100 spamov? lebo znamienko ktore si pouzil tomu nasvädcuje ..:) ">100" z matematickej vety "x>100" (citaj "iks" je vacsie ako sto), tak by to malo byt "<100" z vety "x<100" (citaj "iks" je mensie ako sto) ... :)
Odpovedať Známka: 7.9 Hodnotiť:
 

test trocha od veci, to ste mali skor porovnat antispamy na slovenskych webmailoch
Odpovedať Známka: -6.5 Hodnotiť:
 

antispamy (ha ha) na slovenskych webmailoch (ha ha). chod si citat nc alebo obdobnu stranku o pc s lahsim ponatim zanra...
Odpovedať Známka: 2.0 Hodnotiť:
 

to by nebolo zle napriklad pop3 na centrume prijima aj spamovy kos to je dobra haluska
Odpovedať Známka: 2.0 Hodnotiť:
 

Pouzivam gmail uz par rokov a nemam vobec ziadne problemy so spamom. Maximalne tak par reklam, ale tie mi prisli az po zaregistrovani sa neviem kde.
Odpovedať Známka: -6.4 Hodnotiť:
 

Používame rovnakú kombináciu SA+TB a dokonca aj filozofia nastavení je takmer totožná.

Rozdiel je v tom, že spam putuje používateľovi do jedného priečinka. Používatelia vedia, že občas musia skontrolovať, či im filtre nezahodili dobrú správu (stáva sa to veľmi zriedkavo, ale občas sa stane). Nevidím reálny prínos v delení na 2 priečinky. Pokiaľ ide o množstvo falošných poplachov, tak SA a TB sú na tom vyrovnane.
Odpovedať Známka: -2.0 Hodnotiť:
 

Ja to mám vyriešené najlepšie. Mail mám na servrcoh Google a sťahujem ho Thunderbirdom a filtrujem SpamAssassinom. To čo Google ešte neodfiltruje, to dorieši SpamAssassin. :)
Odpovedať Známka: 2.0 Hodnotiť:
 

problem u mna je ze gmail odfiltruje viac ako by bolo treba a naviem mu nastavit napriklad ze vsetko *.sk default nie je spam
Odpovedať Známka: 2.0 Hodnotiť:
 

sa necuduj preco ti prichadza tak malo odpovedi :D
Odpovedať Známka: -4.3 Hodnotiť:
 

"v pomerne štandardnej konfigurácii. "

co je to pomerne stnadardna konfiguracia ?

mozete zverejnit konfig spam asassinu ?


Odpovedať Známka: 0.0 Hodnotiť:
 

U Gmailu ide aj o typ spamu, aky tam chodi. Ja som raz spravil jednu velku chybu a testoval som, ci mi zacnu chodit spamy po uverejneni mojej nechranenej mailovej adresy (schovanej pomocou CSS proti ludom) na jednej nie velmi navstevovanej stranke. Bohuzial zacali, priemerne 50 za den, Gmail z toho odfiltruje 1-5 mailov a false positive je cca kazdy 3. regulerny doruceny mail.

Celkovo mi z toho vyplyva, ze Spam folder tam prakticky vyznam nema, neviem kde ste to testovali vy, ale asi ste mali velmi slabych spammerov.
Odpovedať Známka: 3.3 Hodnotiť:
 

Gmail cca 690 sprav mesacne, max 5 sprav zle oznacenych ako spam...

Odpovedať Známka: 5.0 Hodnotiť:
 

pouzivam tieto 3 kombinacie uz dlhsiu dobu :) a musim uznat ze do SPAMU mi nehodil este ziadny DOLEZITY email. Spam vsetok pekne prefiltruje. Do mesiaca max 2-3 maile.
Odpovedať Známka: -3.3 Hodnotiť:
 

Ja Gmail pouzivam dost dlho, tesne po tom ako to spustili a este ani raz sa mi nestalo ze by mi zhltol mail alebo spam presiel do dorucenych, v tomto smere som absolutne spokojny. Moj prvy email ktory mam na Atlase asi od nejakeho roku 98 je na tom omnoho horsie - ak je filter na mensiu uroven tak vsetko chyta spam filter, ak na slabsiu tak nechyta nic a vsetko prejde
Odpovedať Známka: 0.0 Hodnotiť:
 

V pripade GMailu existuje hypoteza, ze pri otvorenom accounte sa znizuje ucinnost filtra oproti stahovaniu (napriklad cez POP3) v dlhsich intervaloch (napr. 1 den).
Tato hypoteza je ciastocne potvrdena samotnym Googlom, v prehlaseni kde vravi, ze si zlepsuju antispam engine aj uzivatelmi identifikovanymi spammailami.
Odpovedať Známka: 3.3 Hodnotiť:
 

pre spamassassin existuju taktiez rozne pluginy napr fuzzyocr na obrazkovy spam a podobne
co doporucujem pouzivat je rbl blacklist na servery, konkretne najlepsi je zen.spamhaus.org, hostujem vyse 10k boxov, teraz je 1:50 od polnoci henten rbl odmietol 11000 mailov, false positive som zatial nezaznamenal, treba sa zbavit najviac spamu predtym nez to server prijme nech zbytocne nevytazuje stroje
Odpovedať Známka: 8.1 Hodnotiť:
 

Denne mi chodi okolo 30 mailov, 25 je spam =D Je to uz dost stare konto. Stacilo, ze som 2 tyzdne oznacoval v TB spam, cim sa "vytrenoval" filter. Potom som uz len nastavil, aby boli spravy oznacovane ako SPAM automaticky presunute. Pre istotu este stale skontrolujem, co vyradil, ale zatial 100% ucinnost.
Odpovedať Známka: -6.5 Hodnotiť:
 


Odpovedať Známka: -6.4 Hodnotiť:

Pridať komentár