4. ZÁPAS S OBTĚŽUJÍCÍ POŠTOU VE FZÚ
Internet je dnes velmi rozšířené médium, má pravděpodobně už stovky miliónů uživatelů a každý z nich může dostat e-mail. Existuje řada způsobů, jak v Internetu dolovat e-mailové adresy, založených především na skenování webových stránek. Existují legální firmy, které tímto způsobem vytvářejí databáze adres a prodávají je. Každý z nás proto někdy dostane nevyžádaný e-mail obvykle reklamního obsahu. Takovéto zprávy bývají označovány anglickým slovem spam (podle slovníku též lunch z krájené kořeněné šunky").
Příjemce spamu se při jeho spatření cítí být napaden a mívá potřebu se odesílateli pomstít. Spammeři to tuší a proto se snaží zůstat v anonymitě. Proto jestliže na spam odpovíte na adresu odesílatele uvedenou v hlavičce From: nebo Reply-to: , původce zprávy vaši odpověď nedostane. Dostanete ji zpět jako nedoručitelnou (tradiční způsob), nebo ji dostane někdo zcela nevinný (novější způsob). Pátrání po pravém původci zprávy, je-li šikovný, bude bezvýsledné. Je proto vhodné šetřit časem i energií a nežádoucí zprávu si v klidu zrušit. Tento postup lze do určité míry automatizovat, jak bude popsáno níže.
Původní postupy automaticky rozpoznaly spam podle určitých nesrovnalostí v hlavičkách zprávy nebo v protokolu doručení. Tyto postupy však dnes již nejsou účinné, protože spammeři se je naučili obcházet. Zbývá jediná možnost: každou došlou zprávu přečíst a inteligentním programem ohodnotit podle obsahu. Program se může splést a buď spam propustit nebo naopak odklidit správný dopis. Filtrace pošty proto musí být zařízena tak, aby umožnila lidskou kontrolu a korekci. Předkládaná instalace toto splňuje.
Na cedru a sosně je nainstalován program SpamAssassin 2.61 . Instalace sestává z RPM balíčků spamassassin-2.61-1 , spamassassin-tools-2.61-1 , perl-Mail-SpamAssassin-2.61-1 .
Jedná se o expertní systém napsaný v jazyce Perl a skládá se z programu a z pravidel určujících jeho zdánlivou inteligenci. Program funguje v zásadě tak, že pošta, která je v současných linuxech lokálně doručována programem procmail , je souborem ~/.procmailrc přefiltrována programem spamassassin . Bezprostředním výsledkem běhu programu je to, že zpráva je zařazena do došlé pošty zdánlivě normálně, ale ve skutečnosti s pozměněnými headery. S takto označkovanou zprávou potom znovu zachází procmail . Zprávu lze především uložit do vyhrazené poštovní složky, případně i zrušit.
Systém je vhodný pro uživatele ústavní elektronické pošty, kteří si došlou poštu ukládají na serveru, nebo kteří si ji automaticky forwardují jinam. Uvedení systému do provozu pro daného uživatele není zcela triviální. Konfiguraci vám na požádání udělá pí Rozhoňová, rozhon@fzu.cz . Jednou vytvořenou konfiguraci vám také bude udržovat, což zahrnuje především bayesovské učení ze sbírek spamů.
Chcete-li dosáhnout lepší účinnosti, vytvořte si vlastní sbírku. Stačí, když si spamy, které systém správně nerozpoznal, uložíte ve standardním formátu MBOX . Poštovní archívy tohoto typu vytvoříte tak, že zprávy budete ukládat z unixového programu pine , nebo z libovolného IMAP klienta, když zadáte ukládání do poštovního folderu na serveru. Poštovní programy ve Windows při lokálním ukládání (tj. na vašem PC ) zpravidla používají databázově orientované formáty, lokálně uložené spamy proto k učení využít nelze.
Jestliže máte vlastní sbírku spamů uloženu dejme tomu v souboru soubor, můžete si svou osobní konfiguraci přiučit povelem
uceni spam soubor
na cedru či na sosně podle toho, kde máte aktivní poštu. K efektivnímu naučení bývá zapotřebí sbírka řádově stovek a více zpráv. V adresáři /usr/local/SpamAssassin/sbirky jsou k vidění soubory spamů, které SAVT standardně používá k učení uživatelských konfigurací. Máte-li vlastní hodnotnou sbírku, můžete ji poskytnout pracovníkům SAVT , nejlépe pí. Rozhoňové, k použití pro všechny.
Pokud používáte na zpracování pošty program pine , a proleze Vám nějaký ten spam, nebo naopak SpamAssassin vyřadí užitečný mail, můžete přímo z pinu naučit SpamAssassin o povaze takového mailu. Stisknutím "H" zapněte v pine zobrazení plné hlavicky zprávy ( Full Headers ) a přesměrujte pravě otevřenou zprávu nebo zprávu, na kterou ukazuje kurzor, do roury povelu
pro spam, nebo do poveluuceni spam
uceni ham
pro mylně vyřazenou užitečnou zprávu. Vypnout zobrazení plné hlavicky zprávy můžete zase stiskem "H"
.V začátcích filtrace nežádané pošty jsme zvědavcům poskytovali testovací konfiguraci, při níž byly vytipované zprávy ponechány v došlé poště, jen nápadně označeny v poli Subject: . V současné verzi tento režim už není podporován.
Zprávy jsou označkovány přidáním headeru X-Spam-Status: a několika dalších. Tyto headery uživatel při běžné práci s poštou nevidí. Pozitivně indikované zprávy jsou z došlé pošty přesunuty do vyhrazené poštovní složky na serveru, defaultně ~/mail/spam-today . Každý den v poledne je uživateli odeslána krátká zpráva, obsahující seznam zpráv v souboru spam-today . Obsah tohoto souboru je současně přesunut do nultého archivního souboru, defaultně ~/mail/spam .
Na začátku každého měsíce je soubor spam přejmenován na jméno prvního archívního souboru, defaultně spam-last-month . Těsně před tím je ale první archívní soubor přejmenován na jméno druhého archívního souboru, defaultně spam-last-but-one-month . Tímto mechanismem je docíleno toho, že vyřazené zprávy máte k dispozici ještě nejméně dva měsíce.
Přejete-li si filtraci, požádejte e-mailem na adrese rozhon@fzu.cz . Na tuto adresu se obracejte i v případě provozních potíží, třeba kdybyste narazili na kvótu diskového prostoru na serveru.
Soubor www.fzu.cz/~kratky/spam/.procmailrc , který zařídí spuštění expertního systému
Soubor www.fzu.cz/~kratky/spam/.spamassassin/user_prefs , který zařídí vhodné nastavení prahu citlivosti a zvýhodní ústavní odesilatele.
Skript www.fzu.cz/~kratky/spam/bin/spam_daily spouštěný v poledne cronem
Skript www.fzu.cz/~kratky/spam/bin/spam_monthly spouštěný jednou měsíčně
Relevantní řádky v uživatelově crontabu