4. ZÁPAS S OBTĚŽUJÍCÍ POŠTOU VE FZÚ


Internet  je dnes velmi rozšířené médium, má pravděpodobně už stovky miliónů uživatelů a každý z nich může dostat e-mail. Existuje řada způsobů, jak v  Internetu  dolovat e-mailové adresy, založených především na skenování webových stránek. Existují legální firmy, které tímto způsobem vytvářejí databáze adres a prodávají je. Každý z nás proto někdy dostane nevyžádaný e-mail obvykle reklamního obsahu. Takovéto zprávy bývají označovány anglickým slovem  spam  (podle slovníku též „lunch z krájené kořeněné šunky").

Příjemce  spamu  se při jeho spatření cítí být napaden a mívá potřebu se odesílateli pomstít. Spammeři to tuší a proto se snaží zůstat v anonymitě. Proto jestliže na  spam  odpovíte na adresu odesílatele uvedenou v hlavičce  From:  nebo  Reply-to: , původce zprávy vaši odpověď nedostane. Dostanete ji zpět jako nedoručitelnou (tradiční způsob), nebo ji dostane někdo zcela nevinný (novější způsob). Pátrání po pravém původci zprávy, je-li šikovný, bude bezvýsledné. Je proto vhodné šetřit časem i energií a nežádoucí zprávu si v klidu zrušit. Tento postup lze do určité míry automatizovat, jak bude popsáno níže.


4.1 SpamAssassin

Původní postupy automaticky rozpoznaly  spam  podle určitých nesrovnalostí v hlavičkách zprávy nebo v protokolu doručení. Tyto postupy však dnes již nejsou účinné, protože spammeři se je naučili obcházet. Zbývá jediná možnost: každou došlou zprávu přečíst a inteligentním programem ohodnotit podle obsahu. Program se může splést a buď  spam  propustit nebo naopak odklidit správný dopis. Filtrace pošty proto musí být zařízena tak, aby umožnila lidskou kontrolu a korekci. Předkládaná instalace toto splňuje.

Na  cedru  a  sosně  je nainstalován program  SpamAssassin 2.61 . Instalace sestává z  RPM  balíčků spamassassin-2.61-1 ,  spamassassin-tools-2.61-1 ,  perl-Mail-SpamAssassin-2.61-1 .

Jedná se o expertní systém napsaný v jazyce  Perl  a skládá se z programu a z pravidel určujících jeho zdánlivou inteligenci. Program funguje v zásadě tak, že pošta, která je v současných linuxech lokálně doručována programem  procmail , je souborem  ~/.procmailrc  přefiltrována programem spamassassin . Bezprostředním výsledkem běhu programu je to, že zpráva je zařazena do došlé pošty zdánlivě normálně, ale ve skutečnosti s pozměněnými headery. S takto označkovanou zprávou potom znovu zachází  procmail . Zprávu lze především uložit do vyhrazené poštovní složky, případně i zrušit.

Systém je vhodný pro uživatele ústavní elektronické pošty, kteří si došlou poštu ukládají na serveru, nebo kteří si ji automaticky forwardují jinam. Uvedení systému do provozu pro daného uživatele není zcela triviální. Konfiguraci vám na požádání udělá pí Rozhoňová, rozhon@fzu.cz . Jednou vytvořenou konfiguraci vám také bude udržovat, což zahrnuje především bayesovské učení ze sbírek spamů.

Chcete-li dosáhnout lepší účinnosti, vytvořte si vlastní sbírku. Stačí, když si spamy,  které  systém správně nerozpoznal, uložíte ve standardním formátu  MBOX . Poštovní archívy tohoto typu vytvoříte tak, že zprávy budete ukládat z unixového programu  pine , nebo z libovolného  IMAP  klienta, když zadáte ukládání do poštovního folderu na serveru. Poštovní programy ve  Windows  při lokálním ukládání (tj. na vašem  PC ) zpravidla používají databázově orientované formáty, lokálně uložené spamy proto k učení využít nelze.

Jestliže máte vlastní sbírku spamů uloženu dejme tomu v souboru soubor, můžete si svou osobní konfiguraci přiučit povelem

uceni spam soubor

na  cedru  či na  sosně  podle toho, kde máte aktivní poštu. K efektivnímu naučení bývá zapotřebí sbírka řádově stovek a více zpráv. V adresáři  /usr/local/SpamAssassin/sbirky  jsou k vidění soubory spamů, které  SAVT  standardně používá k učení uživatelských konfigurací. Máte-li vlastní hodnotnou sbírku, můžete ji poskytnout pracovníkům  SAVT , nejlépe pí. Rozhoňové, k použití pro všechny.

Pokud používáte na zpracování pošty program  pine  , a proleze Vám nějaký ten spam, nebo naopak  SpamAssassin  vyřadí užitečný mail, můžete přímo z pinu naučit SpamAssassin  o povaze takového mailu. Stisknutím "H" zapněte v  pine  zobrazení plné hlavicky zprávy (  Full Headers ) a přesměrujte pravě otevřenou zprávu nebo zprávu, na kterou ukazuje kurzor, do roury povelu

uceni spam

pro spam, nebo do povelu

uceni ham

pro mylně vyřazenou užitečnou zprávu. Vypnout zobrazení plné hlavicky zprávy můžete zase stiskem "H"

.

4.2 Základní režim filtrace

V začátcích filtrace nežádané pošty jsme zvědavcům poskytovali testovací konfiguraci, při níž byly vytipované zprávy ponechány v došlé poště, jen nápadně označeny v poli  Subject: . V současné verzi tento režim už není podporován.


4.3 Pokročilý režim filtrace

Zprávy jsou označkovány přidáním headeru  X-Spam-Status:  a několika dalších. Tyto headery uživatel při běžné práci s poštou nevidí. Pozitivně indikované zprávy jsou z došlé pošty přesunuty do vyhrazené poštovní složky na serveru, defaultně  ~/mail/spam-today . Každý den v poledne je uživateli odeslána krátká zpráva, obsahující seznam zpráv v souboru  spam-today . Obsah tohoto souboru je současně přesunut do nultého archivního souboru, defaultně  ~/mail/spam .

Na začátku každého měsíce je soubor  spam  přejmenován na jméno prvního archívního souboru, defaultně  spam-last-month . Těsně před tím je ale první archívní soubor přejmenován na jméno druhého archívního souboru, defaultně  spam-last-but-one-month . Tímto mechanismem je docíleno toho, že vyřazené zprávy máte k dispozici ještě nejméně dva měsíce.


4.4 Máte o program zájem?

Přejete-li si filtraci, požádejte e-mailem na adrese  rozhon@fzu.cz . Na tuto adresu se obracejte i v případě provozních potíží, třeba kdybyste narazili na kvótu diskového prostoru na serveru.


4.5 Informace pro kutily