SpamBayes - SpamBayes

SpamBayes
Původní autoři	Tim Peters
První vydání	Září 2002
Stabilní uvolnění	1.0.4 / březen 2005
Náhled verze	1.1a6 / 6. prosince 2008
Napsáno	Krajta
Plošina	Cross-platform
K dispozici v	Angličtina pouze
Typ	Filtrování e-mailů
Licence	PSFL
webová stránka	spambayes.sourceforge.net

SpamBayes je Bayesian filtr nevyžádané pošty napsáno v Krajta který používá techniky stanovené Paul Graham ve své eseji „Plán spamu“. Následně byl vylepšen o Gary Robinson a Tim Peters, mezi ostatními.

Nejpozoruhodnějším rozdílem mezi běžným bayesovským filtrem a filtrem používaným SpamBayesem je, že existují spíše tři klasifikace než dvě: spam, non-spam (tzv. šunka ve SpamBayes) a nejistý. Uživatel trénuje zprávu jako ham nebo spam; při filtrování zprávy generují spamové filtry jedno skóre pro ham a druhé pro spam.

Pokud je skóre spamu vysoké a skóre Ham je nízké, zpráva bude klasifikována jako spam. Pokud je skóre spamu nízké a skóre Ham je vysoké, bude zpráva klasifikována jako Ham. Pokud jsou skóre vysoká nebo obojí nízká, zpráva bude klasifikována jako nejistá.

Tento přístup vede k nízkému počtu falešně pozitivní výsledky a falešné negativy, ale může to vést k řadě nejistot, které vyžadují lidské rozhodnutí.

Filtrování webu

Nějaká práce šla do použití SpamBayes na filtrování internetového obsahu přes a proxy webový server.^[2]^[3]

Reference

externí odkazy

[1] ttp://sourceforge.net/projects/spambayes/files/spambayes/1.1a6/CHANGELOG.txt/download

[2] ttp://mail.python.org/pipermail/spambayes-dev/2003-December/001804.html

[3] ttp://osdir.com/ml/mail.spam.spambayes.devel/2008-05/msg00004.html

[1]

[2]

[3]