SpamBayes - SpamBayes
Původní autoři | Tim Peters |
---|---|
První vydání | Září 2002 |
Stabilní uvolnění | 1.0.4 / březen 2005 |
Náhled verze | 1.1a6 / 6. prosince 2008[1] |
Napsáno | Krajta |
Plošina | Cross-platform |
K dispozici v | Angličtina pouze |
Typ | Filtrování e-mailů |
Licence | PSFL |
webová stránka | spambayes.sourceforge.net |
SpamBayes je Bayesian filtr nevyžádané pošty napsáno v Krajta který používá techniky stanovené Paul Graham ve své eseji „Plán spamu“. Následně byl vylepšen o Gary Robinson a Tim Peters, mezi ostatními.
Nejpozoruhodnějším rozdílem mezi běžným bayesovským filtrem a filtrem používaným SpamBayesem je, že existují spíše tři klasifikace než dvě: spam, non-spam (tzv. šunka ve SpamBayes) a nejistý. Uživatel trénuje zprávu jako ham nebo spam; při filtrování zprávy generují spamové filtry jedno skóre pro ham a druhé pro spam.
Pokud je skóre spamu vysoké a skóre Ham je nízké, zpráva bude klasifikována jako spam. Pokud je skóre spamu nízké a skóre Ham je vysoké, bude zpráva klasifikována jako Ham. Pokud jsou skóre vysoká nebo obojí nízká, zpráva bude klasifikována jako nejistá.
Tento přístup vede k nízkému počtu falešně pozitivní výsledky a falešné negativy, ale může to vést k řadě nejistot, které vyžadují lidské rozhodnutí.
Filtrování webu
Nějaká práce šla do použití SpamBayes na filtrování internetového obsahu přes a proxy webový server.[2][3]