v statistická klasifikace, Bayesův klasifikátor minimalizuje pravděpodobnost nesprávné klasifikace.[1]
Definice
Předpokládejme pár
bere hodnoty v
, kde
je označení třídy z
. To znamená, že podmíněné rozdělení z X, vzhledem k tomu, že štítek Y bere hodnotu r je dána
pro 
kde "
„znamená“ je distribuováno jako „a kde
označuje rozdělení pravděpodobnosti.
A klasifikátor je pravidlo, které se přiřazuje k pozorování X=X odhad nebo odhad toho, co nepozorovaný štítek Y=r ve skutečnosti byl. Teoreticky je klasifikátor měřitelnou funkcí
, s výkladem, který C klasifikuje bod X do třídy C(X). Pravděpodobnost nesprávné klasifikace, nebo riziko, klasifikátoru C je definován jako

Bayesův klasifikátor je

V praxi, stejně jako ve většině statistik, jsou potíže a jemnosti spojeny s efektivním modelováním rozdělení pravděpodobnosti - v tomto případě
. Klasifikátor Bayes je užitečným měřítkem v statistická klasifikace.
Nadměrné riziko obecného klasifikátoru
(možná v závislosti na některých tréninkových datech) je definována jako
Tato nezáporná veličina je tedy důležitá pro hodnocení výkonnosti různých klasifikačních technik. Klasifikátor se říká, že je konzistentní pokud nadměrné riziko konverguje k nule, protože velikost souboru tréninkových dat má sklon k nekonečnu.[2]
Důkaz optimality
Důkaz, že klasifikátor Bayes je optimální a Míra chyb Bayes je minimální výtěžek následovně.
Definujte proměnné: Riziko
, Bayesovo riziko
, všechny možné třídy, do kterých lze body klasifikovat
. Nechť je zadní pravděpodobnost bodu patřícího do třídy 1
. Definujte klasifikátor
tak jako

Pak máme následující výsledky:
(A)
, tj.
je Bayesův klasifikátor,
(b) Pro jakýkoli klasifikátor
, nadměrné riziko splňuje ![{ displaystyle R (h) -R ^ {*} = 2 mathbb {E} _ {X} vlevo [| eta (x) -0,5 | cdot mathbb {I} _ { vlevo {h (X) neq h ^ {*} (X) doprava }} doprava]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/92a2fec73684d3551d08cf02e2c48ed1005af28d)
(C) 
Důkaz (a): Pro jakýkoli klasifikátor
, my máme
![{ displaystyle { begin {aligned} R (h) & = mathbb {E} _ {XY} left [ mathbb {I} _ { left {h (X) neq Y right }} right] & = mathbb {E} mathbb {E} _ {Y | X} [ mathbb {I} _ { left {h (X) neq Y right }}]] & = mathbb {E} _ {X} [ eta (X) mathbb {I} _ { left {h (X) = 0 right }} + (1- eta (X)) mathbb {I} _ { left {h (X) = 1 right }}] end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/46a9f1efbe207c4208cb23bff0ccdd3f73a97ce6)
Všimněte si toho
je minimalizován tím, že
,

Minimálním možným rizikem je tedy Bayesovo riziko,
.
Důkaz (b):
![{ displaystyle { begin {zarovnaný} R (h) -R ^ {*} & = R (h) -R (h ^ {*}) & = mathbb {E} _ {X} [ eta (X) mathbb {I} _ { left {h (X) = 0 right }} + (1- eta (X)) mathbb {I} _ { left {h (X) = 1 right }} - eta (X) mathbb {I} _ { left {h ^ {*} (X) = 0 right }} - (1- eta (X)) mathbb {I} _ { left {h ^ {*} (X) = 1 right }}] & = mathbb {E} _ {X} [| 2 eta (X) -1 | mathbb {I} _ { left {h (X) neq h ^ {*} (X) right }}] & = 2 mathbb {E} _ {X} [| eta ( X) -0,5 | mathbb {I} _ { left {h (X) neq h ^ {*} (X) right }}] end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b0340d50b1dd24e974c522f8ea9c59e2bcbeef3f)
Důkaz (c):
![{ displaystyle { begin {aligned} R (h ^ {*}) & = mathbb {E} _ {X} [ eta (X) mathbb {I} _ { left {h ^ {*} (X) = 0 right }} + (1- eta (X)) mathbb {I} _ { left {h * (X) = 1 right }}] & = mathbb {E} _ {X} [ min ( eta (X), 1- eta (X))] end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/01df273ced4bc3702c2210244ef440c44f67bac6)
Obecný případ, že Bayesův klasifikátor minimalizuje chybu klasifikace, když každý prvek může patřit jednomu z n kategorie vycházejí z očekávání, a to následujícím způsobem.
![{ displaystyle { begin {aligned} mathbb {E} ( mathbb {I} _ { {y neq { hat {y}} }}) & = mathbb {E} mathbb {E} left ( mathbb {I} _ { {y neq { hat {y}} }} | X = x right) & = mathbb {E} left [Pr (Y = 1 | X = x) mathbb {I} _ { {{ {{}} = 2,3, dots, n }} + Pr (Y = 2 | X = x) mathbb {I} _ { {{ hat {y}} = 1,3, dots, n }} + dots + Pr (Y = n | X = x) mathbb {I} _ { {{ hat {y} } = 1,2,3, dots, n-1 }} right] end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/28899b9bdb3f5a9e6b66a3d7b1bad87ed0e9d464)
To je minimalizováno klasifikací

pro každé pozorování X.
Viz také
Reference