Lineární oddělitelnost - Linear separability

v Euklidovská geometrie, lineární oddělitelnost je vlastnost dvou sad bodů. To je nejjednodušší vizualizovat ve dvou dimenzích ( Euklidovské letadlo ) tím, že jednu sadu bodů považujete za modrou a druhou za červenou. Tyto dvě sady jsou lineárně oddělitelné pokud existuje alespoň jeden čára v rovině se všemi modrými body na jedné straně čáry a všemi červenými body na druhé straně. Tato myšlenka se okamžitě zobecní na euklidovské prostory vyšších dimenzí, pokud je čára nahrazena a nadrovina.
Problém stanovení, zda je dvojice sad lineárně oddělitelná, a nalezení oddělovací nadroviny, pokud jsou, vyvstává v několika oblastech. v statistika a strojové učení, klasifikace určitých typů dat je problém, pro který existují dobré algoritmy založené na tomto konceptu.
Matematická definice
Nechat a být dvě sady bodů v n-rozměrný euklidovský prostor. Pak a jsou lineárně oddělitelné pokud existují n + 1 reálná čísla , takže každý bod splňuje a každý bod splňuje , kde je -tá složka .
Ekvivalentně jsou dvě sady lineárně oddělitelné přesně, když jsou příslušné konvexní trupy jsou disjunktní (hovorově nepřekrývejte).[Citace je zapotřebí ]
Příklady
Tři non-kolineární body ve dvou třídách ('+' a '-') jsou vždy lineárně oddělitelné ve dvou rozměrech. To ilustrují tři příklady na následujícím obrázku (případ „+“ není zobrazen, ale je podobný případu „-“):
![]() | ![]() | ![]() |
Avšak ne všechny sady čtyř bodů, žádné tři kolineární, jsou lineárně oddělitelné ve dvou rozměrech. Následující příklad by potřeboval dva přímky, a proto není lineárně oddělitelný:
![]() |
Všimněte si, že tři body, které jsou kolineární a tvaru "+ ⋅⋅⋅ - ⋅⋅⋅ +" také nejsou lineárně oddělitelné.
Lineární oddělitelnost booleovských funkcí v systému Windows n proměnné
A Booleovská funkce v n proměnné lze považovat za přiřazení 0 nebo 1 ke každému vrcholu booleovské hodnoty hyperkrychle v n rozměry. To dává přirozené rozdělení vrcholů do dvou sad. Booleovská funkce se říká, že je lineárně oddělitelné za předpokladu, že tyto dvě sady bodů jsou lineárně oddělitelné. Počet odlišných booleovských funkcí je kde n je počet proměnných předaných do funkce.[1]
Počet proměnných | Booleovské funkce | Lineárně oddělitelné booleovské funkce |
---|---|---|
2 | 16 | 14 |
3 | 256 | 104 |
4 | 65536 | 1882 |
5 | 4294967296 | 94572 |
6 | 18446744073709552000 | 15028134 |
7 | 3.402823669 ×10^38 | 8378070864 |
8 | 1.157920892 ×10^77 | 17561539552946 |
9 | 1.340780792 ×10^154 | 144130531453121108 |
Podporujte vektorové stroje

Klasifikace údajů je v systému Windows běžný úkol strojové učení Předpokládejme, že jsou uvedeny některé datové body, z nichž každý patří do jedné ze dvou sad, a chceme vytvořit model, který rozhodne, která sada Nový datový bod bude v. V případě podporovat vektorové stroje, datový bod je považován za a p-dimenzionální vektor (seznam p čísla) a chceme vědět, zda můžeme takové body oddělit pomocí (p - 1) -dimenzionální nadrovina. Tomu se říká a lineární klasifikátor. Existuje mnoho hyperplánů, které by mohly klasifikovat (oddělit) data. Jednou z nejvhodnějších možností jako nejlepší nadrovina je ta, která představuje největší oddělení nebo okraj mezi těmito dvěma sadami. Takže zvolíme nadrovinu tak, aby byla vzdálenost od ní k nejbližšímu datovému bodu na každé straně maximalizována. Pokud taková nadrovina existuje, je známá jako hyperrovina s maximálním okrajem a lineární klasifikátor, který definuje, je známý jako maximum klasifikátor marže.
Více formálně, vzhledem k některým tréninkovým údajům , sada n body formuláře
Kde yi je buď 1 nebo -1, což označuje množinu, do které bod patří. Každý je p-dimenzionální nemovitý vektor. Chceme najít hyperrovinu s maximálním okrajem, která rozděluje body, které mají od těch, kteří mají . Jakoukoli nadrovinu lze zapsat jako množinu bodů uspokojující
kde označuje Tečkovaný produkt a (nemusí být nutně normalizováno) normální vektor do nadroviny. Parametr určuje odsazení nadroviny od počátku podél normálového vektoru .
Pokud jsou tréninková data lineárně oddělitelná, můžeme vybrat dva hyperplány takovým způsobem, že oddělují data a mezi nimi nejsou žádné body, a poté se pokusit maximalizovat jejich vzdálenost.
Viz také
Reference
- ^ 1962-, Russell, Stuart J. (2016). Umělá inteligence je moderní přístup. Norvig, Peter 1956- (třetí vydání). Boston. p. 766. ISBN 978-1292153964. OCLC 945899984.CS1 maint: číselné názvy: seznam autorů (odkaz)
- ^ Gruzling, Nicolle (2006). "Lineární oddělitelnost vrcholů n-dimenzionální hyperkrychle. M.Sc Thesis". University of Northern British Columbia. Citovat deník vyžaduje
| deník =
(Pomoc)