Pavučina (shlukování) - Cobweb (clustering)
PAVUČINA je přírůstkový systém pro hierarchické koncepční shlukování. COBWEB vynalezl profesor Douglas H. Fisher, v současné době na Vanderbiltově univerzitě.[1][2]
COBWEB přírůstkově organizuje pozorování do a klasifikační strom. Každý uzel ve stromu klasifikace představuje třídu (koncept) a je označen pravděpodobnostním konceptem, který shrnuje distribuce atributů a hodnot objektů klasifikovaných pod uzlem. Tento klasifikační strom lze použít k předpovědi chybějících atributů nebo třídy nového objektu.[3]
Při vytváření klasifikačního stromu používá COBWEB čtyři základní operace. Která operace je vybrána, závisí na nástroj kategorie klasifikace dosažené jeho použitím. Jedná se o tyto operace:
- Sloučení dvou uzlů
Sloučení dvou uzlů znamená jejich nahrazení uzlem, jehož potomky jsou sjednocením sad podřízených uzlů a který shrnuje rozdělení hodnot a atributů všech objektů klasifikovaných pod nimi. - Rozdělení uzlu
Uzel je rozdělen tak, že jej nahradí svými potomky. - Vkládání nového uzlu
Vytvoří se uzel odpovídající objektu, který se vkládá do stromu. - Předání objektu v hierarchii
Efektivní volání algoritmu COBWEB na objektu a podstromu zakořeněném v uzlu.
Algoritmus COBWEB
PAVUČINA(vykořenit, záznam): Vstup: uzel COBWEB vykořenit, instance k vložení záznam -li vykořenit nemá žádné děti pak děti := {kopírovat(vykořenit)} nová kategorie(záznam) přidá dítě s hodnotami funkcí záznamu. vložit(záznam, vykořenit) aktualizovat statistiky root jiný vložit(záznam, vykořenit) pro dítě v vykořenitDěti dělat vypočítat kategorii Utility pro vložit(záznam, dítě), nastavit nejlepší1, nejlepší2 děti w. nejlepší UK. konec pro -li nová kategorie(záznam) pak poskytuje nejlepší CU nová kategorie(záznam) jiný -li spojit(nejlepší1, nejlepší2) pak poskytuje nejlepší CU spojit(nejlepší1, nejlepší2) PAVUČINA(vykořenit, záznam) jinak pokud rozdělit(nejlepší1) pak poskytuje nejlepší CU rozdělit(nejlepší1) PAVUČINA(vykořenit, záznam) jiný PAVUČINA(nejlepší1, záznam) skončit, pokud konec
externí odkazy
Reference
- ^ Fisher, Douglas (1987). „Získávání znalostí prostřednictvím postupného koncepčního shlukování“. Strojové učení. 2 (2): 139–172. doi:10.1007 / BF00114265.
- ^ Fisher, Douglas H. (červenec 1987). Msgstr "Zlepšení odvozování prostřednictvím koncepčního shlukování". Sborník konferencí AAAI z roku 1987. Konference AAAI. Seattle Washington. 461–465.
- ^ Wayne Iba a Pat Langley. "Pavučinové modely kategorizace a pravděpodobnostní formování konceptů". V Emmanuel M. Pothos a Andy J. Wills (ed.). Formální přístupy v kategorizaci. Cambridge: Cambridge University Press. 253–273. ISBN 9780521190480.