Graphoid - Graphoid
A graphoid je sada výpisů z formuláře, “X je irelevantní Y vzhledem k tomu, že víme Z„kde X, Y a Z jsou sady proměnných. Pojem „irelevance“ a „vzhledem k tomu, že víme“ může získat různé interpretace, včetně pravděpodobnostní, relační a korelační, v závislosti na aplikaci. Tyto interpretace sdílejí společné vlastnosti, které lze zachytit cestami v grafech (odtud název „graphoid“). Teorie grafoidů charakterizuje tyto vlastnosti v konečné sadě axiomy které jsou společné pro informační irelevanci a její grafické znázornění.
Dějiny
Judea Pearl a Azaria Paz[1] vytvořil termín „graphoids“ poté, co zjistil, že vládne množina axiomů podmíněná nezávislost v teorie pravděpodobnosti sdílí neorientované grafy. Proměnné jsou reprezentovány jako uzly v grafu takovým způsobem, že proměnné sady X a Y jsou nezávislé podmíněny Z v distribuci, kdykoli je uzel nastaven Z odděluje X z Y v grafu. Axiomy pro podmíněnou nezávislost v pravděpodobnosti byly odvozeny dříve A. Philip Dawid[2] a Wolfgang Spohn.[3]Korespondence mezi závislostí a grafy byla později rozšířena na směrované acyklické grafy (DAG)[4][5][6] a na další modely závislosti.[1][7]
Definice
Model závislosti M je podmnožinou trojic (X,Z,Y) pro které predikát Já(X,Z,Y): X je nezávislý na Y daný Z, je pravda. Graphoid je definován jako model závislosti, který je uzavřen v následujících pěti axiomech:
- Symetrie:
- Rozklad:
- Slabá unie:
- Kontrakce:
- Průsečík:
Semi-grafhoid je model závislosti uzavřený pod 1–4. Těchto pět axiomů dohromady je známo jako grafoidní axiomy.[8] Slabé vlastnosti spojení a kontrakce intuitivně znamenají, že irelevantní informace by neměly změnit stav relevance jiných propozic v systému; to, co bylo relevantní, zůstává relevantní a co irelevantní zůstává irelevantní.[8]
Druhy grafoidů
Pravděpodobné grafoidy[1][7]
Podmíněná nezávislost, definovaná jako
je semi-grafhoid, který se stane úplným grafhoidem, když P je přísně pozitivní.
Korelační grafoidy[1][7]
Závislostní model je korelační grafoid, pokud v nějaké pravděpodobnostní funkci máme,
kde je částečná korelace mezi X a y daný soubor Z.
Jinými slovy, chyba lineárního odhadu proměnných v X pomocí měření na Z by se nesnížil přidáním měření proměnných v Y, čímž se Y irelevantní pro odhad X. Korelační a pravděpodobnostní modely závislosti se shodují pro normální rozdělení.
Relační grafoidi[1][7]
Model závislosti je relační grafoid, pokud splňuje
Slovem rozsah povolených hodnot pro X není omezen výběrem Yjednou Z je opraveno. Prohlášení o nezávislosti patřící k tomuto modelu jsou podobná jako vložené vícehodnotové závislosti (EMVD s) v databázích.
Grafem indukované grafoidy
Pokud existuje neorientovaný graf G takový, že
pak se grafoid nazývá grafem indukovaný. Jinými slovy, existuje neorientovaný graf G tak, že každé prohlášení o nezávislosti v M se odráží jako oddělení vrcholů v G a naopak. Nutnou a dostatečnou podmínkou pro to, aby závislostním modelem byl grafoidem indukovaný grafoid, je splnění následujících axiomů: symetrie, rozklad, průnik, silná unie a tranzitivita.
Tvrdí to silná unie
Transitivita to uvádí
Symetrie axiomů, rozklad, průnik, silná unie a tranzitivita tvoří úplnou charakteristiku nepřesměrovaných grafů.[9]
DAG indukované grafoidy
Graphoid se nazývá DAG-indukovaný, pokud existuje směrovaný acyklický graf D takhle kde znamená d-oddělení v D. d-oddělení (d-connotes "directional") rozšiřuje pojem oddělení vrcholů z neorientovaných grafů na směrované acyklické grafy. Umožňuje čtení podmíněných nezávislostí ze struktury Bayesovské sítě. Podmíněné nezávislosti v DAG však nelze zcela charakterizovat konečnou sadou axiomů.[10]
Zahrnutí a konstrukce
Grafem indukované a DAG indukované grafoidy jsou oba obsaženy v pravděpodobnostních grafoidech.[11] To znamená, že pro každý graf G existuje rozdělení pravděpodobnosti P tak, aby každá podmíněná nezávislost v P je zastoupena v Ga naopak. Totéž platí pro DAG. Existují však pravděpodobnostní distribuce, které nejsou grafoidní, a navíc neexistuje pravděpodobná konečná axiomatizace pro pravděpodobnostní podmíněné závislosti.[12]
Thomas Verma ukázal, že každý semi-grafhoid má rekurzivní způsob konstrukce DAG, ve kterém každý d-oddělení je platné.[13]Konstrukce je podobná konstrukci použité v Bayesovy sítě a jde takto:
- Uspořádejte proměnné v libovolném pořadí 1, 2, ..., i, ...,N a počínaje i = 1,
- vyberte pro každý uzel i sada uzlů PAi takhle i je nezávislý na všech svých předchůdcích, 1, 2, ...,i - 1, podmíněno PAi.
- Kreslete šipky z PAi na i a pokračovat.
DAG vytvořený touto konstrukcí bude představovat všechny podmíněné nezávislosti, které vyplývají z těch použitých při konstrukci. Navíc každý d-oddělení zobrazené v DAG bude platnou podmíněnou nezávislostí na grafu použitém při stavbě.
Reference
- ^ A b C d E Pearl, Judea; Paz, Azaria (1985). „Graphoids: Graphic-Based Logic for Reasoning About Relevance Relations“ (PDF).
- ^ Dawid, A. Philip (1979). "Podmíněná nezávislost ve statistické teorii". Journal of the Royal Statistical Society, Series B: 1–31.
- ^ Spohn, Wolfgang (1980). „Stochastická nezávislost, kauzální nezávislost a štítnost“. Journal of Philosophical Logic. 9: 73–99. doi:10.1007 / bf00258078.
- ^ Pearl, Judea (1986). "Fúze, šíření a strukturování v sítích víry". Umělá inteligence. 29 (3): 241–288. doi:10.1016 / 0004-3702 (86) 90072-x.
- ^ Verma, Thomas; Pearl, Judea (1988). "Příčinné sítě: sémantika a expresivita". Sborník ze 4. workshopu o nejistotě v umělé inteligenci: 352–359.
- ^ Lauritzen, S.L. (1996). Grafické modely. Oxford: Clarendon Press.
- ^ A b C d Geiger, Dan (1990). „Graphoidy: Kvalitativní rámec pro pravděpodobnostní závěr“ (PhD Disertace, Technical Report R-142, Computer Science Department, University of California, Los Angeles).
- ^ A b Pearl, Judea (1988). Pravděpodobnostní uvažování v inteligentních systémech: sítě věrohodné inference. Morgan Kaufmann.
- ^ A. Paz, J. Pearl a S. Ur, „New Characterization of Graphs Based on Interception Relations“, Journal of Graph Theory, Vol. 22, č. 2, 125-136, 1996.
- ^ Geiger, D. (1987). „Neaxiomatizovatelnost závislostí v směrovaných acyklických grafech“ (PDF). UCLA Computer Science Tech Report R-83.
- ^ Geiger, D .; Pearl, J. (1993). "Logické a algoritmické vlastnosti podmíněné nezávislosti a grafické modely". Annals of Statistics. 21 (4): 2001–2021. CiteSeerX 10.1.1.295.2043. doi:10.1214 / aos / 1176349407.
- ^ Studený, M. (1992). Kubik, S .; Visek, J.A. (eds.). "Podmíněné vztahy nezávislosti nemají žádnou konečnou úplnou charakteristiku". Teorie informací, statistické rozhodovací funkce a náhodné procesy. Transakce 11. pražské konference. Dordrecht: Kluwer. B: 377–396.
- ^ Verma, T .; Pearl, J. (1990). Shachter, R .; Levitt, T.S .; Kanal, L.N. (eds.). „Kauzální sítě: sémantika a expresivita“. Nejistota v AI 4. Elsevier Science Publishers: 69–76.