Graphoid - Graphoid

A graphoid je sada výpisů z formuláře, “X je irelevantní Y vzhledem k tomu, že víme Z„kde X, Y a Z jsou sady proměnných. Pojem „irelevance“ a „vzhledem k tomu, že víme“ může získat různé interpretace, včetně pravděpodobnostní, relační a korelační, v závislosti na aplikaci. Tyto interpretace sdílejí společné vlastnosti, které lze zachytit cestami v grafech (odtud název „graphoid“). Teorie grafoidů charakterizuje tyto vlastnosti v konečné sadě axiomy které jsou společné pro informační irelevanci a její grafické znázornění.

Dějiny

Judea Pearl a Azaria Paz[1] vytvořil termín „graphoids“ poté, co zjistil, že vládne množina axiomů podmíněná nezávislost v teorie pravděpodobnosti sdílí neorientované grafy. Proměnné jsou reprezentovány jako uzly v grafu takovým způsobem, že proměnné sady X a Y jsou nezávislé podmíněny Z v distribuci, kdykoli je uzel nastaven Z odděluje X z Y v grafu. Axiomy pro podmíněnou nezávislost v pravděpodobnosti byly odvozeny dříve A. Philip Dawid[2] a Wolfgang Spohn.[3]Korespondence mezi závislostí a grafy byla později rozšířena na směrované acyklické grafy (DAG)[4][5][6] a na další modely závislosti.[1][7]

Definice

Model závislosti M je podmnožinou trojic (X,Z,Y) pro které predikát (X,Z,Y): X je nezávislý na Y daný Z, je pravda. Graphoid je definován jako model závislosti, který je uzavřen v následujících pěti axiomech:

  1. Symetrie:
  2. Rozklad:
  3. Slabá unie:
  4. Kontrakce:
  5. Průsečík:

Semi-grafhoid je model závislosti uzavřený pod 1–4. Těchto pět axiomů dohromady je známo jako grafoidní axiomy.[8] Slabé vlastnosti spojení a kontrakce intuitivně znamenají, že irelevantní informace by neměly změnit stav relevance jiných propozic v systému; to, co bylo relevantní, zůstává relevantní a co irelevantní zůstává irelevantní.[8]

Druhy grafoidů

Pravděpodobné grafoidy[1][7]

Podmíněná nezávislost, definovaná jako

je semi-grafhoid, který se stane úplným grafhoidem, když P je přísně pozitivní.

Korelační grafoidy[1][7]

Závislostní model je korelační grafoid, pokud v nějaké pravděpodobnostní funkci máme,

kde je částečná korelace mezi X a y daný soubor Z.

Jinými slovy, chyba lineárního odhadu proměnných v X pomocí měření na Z by se nesnížil přidáním měření proměnných v Y, čímž se Y irelevantní pro odhad X. Korelační a pravděpodobnostní modely závislosti se shodují pro normální rozdělení.

Relační grafoidi[1][7]

Model závislosti je relační grafoid, pokud splňuje

Slovem rozsah povolených hodnot pro X není omezen výběrem Yjednou Z je opraveno. Prohlášení o nezávislosti patřící k tomuto modelu jsou podobná jako vložené vícehodnotové závislosti (EMVD s) v databázích.

Grafem indukované grafoidy

Pokud existuje neorientovaný graf G takový, že

pak se grafoid nazývá grafem indukovaný. Jinými slovy, existuje neorientovaný graf G tak, že každé prohlášení o nezávislosti v M se odráží jako oddělení vrcholů v G a naopak. Nutnou a dostatečnou podmínkou pro to, aby závislostním modelem byl grafoidem indukovaný grafoid, je splnění následujících axiomů: symetrie, rozklad, průnik, silná unie a tranzitivita.

Tvrdí to silná unie

Transitivita to uvádí

Symetrie axiomů, rozklad, průnik, silná unie a tranzitivita tvoří úplnou charakteristiku nepřesměrovaných grafů.[9]

DAG indukované grafoidy

Graphoid se nazývá DAG-indukovaný, pokud existuje směrovaný acyklický graf D takhle kde znamená d-oddělení v D. d-oddělení (d-connotes "directional") rozšiřuje pojem oddělení vrcholů z neorientovaných grafů na směrované acyklické grafy. Umožňuje čtení podmíněných nezávislostí ze struktury Bayesovské sítě. Podmíněné nezávislosti v DAG však nelze zcela charakterizovat konečnou sadou axiomů.[10]

Zahrnutí a konstrukce

Grafem indukované a DAG indukované grafoidy jsou oba obsaženy v pravděpodobnostních grafoidech.[11] To znamená, že pro každý graf G existuje rozdělení pravděpodobnosti P tak, aby každá podmíněná nezávislost v P je zastoupena v Ga naopak. Totéž platí pro DAG. Existují však pravděpodobnostní distribuce, které nejsou grafoidní, a navíc neexistuje pravděpodobná konečná axiomatizace pro pravděpodobnostní podmíněné závislosti.[12]

Thomas Verma ukázal, že každý semi-grafhoid má rekurzivní způsob konstrukce DAG, ve kterém každý d-oddělení je platné.[13]Konstrukce je podobná konstrukci použité v Bayesovy sítě a jde takto:

  1. Uspořádejte proměnné v libovolném pořadí 1, 2, ..., i, ...,N a počínaje i = 1,
  2. vyberte pro každý uzel i sada uzlů PAi takhle i je nezávislý na všech svých předchůdcích, 1, 2, ...,i - 1, podmíněno PAi.
  3. Kreslete šipky z PAi na i a pokračovat.

DAG vytvořený touto konstrukcí bude představovat všechny podmíněné nezávislosti, které vyplývají z těch použitých při konstrukci. Navíc každý d-oddělení zobrazené v DAG bude platnou podmíněnou nezávislostí na grafu použitém při stavbě.

Reference

  1. ^ A b C d E Pearl, Judea; Paz, Azaria (1985). „Graphoids: Graphic-Based Logic for Reasoning About Relevance Relations“ (PDF).
  2. ^ Dawid, A. Philip (1979). "Podmíněná nezávislost ve statistické teorii". Journal of the Royal Statistical Society, Series B: 1–31.
  3. ^ Spohn, Wolfgang (1980). „Stochastická nezávislost, kauzální nezávislost a štítnost“. Journal of Philosophical Logic. 9: 73–99. doi:10.1007 / bf00258078.
  4. ^ Pearl, Judea (1986). "Fúze, šíření a strukturování v sítích víry". Umělá inteligence. 29 (3): 241–288. doi:10.1016 / 0004-3702 (86) 90072-x.
  5. ^ Verma, Thomas; Pearl, Judea (1988). "Příčinné sítě: sémantika a expresivita". Sborník ze 4. workshopu o nejistotě v umělé inteligenci: 352–359.
  6. ^ Lauritzen, S.L. (1996). Grafické modely. Oxford: Clarendon Press.
  7. ^ A b C d Geiger, Dan (1990). „Graphoidy: Kvalitativní rámec pro pravděpodobnostní závěr“ (PhD Disertace, Technical Report R-142, Computer Science Department, University of California, Los Angeles).
  8. ^ A b Pearl, Judea (1988). Pravděpodobnostní uvažování v inteligentních systémech: sítě věrohodné inference. Morgan Kaufmann.
  9. ^ A. Paz, J. Pearl a S. Ur, „New Characterization of Graphs Based on Interception Relations“, Journal of Graph Theory, Vol. 22, č. 2, 125-136, 1996.
  10. ^ Geiger, D. (1987). „Neaxiomatizovatelnost závislostí v směrovaných acyklických grafech“ (PDF). UCLA Computer Science Tech Report R-83.
  11. ^ Geiger, D .; Pearl, J. (1993). "Logické a algoritmické vlastnosti podmíněné nezávislosti a grafické modely". Annals of Statistics. 21 (4): 2001–2021. CiteSeerX  10.1.1.295.2043. doi:10.1214 / aos / 1176349407.
  12. ^ Studený, M. (1992). Kubik, S .; Visek, J.A. (eds.). "Podmíněné vztahy nezávislosti nemají žádnou konečnou úplnou charakteristiku". Teorie informací, statistické rozhodovací funkce a náhodné procesy. Transakce 11. pražské konference. Dordrecht: Kluwer. B: 377–396.
  13. ^ Verma, T .; Pearl, J. (1990). Shachter, R .; Levitt, T.S .; Kanal, L.N. (eds.). „Kauzální sítě: sémantika a expresivita“. Nejistota v AI 4. Elsevier Science Publishers: 69–76.