Desková notace - Plate notation

v Bayesovský závěr, desková notace je metoda reprezentace proměnných, které se opakují v a grafický model. Místo toho, aby se každá opakovaná proměnná kreslila jednotlivě, se k seskupení proměnných do podgrafu, který se opakuje společně, použije deska nebo obdélník a na desku se nakreslí číslo, které představuje počet opakování podgrafu v desce.[1] Předpoklady jsou takové, že podgraf je duplikován, takže proměnné v podgrafu jsou indexovány opakovacím číslem a všechny odkazy, které překračují hranici desky, jsou replikovány jednou pro každé opakování podgrafu.[2]

Příklad

Desková notace pro Latentní Dirichletova alokace

V tomto příkladu uvažujeme Latentní Dirichletova alokace, a Bayesovská síť který modeluje, jak jsou dokumenty v korpusu topicky příbuzné. Na žádném talíři nejsou dvě proměnné; α je parametr uniformy Dirichlet před distribucí témat jednotlivých dokumentů a β je parametr uniformního Dirichleta před distribucí slov podle témat.

Vnější deska představuje všechny proměnné související s konkrétním dokumentem, včetně , distribuce tématu dokumentu i. The M v rohu desky znamená, že se proměnné uvnitř opakují M krát, jednou pro každý dokument. Vnitřní deska představuje proměnné spojené s každou z slova v dokumentu i: je distribuce tématu pro jth slovo v dokumentu i, a je skutečné použité slovo.

The N v rohu představuje opakování proměnných na vnitřní desce krát, jednou pro každé slovo v dokumentu i. Kruh představující jednotlivá slova je stínovaný, což znamená, že každé z nich je pozorovatelný, a ostatní kruhy jsou prázdné, což znamená, že ostatní proměnné jsou latentní proměnné. Směrované hrany mezi proměnnými označují závislosti mezi proměnnými: například každou záleží na a β.

Rozšíření

Bayesian vícerozměrný Gaussian směsný model pomocí deskové notace. Menší čtverce označují pevné parametry; větší kruhy označují náhodné proměnné. Vyplněné tvary označují známé hodnoty. Označení [K] znamená vektor velikosti K.; [D, D] znamená matici velikosti D×D; Samotné K znamená a kategorická proměnná s K. výsledky. Kroužkovitá čára vycházející z z zakončení příčkou označuje a přepínač - hodnota této proměnné vybere pro ostatní příchozí proměnné, kterou hodnotu použít z velikosti -K. pole možných hodnot.

Řadu rozšíření vytvořili různí autoři, aby vyjádřili více informací než jen podmíněné vztahy. Několik z nich se však stalo standardem. Snad nejčastěji používaným rozšířením je použití obdélníků místo kruhů k označení nenáhodných proměnných - buď parametrů, které se mají vypočítat, hyperparametry danou pevnou hodnotu (nebo vypočítanou přes empirický Bayes ) nebo proměnné, jejichž hodnoty jsou deterministicky počítány z náhodné proměnné.

Diagram vpravo ukazuje několik dalších nestandardních konvencí používaných v některých článcích na Wikipedii (např. variační Bayes ):

  • Proměnné, které jsou ve skutečnosti náhodné vektory jsou označeny vložením velikosti vektoru do závorek uprostřed uzlu.
  • Proměnné, které jsou ve skutečnosti náhodné matice jsou podobně označeny umístěním velikosti matice do závorek uprostřed uzlu, přičemž čárky oddělují velikost řádku od velikosti sloupce.
  • Kategorické proměnné jsou označeny umístěním jejich velikosti (bez závorky) do středu uzlu.
  • Kategorické proměnné, které fungují jako „přepínače“ a které vybírají jednu nebo více dalších náhodných proměnných, které mají být podmíněny z velké množiny takových proměnných (např. Složek směsi), jsou označeny zvláštním typem šipky obsahující klikatou čáru a končící T křižovatka.
  • Tučné písmo se důsledně používá pro vektorové nebo maticové uzly (ale ne kategorické uzly).

Implementace softwaru

Desková notace byla implementována v různých TeX /Latex výkresové balíčky, ale také jako součást grafických uživatelských rozhraní k Bayesian statistickým programům, jako je HMYZ a BayesiaLab.

Reference

  1. ^ Ghahramani, Zoubin (srpen 2007). Grafické modely (Mluvený projev). Tübingen, Německo. Citováno 21. února 2008.
  2. ^ Buntine, Wray L. (prosinec 1994). „Operace pro učení s grafickými modely“ (PDF). Journal of Artificial Intelligence Research. AI Access Foundation. 2: 159–225. arXiv:cs / 9412102. Bibcode:1994cs ....... 12102B. doi:10.1613 / jair.62. ISSN  1076-9757. Citováno 21. února 2008.