Informační algebra - Information algebra

Termín "informační algebra"odkazuje na matematické techniky zpracování informací. Klasický teorie informace se vrací do Claude Shannon. Je to teorie přenosu informací, která se zaměřuje na komunikaci a ukládání. Dosud však nebylo bráno v úvahu, že informace pocházejí z různých zdrojů, a proto jsou obvykle kombinovány. V klasické teorii informací bylo navíc opomíjeno, že je třeba extrahovat ty části z části informací, které jsou relevantní pro konkrétní otázky.

Matematické formulace těchto operací vede k algebra informací, popisující základní režimy zpracování informací. Taková algebra zahrnuje několik formalismů počítačová věda, které se na první pohled zdají odlišné: relační databáze, více systémů formální logiky nebo numerické problémy lineární algebry. Umožňuje vývoj obecných postupů zpracování informací a tím i sjednocení základních metod informatiky, zejména distribuované zpracování informací.

Informace se týkají přesných otázek, pocházejí z různých zdrojů, musí být agregovány a mohou být zaměřeny na zajímavé otázky. Z těchto úvah vycházejí informační algebry (Kohlas 2003 ) jsou dva tříděné algebry , kde je poloskupina, představující kombinaci nebo agregaci informací, je mříž z domén (související s otázkami) jehož částečná objednávka odráží zrnitost domény nebo otázky a a smíšený provoz představující zaměření nebo extrakci informací.

Informace a jejich operace

Přesněji řečeno v algebře dvou tříd , jsou definovány následující operace

Kombinace
Se zaměřením
            

Navíc v jsou definovány obvyklé mřížkové operace (setkání a připojení).

Axiomy a definice

Axiomy dvousložkové algebry , kromě axiomů mřížky :

Poloskupina
je komutativní poloskupina v kombinaci s neutrálním prvkem (představujícím prázdnou informaci).
Distributivita zaostřování nad kombinací

Zaměřit informace na v kombinaci s dalšími informacemi do domény , lze také nejprve zaměřit druhou informaci a poté kombinovat.

Transitivita zaostřování

Zaměřit informace na a , lze to zaměřit .

Idempotence

Informace kombinovaná s částí sebe sama nepřináší nic nového.

Podpěra, podpora
takhle

Každá informace se týká alespoň jedné domény (otázka).

            

Dvouřadá algebra splnění těchto axiomů se nazývá Informační algebra.

Pořadí informací

Částečné pořadí informací lze zavést definováním -li . Tohle znamená tamto je méně informativní než pokud nepřidá žádné nové informace . Poloskupina je semilattice vzhledem k tomuto řádu, tj. . Relativní k jakékoli doméně (otázka) částečnou objednávku lze zavést definováním -li . Představuje pořadí informačního obsahu a vzhledem k doméně (otázka) .

Informační algebra se štítky

Tyto páry , kde a takhle tvoří a označená Informační algebra. Přesněji řečeno v algebře dvou tříd , jsou definovány následující operace

Značení
Kombinace
Projekce
            

Modely informačních algeber

Následuje neúplný seznam instancí informačních algeber:

Vypracovaný příklad: relační algebra

Nechat být sada symbolů, tzv atributy (nebo sloupecjména). Pro každého nechat být neprázdná množina,sada všech možných hodnot atributu . Například pokud , pak mohla být sada řetězců, zatímco a jsou obě množina nezáporných celých čísel.

Nechat . An -tuple je funkce aby a pro každého Vše v bezpečí -tuples je označen . Pro -tuple a podmnožina omezení je definován jako-tuple aby pro všechny .

A vztah přes je sada -tuples, tj. podmnožina Sada atributů se nazývá doména z a označeno. Pro the projekce z na je definován takto:

The připojit se vztahu přes a vztah přes je definován následovně:

Jako příklad, pojďme a být následující vztahy:

Pak se připojte k a je:

Relační databáze s přirozeným spojením jako kombinace a obvyklá projekce je informační algebra. Od té doby jsou operace dobře definované

  • Li , pak .

Je snadné vidět, že relační databáze splňují axiomy označené algebry s informacemi:

poloskupina
a
tranzitivita
Li , pak .
kombinace
Li a , pak .
idempotence
Li , pak .
Podpěra, podpora
Li , pak .

Připojení

Oceňovací algebry
Zrušení idempotenční axiomu vede k oceňovací algebry. Tyto axiomy byly zavedeny (Shenoy & Shafer 1990 ) zobecnit místní výpočetní schémata (Lauritzen & Spiegelhalter 1988 ) od Bayesovských sítí po obecnější formalizmy, včetně funkce víry, potenciálních potenciálů atd. (Kohlas a Shenoy 2000 ). Expozici na dané téma v délce knihy viz Pouly & Kohlas (2011).
Domény a informační systémy
Kompaktní informační algebry (Kohlas 2003 ) souvisí s Scott domény a Scott informační systémy (Scott 1970 );(Scott 1982 );(Larsen & Winskel 1984 ).
Nejisté informace
Náhodné proměnné s hodnotami v informačních algebrách představují pravděpodobnostní argumentace systémy (Haenni, Kohlas & Lehmann 2000 ).
Sémantické informace
Informační algebry zavádějí sémantiku spojením informací s otázkami prostřednictvím zaměření a kombinace (Groenendijk a Stokhof 1984 );(Floridi 2004 ).
Informační tok
Informační algebry souvisí s tokem informací, zejména s klasifikacemi (Barwise a Seligman 1997 ).
Rozklad stromů
...
Teorie poloskupin
...
Kompoziční modely
Takové modely lze definovat v rámci informačních algeber: https://arxiv.org/abs/1612.02587
Rozšířené axiomatické základy informací a oceňovací algebry
Koncept podmíněné nezávislosti je základní pro informační algebry a je k dispozici nový axiomatický základ informačních algeber, založený na podmíněné nezávislosti, rozšiřující starou (viz výše): https://arxiv.org/abs/1701.02658

Historické kořeny

Axiomy pro informační algebry jsou odvozeny ze systému axiomů navrženého v (Shenoy a Shafer, 1990), viz také (Shafer, 1991).

Reference

  • Barwise, J.; Seligman, J. (1997), Informační tok: Logika distribuovaných systémů„Cambridge UK: Number 44 in Cambridge Tracts in Theoretical Computer Science, Cambridge University Press
  • Bergstra, J. A.; Heering, J .; Klint, P. (1990), "Modulová algebra", Deník ACM, 73 (2): 335–372, doi:10.1145/77600.77621, S2CID  7910431
  • Bistarelli, S .; Fargier, H .; Montanari, U .; Rossi, F .; Schiex, T .; Verfaillie, G. (1999), „Semiring-based CSPs and valued CSPs: Frameworks, properties, and comparison“, Omezení, 4 (3): 199–240, doi:10.1023 / A: 1026441215081, S2CID  17232456[trvalý mrtvý odkaz ]
  • Bistarelli, Stefano; Montanari, Ugo; Rossi, Francesca (1997), „Spokojenost a optimalizace na základě semiring omezení“, Deník ACM, 44 (2): 201–236, CiteSeerX  10.1.1.45.5110, doi:10.1145/256303.256306, S2CID  4003767[trvalý mrtvý odkaz ]
  • de Lavalette, Gerard R. Renardel (1992), „Logická sémantika modularizace“, v Egonu Börgerovi; Gerhard Jäger; Hans Kleine Büning; Michael M. Richter (eds.), CSL: 5. Workshop on Computer Science Logic, Volume 626 of Lecture Notes in Computer Science, Springer, pp. 306–315, ISBN  978-3-540-55789-0
  • Floridi, Luciano (2004), „Nástin teorie silně sémantické informace“ (PDF), Mysl a stroje, 14 (2): 197–221, doi:10.1023 / b: mind.0000021684.50925.c9, S2CID  3058065
  • Groenendijk, J .; Stokhof, M. (1984), Studie o sémantice otázek a pragmatice odpovědí, Disertační práce, Universiteit van Amsterdam
  • Haenni, R .; Kohlas, J .; Lehmann, N. (2000), „Pravděpodobnostní argumentační systémy“ (PDF), J. Kohlas; S. Moral (eds.), Příručka systémů spravovatelného uvažování a nejistoty, Dordrecht: Svazek 5: Algoritmy pro nejistotu a nepřiměřené uvažování, Kluwer, s. 221–287, archivovány z originál (PDF) 25. ledna 2005
  • Halmos, Paul R. (2000), „Autobiografie polyadických algeber“, Logický deník IGPL, 8 (4): 383–392, doi:10.1093 / jigpal / 8.4.383, S2CID  36156234
  • Henkin, L.; Monk, J. D .; Tarski, A. (1971), Válcové algebry, Amsterdam: Severní Holandsko, ISBN  978-0-7204-2043-2
  • Jaffar, J .; Maher, M. J. (1994), „Constraint logic programming: A survey“, J. Logického programování, 19/20: 503–581, doi:10.1016/0743-1066(94)90033-7
  • Kohlas, J. (2003), Informační algebry: Generické struktury pro odvozování, Springer-Verlag, ISBN  978-1-85233-689-9
  • Kohlas, J .; Shenoy, P.P. (2000), „Computation in valuation algebras“, J. Kohlas; S. Moral (eds.), Příručka systémů spravovatelného odůvodňování a nejistoty, svazek 5: Algoritmy pro nejistotu a nepřiměřené zdůvodňování, Dordrecht: Kluwer, s. 5–39
  • Kohlas, J .; Wilson, N. (2006), Přesný a přibližný lokální výpočet v semiringem indukovaných oceňovacích algebrách (PDF), Technická zpráva 06-06, Katedra informatiky, University of Fribourg, archivováno od originál (PDF) dne 24. září 2006
  • Larsen, K. G .; Winskel, G. (1984), „Využití informačních systémů k efektivnímu řešení rekurzivních doménových rovnic“, Gilles Kahn; David B. MacQueen; Gordon D. Plotkin (eds.), Sémantika datových typů, mezinárodní sympozium, Sophia-Antipolis, Francie, 27. – 29. Června 1984, sborník, 173 of Lecture Notes in Computer Science, Berlin: Springer, pp. 109–129
  • Lauritzen, S.L .; Spiegelhalter, D. J. (1988), „Místní výpočty s pravděpodobnostmi grafických struktur a jejich aplikace na expertní systémy“, Journal of the Royal Statistical Society, Series B, 50: 157–224
  • Pouly, Marc; Kohlas, Jürg (2011), Obecná inference: Sjednocující teorie pro automatické uvažováníJohn Wiley & Sons, ISBN  978-1-118-01086-0
  • Scott, Dana S. (1970), Nástin matematické teorie výpočtu„Technical Monograph PRG – 2, Oxford University Computing Laboratory, Programming Research Group
  • Scott, D.S. (1982), „Domains for denotational semantics“, v M. Nielsen; E.M. Schmitt (eds.), Automaty, jazyky a programování, Springer, str. 577–613
  • Shafer, G. (1991), Axiomatická studie výpočtu ve vysokých stromech, Working Paper 232, School of Business, University of Kansas
  • Shenoy, P. P .; Shafer, G. (1990). "Axiomy pro pravděpodobnost a funkci víry-funkce". V Ross D. Shachter; Tod S. Levitt; Laveen N. Kanal; John F. Lemmer (eds.). Nejistota v umělé inteligenci 4. Inteligence stroje a rozpoznávání vzorů. 9. Amsterdam: Elsevier. 169–198. doi:10.1016 / B978-0-444-88650-7.50019-6. hdl:1808/144. ISBN  978-0-444-88650-7.
  • Wilson, Nic; Mengin, Jérôme (1999), „Logická dedukce pomocí lokálního výpočetního rámce“, v Anthony Hunter; Simon Parsons (eds.), Symbolické a kvantitativní přístupy k uvažování a nejistotě, Evropská konference, ECSQARU'99, Londýn, Velká Británie, 5. – 9. Července 1999, sborník, svazek 1638 přednášek v informatice, Springer, str. 386–396, ISBN  978-3-540-66131-3