Algoritmická pravděpodobnost - Algorithmic probability

v teorie algoritmických informací, algoritmická pravděpodobnost, také známý jako Solomonoffova pravděpodobnost, je matematická metoda přiřazení předchozího pravděpodobnost k danému pozorování. To bylo vynalezeno Ray Solomonoff v šedesátých letech.[1] Používá se v teorii indukční inference a analýze algoritmů. V jeho obecná teorie indukční inference, Solomonoff používá předchozí[je zapotřebí objasnění ] získaný tímto vzorcem[který? ], v Bayesovo pravidlo pro předpověď[potřebný příklad ][je třeba další vysvětlení ].[2]

V použitém matematickém formalismu mají pozorování podobu konečných binárních řetězců a univerzálním předním je rozdělení pravděpodobnosti na množinu konečných binárních řetězců[Citace je zapotřebí ]. Předchozí je univerzální ve smyslu Turing-vypočítatelnosti, tj. Žádný řetězec nemá nulovou pravděpodobnost. Není to vypočítatelné, ale lze to odhadnout.[3]


Přehled

Algoritmická pravděpodobnost se zabývá následujícími otázkami:[Citace je zapotřebí ] Vzhledem k souboru údajů o nějakém jevu, kterému chceme porozumět, jak můžeme vybrat nejpravděpodobnější hypotéza jak to bylo způsobeno ze všech možných hypotéz a jak můžeme vyhodnotit různé hypotézy? Jak můžeme předpovídat budoucí data a jak měřit pravděpodobnost, že tato předpověď bude správná?

Čtyři hlavní inspirace pro Solomonoffovu algoritmickou pravděpodobnost byly: Occamova břitva, Epikurův princip několika vysvětlení, moderní teorie výpočtů (např. použití a univerzální Turingův stroj ) a Bayesovo pravidlo pro předpověď.[4]

Occamův břitva a Epikurův princip jsou v podstatě dvě různé nematematické aproximace univerzální před.[Citace je zapotřebí ]

  • Occamova břitva: z teorií, které jsou v souladu s pozorovanými jevy, je třeba zvolit nejjednodušší teorii.[5]
  • Epikurův princip několika vysvětlení: pokud je s pozorováním v souladu více než jedna teorie, ponechte si všechny takové teorie.[6]

Jádrem univerzálního předchozího je abstraktní model počítače, například a univerzální Turingův stroj.[7] Jakýkoli abstraktní počítač to udělá, pokud je Turing-complete, tj. Každý konečný binární řetězec má alespoň jeden program, který jej na abstraktním počítači vypočítá.

Abstraktní počítač slouží k přesnému významu výrazu „jednoduché vysvětlení“[Citace je zapotřebí ]. V použitém formalismu jsou vysvětlení nebo teorie jevů počítačové programy, které generují řetězce pozorování, když jsou spuštěny na abstraktním počítači.[Citace je zapotřebí ] Jednoduchým vysvětlením je krátký počítačový program. Složitým vysvětlením je dlouhý počítačový program.[Citace je zapotřebí ] Jednoduchá vysvětlení jsou pravděpodobnější, takže řetězec s vysokou pravděpodobností je vygenerován krátkým počítačovým programem nebo snad kterýmkoli z velkého počtu mírně delších počítačových programů. Řetězec s nízkou pravděpodobností je řetězec, který lze vygenerovat pouze dlouhým počítačovým programem[Citace je zapotřebí ].

Tyto nápady mohou být konkretizovány[potřebný příklad ] a pravděpodobnosti použité k vytvoření předchozího rozdělení pravděpodobnosti pro dané pozorování.[Citace je zapotřebí ] Solomonoffův hlavní důvod pro vynalézání tohoto předchozího je proto, aby mohl být použit v Bayesově pravidle, když skutečný předchozí není znám, což umožňuje predikci za nejistoty.[Citace je zapotřebí ] Předpovídá nejpravděpodobnější pokračování tohoto pozorování a poskytuje měřítko pravděpodobnosti tohoto pokračování.[Citace je zapotřebí ]

Ačkoliv univerzální pravděpodobnost pozorování (a jeho rozšíření) je nespočetné, existuje počítačový algoritmus, Levin Search, [8] který, když běží na delší a delší dobu, vygeneruje posloupnost aproximací, které konvergují k univerzální rozdělení pravděpodobnosti.[Citace je zapotřebí ]

Solomonoff dokázal, že tato distribuce je strojově neměnná v rámci konstantního faktoru (tzv věta o invariance ).[9]

Solomonoff vynalezl koncept algoritmické pravděpodobnosti s jeho přidruženou větou o invariance kolem roku 1960,[10] zveřejnění zprávy o tom: „Předběžná zpráva o obecné teorii induktivní inference“.[11] Tyto myšlenky objasnil podrobněji v roce 1964 v „Formální teorii indukční inference“, část I.[12] a část II.[13]

Další diskuse

Solomonoff popsal univerzální počítač s náhodně generovaným vstupním programem. Program počítá nějaký možná nekonečný výstup. Univerzální rozdělení pravděpodobnosti je rozdělení pravděpodobnosti na všechny možné výstupní řetězce s náhodným vstupem.[14]

Algoritmická pravděpodobnost jakékoli dané předpony konečných výstupů q je součet pravděpodobností programů, které něco počítají, počínaje q. Určité dlouhé objekty s krátkými programy mají vysokou pravděpodobnost.

Algoritmická pravděpodobnost je hlavní složkou Solomonoffova teorie indukční inference, teorie predikce na základě pozorování; byl vynalezen s cílem použít jej pro strojové učení; vzhledem k posloupnosti symbolů, který z nich přijde dál? Solomonoffova teorie poskytuje odpověď, která je v určitém smyslu optimální, i když je nesporná. Na rozdíl od například Karl Popper neformální teorie indukční inference,[je zapotřebí objasnění ] Solomonoff je matematicky přísný.

Algoritmická pravděpodobnost úzce souvisí s konceptem Kolmogorovova složitost. Kolmogorovovo zavedení složitosti bylo motivováno informační teorií a náhodnými problémy, zatímco Solomonoff zavedl složitost algoritmu z jiného důvodu: induktivní uvažování. Jedinou univerzální předchozí pravděpodobnost, kterou lze v Bayesově pravidle nahradit každou skutečnou předchozí pravděpodobností, vynalezl Solomonoff s Kolmogorovovou složitostí jako vedlejším produktem.[15]

Solomonoffova nesčetná míra je univerzální v jistém silném smyslu, ale doba výpočtu může být nekonečná. Jedním ze způsobů řešení této otázky je varianta vyhledávacího algoritmu Leonida Levina,[16] což omezuje čas strávený výpočtem úspěšnosti možných programů, přičemž kratší programy mají více času. Mezi další metody omezení prostoru pro vyhledávání patří tréninkové sekvence.

Klíčoví lidé

Viz také

Reference

  1. ^ Solomonoff, R., "Předběžná zpráva o obecné teorii indukčního závěru ", Zpráva V-131, Zator Co., Cambridge, Ma. (Revize zprávy z 4. února 1960, listopad 1960).
  2. ^ Li, M. a Vitanyi, P., Úvod do Kolmogorovovy složitosti a jejích aplikací, 3. vydání, Springer Science and Business Media, N.Y., 2008
  3. ^ Hutter, M., Legg, S. a Vitanyi, P., „Algoritmická pravděpodobnost“, Scholarpedia, 2 (8): 2572, 2007.
  4. ^ Li a Vitanyi, 2008, str. 347
  5. ^ Li a Vitanyi, 2008, str. 341
  6. ^ Li a Vitanyi, 2008, str. 339.
  7. ^ Hutter, M., „Algoritmická informační teorie“, Scholarpedia, 2 (3): 2519.
  8. ^ Levin, L.A., "Universal Search Problems", in Problemy Peredaci Informacii 9, str. 115–116, 1973
  9. ^ Solomonoff, R., "Komplexní indukční systémy: Porovnání a věty o konvergenci „IEEE Trans. On Information Theory, sv. IT-24, č. 4, str. 422-432, červenec 1978
  10. ^ Solomonoff, R., „Objev algoritmické pravděpodobnosti“, Journal of Computer and System Sciences, Sv. 55, č. 1, str. 73-88, srpen 1997.
  11. ^ Solomonoff, R., "Předběžná zpráva o obecné teorii indukčního závěru ", Zpráva V-131, Zator Co., Cambridge, Ma. (Revize zprávy z 4. února 1960, listopad 1960).
  12. ^ Solomonoff, R., "Formální teorie indukčního závěru, část I. ". Informace a kontrola, Sv. 7, č. 1, str. 1-22, březen 1964.
  13. ^ Solomonoff, R., "Formální teorie indukčního závěru, část II " Informace a kontrola, Sv. 7, č. 2, str. 224–254, červen 1964.
  14. ^ Solomonoff, R., "Kolmogorovova přednáška: Univerzální distribuce a strojové učení " Počítačový deník, Sv. 46, č. 6, str. 598, 2003.
  15. ^ Gács, P. a Vitányi, P., „In Memoriam Raymond J. Solomonoff“, Newsletter IEEE Information Theory Society, Sv. 61, č. 1, březen 2011, s. 11.
  16. ^ Levin, L.A., "Universal Search Problems", in Problemy Peredaci Informacii 9, str. 115–116, 1973

Zdroje

  • Li, M. a Vitanyi, P., Úvod do Kolmogorovovy složitosti a jejích aplikací, 3. vydání, Springer Science and Business Media, N.Y., 2008

Další čtení

externí odkazy