Stroj Gödel - Gödel machine
![]() | tento článek potřebuje další citace pro ověření.Březen 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
A Stroj Gödel je hypotetické sebezdokonalování počítačový program který řeší problémy optimálním způsobem.[je zapotřebí objasnění ] Používá rekurzivní protokol sebezdokonalování, ve kterém přepisuje svůj vlastní kód, když dokáže, že nový kód poskytuje lepší strategii.[1][2] Stroj vynalezl Jürgen Schmidhuber (poprvé navrženo v roce 2003[3]), ale je pojmenován po Kurt Gödel kdo inspiroval matematické teorie.[4]
Stroj Gödel je často diskutován při řešení problémů meta-učení, známé také jako „učení se učit“. Mezi aplikace patří automatizace rozhodování o lidském designu a přenos znalostí mezi několika souvisejícími úkoly a mohou vést k návrhu robustnějších a obecnějších učebních architektur.[5] Ačkoli je to teoreticky možné, nebyla vytvořena žádná plná implementace.[6]
Stroj Gödel je často srovnáván s Marcus Hutter je AIXItl, další formální specifikace pro umělá obecná inteligence. Schmidhuber poukazuje na to, že stroj Gödel by mohl začít implementací AIXItl jako svého počátečního podprogramu a sám se upravit poté, co najde důkaz, že jiný algoritmus pro jeho vyhledávací kód bude lepší.[7]
Omezení
Tradiční problémy vyřešené počítačem vyžadují pouze jeden vstup a poskytují určitý výstup. Počítače tohoto druhu měly svůj původní algoritmus pevně propojený.[8] To nebere v úvahu dynamické přírodní prostředí, a tak bylo cílem překonat stroj Gödel.
Stroj Gödel má však svá vlastní omezení. Podle Gödelova První věta o neúplnosti, jakýkoli formální systém, který zahrnuje aritmetiku, je buď chybný, nebo umožňuje výroky, které v systému nelze prokázat. Proto i stroj Gödel s neomezenými výpočetními prostředky musí ignorovat ta vlastní vylepšení, jejichž účinnost nemůže prokázat.[3]
Proměnné zájmu
![]() | Tato sekce možná matoucí nebo nejasné čtenářům.Září 2017) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Existují tři proměnné, které jsou zvláště užitečné v době běhu stroje Gödel.[3]
- Někdy proměnná bude mít binární ekvivalent . To se postupně zvyšuje po celou dobu chodu stroje.
- Žádný vstup určený pro stroj Gödel z přírodního prostředí je uložen v proměnné . Je pravděpodobné, že tomu tak je bude obsahovat různé hodnoty pro různé hodnoty proměnné .
- Výstupy stroje Gödel jsou uloženy v proměnných , kde bude v určitém čase výstupním bitovým řetězcem .
Kdykoliv , kde , cílem je maximalizovat budoucí úspěch nebo užitečnost. Typický užitková funkce následuje vzor :
kde je skutečný odměnový vstup (kódovaný uvnitř ) v čase , označuje operátor podmíněného očekávání s ohledem na nějakou možná neznámou distribuci z majetku možných distribucí ( odráží vše, co je známo o pravděpodobných reakcích prostředí) a výše uvedené je funkce státu který jednoznačně identifikuje aktuální cyklus.[3] Vezměte na vědomí, že bereme v úvahu možnost prodloužení očekávané životnosti prostřednictvím vhodných akcí.[3]
Pokyny používané důkazními technikami
![]() | Tato sekce možná matoucí nebo nejasné čtenářům.Září 2017) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Povaha šesti níže uvedených pokynů pro úpravu důkazu neumožňuje vložit do důkazu nesprávnou větu, a tak bagatelizovat ověření důkazu.[3]
get-axiom (n)
Připojuje n-th axiom jako věta k aktuální posloupnosti vět. Níže je počáteční schéma axiomu:
- Hardwarové axiomy formálně specifikovat, jak by se komponenty stroje mohly měnit z jednoho cyklu na druhý.
- Axiomy odměn definovat výpočetní náklady hardwarových instrukcí a fyzických nákladů na výstupní akce. Související axiomy také definují životnost stroje Gödel jako skalární množství představující všechny odměny / náklady.
- Axiomy prostředí omezit způsob, jakým nové vstupy X jsou vyráběny z prostředí na základě předchozích posloupností vstupů y.
- Axiomy nejistoty / Axiomy manipulace s řetězcem jsou standardní axiomy pro aritmetiku, počet, teorie pravděpodobnosti a manipulace s řetězci, která umožňuje konstrukci důkazů souvisejících s budoucími hodnotami proměnných ve stroji Gödel.
- Počáteční stavové axiomy obsahují informace o tom, jak rekonstruovat části nebo celý počáteční stav.
- Utilitní axiomy popsat celkový cíl v podobě užitné funkce u.
použít-pravidlo (k, m, n)
Zabere index k pravidla odvození (např Modus tollens, Modus ponens ) a pokusí se jej použít na dvě dříve prokázané věty m a n. Výsledná věta se poté přidá k důkazu.
věta o odstranění (m)
Odstraní větu uloženou v indexu m v aktuálním důkazu. To pomáhá zmírnit omezení úložiště způsobená nadbytečnými a zbytečnými větami. Výše uvedené věty nelze na odstraněné věty odkazovat použít-pravidlo funkce.
set-switchprog (m, n)
Nahrazuje přepínač S pm: n, pokud není prázdný podřetězec z S p.
šek()
Ověří, zda bylo dosaženo cíle kontrolního vyhledávání. Cílová věta uvádí, že vzhledem k aktuální axiomatizované užitné funkci u (Položka 1f), užitečnost přechodu z p k aktuálnímu přepínači by byla vyšší než užitečnost pokračování v provádění p (což by pokračovalo v hledání alternativních programů).[3] To je ukázáno v následujícím popisu dekódované funkce check () pro stroj Gödel:
state2theem (m, n)
Vezme dva argumenty, m a na pokusí se převést obsah Sm: n do věty.
Ukázkové aplikace
Časově omezená NP-tvrdá optimalizace
Počáteční vstup do stroje Gödel je reprezentace připojeného grafu s velkým počtem uzly spojené hranami různých délek. V daném čase T mělo by to najít cyklický cesta spojující všechny uzly. Jediná odměna se skutečnou hodnotou se objeví najednou T. Rovná se 1 děleno délkou dosud nalezené nejlepší cesty (0, pokud žádná nebyla nalezena). Neexistují žádné další vstupy. Vedlejším produktem maximalizace očekávané odměny je najít nejkratší cestu, kterou lze v omezeném čase najít, vzhledem k počátečnímu zkreslení.[3]
Rychlé dokazování věty
Dokažte nebo vyvrátte co nejrychleji, že všechna sudá celá čísla> 2 jsou součtem dvou prvočísel (Goldbachova domněnka ). Odměna je 1 /t, kde t je čas potřebný k předložení a ověření prvního takového důkazu.[9]
Maximalizace očekávané odměny s omezenými prostředky
A poznávací robot, který potřebuje alespoň 1 litr benzínu za hodinu interaguje s částečně neznámým prostředím a snaží se najít skryté, omezené sklady benzínu, aby občas natankovalo svoji nádrž. Je odměňován v poměru k jeho životnosti a umírá maximálně po 100 letech, nebo jakmile je jeho nádrž prázdná nebo spadne z útesu atd. The pravděpodobnostní reakce na životní prostředí jsou zpočátku neznámé, ale předpokládá se, že jsou vzorkovány z axiomatizovaného Speed Prior, podle kterého jsou těžko vypočítatelné reakce na životní prostředí nepravděpodobné. To umožňuje vypočítatelnou strategii pro vytváření téměř optimálních předpovědí. Jedním z vedlejších produktů maximalizace očekávané odměny je maximalizace očekávané životnosti.[3]
Viz také
Reference
- ^ Mahmud, M. M. Hassan (2008). Universal Transfer Learning. s. 16–18. ISBN 9780549909880.
- ^ Anderson, Michael L .; Tim Oates (jaro 2007). „Přehled nedávného výzkumu metareasoningu a metalearningu“. AI Magazine. 28 (1): 7.
- ^ A b C d E F G h i Schmidhuber, Jürgen (prosinec 2006). Gödel Machines: Samoreferenční ¨ Univerzální řešení problémů, která prokazatelně zajišťují optimální sebezdokonalování (PDF). Citováno 10. listopadu 2014.
- ^ „Stroj Gödel“.
- ^ Schaul, Tom; Schmidhuber, Juergen (2010). "Metalearning". Scholarpedia. 5 (6): 4650. Bibcode:2010SchpJ ... 5.4650S. doi:10,4249 / scholarpedia.4650. Citováno 10. listopadu 2014.
- ^ Steunebrink, Bas R .; Schmidhuber, Jürgen (2011). Rodina implementací strojů Gödel. Přednášky z informatiky. 6830. str. 275–280. CiteSeerX 10.1.1.300.3076. doi:10.1007/978-3-642-22887-2_29. ISBN 978-3-642-22886-5.
- ^ Schmidhuber, Jürgen (5. března 2009). „Ultimate Cognition à la Gödel“ (PDF). Kognitivní výpočet. 1 (2): 177–193. CiteSeerX 10.1.1.218.3323. doi:10.1007 / s12559-009-9014-r. Citováno 13. listopadu 2014.
- ^ Schmidhuber, Jürgen (5. března 2009). „Ultimate Cognition à la Gödel“ (PDF). Kognitivní výpočet. 1 (2): 177–193. CiteSeerX 10.1.1.218.3323. doi:10.1007 / s12559-009-9014-r. Citováno 13. listopadu 2014.
- ^ Schmidhuber, Jürgen (5. března 2009). „Ultimate Cognition à la Gödel“. Kognitivní výpočet. 1 (2): 177–193. CiteSeerX 10.1.1.218.3323. doi:10.1007 / s12559-009-9014-r.