Richard S. Sutton - Richard S. Sutton
Tento životopis živé osoby potřebuje další citace pro ověření.Ledna 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Richard S. Sutton | |
---|---|
Národnost | kanadský |
Státní občanství | kanadský |
Alma mater | University of Massachusetts Amherst Stanfordská Univerzita |
Známý jako | Časové rozdílové učení, Dyna, Možnosti, GQ (λ) |
Ocenění | AAAI Chlapík (2001) Cena prezidenta (INNS) (2003) Royal Society of Canada Chlapík (2016) |
Vědecká kariéra | |
Pole | Umělá inteligence Posílení učení |
Instituce | University of Alberta |
Teze | Dočasné přiřazení kreditu při posilování učení (1984) |
Doktorský poradce | Andrew Barto |
Doktorandi | David Silver, Doina Precup |
webová stránka | neúplné myšlenky |
Richard S. Sutton je Kanaďan počítačový vědec. V současné době je významným vědeckým pracovníkem DeepMind a profesor výpočetní vědy na University of Alberta. Sutton je považován[1] jeden ze zakladatelů moderní výpočetní techniky posilování učení, které mají několik významných příspěvků v této oblasti, včetně učení časového rozdílu a metody gradientu politiky.
Život a vzdělání
Richard Sutton se narodil v roce Ohio a vyrostl v Oak Brook, Illinois, a předměstí z Chicago.
Sutton dostal jeho B.A. v psychologie z Stanfordská Univerzita v roce 1978 před přijetím SLEČNA. (1980) a Ph.D. (1984) v počítačová věda z University of Massachusetts Amherst pod dohledem Andrew Barto. Jeho disertační práce, Dočasné přiřazení kreditu ve vzdělávání výztuže, představil architektury herec-kritik a „časové přiřazení úvěru“.[2]
Kariéra
V roce 1984 byl Sutton a postdoktorský výzkumník na University of Massachusetts.
V letech 1985 až 1994 působil jako hlavní člen technického personálu v Laboratoři počítačových a inteligentních systémů v GTE v Waltham, Massachusetts. V roce 1995 se vrátil na University of Massachusetts jako vedoucí vědecký pracovník.
Od roku 1998 do roku 2002 pracoval Sutton v AT&T Shannonova laboratoř v Florham Park, New Jersey jako hlavní technický pracovník v oddělení umělé inteligence.
Od roku 2003 je profesorem počítačových věd na University of Alberta. Do roku 2018 vedl laboratoř Reinforcement Learning a Artificial Intelligence Laboratory.
Při zachování profesury se připojil Sutton Deepmind v červnu 2017 jako význačný vědecký pracovník a spoluzakladatel své nové Edmonton kancelář.[2][3]
Sutton se stal kanadským občanem v roce 2015 a v roce 2017 se vzdal amerického občanství.
Vybrané publikace
- Sutton, R. S., Barto, A. G., Učení o posílení: Úvod. MIT Press, 1998. Přeloženo také do japonštiny a ruštiny. Druhé vydání MIT Press 2018.
- Miller, W. T., Sutton, R. S., Werbos, P. J. (Eds.), Neuronové sítě pro řízení. MIT Press, 1991.
- Sutton, R. S. (ed.), Reinforcement Learning. Dotisk zvláštního čísla časopisu Machine Learning Journal. Kluwer Academic Press, 1992
Ceny a vyznamenání
Sutton je členem Sdružení pro povýšení umělé inteligence (AAAI) od roku 2001.[4] V roce 2003 obdržel cenu prezidenta od společnosti International Neural Network Society[5] a v roce 2013 ocenění Vynikající úspěch ve výzkumu od University of Massachusetts Amherst.[6]
Suttonova nominace na člena AAAI zní:[4]
Za významné příspěvky k mnoha tématům strojového učení, včetně učení posílení, technik časového rozdílu a neuronových sítí.
Reference
- ^ „Exkluzivní: Rozhovor s Richem Suttonem, otcem učení o posílení“. 11.01.2018. Archivovány od originál dne 01.01.2018. Citováno 2018-12-17.
- ^ A b „Stručná biografie pro Richarda Suttona“. Incompleteideas.net. Citováno 2018-12-17.
- ^ „DeepMind expanduje do Kanady s novou výzkumnou kanceláří v Edmontonu v Albertě“. DeepMind. Citováno 2018-12-17.
- ^ A b „Zvolen AAAI Fellows“. www.aaai.org. Citováno 2018-12-17.
- ^ „Příjemci ceny INNS“. www.inns.org. Citováno 2018-12-17.
- ^ „Příjemci ceny za vynikající výsledky a advokacii“. College of Information and Computer Sciences, University of Massachusetts Amherst. 2010-10-05. Citováno 2018-12-17.