Kompatibilní s člověkem - Human Compatible

Kompatibilní s člověkem
Human Compatible (Stuart J. Russell, 2019) book cover.jpg
Vydání v pevné vazbě
AutorStuart J. Russell
ZeměSpojené státy
JazykAngličtina
PředmětProblém s ovládáním AI
ŽánrLiteratura faktu
VydavatelViking
Datum publikace
8. října 2019
Stránky352
ISBN978-0-525-55861-3
OCLC1083694322

Kompatibilní s člověkem: Umělá inteligence a problém kontroly je literatura faktu z roku 2019 od počítačového vědce Stuart J. Russell. Tvrdí to riziko pro lidstvo od pokročilých umělá inteligence (AI) je vážným problémem navzdory nejistotě ohledně budoucího pokroku v AI. Rovněž navrhuje přístup k Problém s ovládáním AI.

souhrn

Russell začíná tvrzením, že standardní model výzkumu AI, ve kterém je primární definice úspěchu stále lepší a lepší při dosahování přísných cílů stanovených člověkem, je nebezpečně zavádějící. Takové cíle nemusí ve skutečnosti odrážet to, co mají v úmyslu lidské designéry, například tím, že nezohledňují lidské hodnoty, které nejsou zahrnuty do cílů. Pokud by se umělá inteligence vyvinutá podle standardního modelu měla stát superinteligentní, pravděpodobně by plně neodráželo lidské hodnoty a mohlo by to mít pro lidstvo katastrofu. Russell tvrdí, že právě proto, že časová osa pro vývoj lidské nebo superinteligentní AI je velmi nejistá, měl by být bezpečnostní výzkum zahájen co nejdříve, protože je také velmi nejisté, jak dlouho bude takový výzkum trvat.

Russell tvrdí, že pokračující pokrok v oblasti umělé inteligence je nevyhnutelný kvůli ekonomickým tlakům. Tyto tlaky lze již vidět ve vývoji stávajících technologií AI, jako je samojízdná auta a software osobního asistenta. Navíc by umělá inteligence na lidské úrovni mohla mít hodnotu mnoha bilionů dolarů. Russell poté zkoumá současnou debatu o riziku umělé inteligence. Nabízí vyvrácení řady společných argumentů, které odmítají riziko umělé inteligence, a připisuje velkou část jejich vytrvalosti tribalismu - vědci v oblasti umělé inteligence mohou vnímat rizika související s umělou inteligencí jako „útok“ na jejich pole. Russell však znovu opakuje, že existují legitimní důvody, proč brát problémy s rizikem AI vážně a že díky ekonomickým tlakům jsou nevyhnutelné pokračující inovace v oblasti AI.

Russell pak navrhuje přístup k vývoji prokazatelně prospěšných strojů zaměřených na úctu k lidem. Na rozdíl od standardního modelu AI, kde je cíl přísný a jistý, by tento přístup způsobil, že skutečný cíl AI zůstane nejistý, přičemž AI o něm přistupuje pouze s jistotou, protože získává více informací o lidech a světě. Tato nejistota by v ideálním případě zabránila katastrofickým nedorozuměním lidských preferencí a podpořila spolupráci a komunikaci s lidmi. Na závěr Russell požaduje přísnější řízení výzkumu a vývoje umělé inteligence i kulturní introspekci o přiměřené míře autonomie, která by se udržela ve světě ovládaném umělou inteligencí.

Russellovy tři principy

Russell uvádí tři principy, kterými se má řídit vývoj prospěšných strojů. Zdůrazňuje, že tyto zásady nemají být výslovně zakódovány do strojů; spíše jsou určeny pro lidské vývojáře. Principy jsou následující:[1]:173

1. Jediným cílem stroje je maximalizovat realizaci lidských preferencí.

2. Stroj si zpočátku není jistý, jaké jsou tyto preference.

3. Konečným zdrojem informací o lidských preferencích je lidské chování.

„Preference, na které Russell odkazuje,„ jsou všeobjímající; pokrývají vše, na čem by vám mohlo záležet, libovolně daleko do budoucnosti. “[1]:173 Podobně „chování“ zahrnuje jakoukoli volbu mezi možnostmi,[1]:177 a nejistota je taková, že každé logicky možné lidské preferenci musí být přiřazena určitá pravděpodobnost, která může být docela malá.[1]:201

Russell zkoumá učení inverzní výztuže, ve kterém stroj vyvozuje funkci odměny z pozorovaného chování, jako možný základ mechanismu pro učení lidských preferencí.[1]:191–193

Recepce

Několik recenzentů souhlasilo s argumenty knihy. Ian Ukázka Opatrovník označil za „přesvědčivou“ a „nejdůležitější knihu o AI v tomto roce“.[2] Richard Waters z Financial Times ocenil „osvěžující intelektuální přísnost“ knihy.[3] Kirkus jej podpořila jako „silný důvod pro plánování dne, kdy nás stroje mohou přelstít“.[4]

Stejní recenzenti charakterizovali knihu jako „křivou a vtipnou“,[2] nebo „přístupný“[4] kvůli jeho „lakonickému stylu a suchému humoru“.[3] Matthew Hutson z Wall Street Journal řekl: „Vzrušující kniha pana Russella zachází hluboko a zářila suchými vtipy“.[5] A Knihovní deník recenzent to nazval „Správný průvodce ve správný čas“.[6]

James McConnachie z Časy napsal: „Toto není docela populární kniha, kterou AI naléhavě potřebuje. Její technické části jsou příliš obtížné, její filozofické příliš snadné. Ale je fascinující a významná.“[7]

Naproti tomu Kompatibilní s člověkem byl kritizován v jeho Příroda recenze Davida Leslieho, člena etické skupiny v Alan Turing Institute; a podobně v a New York Times názorová esej od Melanie Mitchell. Jedním bodem sporu bylo, zda superinteligence je možné. Leslie tvrdí, že Russell „nepřesvědčil, že se někdy dočkáme příchodu„ druhého inteligentního druhu ““, a Mitchell pochybuje, že by stroj mohl „překonat obecnost a flexibilitu lidské inteligence“, aniž by ztratil „rychlost, přesnost a programovatelnost počítač". Druhou neshodou bylo, zda by inteligentní stroje měly přirozeně sklon přijímat takzvané morální hodnoty „zdravého rozumu“. Při Russellově myšlenkovém experimentu o geoinženýrském robotu, který „dusí lidstvo, aby odkyselil oceány“, Leslie „bojuje s identifikací jakékoli inteligence“. Podobně Mitchell věří, že inteligentní robot by přirozeně měl tendenci být „zmírněn zdravým rozumem, hodnotami a sociálním úsudkem, bez něhož by obecná inteligence nemohla existovat“.[8][9]

Kniha byla pro rok 2019 zařazena do užšího výběru Financial Times/ Cena McKinsey.[10]

Viz také

Reference

externí odkazy