Chainer - Chainer - Wikipedia

Chainer
Původní autoři	Seiya Tokui
Vývojáři	Community, Preferred Networks, Inc.
První vydání	9. června 2015; před 5 lety.
Stabilní uvolnění	7.7.0 / 30. července 2020; Před 4 měsíci
Úložiště	github.com/ Chainer/ Chainer;
Napsáno	Krajta
Plošina	napříč platformami
K dispozici v	Krajta
Typ	Hluboké učení knihovna
Licence	MIT
webová stránka	Chainer.org

Chainer je otevřený zdroj hluboké učení rámec napsaný čistě v Krajta na vrcholu NumPy a knihovny CuPy Python. Vývoj vede japonská riziková společnost Preferred Networks ve spolupráci s IBM, Intel, Microsoft, a Nvidia.^[4]^[5]^[6]^[7]

Chainer se vyznačuje brzkým přijetím „definovat po běhu "schéma, stejně jako jeho výkon na rozsáhlých systémech.^[1] První verze byla vydána v červnu 2015 a od té doby si získala velkou popularitu v Japonsku.^[1]^[2] V roce 2017 byl navíc uveden na seznam KDnuggets v top 10 otevřených zdrojových projektech Pythonu pro strojové učení.^[8]

V prosinci 2019 společnost Preferred Networks oznámila přechod svého vývojového úsilí z Chainer na PyTorch a poskytne opravné opravy až po vydání verze 7.^[9]

Definujte po běhu

Chainer byl první rámec hlubokého učení, který zavedl přístup definovat podle běhu.^[10]^[11] Tradiční postup pro trénování sítě byl ve dvou fázích: definování pevných spojení mezi matematickými operacemi (jako je násobení matic a nelineární aktivace) v síti a poté spuštění skutečného výpočtu tréninku. Tomu se říká přístup definovat a spustit nebo statický graf. Theano a TensorFlow patří mezi významné rámce, které zvolily tento přístup. Naproti tomu v přístupu definovat podle běhu nebo v dynamickém grafu není připojení v síti určeno při zahájení školení. Síť se určuje během školení, jak se provádí skutečný výpočet.

Jednou z výhod tohoto přístupu je, že je intuitivní a flexibilní.^[12] Pokud má síť komplikované řídicí toky, jako je podmíněné a smyčky, v přístupu definování a spuštění jsou pro tyto konstrukce nutné speciálně navržené operace. Na druhou stranu v přístupu definovat podle běhu lze k popisu takového toku použít nativní konstrukce programovacího jazyka, jako jsou příkazy if a for. Tuto flexibilitu je obzvláště užitečné implementovat rekurentní neuronové sítě.^[13]^[14]

Další výhodou je snadnost ladění.^[12] V přístupu definovat a spustit, pokud se ve výpočtu tréninku vyskytla chyba (například numerická chyba), je často obtížné zkontrolovat chybu, protože kód zapsaný k definování sítě a skutečné místo chyby jsou odděleny . V přístupu definovat-by-run můžete pozastavit výpočet pomocí integrovaného jazyka debugger a zkontrolujte data, která proudí na vašem kódu sítě.

Definování podle běhu si získalo popularitu od zavedení Chainerem a nyní je implementováno v mnoha dalších rámcích, včetně PyTorch^[15] a TensorFlow.^[12]

Rozšiřující knihovny

Chainer má čtyři rozšiřující knihovny, ChainerMN, ChainerRL, ChainerCV a ChainerUI. ChainerMN umožňuje použití Chainer na více GPU s výkonem výrazně rychlejším než jiné rámce hlubokého učení.^[1] Superpočítač běžící Chainer na 1024 GPU zpracoval 90 epoch ImageNet datová sada v síti ResNet-50 za 15 minut, což je čtyřikrát rychlejší než předchozí rekord Facebook.^[16]^[17] ChainerRL přidává nejmodernější technologie posilování učení Algoritmy a ChainerUI je nástroj pro správu a vizualizaci.

Aplikace

Chainer se používá jako rámec pro Řetěz na barvy služba, která funguje automaticky zbarvení černé a bílé, pouze čáry, výkresy s minimálním vstupem uživatele.^[18]^[19]

Viz také

Reference

^ ^A ^b ^C ^d „Big-in-Japan AI code 'Chainer' shows how Intel will gun for GPUs". Registrace. 2017-04-07. Citováno 2017-12-24.
^ ^A ^b „Deep Learning クフレームワーク Chainer を公開しました“ (v japonštině). 09.06.2015. Citováno 2017-12-24.
^ „Vydání 7.7.0“. 30. července 2020. Citováno 31. července 2020.
^ „Domovská stránka Chainer“. Citováno 2017-12-24.
^ „IBM chce být„ Red Hat “hlubokého učení“. HPCwire. 2017-01-26. Citováno 2017-09-08.
^ „Intel spolupracuje s preferovanými sítěmi v Japonsku na hlubokém učení“. 2017-04-06. Citováno 2017-12-24.
^ „Microsoft uzavírá partnerství s Preferred Networks, aby přinesl technologii hlubokého učení Chainer do Azure - MSPoweruser“. MSPoweruser. 2017-05-23. Citováno 2017-09-08.
^ „Top 20 Python Machine Learning Open Source Projects“. KDnuggets. 2017-11-24.
^ „Preferred Networks migruje svoji Deep Learning Research Platform na PyTorch“. Preferred Networks, Inc.. 2019-12-05. Citováno 2019-12-27.
^ Tokui, Seiya; et al. (2015). „Chainer: open-source framework nové generace pro hluboké učení“. 29. výroční konference o systémech zpracování neurálních informací (NIPS). 5.
^ Shimada, Naoki (14. září 2017). Hluboké učení s Chainerem. Gijutsu-Hyohron. p. 61. ISBN 4774191868.
^ ^A ^b ^C „Eager Execution: Imperative, define-by-run interface to TensorFlow“. Výzkumný blog Google.
^ „Deep Learning With Dynamic Computation Graphs (ICLR 2017)“. Metadata.
^ Hido, Shohei (8. listopadu 2016). „Chainer usnadňuje komplexní neuronové sítě“. O'Reilly Media. Citováno 26. června 2018.
^ Perez, Carlos E. (20. ledna 2017). „PyTorch, dynamické výpočetní grafy a modulární hluboké učení“. Střední.
^ „Extremely Large Minibatch SGD: Training ResNet-50 on ImageNet in 15 Minutes“ (pdf). Citováno 2017-12-24.
^ Greene, Tristan (20. listopadu 2017). „Japonci v soutěži o trénink umělé inteligence překonali Japonce“. Další web. Citováno 24. listopadu 2017.
^ Know, Now You (2017-02-15). „Tento software založený na neuronových sítích dodá vašim výkresům barvu zdarma“. Technicky. Citováno 2017-09-08.
^ Aplikace pro kreslení „pixiv Sketch“ a služba automatického barvení „PaintsChainer“ spolupracují na poskytnutí nové funkce pro automatické barvení ilustrací! “. 2017-05-24. Citováno 2017-12-24.

externí odkazy

Oficiální webové stránky

[:0-1] A ^b ^C ^d „Big-in-Japan AI code 'Chainer' shows how Intel will gun for GPUs". Registrace. 2017-04-07. Citováno 2017-12-24.

[:1-2] A ^b „Deep Learning クフレームワーク Chainer を公開しました“ (v japonštině). 09.06.2015. Citováno 2017-12-24.

[wikidata-fd89700eea5fb345fca0299d56cdb5330f5533a0-v3-3] „Vydání 7.7.0“. 30. července 2020. Citováno 31. července 2020.

[4] „Domovská stránka Chainer“. Citováno 2017-12-24.

[5] „IBM chce být„ Red Hat “hlubokého učení“. HPCwire. 2017-01-26. Citováno 2017-09-08.

[6] „Intel spolupracuje s preferovanými sítěmi v Japonsku na hlubokém učení“. 2017-04-06. Citováno 2017-12-24.

[7] „Microsoft uzavírá partnerství s Preferred Networks, aby přinesl technologii hlubokého učení Chainer do Azure - MSPoweruser“. MSPoweruser. 2017-05-23. Citováno 2017-09-08.

[8] „Top 20 Python Machine Learning Open Source Projects“. KDnuggets. 2017-11-24.

[9] „Preferred Networks migruje svoji Deep Learning Research Platform na PyTorch“. Preferred Networks, Inc.. 2019-12-05. Citováno 2019-12-27.

[10] Tokui, Seiya; et al. (2015). „Chainer: open-source framework nové generace pro hluboké učení“. 29. výroční konference o systémech zpracování neurálních informací (NIPS). 5.

[11] Shimada, Naoki (14. září 2017). Hluboké učení s Chainerem. Gijutsu-Hyohron. p. 61. ISBN 4774191868.

[ResBlog-12] A ^b ^C „Eager Execution: Imperative, define-by-run interface to TensorFlow“. Výzkumný blog Google.

[13] „Deep Learning With Dynamic Computation Graphs (ICLR 2017)“. Metadata.

[14] Hido, Shohei (8. listopadu 2016). „Chainer usnadňuje komplexní neuronové sítě“. O'Reilly Media. Citováno 26. června 2018.

[15] Perez, Carlos E. (20. ledna 2017). „PyTorch, dynamické výpočetní grafy a modulární hluboké učení“. Střední.

[15min-1-16] „Extremely Large Minibatch SGD: Training ResNet-50 on ImageNet in 15 Minutes“ (pdf). Citováno 2017-12-24.

[15min-2-17] Greene, Tristan (20. listopadu 2017). „Japonci v soutěži o trénink umělé inteligence překonali Japonce“. Další web. Citováno 24. listopadu 2017.

[18] Know, Now You (2017-02-15). „Tento software založený na neuronových sítích dodá vašim výkresům barvu zdarma“. Technicky. Citováno 2017-09-08.

[19] Aplikace pro kreslení „pixiv Sketch“ a služba automatického barvení „PaintsChainer“ spolupracují na poskytnutí nové funkce pro automatické barvení ilustrací! “. 2017-05-24. Citováno 2017-12-24.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

Software pro hluboké učení
Otevřený zdroj	Apache MXNet Apache SINGA Caffe Deeplearning4j DeepSpeed Dlib Keras Microsoft Cognitive Toolkit ML.NET OpenNN PyTorch TensorFlow Theano Pochodeň ONNX
Proprietární	Jablko Jádro ML IBM Watson Javor Neural Designer Wolfram Mathematica
Kategorie Srovnání