Chainer - Chainer - Wikipedia

Chainer
Původní autořiSeiya Tokui
VývojářiCommunity, Preferred Networks, Inc.
První vydání9. června 2015; před 5 lety (2015-06-09).[1][2]
Stabilní uvolnění
7.7.0[3] / 30. července 2020; Před 4 měsíci (30. července 2020)
Úložiště Upravte to na Wikidata
NapsánoKrajta
Plošinanapříč platformami
K dispozici vKrajta
TypHluboké učení knihovna
LicenceMIT
webová stránkaChainer.org

Chainer je otevřený zdroj hluboké učení rámec napsaný čistě v Krajta na vrcholu NumPy a knihovny CuPy Python. Vývoj vede japonská riziková společnost Preferred Networks ve spolupráci s IBM, Intel, Microsoft, a Nvidia.[4][5][6][7]

Chainer se vyznačuje brzkým přijetím „definovat po běhu "schéma, stejně jako jeho výkon na rozsáhlých systémech.[1] První verze byla vydána v červnu 2015 a od té doby si získala velkou popularitu v Japonsku.[1][2] V roce 2017 byl navíc uveden na seznam KDnuggets v top 10 otevřených zdrojových projektech Pythonu pro strojové učení.[8]

V prosinci 2019 společnost Preferred Networks oznámila přechod svého vývojového úsilí z Chainer na PyTorch a poskytne opravné opravy až po vydání verze 7.[9]

Definujte po běhu

Chainer byl první rámec hlubokého učení, který zavedl přístup definovat podle běhu.[10][11] Tradiční postup pro trénování sítě byl ve dvou fázích: definování pevných spojení mezi matematickými operacemi (jako je násobení matic a nelineární aktivace) v síti a poté spuštění skutečného výpočtu tréninku. Tomu se říká přístup definovat a spustit nebo statický graf. Theano a TensorFlow patří mezi významné rámce, které zvolily tento přístup. Naproti tomu v přístupu definovat podle běhu nebo v dynamickém grafu není připojení v síti určeno při zahájení školení. Síť se určuje během školení, jak se provádí skutečný výpočet.

Jednou z výhod tohoto přístupu je, že je intuitivní a flexibilní.[12] Pokud má síť komplikované řídicí toky, jako je podmíněné a smyčky, v přístupu definování a spuštění jsou pro tyto konstrukce nutné speciálně navržené operace. Na druhou stranu v přístupu definovat podle běhu lze k popisu takového toku použít nativní konstrukce programovacího jazyka, jako jsou příkazy if a for. Tuto flexibilitu je obzvláště užitečné implementovat rekurentní neuronové sítě.[13][14]

Další výhodou je snadnost ladění.[12] V přístupu definovat a spustit, pokud se ve výpočtu tréninku vyskytla chyba (například numerická chyba), je často obtížné zkontrolovat chybu, protože kód zapsaný k definování sítě a skutečné místo chyby jsou odděleny . V přístupu definovat-by-run můžete pozastavit výpočet pomocí integrovaného jazyka debugger a zkontrolujte data, která proudí na vašem kódu sítě.

Definování podle běhu si získalo popularitu od zavedení Chainerem a nyní je implementováno v mnoha dalších rámcích, včetně PyTorch[15] a TensorFlow.[12]

Rozšiřující knihovny

Chainer má čtyři rozšiřující knihovny, ChainerMN, ChainerRL, ChainerCV a ChainerUI. ChainerMN umožňuje použití Chainer na více GPU s výkonem výrazně rychlejším než jiné rámce hlubokého učení.[1] Superpočítač běžící Chainer na 1024 GPU zpracoval 90 epoch ImageNet datová sada v síti ResNet-50 za 15 minut, což je čtyřikrát rychlejší než předchozí rekord Facebook.[16][17] ChainerRL přidává nejmodernější technologie posilování učení Algoritmy a ChainerUI je nástroj pro správu a vizualizaci.

Aplikace

Chainer se používá jako rámec pro Řetěz na barvy služba, která funguje automaticky zbarvení černé a bílé, pouze čáry, výkresy s minimálním vstupem uživatele.[18][19]

Viz také

Reference

  1. ^ A b C d „Big-in-Japan AI code 'Chainer' shows how Intel will gun for GPUs". Registrace. 2017-04-07. Citováno 2017-12-24.
  2. ^ A b „Deep Learning ク フ レ ー ム ワ ー ク Chainer を 公開 し ま し た“ (v japonštině). 09.06.2015. Citováno 2017-12-24.
  3. ^ „Vydání 7.7.0“. 30. července 2020. Citováno 31. července 2020.
  4. ^ „Domovská stránka Chainer“. Citováno 2017-12-24.
  5. ^ „IBM chce být„ Red Hat “hlubokého učení“. HPCwire. 2017-01-26. Citováno 2017-09-08.
  6. ^ „Intel spolupracuje s preferovanými sítěmi v Japonsku na hlubokém učení“. 2017-04-06. Citováno 2017-12-24.
  7. ^ „Microsoft uzavírá partnerství s Preferred Networks, aby přinesl technologii hlubokého učení Chainer do Azure - MSPoweruser“. MSPoweruser. 2017-05-23. Citováno 2017-09-08.
  8. ^ „Top 20 Python Machine Learning Open Source Projects“. KDnuggets. 2017-11-24.
  9. ^ „Preferred Networks migruje svoji Deep Learning Research Platform na PyTorch“. Preferred Networks, Inc.. 2019-12-05. Citováno 2019-12-27.
  10. ^ Tokui, Seiya; et al. (2015). „Chainer: open-source framework nové generace pro hluboké učení“. 29. výroční konference o systémech zpracování neurálních informací (NIPS). 5.
  11. ^ Shimada, Naoki (14. září 2017). Hluboké učení s Chainerem. Gijutsu-Hyohron. p. 61. ISBN  4774191868.
  12. ^ A b C „Eager Execution: Imperative, define-by-run interface to TensorFlow“. Výzkumný blog Google.
  13. ^ „Deep Learning With Dynamic Computation Graphs (ICLR 2017)“. Metadata.
  14. ^ Hido, Shohei (8. listopadu 2016). „Chainer usnadňuje komplexní neuronové sítě“. O'Reilly Media. Citováno 26. června 2018.
  15. ^ Perez, Carlos E. (20. ledna 2017). „PyTorch, dynamické výpočetní grafy a modulární hluboké učení“. Střední.
  16. ^ „Extremely Large Minibatch SGD: Training ResNet-50 on ImageNet in 15 Minutes“ (pdf). Citováno 2017-12-24.
  17. ^ Greene, Tristan (20. listopadu 2017). „Japonci v soutěži o trénink umělé inteligence překonali Japonce“. Další web. Citováno 24. listopadu 2017.
  18. ^ Know, Now You (2017-02-15). „Tento software založený na neuronových sítích dodá vašim výkresům barvu zdarma“. Technicky. Citováno 2017-09-08.
  19. ^ Aplikace pro kreslení „pixiv Sketch“ a služba automatického barvení „PaintsChainer“ spolupracují na poskytnutí nové funkce pro automatické barvení ilustrací! “. 2017-05-24. Citováno 2017-12-24.

externí odkazy