LeNet - LeNet

LeNet je konvoluční neuronová síť struktura navržená Yann LeCun et al. v roce 1989. Obecně LeNet odkazuje na lenet-5 a je jednoduchý konvoluční neuronová síť. Konvoluční neuronové sítě jsou něco jako dopředná neuronová síť jejichž umělé neurony mohou reagovat na část okolních buněk v rozsahu pokrytí a dobře fungovat při zpracování obrazu ve velkém měřítku.

Historie vývoje

LeNet5 byl jedním z prvních konvoluční neuronové sítě a podporoval rozvoj hluboké učení. Od roku 1988, po letech výzkumu a mnoha úspěšných iteracích, byla průkopnická práce pojmenována LeNet5.

Yann LeCun v roce 2018

V roce 1989 Yann LeCun et al. na Bell Labs nejprve aplikoval algoritmus zpětné propagace k praktickým aplikacím a věřil, že schopnost naučit se generalizaci sítě lze výrazně zlepšit poskytnutím omezení z domény úkolu. Spojil konvoluční neuronovou síť vycvičenou algoritmy zpětného šíření ke čtení ručně psaných čísel a úspěšně ji použil při identifikaci ručně psaných čísel PSČ poskytovaných Americká poštovní služba. To byl prototyp toho, co se později začalo jmenovat LeNet.[1]Ve stejném roce LeCun popsal malý ručně rozpoznaný problém s rozpoznáváním číslic v jiném článku a ukázal, že i když je tento problém lineárně oddělitelný, jednovrstvé sítě vykazovaly špatné možnosti generalizace. Při použití detektorů funkcí invariantních na posun ve vícevrstvé omezené síti by model mohl fungovat velmi dobře. Věřil, že tyto výsledky prokázaly, že minimalizace počtu volných parametrů v neuronové síti může zvýšit schopnost generalizace neuronové sítě.[2]

V roce 1990 jejich práce popisovala opětovné použití sítí zpětného šíření při rozpoznávání ručně psaných číslic. Na datech provedli pouze minimální předzpracování a model byl pro tento úkol pečlivě navržen a byl velmi omezený. Vstupní data se skládala ze obrázků, z nichž každý obsahoval číslo, a výsledky testů na digitálních datech poštovního směrovacího čísla poskytnutých americkou poštovní službou ukázaly, že model měl chybovost pouze 1% a míru odmítnutí asi 9%.[3]

Jejich výzkum pokračoval dalších osm let a v roce 1998 Yann LeCun, Leon Bottou, Yoshua Bengio a Patrick Haffner přezkoumali různé metody rozpoznávání rukou psaných znaků v papírové podobě a k identifikaci srovnávacích úkolů použili standardní ručně psané číslice. Tyto modely byly porovnány a výsledky ukázaly, že síť překonala všechny ostatní modely. Poskytli také příklady praktických aplikací neuronových sítí, jako jsou dva systémy pro rozpoznávání ručně psaných znaků online a modely, které dokázaly přečíst miliony šeků denně.[4]

Výzkum dosáhl velkého úspěchu a vzbudil zájem vědců o studium neuronových sítí. Zatímco architektura nejvýkonnějších neuronových sítí dnes není stejná jako architektura LeNet, síť byla výchozím bodem pro velké množství architektur neuronových sítí a také přinesla inspiraci do pole.

Časová osa
1989Yann LeCun a kol. navrhl původní podobu LeNetLeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W. & Jackel, L. D. (1989). Zpětná propagace aplikovaná na ručně psané rozpoznávání PSČ. Neural Computation, 1 (4): 541-551.[1]
1989Yann LeCun dokazuje, že minimalizace počtu volných parametrů v neuronových sítích může zvýšit schopnost generalizace neuronových sítí.LeCun, Y. (1989). Zobecnění a strategie návrhu sítě. Technická zpráva CRG-TR-89-4, Department of Computer Science, University of Toronto.[2]
1990Jejich příspěvek popisuje opětovné použití sítí pro zpětné šíření v rozpoznávání ručně psaných číslicLeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W. & Jackel, L. D. (1990). Ručně psané rozpoznávání číslic se sítí zpětného šíření. Pokroky v systémech zpracování neurálních informací 2 (NIPS * 89).[3]
1998Přezkoumali různé metody používané při rozpoznávání rukou psaných znaků a porovnali je se standardními standardy pro rozpoznávání ručně psaných číslic. Výsledky to ukazují konvoluční neuronové sítě překonat všechny ostatní modely.LeCun, Y .; Bottou, L .; Bengio, Y. & Haffner, P. (1998). Učení založené na přechodu aplikované na rozpoznávání dokumentů. Postup IEEE. 86 (11): 2278 - 2324.[4]

Struktura[5] [6]

Jako zástupce rané konvoluční neuronové sítě má LeNet základní jednotky konvoluční neuronové sítě, jako je konvoluční vrstva, sdružovací vrstva a vrstva plného připojení, což vytváří základ pro budoucí vývoj konvoluční neuronové sítě. Jak je znázorněno na obrázku (vstupní obrazová data s 32 * 32 pixely): lenet-5 se skládá ze sedmi vrstev. Kromě vstupu může každá další vrstva parametry vlaku. Na obrázku Cx představuje vrstvu konvoluce, Sx představuje vrstvu podvzorkování, Fx představuje úplnou vrstvu připojení a x představuje index vrstvy.[1]

Vrstva C1 je a konvoluční vrstva se šesti konvolučními jádry 5x5 a velikostí mapování funkcí je 28x28, což může zabránit vypadnutí informací ze vstupního obrazu z hranice konvolučního jádra.

Vrstva S2 je vrstva podvzorkování / sdružování, která vydává 6 grafů funkcí o velikosti 14x14. Každá buňka v každé mapě prvků je spojena s 2x2 sousedstvími v odpovídající mapě funkcí v C1.

Vrstva C3 je konvoluční vrstva s 16 5-5 konvolučními jádry. Vstup prvních šesti funkčních map C3 je každá souvislá podmnožina tří map funkcí v S2, vstup dalších šesti funkčních map pochází ze vstupu čtyř souvislých podmnožin a vstup dalších tří funkčních map pochází z čtyři nespojité podmnožiny. Nakonec vstup pro poslední graf funkcí pochází ze všech grafů funkcí S2.

Layer S4 is similar to S2, with size of 2x2 and output of 16 5x5 feature graphs.

Layer C5 je konvoluční vrstva se 120 konvolučními jádry o velikosti 5x5. Každá buňka je připojena k sousedství 5 * 5 na všech 16 grafech funkcí S4. Tady, protože velikost grafu funkcí S4 je také 5x5, výstupní velikost C5 je 1 * 1. Takže S4 a C5 jsou zcela propojeny. C5 je označen jako konvoluční vrstva namísto plně připojené vrstvy, protože pokud se vstup lenet-5 zvětší a jeho struktura zůstane nezměněna, bude jeho výstupní velikost větší než 1x1, tj. Ne plně připojená vrstva.

Vrstva F6 je plně připojena k C5 a na výstupu je 84 grafů funkcí.

Funkce

  • Každý konvoluční vrstva zahrnuje tři části: konvoluce, sdružování a nelineární aktivační funkce
  • Použití konvoluce k extrakci prostorových funkcí (konvoluce se původně nazývala receptivní pole)
  • Podvzorkování průměrné vrstvy sdružování
  • tanh aktivační funkce
  • Používání MLP jako posledního klasifikátoru
  • Řídké spojení mezi vrstvami snižuje složitost výpočtu

aplikace

Rozpoznávání jednoduchých digitálních obrázků je nejklasičtější aplikací LeNetu, protože byla kvůli tomu vyvinuta.

Když Yann LeCun, et al. nastolili původní podobu LeNet v roce 1989. Papír Zpětná propagace aplikovaná na ručně psané rozpoznávání PSČ[1] ukazuje, jak lze taková omezení integrovat do a zpětná propagace síť prostřednictvím architektury sítě. A to bylo úspěšně aplikováno na rozpoznávání ručně psaných číslic PSČ poskytovaných americkou poštovní službou.[1]

Analýza rozvoje

LeNet5 znamená vznik CNN a definuje základní komponenty CNN.[4] V té době to ale nebylo populární kvůli nedostatku hardwarového vybavení, zejména GPU (specializované grafické jednotky) elektronický obvod navržen tak, aby rychle manipulovat a měnit Paměť urychlit vytváření snímky v vyrovnávací paměť snímků určené pro výstup do a zobrazovací zařízení ) a další algoritmus, například SVM může dosáhnout podobných efektů nebo dokonce překročit LeNet.

Až do úspěchu AlexNet v roce 2012, CNN se stala nejlepší volbou pro aplikace počítačového vidění a mnoho různých typů CNN byl zvýšen, jako je R-CNN série. Dnes, CNN modely se zcela liší od Lenetu, ale všechny jsou vyvíjeny na základě LeNet.

Reference

  1. ^ A b C d E LeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W .; Jackel, L. D. (prosinec 1989). "Backpropagation Applied to Handwritten Zip Code Recognition". Neurální výpočet. 1 (4): 541–551. doi:10.1162 / neco.1989.1.4.541. ISSN  0899-7667.
  2. ^ A b Lecun, Yann (červen 1989). „Zobecnění a strategie návrhu sítě“ (PDF). Technická zpráva CRG-TR-89-4. Katedra informatiky, University of Toronto.
  3. ^ A b LeCun, Y .; Boser, B .; Denker, J. S .; Henderson, D .; Howard, R.E .; Hubbard, W .; Jacker, L. D. (červen 1990). „Ručně psané rozpoznávání číslic se sítí zpětného šíření“ (PDF). Pokroky v systémech zpracování neurálních informací 2: 396–404.
  4. ^ A b C Lecun, Y .; Bottou, L .; Bengio, Y .; Haffner, P. (1998). „Učení založené na přechodu aplikované na rozpoznávání dokumentů“ (PDF). Sborník IEEE. 86 (11): 2278–2324. doi:10.1109/5.726791.
  5. ^ „卷积 神经 网络 之 LeNet - Brook_icv - 博客 园“. www.cnblogs.com (v čínštině). Citováno 2019-11-16.
  6. ^ blog.csdn.net https://blog.csdn.net/happyorg/article/details/78274066. Citováno 2019-11-16. Chybějící nebo prázdný | název = (Pomoc)