Časová osa optického rozpoznávání znaků - Timeline of optical character recognition

Tohle je časová osa optické rozpoznávání znaků.

Přehled

Časový úsek	souhrn
1870–1931	Nejčasnější myšlenky optického rozpoznávání znaků (OCR) jsou koncipovány. Fournier d'Albe Optofon a Tauschek's Reading Machine jsou vyvíjeny jako zařízení, která pomáhají nevidomému číst.^[1]
1931–1954	První OCR nástroje jsou vynalezeny a použity v průmyslu, schopné interpretovat Morseova abeceda a číst nahlas text. The Inteligentní stroje Research Corporation je první společností vytvořenou k prodeji těchto nástrojů.^[2]
1954–1974	The Optacon, první přenosné zařízení OCR, je vyvíjeno. Podobná zařízení se používají k digitalizaci Reader's Digest kupóny a poštovní adresy. Pro usnadnění skenování jsou navržena speciální písma.^[1]^[3]^[4]
1974–2000	Skenery se masivně používají ke čtení cenovek a pasů.^[5] Společnosti jako Caere Corporation, ABBYY a Kurzweil Computer Products Inc. Ten druhý vyvíjí první všesměrový OCR software, schopný číst jakýkoli textový dokument.^[6]
2000–2016	Software OCR je k dispozici online zdarma prostřednictvím produktů jako Adobe Acrobat, WebOCR a Disk Google.^[7]^[8]

Časová osa

1969. Americká armáda implementovala to, co mohlo být jednou z prvních hlavních aplikací využívajících technologii OCR, převedením jejich manuálního přidělovacího programu na centralizovaný systém využívající počítače IBM 360. Proces zahrnoval nákup psacích strojů IBM Selectric s použitím písma Time Roman 12 pro všechny její finanční kanceláře po celém světě. Tato aplikace umožňovala veškerému vojenskému personálu přidělovat části své výplaty prostřednictvím automatických srážek ze mzdy, platit účty, posílat úspory atd., Což eliminovalo měsíční zpracování. Úspěch tohoto programu připravil půdu pro sledování všech vojenských služeb a nakonec po letech vedl k přechodu na plně automatizovaný systém odměňování.

Rok	Typ události	Technologie	Detaily
1870	Vynález		Americký vynálezce Charles R. Carey vynalezl skener sítnice, systém přenosu obrazu využívající mozaiku fotobuněk, považovaný za první vynález OCR na světě.^[1]
1885	Vynález	Skener obrázků	Paul Nipkow vymýšlí Nipkow disk, zařízení pro skenování obrazu, které bude později velkým průlomem jak pro moderní televizi, tak pro čtecí stroje.^[9]
1900	Vynález		Ruský vědec Tyurin předpokládá, že první OCR stroj bude sloužit jako pomůcka pro zrakově postižené, ale nikdy se mu ho nepodaří vyvinout.^[1]
1912	Produkt	Text na řeč	Edmund Fournier d'Albe rozvíjí Optofon, ruční skener, který při pohybu po vytištěné stránce produkuje tóny, které odpovídají konkrétním písmenům nebo znakům, aby je mohl interpretovat nevidomý.^[10]^[11]
1916	Patent		Americký inženýr John B. Květiny patentuje stroj „One-Eyed Machine Stenographer“, stroj schopný číst a psát skript. Fungovalo to tak, že se všechna písmena překrývala, aby se našel bod, který je každé z nich označil.^[12]
1921	Vynález	Text-to-hmatové vjemy	Italský profesor Ciro Codelupi předpokládá „čtecí stroj pro nevidomé“, schopný přeměnit světelné vjemy na hmatové vjemy.^[13]
1929	Vynález		Rakouský inženýr Gustav Tauschek vytvoří první OCR zařízení zvané „Čtecí stroj“ s fotosenzorem ukazujícím světlo na slova, když odpovídají šabloně obsahu v její paměti.^[14]
1931	Patent	Převod textu na telegraf	Izraelský fyzik a vynálezce Emanuel Goldberg získává patent na svůj „statistický stroj“ (US patent 1838389 ), který později získal IBM. Byl popsán jako schopný číst znaky a převádět je na standardní telegrafní kód.^[1]
1938	Vynález		Profesor MIT Vannevar Bush vyvíjí Microfilm Rapid Selector, podobný, ale jednodušší Goldbergův statistický stroj, a 40krát rychlejší.^[15]
1949	aplikace		Inženýři pracující na Radio Corporation of America zahájit projekt na pomoc nevidomým a nevidomým Americké ministerstvo pro záležitosti veteránů pomocí prvních technik převodu textu na řeč.^[16]
1951	Vynález	Text a Morseova řeč	Americký kryptoanalytik David H. Shepard a Harvey Cook mladší postavili „Gismo“, stroj schopný číst nahlas písmeno po písmenku a interpretovat Morseovu abecedu (US patent 2663758 ).^[2]
1952	Společnost		The Inteligentní stroje Research Corporation je založen D. Shepardem a William Lawless ml, komercializovat Gismo (později přejmenovaný na „Analyzing Reader“).^[17]
1954	aplikace		Americký časopis Reader's Digest se stává první firmou, která instaluje čtečku OCR, která se používá k převodu strojopisných zpráv o prodeji děrné štítky.^[1]
1962	Vynález	Přenosnost	Stanfordský profesor John Linvill rozvíjí Optacon, první přenosné čtecí zařízení pro nevidomé.^[18]
1965	aplikace		Reader's Digest rozšiřuje své použití OCR k digitalizaci sériových čísel kupónů. s RCA 501 počítač.^{[Citace je zapotřebí ]}
1965	Vynález		Americký vynálezce Jacob Rabinow vyvíjí stroj OCR pro třídění pošty z americké pošty.^[4]
1966	Vynález	Skener rukopisu	The Laboratoř IBM Rochester rozvíjí IBM 1287, první skener schopný číst libovolná ručně psaná čísla.^[19]
1966	Patent		Linvill získal patent na Optacon, který je popsán jako „Pomůcka pro čtení pro nevidomé“ (US patent 3229387 ).
1968	Vynález	Písma	Američtí zakladatelé typů a švýcarský designér Adrian Frutiger představen OCR-A a OCR-B; písma vytvořená k usnadnění operací OCR.^[3]^[20]
1971	aplikace	Poštovní skener	Kanadský poštovní operátor Canada Post začne používat systémy OCR, číst jméno a adresu na obálky a tisknout čárové kódy pomocí ultrafialový inkoust (US patent 5420403 ).^[21]
1974	Společnost	Omni-font	Americký vynálezce Ray Kurzweil vytváří společnost Kurzweil Computer Products Inc., která vyvíjí první software OCR s více písmy, který dokáže rozpoznat text vytištěný prakticky jakýmkoli písmem.^[5]
1976	Společnost		Založena společnost Dallas Recognition Equipment Inc., aby četla příjmy z kreditních karet z nákupů benzínu (US patent 4027141 ).^[9]
1977	Společnost	Komercializace	Robert Noyce zakládá společnost Caere Corporation (nyní Komunikace Nuance ) a představuje první komerční ruční čtečku OCR.^[22]
1978	Produkt		Společnost Kurzweil Computer Products začíná prodávat komerční verzi počítačového programu OCR s názvem „Kurzweil Reading Machine“.^[6]
1980	Prodejní		Kurzweilova společnost je prodána xerox, který jej přejmenoval na Scansoft (nyní sloučeno s Nuance Communications).^[9]
1984	Produkt	Pasový skener	Společnost Caere Corporation vyvíjí první pasový skener pro Americké ministerstvo zahraničí.^[23]
1987	aplikace	Skener cenovek	Američtí maloobchodníci Sears, Kmart a J.C.Penney začněte ke skenování cenovek používat OCR.^[21]
1989	Společnost		OCR ruská společnost ABBYY je založen Davidem Yangem a začíná prodávat produkty určené ke zjednodušení převodu papírových souborů na digitální data.^[24]
1992	Vynález		První program, který rozpozná cyrilice je vynalezen ruskou společností OKRUS.^[1]
2000	aplikace	Služba online	Technologie OCR je dostupná online jako služba (WebOCR), v a cloud computing prostředí, stejně jako v mobilních aplikacích, jako je překlad cizojazyčných znaků v reálném čase na smartphone.^[25]
2005	aplikace	Software	The volný, uvolnit cross-platform OCR engine Tesseract vydává Hewlett Packard a University of Nevada, Las Vegas.
2008	aplikace		Adobe Acrobat začíná včetně podpory OCR na jakémkoli Soubor PDF.^[8]
2011	aplikace	Vyhledávání frekvence slov	Prohlížeč Google Ngram je vyvinut pro mapování frekvencí slov na jakémkoli zdroji vytištěném od roku 1950 do roku 2008.^[26]^[27]
2013	aplikace		The MNIST databáze je vytvořen k trénování modelů strojového učení v rozpoznávání vzorů.^[28]
2015	aplikace	Otevřený přístup	Google nabízí nástroje OCR pro skenování všech Disk Google soubory ve více než 200 jazycích zdarma.^[7]

Viz také

Reference

^ ^A ^b ^C ^d ^E ^F ^G Schantz, H. F. (1982) Historie OCR: optické rozpoznávání znakůAsociace uživatelů technologie Recognition Technologies.
^ ^A ^b „První systém OCR:„ GISMO “(1951): HistoryofInformation.com“. www.historyofinformation.com. Citováno 2016-09-17.
^ ^A ^b Frutiger, Adrian. Typ. Podepsat. Symbol. ABC Verlag, Curych, 1980. s. 50
^ ^A ^b „Optické rozpoznávání znaků - historie“. Technologie ABBYY. Citováno 18. září 2016.
^ ^A ^b J. Scott Hauger, Čtecí stroje pro nevidomé ( PDF ), Blacksburg, Virginie, Fakulta polytechnického institutu ve Virginii a State University, duben 1995, s. I-II, 11-13.
^ ^A ^b „Počítačové produkty Kurzweil“. www.kurzweiltech.com. Citováno 2016-09-18.
^ ^A ^b „Paper to Digital in 200+ languages“. Citováno 2016-09-18.
^ ^A ^b "Tisková místnost". Adobe Systems. 14. července 2009. Citováno 4. prosince 2010.
^ ^A ^b ^C "Historie OCR". Časopis pro zpracování dat. 12: 46. 1970.
^ EE Fournier, Optofon s typovým čtením, náš přebytek, naše lodě a evropská potřeba atd ( PDF ), in Scientific American, sv. 123, č. 19, New York, Scientific American Publishing Co., 6. listopadu 1920, str. 463-465.
^ d'Albe, E. E. Fournier (01.07.1914). „Na optofonu se snímáním typu“. Proceedings of the Royal Society of London A: Mathematical, Physical and Engineering Sciences. 90 (619): 373–375. Bibcode:1914RSPSA..90..373D. doi:10.1098 / rspa.1914.0061. ISSN 1364-5021.
^ La macchina che legge e che scrive (PDF ), in La scienza per tutti, Year XXIII, nº 11, Milano, Casa Editrice Sozogno, 1 ° June 1916, str. 166. (italská)
^ Macchina per leggere pei ciechi (PDF ), La scienza per tutti, ročník XXVIII, č. 2, Miláno, Casa Editrice Sozogno, 15. ledna 1921, s. 20 (italská)
^ „History of Computers and Computing, Birth of the modern computer, The bases of digital computers, OCR“. history-computer.com. Citováno 2016-09-09.
^ Buckland, Michael Keeble (01.01.2006). Emanuel Goldberg a jeho stroj znalostí: Informace, vynález a politické síly. Greenwood Publishing Group. ISBN 9780313313325.
^ „Čtecí stroj mluví nahlas“, Únor 1949, Popular Science.
^ Douglas Martin (11. prosince 2007). „David H. Shepard, 84 let, umírá; Optical Reader Inventor“. New York Times. Citováno 5. června 2010.
^ „Čtecí stroj, který dosud nebyl postaven“. AccessWorld. Citováno 18. září 2016.
^ "Rochester chronologie". IBM. Citováno 18. září 2016.
^ "OCR-A Standard | Typekit". typekit.com. Citováno 2016-09-18.
^ ^A ^b "Přehled OCR a jeho aplikací" (PDF). Porozumění optickému rozpoznávání znaků. Citováno 18. září 2016.
^ „Historie společnosti Caere Corporation - FundingUniverse“. www.fundinguniverse.com. Citováno 2016-09-23.
^ Jacobson, Gary. „Žádné zášť, říká Bill Moore, ale stále hledá spravedlnost.“. Dallas News. Citováno 18. září 2016.
^ „Rozhovor Mixergy: Jak příspěvek na nástěnce změnil vše - s Davidem Yangem“. Citováno 22. srpna 2013.
^ „Porozumění optickému rozpoznávání znaků“ (PDF). Čárový kód a sběr dat. Citováno 18. září 2016.
^ „Databáze Google Ngram sleduje popularitu 500 miliard slov“ Huffington Post, 17. prosince 2010, webová stránka: HP8150.
^ „Culturomics, Ngrams a nové elektrické nástroje pro vědu“. Citováno 2016-09-18.
^ „MNIST ručně psaná databáze číslic, Yann LeCun, Corinna Cortes a Chris Burges“. yann.lecun.com. Citováno 2016-09-18.

[:0-1] A ^b ^C ^d ^E ^F ^G Schantz, H. F. (1982) Historie OCR: optické rozpoznávání znakůAsociace uživatelů technologie Recognition Technologies.

[:4-2] A ^b „První systém OCR:„ GISMO “(1951): HistoryofInformation.com“. www.historyofinformation.com. Citováno 2016-09-17.

[:5-3] A ^b Frutiger, Adrian. Typ. Podepsat. Symbol. ABC Verlag, Curych, 1980. s. 50

[:6-4] A ^b „Optické rozpoznávání znaků - historie“. Technologie ABBYY. Citováno 18. září 2016.

[:7-5] A ^b J. Scott Hauger, Čtecí stroje pro nevidomé ( PDF ), Blacksburg, Virginie, Fakulta polytechnického institutu ve Virginii a State University, duben 1995, s. I-II, 11-13.

[:3-6] A ^b „Počítačové produkty Kurzweil“. www.kurzweiltech.com. Citováno 2016-09-18.

[:8-7] A ^b „Paper to Digital in 200+ languages“. Citováno 2016-09-18.

[:9-8] A ^b "Tisková místnost". Adobe Systems. 14. července 2009. Citováno 4. prosince 2010.

[:2-9] A ^b ^C "Historie OCR". Časopis pro zpracování dat. 12: 46. 1970.

[10] EE Fournier, Optofon s typovým čtením, náš přebytek, naše lodě a evropská potřeba atd ( PDF ), in Scientific American, sv. 123, č. 19, New York, Scientific American Publishing Co., 6. listopadu 1920, str. 463-465.

[11] 'Albe, E. E. Fournier (01.07.1914). „Na optofonu se snímáním typu“. Proceedings of the Royal Society of London A: Mathematical, Physical and Engineering Sciences. 90 (619): 373–375. Bibcode:1914RSPSA..90..373D. doi:10.1098 / rspa.1914.0061. ISSN 1364-5021.

[12] La macchina che legge e che scrive (PDF ), in La scienza per tutti, Year XXIII, nº 11, Milano, Casa Editrice Sozogno, 1 ° June 1916, str. 166. (italská)

[13] Macchina per leggere pei ciechi (PDF ), La scienza per tutti, ročník XXVIII, č. 2, Miláno, Casa Editrice Sozogno, 15. ledna 1921, s. 20 (italská)

[14] „History of Computers and Computing, Birth of the modern computer, The bases of digital computers, OCR“. history-computer.com. Citováno 2016-09-09.

[15] Buckland, Michael Keeble (01.01.2006). Emanuel Goldberg a jeho stroj znalostí: Informace, vynález a politické síly. Greenwood Publishing Group. ISBN 9780313313325.

[16] „Čtecí stroj mluví nahlas“, Únor 1949, Popular Science.

[NT-17] Douglas Martin (11. prosince 2007). „David H. Shepard, 84 let, umírá; Optical Reader Inventor“. New York Times. Citováno 5. června 2010.

[18] „Čtecí stroj, který dosud nebyl postaven“. AccessWorld. Citováno 18. září 2016.

[19] "Rochester chronologie". IBM. Citováno 18. září 2016.

[20] "OCR-A Standard | Typekit". typekit.com. Citováno 2016-09-18.

[:1-21] A ^b "Přehled OCR a jeho aplikací" (PDF). Porozumění optickému rozpoznávání znaků. Citováno 18. září 2016.

[22] „Historie společnosti Caere Corporation - FundingUniverse“. www.fundinguniverse.com. Citováno 2016-09-23.

[23] Jacobson, Gary. „Žádné zášť, říká Bill Moore, ale stále hledá spravedlnost.“. Dallas News. Citováno 18. září 2016.

[Mixergy_interview-24] „Rozhovor Mixergy: Jak příspěvek na nástěnce změnil vše - s Davidem Yangem“. Citováno 22. srpna 2013.

[25] „Porozumění optickému rozpoznávání znaků“ (PDF). Čárový kód a sběr dat. Citováno 18. září 2016.

[Huf-26] „Databáze Google Ngram sleduje popularitu 500 miliard slov“ Huffington Post, 17. prosince 2010, webová stránka: HP8150.

[27] „Culturomics, Ngrams a nové elektrické nástroje pro vědu“. Citováno 2016-09-18.

[28] „MNIST ručně psaná databáze číslic, Yann LeCun, Corinna Cortes a Chris Burges“. yann.lecun.com. Citováno 2016-09-18.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]