Časová osa optického rozpoznávání znaků - Timeline of optical character recognition

Tohle je časová osa optické rozpoznávání znaků.

Přehled

Časový úseksouhrn
1870–1931Nejčasnější myšlenky optického rozpoznávání znaků (OCR) jsou koncipovány. Fournier d'Albe Optofon a Tauschek's Reading Machine jsou vyvíjeny jako zařízení, která pomáhají nevidomému číst.[1]
1931–1954První OCR nástroje jsou vynalezeny a použity v průmyslu, schopné interpretovat Morseova abeceda a číst nahlas text. The Inteligentní stroje Research Corporation je první společností vytvořenou k prodeji těchto nástrojů.[2]
1954–1974The Optacon, první přenosné zařízení OCR, je vyvíjeno. Podobná zařízení se používají k digitalizaci Reader's Digest kupóny a poštovní adresy. Pro usnadnění skenování jsou navržena speciální písma.[1][3][4]
1974–2000Skenery se masivně používají ke čtení cenovek a pasů.[5] Společnosti jako Caere Corporation, ABBYY a Kurzweil Computer Products Inc. Ten druhý vyvíjí první všesměrový OCR software, schopný číst jakýkoli textový dokument.[6]
2000–2016Software OCR je k dispozici online zdarma prostřednictvím produktů jako Adobe Acrobat, WebOCR a Disk Google.[7][8]

Časová osa

1969. Americká armáda implementovala to, co mohlo být jednou z prvních hlavních aplikací využívajících technologii OCR, převedením jejich manuálního přidělovacího programu na centralizovaný systém využívající počítače IBM 360. Proces zahrnoval nákup psacích strojů IBM Selectric s použitím písma Time Roman 12 pro všechny její finanční kanceláře po celém světě. Tato aplikace umožňovala veškerému vojenskému personálu přidělovat části své výplaty prostřednictvím automatických srážek ze mzdy, platit účty, posílat úspory atd., Což eliminovalo měsíční zpracování. Úspěch tohoto programu připravil půdu pro sledování všech vojenských služeb a nakonec po letech vedl k přechodu na plně automatizovaný systém odměňování.
RokTyp událostiTechnologieDetaily
1870VynálezAmerický vynálezce Charles R. Carey vynalezl skener sítnice, systém přenosu obrazu využívající mozaiku fotobuněk, považovaný za první vynález OCR na světě.[1]
1885VynálezSkener obrázkůPaul Nipkow vymýšlí Nipkow disk, zařízení pro skenování obrazu, které bude později velkým průlomem jak pro moderní televizi, tak pro čtecí stroje.[9]
1900VynálezRuský vědec Tyurin předpokládá, že první OCR stroj bude sloužit jako pomůcka pro zrakově postižené, ale nikdy se mu ho nepodaří vyvinout.[1]
1912ProduktText na řečEdmund Fournier d'Albe rozvíjí Optofon, ruční skener, který při pohybu po vytištěné stránce produkuje tóny, které odpovídají konkrétním písmenům nebo znakům, aby je mohl interpretovat nevidomý.[10][11]
1916PatentAmerický inženýr John B. Květiny patentuje stroj „One-Eyed Machine Stenographer“, stroj schopný číst a psát skript. Fungovalo to tak, že se všechna písmena překrývala, aby se našel bod, který je každé z nich označil.[12]
1921VynálezText-to-hmatové vjemyItalský profesor Ciro Codelupi předpokládá „čtecí stroj pro nevidomé“, schopný přeměnit světelné vjemy na hmatové vjemy.[13]
1929VynálezRakouský inženýr Gustav Tauschek vytvoří první OCR zařízení zvané „Čtecí stroj“ s fotosenzorem ukazujícím světlo na slova, když odpovídají šabloně obsahu v její paměti.[14]
1931PatentPřevod textu na telegrafIzraelský fyzik a vynálezce Emanuel Goldberg získává patent na svůj „statistický stroj“ (US patent 1838389 ), který později získal IBM. Byl popsán jako schopný číst znaky a převádět je na standardní telegrafní kód.[1]
1938VynálezProfesor MIT Vannevar Bush vyvíjí Microfilm Rapid Selector, podobný, ale jednodušší Goldbergův statistický stroj, a 40krát rychlejší.[15]
1949aplikaceInženýři pracující na Radio Corporation of America zahájit projekt na pomoc nevidomým a nevidomým Americké ministerstvo pro záležitosti veteránů pomocí prvních technik převodu textu na řeč.[16]
1951VynálezText a Morseova řečAmerický kryptoanalytik David H. Shepard a Harvey Cook mladší postavili „Gismo“, stroj schopný číst nahlas písmeno po písmenku a interpretovat Morseovu abecedu (US patent 2663758 ).[2]
1952SpolečnostThe Inteligentní stroje Research Corporation je založen D. Shepardem a William Lawless ml, komercializovat Gismo (později přejmenovaný na „Analyzing Reader“).[17]
1954aplikaceAmerický časopis Reader's Digest se stává první firmou, která instaluje čtečku OCR, která se používá k převodu strojopisných zpráv o prodeji děrné štítky.[1]
1962VynálezPřenosnostStanfordský profesor John Linvill rozvíjí Optacon, první přenosné čtecí zařízení pro nevidomé.[18]
1965aplikaceReader's Digest rozšiřuje své použití OCR k digitalizaci sériových čísel kupónů. s RCA 501 počítač.[Citace je zapotřebí ]
1965VynálezAmerický vynálezce Jacob Rabinow vyvíjí stroj OCR pro třídění pošty z americké pošty.[4]
1966VynálezSkener rukopisuThe Laboratoř IBM Rochester rozvíjí IBM 1287, první skener schopný číst libovolná ručně psaná čísla.[19]
1966PatentLinvill získal patent na Optacon, který je popsán jako „Pomůcka pro čtení pro nevidomé“ (US patent 3229387 ).
1968VynálezPísmaAmeričtí zakladatelé typů a švýcarský designér Adrian Frutiger představen OCR-A a OCR-B; písma vytvořená k usnadnění operací OCR.[3][20]
1971aplikacePoštovní skenerKanadský poštovní operátor Canada Post začne používat systémy OCR, číst jméno a adresu na obálky a tisknout čárové kódy pomocí ultrafialový inkoust (US patent 5420403 ).[21]
1974SpolečnostOmni-fontAmerický vynálezce Ray Kurzweil vytváří společnost Kurzweil Computer Products Inc., která vyvíjí první software OCR s více písmy, který dokáže rozpoznat text vytištěný prakticky jakýmkoli písmem.[5]
1976SpolečnostZaložena společnost Dallas Recognition Equipment Inc., aby četla příjmy z kreditních karet z nákupů benzínu (US patent 4027141 ).[9]
1977SpolečnostKomercializaceRobert Noyce zakládá společnost Caere Corporation (nyní Komunikace Nuance ) a představuje první komerční ruční čtečku OCR.[22]
1978ProduktSpolečnost Kurzweil Computer Products začíná prodávat komerční verzi počítačového programu OCR s názvem „Kurzweil Reading Machine“.[6]
1980ProdejníKurzweilova společnost je prodána xerox, který jej přejmenoval na Scansoft (nyní sloučeno s Nuance Communications).[9]
1984ProduktPasový skenerSpolečnost Caere Corporation vyvíjí první pasový skener pro Americké ministerstvo zahraničí.[23]
1987aplikaceSkener cenovekAmeričtí maloobchodníci Sears, Kmart a J.C.Penney začněte ke skenování cenovek používat OCR.[21]
1989SpolečnostOCR ruská společnost ABBYY je založen Davidem Yangem a začíná prodávat produkty určené ke zjednodušení převodu papírových souborů na digitální data.[24]
1992VynálezPrvní program, který rozpozná cyrilice je vynalezen ruskou společností OKRUS.[1]
2000aplikaceSlužba onlineTechnologie OCR je dostupná online jako služba (WebOCR), v a cloud computing prostředí, stejně jako v mobilních aplikacích, jako je překlad cizojazyčných znaků v reálném čase na smartphone.[25]
2005aplikaceSoftwareThe volný, uvolnit cross-platform OCR engine Tesseract vydává Hewlett Packard a University of Nevada, Las Vegas.
2008aplikaceAdobe Acrobat začíná včetně podpory OCR na jakémkoli Soubor PDF.[8]
2011aplikaceVyhledávání frekvence slovProhlížeč Google Ngram je vyvinut pro mapování frekvencí slov na jakémkoli zdroji vytištěném od roku 1950 do roku 2008.[26][27]
2013aplikaceThe MNIST databáze je vytvořen k trénování modelů strojového učení v rozpoznávání vzorů.[28]
2015aplikaceOtevřený přístupGoogle nabízí nástroje OCR pro skenování všech Disk Google soubory ve více než 200 jazycích zdarma.[7]

Viz také

Reference

  1. ^ A b C d E F G Schantz, H. F. (1982) Historie OCR: optické rozpoznávání znakůAsociace uživatelů technologie Recognition Technologies.
  2. ^ A b „První systém OCR:„ GISMO “(1951): HistoryofInformation.com“. www.historyofinformation.com. Citováno 2016-09-17.
  3. ^ A b Frutiger, Adrian. Typ. Podepsat. Symbol. ABC Verlag, Curych, 1980. s. 50
  4. ^ A b „Optické rozpoznávání znaků - historie“. Technologie ABBYY. Citováno 18. září 2016.
  5. ^ A b J. Scott Hauger, Čtecí stroje pro nevidomé ( PDF ), Blacksburg, Virginie, Fakulta polytechnického institutu ve Virginii a State University, duben 1995, s. I-II, 11-13.
  6. ^ A b „Počítačové produkty Kurzweil“. www.kurzweiltech.com. Citováno 2016-09-18.
  7. ^ A b „Paper to Digital in 200+ languages“. Citováno 2016-09-18.
  8. ^ A b "Tisková místnost". Adobe Systems. 14. července 2009. Citováno 4. prosince 2010.
  9. ^ A b C "Historie OCR". Časopis pro zpracování dat. 12: 46. 1970.
  10. ^ EE Fournier, Optofon s typovým čtením, náš přebytek, naše lodě a evropská potřeba atd ( PDF ), in Scientific American, sv. 123, č. 19, New York, Scientific American Publishing Co., 6. listopadu 1920, str. 463-465.
  11. ^ d'Albe, E. E. Fournier (01.07.1914). „Na optofonu se snímáním typu“. Proceedings of the Royal Society of London A: Mathematical, Physical and Engineering Sciences. 90 (619): 373–375. Bibcode:1914RSPSA..90..373D. doi:10.1098 / rspa.1914.0061. ISSN  1364-5021.
  12. ^ La macchina che legge e che scrive (PDF ), in La scienza per tutti, Year XXIII, nº 11, Milano, Casa Editrice Sozogno, 1 ° June 1916, str. 166. (italská)
  13. ^ Macchina per leggere pei ciechi (PDF ), La scienza per tutti, ročník XXVIII, č. 2, Miláno, Casa Editrice Sozogno, 15. ledna 1921, s. 20 (italská)
  14. ^ „History of Computers and Computing, Birth of the modern computer, The bases of digital computers, OCR“. history-computer.com. Citováno 2016-09-09.
  15. ^ Buckland, Michael Keeble (01.01.2006). Emanuel Goldberg a jeho stroj znalostí: Informace, vynález a politické síly. Greenwood Publishing Group. ISBN  9780313313325.
  16. ^ „Čtecí stroj mluví nahlas“, Únor 1949, Popular Science.
  17. ^ Douglas Martin (11. prosince 2007). „David H. Shepard, 84 let, umírá; Optical Reader Inventor“. New York Times. Citováno 5. června 2010.
  18. ^ „Čtecí stroj, který dosud nebyl postaven“. AccessWorld. Citováno 18. září 2016.
  19. ^ "Rochester chronologie". IBM. Citováno 18. září 2016.
  20. ^ "OCR-A Standard | Typekit". typekit.com. Citováno 2016-09-18.
  21. ^ A b "Přehled OCR a jeho aplikací" (PDF). Porozumění optickému rozpoznávání znaků. Citováno 18. září 2016.
  22. ^ „Historie společnosti Caere Corporation - FundingUniverse“. www.fundinguniverse.com. Citováno 2016-09-23.
  23. ^ Jacobson, Gary. „Žádné zášť, říká Bill Moore, ale stále hledá spravedlnost.“. Dallas News. Citováno 18. září 2016.
  24. ^ „Rozhovor Mixergy: Jak příspěvek na nástěnce změnil vše - s Davidem Yangem“. Citováno 22. srpna 2013.
  25. ^ „Porozumění optickému rozpoznávání znaků“ (PDF). Čárový kód a sběr dat. Citováno 18. září 2016.
  26. ^ „Databáze Google Ngram sleduje popularitu 500 miliard slov“ Huffington Post, 17. prosince 2010, webová stránka: HP8150.
  27. ^ „Culturomics, Ngrams a nové elektrické nástroje pro vědu“. Citováno 2016-09-18.
  28. ^ „MNIST ručně psaná databáze číslic, Yann LeCun, Corinna Cortes a Chris Burges“. yann.lecun.com. Citováno 2016-09-18.