Neurální strojový překlad Google - Google Neural Machine Translation

Neurální strojový překlad Google (GNMT) je a neurální strojový překlad (NMT) systém vyvinutý společností Google a představený v listopadu 2016, který používá umělá neuronová síť zvýšit plynulost a přesnost v Google Překladač.[1][2][3][4]

GNMT zvyšuje kvalitu překladu aplikací na příkladu (EBMT) strojový překlad metoda, při které se systém „učí z milionů příkladů“.[2] GNMT navrhovaná architektura systémového učení byla poprvé testována na více než stovce jazyků podporovaných překladačem Google.[2] S velkým end-to-end systému se systém postupem času učí vytvářet lepší a přirozenější překlady.[1] GNMT dokáže překládat celé věty najednou, nikoli jen kousek po kousku.[1] Síť GNMT se může zavázat mezijazyčný strojový překlad kódováním sémantiky věty, spíše než memorováním překladů mezi frázemi.[2][5]

Dějiny

The Google Brain projekt byl založen v roce 2011 ve „tajné výzkumné laboratoři Google X“[6] Google Fellow Jeff Dean, Google Researcher Greg Corrado, a Stanfordská Univerzita Profesor informatiky Andrew Ng.[7][8][9] Práce Ng vedla k některým z největších průlomů ve společnosti Google a Stanford.[6]

V září 2016 ohlásil výzkumný tým společnosti Google vývoj systému Google Neural Machine Translation (GNMT) a do listopadu začal Google Translate používat strojový překlad neuronů (NMT) místo svého předchozího statistické metody (SMT)[1][10][11][12] která byla používána od října 2007 s vlastní proprietární technologií SMT.[13][14]

Systém NMT v Google Translate používá velkou umělou neurální síť, která je schopna hluboké učení.[1][2][3] Použitím milionů příkladů GNMT zlepšuje kvalitu překladu,[2] pomocí širších souvislostí odvodit nejrelevantnější překlad. Výsledek je poté přeskupen a přizpůsoben tak, aby přistupoval k gramaticky založenému lidskému jazyku.[1] GNMT navrhovaná architektura systémového učení byla poprvé testována na více než stovce jazyků podporovaných překladačem Google.[2] GNMT nevytvořil vlastní univerzální interlingua, ale spíše se zaměřil na nalezení shody mezi mnoha jazyky pomocí poznatků z psychologie a lingvistiky.[15] Nový překladač byl poprvé povolen pro osm jazyků: do az angličtiny a francouzštiny, němčiny, španělštiny, portugalštiny, čínštiny, japonštiny, korejštiny a turečtiny v roce 2016.[16] V březnu 2017 byly povoleny tři další jazyky: ruština, hindština a vietnamština spolu s thajštinou, pro kterou byla podpora přidána později.[17][18] Ve stejném měsíci byla také přidána podpora hebrejštiny a arabštiny s pomocí komunity Překladače Google.[19] V polovině dubna 2017 společnost Google Netherlands oznámila podporu nizozemštiny a dalších evropských jazyků souvisejících s angličtinou.[20] Na konci dubna 2017 byla přidána další podpora pro devět indických jazyků: hindština, bengálština, maráthština, gudžarátština, pandžábština, tamilština, telugština, malabarština a kannadština.[21]

Hodnocení

Systém GNMT údajně představuje vylepšení oproti předchozímu Překladači Google v tom, že zvládne „překlad s nulovým výstřelem“, to znamená, že přímo překládá jeden jazyk do jiného (například z japonštiny do korejštiny).[2] Překladač Google dříve nejprve přeložil soubor zdrojový jazyk do angličtiny a poté přeloženy do angličtiny cílový jazyk místo přímého překladu z jednoho jazyka do druhého.[5]

Studie z července 2019 v Annals of Internal Medicine zjistil, že „Překladač Google je životaschopný a přesný nástroj pro překlady zkoušek v jiných jazycích než v angličtině“. Pouze jedna neshoda mezi recenzenty, kteří četli pokusy přeložené strojem, byla způsobena chybou překladu. Protože mnoho lékařských studií je ze systematických recenzí vyloučeno, protože recenzenti nerozumí jazyku, GNMT má potenciál snížit zkreslení a zlepšit přesnost těchto recenzí.[22]

Jazyky podporované GNMT

K říjnu 2020 počet podporovaných jazyků Google Překladač vzrostl na 109, přičemž nyní jsou zahrnuty Kyrgrz, běloruské, latinské, maltské a súdánské

Viz také

Reference

  1. ^ A b C d E F Barak Turovský (15. listopadu 2016), "Nalezeno v překladu: Přesnější a plynulejší věty v Překladači Google", Blog Google, vyvoláno 11. ledna 2017
  2. ^ A b C d E F G h Mike Schuster, Melvin Johnson a Nikhil Thorat (22. listopadu 2016), „Překlad nuly s vícejazyčným systémem strojového překladu neuronů Google“, Výzkumný blog Google, vyvoláno 11. ledna 2017CS1 maint: používá parametr autoři (odkaz)
  3. ^ A b Gil Fewster (5. ledna 2017), „Ohromující oznámení AI od Googlu, které jste pravděpodobně zmeškali“, freeCodeCamp, vyvoláno 11. ledna 2017
  4. ^ Wu, Yonghui; Schuster, Mike; Chen, Zhifeng; Le, Quoc V .; Norouzi, Mohammad (2016). „Neuronový strojový překladový systém Google: Překlenutí propasti mezi lidským a strojovým překladem“. arXiv:1609.08144. Bibcode:2016arXiv160908144W. Citovat deník vyžaduje | deník = (Pomoc)
  5. ^ A b Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie (2010). „MT on and for the Web“ (PDF). Citováno 1. prosince 2016.
  6. ^ A b Robert D. Hof (14. srpna 2014). „Čínský internetový gigant začíná snít: Baidu je součástí online života v Číně, ale chce se stát světovou velmocí. Může mu jeden z předních světových výzkumníků umělé inteligence pomoci vyzvat největší společnosti v Silicon Valley?“. Recenze technologie. Citováno 11. ledna 2017.
  7. ^ Jeff Dean a Andrew Ng (26. června 2012). „Používání rozsáhlých simulací mozku pro strojové učení a A.I.“ Oficiální blog Google. Citováno 26. ledna 2015.
  8. ^ „Projekt rozsáhlých hlubokých neuronových sítí společnosti Google“. Citováno 25. října 2015.
  9. ^ Markoff, John (25. června 2012). „Kolik počítačů identifikuje kočku? 16 000“. New York Times. Citováno 11. února 2014.
  10. ^ Katyanna Quach (17. listopadu 2016), Neuronová síť Google se učí překládat jazyky, na které nebyla vyškolena: Strojový překlad poprvé použil skutečné přenosové učení, vyvoláno 11. ledna 2017
  11. ^ Lewis-Kraus, Gideon (14. prosince 2016). „Velké probuzení A.I.“. The New York Times. Citováno 11. ledna 2017.
  12. ^ Le, Quoc; Schuster, Mike (27. září 2016). „Neural Network for Machine Translation, at Production Scale“. Výzkumný blog Google. Citováno 1. prosince 2016.
  13. ^ Google přechází na svůj vlastní překladatelský systém, 22. října 2007
  14. ^ Barry Schwartz (23. října 2007). „Google Translate Drops SYSTRAN pro domácí vaření“. Země vyhledávače.
  15. ^ Chris McDonald (7. ledna 2017), Komentování článku Gil Fewstera z 5. ledna v Atlantiku, vyvoláno 11. ledna 2017
  16. ^ Turovský, Barak (15. listopadu 2016). "Nalezeno v překladu: Přesnější a plynulejší věty v Překladači Google". Blog Google pro klíčové slovo. Citováno 1. prosince 2016.
  17. ^ Perez, Sarah (6. března 2017). „Chytřejší překladatelský systém využívající technologii A.I. se rozšiřuje do dalších jazyků“. TechCrunch. Oath Inc.
  18. ^ Turovský, Barak (6. března 2017). „Kvalitnější neurální překlady pro spoustu dalších jazyků“. Blog Google pro klíčové slovo. Citováno 6. března 2017.
  19. ^ Novet, Jordánsko (30. března 2017). „Google nyní poskytuje překlady založené na AI pro arabštinu a hebrejštinu“. VentureBeat.
  20. ^ Finge, Rachid (19. dubna 2017). „Grote verbetering voor het Nederlands in Google Translate“ [Velké vylepšení holandštiny v Překladači Google]. Blog Nizozemska Google (v holandštině).
  21. ^ Turovský, Barak (25. dubna 2017). „Zpřístupnění internetu v Indii“. Klíčové slovo.
  22. ^ Jackson, Jeffrey L; Kuriyama, Akira; Anton, Andreea; Choi, duben; Fournier, Jean-Pascal; Geier, Anne-Kathrin; Jacquerioz, Frederique; Kogan, Dmitrij; Scholcoff, Cecilia; Ne, Rao (30. července 2019). „Přesnost Překladače Google pro odebírání dat z neanglických jazyků pro systematické kontroly“. Annals of Internal Medicine. 171 (9): 678. doi:10,7326 / M19-0891. ISSN  0570-183X. PMID  31357212. S2CID  198980789.

externí odkazy