Syntéza lidského obrazu - Human image synthesis


Syntéza lidského obrazu je technologie, kterou lze použít k dosažení věrohodnosti a rovnoměrnosti fotorealistické ztvárnění[1][2] lidské podoby, pohyblivé nebo nehybné. Účinně existuje od počátku 2000s. Mnoho filmů používá počítačem generované snímky představovaly syntetické obrazy postav podobných člověku digitálně složený na skutečný nebo jiný simulovaný filmový materiál. Ke konci 2010s hluboké učení umělá inteligence bylo použito pro syntetizovat obrázky a videa které vypadají jako lidé, aniž by byla nutná lidská pomoc, jakmile bude dokončena fáze školení, zatímco stará školní trasa 7D vyžadovala obrovské množství lidské práce.
Časová osa lidské syntézy obrazu
- V roce 1971 Henri Gouraud udělal první CG geometrie zajmout a znázornění lidské tváře. Modelkou byla jeho manželka Sylvie Gouraud. 3D model byl jednoduchý drátový model a podal žádost shader Gouraud, pro který je nejvíce známý vytvořit první známou reprezentaci lidské podoby na počítači (zobrazit obrázky).[3]
- The 1972 krátký film Počítačem animovaná ruka podle Edwin Catmull a Fred Parke bylo to poprvé počítačem generované snímky byl použit ve filmu k simulaci dojemného lidského vzhledu. Film představoval počítačově simulovanou ruku a obličej (sledovat film zde).
- The 1976 film Futureworld znovu použité části Počítačem animovaná ruka na velké obrazovce.
- The 1983 hudební video k písni Musique Non-Stop německou kapelou Kraftwerk vysílaný v roce 1986. Vytvořil umělec Rebecca Allen, obsahuje nerealisticky vypadající, ale jasně rozeznatelné počítačové simulace členů kapely.
- The 1994 film Vrána byla první filmovou produkcí, která využívala digitální kompozici počítačové simulace znázornění tváře na scény natočené pomocí a tělo dvojité. Nutností byla múza jako herce Brandon Lee portrét hlavního hrdiny byl tragicky zabit náhodně na jevišti.
- v 1999 Paul Debevec et al. z USC zachytil odrazové pole lidské tváře s jejich první verzí a světelný stupeň. Svou metodu představili na SIGGRAPH 2000[4]

- v 2003 publikum debut fotorealistických podobizen člověka ve filmech z roku 2003 Matrix Reloaded v sekvence statných rvaček kde až 100 Agent Smiths boj Neo a v Maticové revoluce kde na začátku konečného zúčtování je agent Smith lícní kost je zasažen Neem a ponechává digitální vzhled nepřirozeně nezraněný. Bonus Matrix Revolutions DVD dokumentuje a podrobně popisuje proces a použité techniky, včetně snímání pohybu obličeje a limbální zachycení pohybu, a projekce na modely.
- v 2003 Animatrix: Final Flight of the Osiris A nejmodernější chtivé lidské podoby, které úplně neoklamaly pozorovatele, kterého vytvořil Čtvercové obrázky.
- v 2003 digitální podoba Tobey Maguire byl vyroben pro filmy Spider-Man 2 a Spider-Man 3 podle Sony Pictures Imageworks.[5]
- v 2009 Debevec a kol. představil nové digitální podoby vytvořené uživatelem Metriky obrázků, tentokrát herečky Emily O'Brien jehož odrazivost byla zachycena světelným stupněm USC 5[6] Pohyb vypadá docela přesvědčivě na rozdíl od neohrabaného běhu v Animatrix: Final Flight of the Osiris který byl nejmodernější v roce 2003, pokud byl fotorealismus záměrem animátoři.
- v 2009 digitální podoba mladšího Arnold Schwarzenegger byl vytvořen pro film Terminator Salvation ačkoli konečný výsledek byl kritizován jako nepřesvědčivý. Geometrie obličeje byla získána z formy Schwarzenegger z roku 1984.
- v 2010 Obrázky Walta Disneyho vydala pokračování sci-fi s názvem Tron: Legacy s digitálně omlazeným digitálním podobným hercem Jeff Bridges hraje na antagonista CLU.
- v SIGGGRAPH 2013 Activision a USC představily a reálný čas „Digital Ira“ je digitální tváří podobnou Ari Shapiro, vědecké pracovnici ICT USC,[7] s využitím světelného stupně USC X od Ghosh et al. pro odrazové pole i pro zachycení pohybu.[8] Konečným výsledkem je předpočítané i vykreslování v reálném čase s nejnovější hrou GPU zobrazeno tady a vypadá docela realisticky.
- v 2014 Prezidentský portrét podle USC ICT ve spojení s Smithsonian Institution byl vyroben pomocí nejnovějšího mobilního světelného stupně USC, kde prezident Barack Obama nechal zachytit jeho geometrii, textury a odrazivost.[9]
- v 2014 Ian Goodfellow et al. představil principy a generativní kontradiktorní síť. GAN se začaly objevovat na začátku roku 2018 díky deepfakes kontroverze.
- Pro 2015 film Zuřivý 7 digitální podoba herce Paul Walker který zemřel při nehodě během natáčení, udělal Weta Digital umožnit dokončení filmu.[10]
- v 2016 techniky, které umožňují téměř v reálném čase padělání z výrazy obličeje ve stávajícím 2D videu byly věrohodně prokázány.[11]
- v 2016 digitální podoba Peter Cushing byl vyroben pro Rogue One film, kde se zdá, že je stejně starý jako herec během natáčení původního filmu z roku 1977 Hvězdné války film.
- v SIGGRAPH 2017 zvukově řízený digitální vzhled horní části trupu Baracka Obamy představili vědci z University of Washington. (Pohled) To bylo poháněno pouze hlasovou stopou jako zdrojovými daty pro animaci po fázi tréninku k získání synchronizace rtů a širší informace o obličeji z školicí materiál skládající se 2D videa se zvukem byla dokončena.[12]
- Pozdě 2017[13] a brzy 2018 viděl vynoření deepfakes kontroverze kde porno videa byly vyzkoušeny s využitím hluboké strojové učení takže tvář herečky byla nahrazena názorem softwaru na to, jak by vypadala tvář jiných osob ve stejné póze a osvětlení.
- v 2018 GDC Epické hry a Tencent hry předvedla „Sirénu“, digitální vzhled herečky Bingjie Jiang. Bylo to možné pomocí následujících technologií: CubicMotion je počítačové vidění Systém, 3Boční systém manipulace obličeje a Vicon systém pro snímání pohybu. Demonstrace probíhala v téměř reálném čase rychlostí 60 snímků za sekundu v systému Windows Unreal Engine 4.[14]
- v 2018 na Světová internetová konference v Wuzhen the Zpravodajská agentura Xinhua představil dva podobné digitální vzhledy podobné svým skutečným moderátorům zpráv Qiu Hao (Čínský jazyk )[15] a Zhang Zhao (anglický jazyk ). Digitální podobní uživatelé byli vyrobeni ve spojení s Sogou.[16] Ani syntéza řeči použité ani gesty digitálních dvojitých kotev nebyly dost dobré na to, aby oklamaly pozorovatele, aby si je spletl se skutečnými lidmi zobrazenými televizní kamerou.
- V září 2018 Google přidal na svůj seznam zákazů „nedobrovolné syntetické pornografické snímky“, což umožnil komukoli požadovat výsledky bloku vyhledávače které je falešně zobrazují jako „nahé nebo v sexuálně explicitní situaci“.[17]
- V únoru 2019 Nvidia otevřené zdroje StyleGAN, novela generativní kontradiktorní síť.[18] Hned poté Phillip Wang vytvořil web ThisPersonDoesNotExist.com s StyleGAN, který demonstruje, že pomocí GAN lze automaticky vytvořit neomezené množství často fotorealistických portrétů obličeje nikoho.[19] StyleGAN od společnosti Nvidia byl představen v dosud ne recenzováno papír na konci roku 2018.[19]
- V červnu 2019 CVPR the MIT CSAIL prezentovány systém s názvem „Speech2Face: Učení tváře za hlasem“ který syntetizuje pravděpodobné tváře pouze na základě záznamu hlasu. Bylo to trénováno s obrovským množstvím videa lidí, kteří mluvili.
- Od 1. července 2019 [20] Virginie kriminalizoval prodej a šíření nepovolené syntetické pornografie, ale nikoli výroba.[21], tak jako § 18.2-386.2 s názvem „Protiprávní šíření nebo prodej obrazů jiného; trest.' se stal součástí Kodex Virginie. Text zákona stanoví: „Každá osoba, která s úmysl na donutit, obtěžovat nebo zastrašit, zlomyslně šíří nebo prodává jakýkoli videografický nebo statický obraz vytvořený jakýmkoli způsobem, který zobrazuje úplně jinou osobu akt, nebo ve stavu svlékání tak, aby odhalil pohlavní orgány, veřejná oblast, hýždě nebo žena prsa, kde tato osoba ví nebo má důvod vědět, že tomu tak není licencováno nebo autorizovaný šířit nebo prodávat takový videografický nebo statický obraz je vinen třídou 1 přečin.".[21] Stejné účty byly Dům Bill 2678 předložený Delegát Marcus Simon do Virginie dům delegátů 14. ledna 2019 a o tři dny později identické Senátní návrh zákona 1736 byl představen Senát Virginie senátor Adam Ebbin.
- Od 1. září 2019 Texas senátní návrh zákona SB 751 pozměňovací návrhy na volební zákon vstoupil v platnost, dávat kandidáti v volby třicetidenní ochranná lhůta před volbami, během nichž je trestným činem výroba a distribuce podobného digitálního vzhledu nebo syntetických padělků. Text zákona definuje předmět zákona jako „video vytvořené s úmyslem oklamat, které zřejmě zobrazuje skutečnou osobu provádějící akci, k níž ve skutečnosti nedošlo"[22]
- V září 2019 Yle, finský veřejnoprávní vysílací společnost, vysílaný jako výsledek experimentu žurnalistika, deepfake prezidenta ve funkci Sauli Niinistö ve svém hlavním zpravodajství za účelem zdůraznění postupující dezinformační technologie a problémů, které z ní vyplývají.
- 1. ledna 2020[23] Kalifornie the státní právo AB-602 vstoupil v platnost zákaz výroby a rozdělení syntetické pornografie bez souhlas zobrazených lidí. AB-602 poskytuje obětem syntetické pornografie soudní zákaz a představuje právní hrozbu statutární a represivní náhradu škody na zločinci vytváření nebo distribuce syntetické pornografie bez souhlasu. Návrh zákona AB-602 byla podepsána do práva v Kalifornii Guvernér Gavin Newsom 3. října 2019 a autorem je Kalifornské státní shromáždění člen Marc Berman.[24]
- 1. ledna 2020Čínské právo vyžadující, aby synteticky falešné záběry měly jasně upozorňovat na jejich falešnost, vstoupilo v platnost. Nedodržení lze považovat za zločin the Správa kyberprostoru v Číně uvedeno na svých webových stránkách. Čína oznámila tento nový zákon v listopadu 2019.[25] Zdá se, že čínská vláda si vyhrazuje právo stíhat uživatele i online video platformy nedodržování pravidel. [26]
- V červenci 2020 the moondisaster.org projekt od MIT je Centrum pokročilé virtuality vydává syntetický faleš podobný člověku ve vzhledu a téměř ve zvuku Nixon. (zobrazit celý film V případě měsíční katastrofy na Youtube.com)
- V listopadu 2020 the Partnerství v oblasti umělé inteligence zveřejnil své Databáze incidentů AI (AIID) ve společnosti IncidentDatabase.ai.[27]
Klíčový průlom k fotorealismu: zachycení odrazivosti

V roce 1999 Paul Debevec et al. USC udělal první známý zachycení odrazivosti přes lidskou tvář s jejich extrémně jednoduchými světelný stupeň. Svou metodu a výsledky prezentovali v SIGGRAPH 2000.[4]

Vědecký průlom vyžadoval nalezení podpovrchová světelná složka (simulační modely zevnitř mírně září), což lze zjistit pomocí znalosti, že světlo, které se odráží od vrstvy olej-vzduch, si zachovává polarizace a podpovrchové světlo ztrácí polarizaci. Vybaven pouze pohyblivým zdrojem světla, pohyblivou videokamerou, 2 polarizátory a počítačovým programem, který dělá extrémně jednoduchou matematiku, a byl získán poslední kus potřebný k dosažení fotorealismu.[4]
Pro věrohodný výsledek obě světla odráží z kůže (BRDF ) a v kůži (zvláštní případ BTDF ) které společně tvoří BSDF musí být zachyceny a simulovány.
Zachyťte

- 3D geometrie a textury jsou zachyceny na a 3D Modelka podle a 3D rekonstrukce metoda, jako je vzorkování cíl pomocí 3D skenování s RGB XYZ skener jako např Arius3d nebo Cyberware (textury z fotografií, nikoli čistý skener RGB XYZ), stereofotogrammetricky z synchronizované fotografie nebo dokonce z dostatečného počtu opakovaných nesimultánních fotky. Digitální sochařství lze použít k vytvoření modelů částí těla, pro které nelze získat data, např. části těla zakryté oděvem.
- Pro věrohodné výsledky také odrazové pole musí být zachyceny nebo musí být vybrána aproximace z knihoven, aby se vytvořil model odrazu cíle 7D.
Syntéza
Celý proces vytváření digitálních dvojníků, tj. Postav tak živých a realistických, že je lze předávat jako obrázky lidí, je velmi složitý úkol, protože vyžaduje fotorealisticky modelování, animovat, křížové mapování, a vykreslování the měkká dynamika těla lidského vzhledu.
Syntéza s herec a vhodné algoritmy se aplikuje pomocí mocného počítače. Hercovou součástí syntézy je postarat se o napodobování člověka výrazy v syntéze statických snímků a také lidském pohybu v film syntetizovat. K simulaci zákonů jsou potřeba algoritmy fyzika a fyziologie a podle toho mapovat modely a jejich vzhled, pohyby a interakci.
Často obojí fyzika /fyziologie založené (tj. kosterní animace ) a obrazové modelování a vykreslování jsou použity v syntetické části. Hybridní modely využívající oba přístupy ukázaly nejlepší výsledky v realističnosti a snadnosti použití. Morph cílová animace snižuje pracovní zátěž tím, že poskytuje vyšší úroveň kontroly, kde jsou různé výrazy obličeje definovány jako deformace modelu, což umožňuje intuitivní ladění výrazů. Animace morfového cíle pak může morfovat model mezi různými definovanými výrazy obličeje nebo tělními pózami, aniž by bylo nutné zasahovat člověka.
Použitím mapování posunutí hraje důležitou roli při získávání realistických výsledků s jemnými detaily pokožky, jako je póry a vrásky tak malé jako 100 µm.
Přístup strojového učení
V pozdních 2010s, strojové učení a přesněji generativní nepřátelské sítě (GAN), byly použity NVIDIA produkovat náhodné, ale fotorealistické portréty podobné člověku. Systém pojmenovaný StyleGAN, byl vyškolen v databázi 70 000 obrázků z webu úschovny obrázků Flickr. Zdrojový kód byl zveřejněn dne GitHub v roce 2019.[28] Výstupy generátorové sítě z náhodného vstupu byly veřejně dostupné na řadě webových stránek.[29][30]
Podobně od roku 2018 deepfake technologie umožnila sítím GAN vyměňovat si tváře mezi aktéry; v kombinaci se schopností předstírat hlasy mohou GAN generovat falešná videa, která se zdají být přesvědčivá.[31]
Aplikace
Hlavní aplikace spadají do domén stock photography, syntetické datové sady, virtuální kinematografie, počítač a videohry a skryté dezinformace útoky.[32][33]
Některé výzkumy dále naznačují, že to může mít terapeutické účinky tak jako "psychologové a poradci také začali používat avatary poskytovat terapii klientům, kteří mají fóbie, historie trauma, závislosti, Aspergerův syndrom nebo sociální úzkost."[34] Silný otisk paměti a účinky aktivace mozku způsobené sledováním vašeho podobného digitálního avatara se vám přezdívá Doppelgängerův efekt.[34] Doppelgängerův efekt se může léčit, když je skrytý dezinformační útok vystaven jako takový cílům útoku.
Související problémy
The syntéza řeči od zavedení aplikace pro úpravu a generování hlasu v roce 2016 se v podstatě odlišuje od záznamu skutečného lidského hlasu Adobe Voco, prototyp, který má být součástí Adobe Creative Suite a DeepMind WaveNet, prototyp z Google.[35]Schopnost krást a manipulovat hlasy jiných lidí vyvolává zjevné etické obavy.[36]
V roce 2018 Konference o systémech zpracování neurálních informací (NeurIPS) vědci z Google představil práci „Přenos učení z ověřování reproduktorů na syntézu převodu textu na řeč více reproduktorů“, který přenáší učení z ověření mluvčího k dosažení syntézy textu na řeč, kterou lze znít téměř jako kdokoli ze vzorku řeči pouhých 5 sekund (poslouchat). [37]
Získávání obrázků pro trénink AI vyvolává otázku soukromí, protože lidé, kteří se používají k tréninku, nesouhlasili.[38]
Digitální podobné zvuky technologie se dostala do rukou zločinců jako v roce 2019 Symantec vědci věděli o 3 případech, kdy byla technologie použita zločin.[39][40]
To spolu se skutečností, že (od roku 2016) techniky, které umožňují téměř v reálném čase padělání z výrazy obličeje ve stávajícím 2D videu bylo věrohodně prokázáno, že zvyšuje důraz na dezinformační situaci.[11]
Viz také
- Motion-capture herectví
- Internetová manipulace
- Mediální syntéza
- Propagandistické techniky
- 3D sběr dat a rekonstrukce objektů
- 3D rekonstrukce z více obrázků
- Odhad pozice 3D obecně a odhad pozice kloubového těla zvláště pokud jde o zachycení lidské podoby.
- 4D rekonstrukce
- Sledování prstů
- Rozpoznávání gest
- StyleGAN
Reference
- ^ Fyzikální model svalů pro kontrolu tvaru úst na IEEE Prozkoumat (vyžaduje členství)
- ^ Realistická 3D animace obličeje v telekonferencích ve virtuálním prostoru na IEEE Prozkoumat (vyžaduje členství)
- ^ „Images de synthèse: palme de la longévité pour l'ombrage de Gouraud“.
- ^ A b C Debevec, Paule (2000). „Získání odrazového pole lidské tváře“. Sborník 27. výroční konference Počítačová grafika a interaktivní techniky - SIGGRAPH '00. ACM. str. 145–156. doi:10.1145/344779.344855. ISBN 978-1581132083. S2CID 2860203. Citováno 2017-05-24.
- ^ Pighin, Frédéric. „Poznámky ke kurzu digitálního klonování obličeje Siggraph 2005“ (PDF). Citováno 2017-05-24.
- ^ V tomto videozáznamu TED v 00:04:59 uvidíte dva klipy, jeden se skutečnou Emily pořízenou skutečnou kamerou a druhý s digitálním vzhledem Emily, pořízený simulací kamery - Což je těžké říct. Bruce Lawmen byl skenován pomocí světelného stupně USC 6 v klidové poloze a také tam zaznamenal běh na a běžecký pás. Mnoho, mnoho digitálních dvojníků Bruce je vidět, jak běží plynule a přirozeně při pohledu na konečnou sekvenci TED talk videa.
- ^ ReForm - Hollywood vytváří digitální klony (Youtube). Projekt tvůrců. 2017-05-24.
- ^ Debevec, Paule. „Digital Ira SIGGRAPH 2013 Real-Time Live“. Citováno 2017-05-24.
- ^ „Skenování a tisk 3D portrétu prezidenta Baracka Obamy“. University of Southern California. 2013. Citováno 2017-05-24.
- ^ Giardina, Carolyn (2015-03-25). "'Furious 7 'and How Peter Jackson's Weta Created Digital Paul Walker ". The Hollywood Reporter. Citováno 2017-05-24.
- ^ A b Thies, Justus (2016). „Face2Face: Zachycení tváře v reálném čase a rekonstrukce videa RGB“. Proc. Počítačové vidění a rozpoznávání vzorů (CVPR), IEEE. Citováno 2017-05-24.
- ^ Suwajanakorn, Supasorn; Seitz, Steven; Kemelmacher-Shlizerman, Ira (2017), Synthesizing Obama: Learning Lip Sync from Audio, University of Washington, vyvoláno 2018-03-02
- ^ Roettgers, Janko (2018-02-21). „Producenti pornografie nabízejí pomoc Hollywoodu sundat hluboko falešná videa“. Odrůda. Citováno 2018-02-28.
- ^ Takahashi, Dean (2018-03-21). „Epic Games předvádí úžasného digitálního člověka v reálném čase s ukázkou sirény“. VentureBeat. Citováno 2018-09-10.
- ^ Kuo, Lily (09.11.2018). „První čínská kotva zpráv o AI odhalena v Číně“. Citováno 2018-11-09.
- ^ Hamilton, Isobel Asher (09.11.2018). „Čína vytvořila to, co tvrdí, že je první kotvou zpravodajství o AI - sledujte ji zde. Citováno 2018-11-09.
- ^ Harwell, Drew (2018-12-30). „Falešná porno videa jsou zbrojena za účelem obtěžování a ponižování žen:„ Každý je potenciálním cílem'". The Washington Post. Citováno 2019-03-14.
V září [z roku 2018] přidal Google na svůj seznam zákazů „nedobrovolné syntetické pornografické snímky“
- ^ „NVIDIA Open-Sources Hyper-Realistic Face Generator StyleGAN“. Medium.com. 2019-02-09. Citováno 2019-10-03.
- ^ A b Paez, Danny (2019-02-13). „Tato osoba neexistuje, je nejlepší jednorázový web roku 2019“. Inverzní (web). Citováno 2018-03-05.
- ^ „Nové státní zákony vstupují v platnost 1. července“.
- ^ A b „§ 18.2-386.2. Protiprávní šíření nebo prodej obrazů jiného; pokuta“. Virginie. Citováno 2020-01-01.
- ^ „V souvislosti s vytvořením trestného činu za vytvoření klamného videa se záměrem ovlivnit výsledek voleb“. Texas. 2019-06-14. Citováno 2020-01-02.
V této části se „hlubokým falešným videem“ rozumí video vytvořené s úmyslem oklamat, které zřejmě zobrazuje skutečnou osobu provádějící akci, k níž ve skutečnosti nedošlo
- ^ Johnson, R.J. (2019-12-30). „Tady vstoupí v platnost nové kalifornské zákony v roce 2020“. KFI. iHeartMedia. Citováno 2020-01-01.
- ^ Mihalcik, Carrie (10. 10. 2019). „Kalifornské zákony se snaží zakročit proti padělání v politice a pornografii“. cnet.com. CNET. Citováno 2019-10-14.
- ^ „Čína se snaží pomocí nových pravidel pro online obsah vykořenit falešné zprávy a falešné zprávy“. Reuters.com. Reuters. 2019-11-29. Citováno 2019-12-08.
- ^ Statt, Nick (29.11.2019). „Čína zveřejňuje hluboké nebo falešné zprávy bez vyzrazení jako trestný čin“. The Verge. Citováno 2019-12-08.
- ^ McGregor, Sean (2020-11-18). „Když selžou systémy AI: Představujeme databázi incidentů AI“. partnershiponai.org. Partnerství v oblasti umělé inteligence. Citováno 2020-11-21.
Vyhnout se opakovaným selháním AI vyžaduje oznámení minulých selhání. Proto dnes představujeme systematizovanou sbírku incidentů, kdy inteligentní systémy způsobily bezpečnost, spravedlnost nebo jiné problémy v reálném světě: AI Incident Database (AIID).
- ^ Synchronizováno (2019-02-09). „NVIDIA Open-Sources Hyper-Realistic Face Generator StyleGAN“. Synchronizováno. Citováno 2020-08-04.
- ^ Veřejná prezentace webových stránek StyleGAN
- ^ Porter, Jon (2019-09-20). „100 000 bezplatných headshotů generovaných umělou inteligencí upozorňuje akciové společnosti na fotografie“. The Verge. Citováno 2020-08-07.
- ^ „Co je to Deepfake?“. PCMAG.com. Březen 2020. Citováno 8. června 2020.
- ^ Harwell, Drew. „Aplikace pro seznamování potřebují ženy. Inzerenti potřebují rozmanitost. Společnosti AI nabízejí řešení: Falešní lidé“. Washington Post. Citováno 2020-08-04.
- ^ Porter, Jon (2019-09-20). „100 000 bezplatných headshotů generovaných umělou inteligencí upozorňuje akciové společnosti na fotografie“. The Verge. Citováno 2020-08-07.
- ^ A b Murphy, Samantha (2011). „Scientific American: Váš avatar, váš průvodce“ (.pdf). Scientific American / Uni of Stanford. Citováno 2013-06-29.
- ^ „WaveNet: Generativní model surového zvuku“. Deepmind.com. 2016-09-08. Citováno 2017-05-24.
- ^ „Adobe Voco„ Photoshop pro hlas “vyvolává obavy“. BBC.com. BBC. 2016-11-07. Citováno 2016-07-05.
- ^ Jia, Ye; Zhang, Yu; Weiss, Ron J. (06.06.2018), „Transfer Learning from Speaker Verification to Multispeaker Text-to-Speech Synthesis“, Pokroky v systémech zpracování neurálních informací, 31: 4485–4495, arXiv:1806.04558, Bibcode:2018arXiv180604558J
- ^ Obchod, Rachel Metz, CNN. „Pokud je váš obrázek online, může to být trénink AI pro rozpoznávání obličeje.“. CNN. Citováno 2020-08-04.
- ^ „Falešné hlasy pomáhají internetovým podvodníkům ukrást peníze'". bbc.com. BBC. 2019-07-08. Citováno 2020-04-16.
- ^ Drew, Harwell (2020-04-16). „Nejprve umělá inteligence: software napodobující hlas se údajně používá při velké krádeži“. washingtonpost.com. Washington Post. Citováno 2019-09-08.