Thomas Huang - Thomas Huang
Thomas Shi-Tao Huang (tradiční čínština : 黃 煦 濤; zjednodušená čínština : 黄 煦 涛; pchin-jin : Huáng Xùtāo, 26. června 1936 - 25. dubna 2020) byl čínský americký elektrotechnik a počítačový vědec. Byl výzkumným pracovníkem a emeritním profesorem na University of Illinois v Urbana-Champaign (UIUC). Huang byl jednou z vedoucích osobností počítačové vidění, rozpoznávání vzorů a interakce člověka s počítačem.[1]
raný život a vzdělávání
Huang se narodil 26. června 1936 v Šanghaj, Čínská republika.[2] V roce 1949 se jeho rodina přestěhovala do Tchaj-wan. Huang studoval elektroniku na Národní tchajwanská univerzita a přijal jeho bakalářský titul v roce 1956.[3]
Huang pokračoval do Spojených států studovat na Massachusetts Institute of Technology (MIT). Na MIT pracoval zpočátku s Peter Elias, který měl zájem teorie informace a kódování obrazu a poté s William F. Schreiber. V té době nebylo skenovací zařízení komerčně dostupné, takže bylo nutné postavit skener pro digitalizaci a reprodukci obrázků. Počítačové programy byly napsány montážní jazyk pomocí prototypu Lincoln Lab TX-0 počítač. Popisy digitalizovaných obrázků byly uloženy na papírová páska s děrovanými otvory.[3] Na Huanga dohlížel Schreiber jak pro jeho M.S. teze, Statistika obrázků a lineárně interpolativní kódování (1960),[4] a jeho Sc.D. teze, Obrazový šum (1963).[5] Jeho magisterská práce se zaměřila na algoritmy pro kódování obrazu pomocí adaptivních technik pro interpolaci s citlivostí na hrany. Jeho doktorát zahrnoval práci na subjektivních účincích obrazového šumu napříč spektrem.[3]
Kariéra
Huang přijal místo na fakultě katedry elektrotechniky na MIT a zůstal tam od roku 1963 do roku 1973.[3] Přijal místo profesora elektrotechniky a ředitele Laboratoře zpracování informací a signálů na Purdue University v roce 1973, zůstal tam až do roku 1980.[3]
V roce 1980 přijal Huang židli v elektrotechnice na University of Illinois v Urbana-Champaign (UIUC).[3] 15. dubna 1996 se Huang stal prvním významným profesorem William L. Everitt v oboru elektrotechniky a počítačového inženýrství na UIUC.[6] Byl zapletený s Koordinovaná vědecká laboratoř (CSL) a působil jako vedoucí skupiny Image Formation and Processing Group v Beckman Institute for Advanced Science and Technology a spolupředseda výzkumné dráhy Beckman Institute o inteligentní interakci s počítačem.[7][8] Od roku 2012 byl jmenován Swanlund Chair, nejvyšší obdařený titul na UIUC.[9][10] Huang odešel z výuky od prosince 2014, ale nadále působil jako výzkumný pracovník.[11]
https://www.asiainsurancereview.com/Magazine/ReadMagazineArticle?aid=39402 Huang byl zakládajícím redaktorem International Journal of Computer Vision, Graphics and Image Processinga společnosti Springer-Verlag Springer Series v informačních vědách. Pomohl uspořádat první mezinárodní sympozium pro kódování obrázků (1969), první mezinárodní seminář o kódování videa s velmi nízkou bitovou rychlostí (1993) a první mezinárodní konferenci o automatickém rozpoznávání tváře a gest (1995), které se staly opakovanými událostmi.[7]
Výzkum
Huangův výzkum se zaměřuje na vývoj obecných konceptů, metodik, teorií a algoritmů, které mají široké uplatnění pro multimodální a multimediální zpracování signálu.[3] Když byl ještě na MIT, vyvinul první algebraický postup pro testování podmínek stability dvourozměrné filtry, založený na dvojité bilineární transformaci a metodě Ansell.[12] Publikoval také na digitální holografie.[13] Během pobytu na Purdue pracoval nelineární filtry, zejména střední filtry, který se stal standardní technikou pro odstranění šumu v obrazech.[14]
Některými z jeho nejranějších prací se zabýval komprese obrazu, rozšiřující se později do oblastí vylepšení, restaurování a analýzy. Vyvinul přístupy pro binární kompresi dokumentů, které využívaly dvourozměrné naskenované informace, zkoumaly změny z jednoho řádku skenování do druhého a detekovaly přechodové body, ve kterých se liší následující řádek. Statistické předpovědi a experimentální výsledky výkonu modelu odpovídaly dobře.[3] V roce 1969 byli Huang a Grant Anderson jedním z prvních týmů, které navrhly metodu blokování transformovat kódování,[15] navazující na práci J. J. Y. Huanga a Petera M. Schultheissa.[16][17]
V roce 1984 Tsai a Huang jako první představili vícerámcovou metodu s frekvenční doménou, která se týkala diskrétní Fourierova transformace pozorovaného nízkého rozlišení satelitní snímky od fáze akvizice po kontinuální Fourierovu transformaci obrazu s vysokým rozlišením pomocí inverzní Fourierova transformace získat konečný obraz se zvýšeným rozlišením.[18][19] Huang také pracoval vlnka metody kódování a další fraktální kódování. Waveletové kódování je zvláště důležité pro načítání obrázků na základě obsahu z multimediální databáze obsahující obrázky, video, zvuk a text. Umožňuje vyhledávat spíše na menších kódovaných obrázcích než na načtených obrázcích v plné velikosti.[3] Mezi další důležité oblasti výzkumu patří použití relevantní zpětná vazba při přizpůsobování databázových systémů záměrům uživatelů (při procházení nebo vyhledávání),[20] a konstrukce obsahu a sémantických indexů pro video pomocí multimediálních informací (posloupnost obrázků, zvuk a skryté titulky, pokud jsou k dispozici).[21]
V oblasti trojrozměrného modelování pracoval Huang na identifikaci trojrozměrného pohybu a struktuře tuhých objektů s více obrazy, na kterých lze identifikovat odpovídající prvky.[22] Tato práce byla důležitá pro kompresi televizních obrazů, pro vývoj obrazových standardů a pro výzkum lidského a počítačového vidění.[3] Huang také pracoval na 3-D modelování, analýze a syntéze obrazů lidské tváře, rukou a těla. Počáteční motivací tohoto výzkumu byla podpora kódování videa na 3D modelu s nízkým datovým tokem pro videotelefony a telekonference. Myšlenka byla, že pokud by mohl být na přijímacím konci vysílán a rekonstruován 3-D model uživatele, pak by stačilo extrahovat a odeslat informace o pohybu k řízení 3D modelu a regeneraci videosekvence. Nástroje vyvinuté pro tento typ scénářů jsou použitelné i pro mnoho dalších problémů, včetně konferencí o virtuálním prostoru s avatary a elektronických her.[23]
Huang považoval zpracování obrazu a řeči za zásadně podobné,[3] a pracoval s rozpoznáváním řeči a zpracováním zvuku i s obrázky. Huang, Mark Hasegawa-Johnson a jejich studenti vytvořili databázi řeči zaznamenanou v automobilech, která je použitelná jako měřítko pro testování audiovizuálních algoritmů rozpoznávání řeči.[24] Také vyvinuli metody pro detekci zvukových prvků, které pravděpodobně upoutají pozornost člověka, a používají je k tomu, aby lidem umožnily efektivněji procházet velkým množstvím zvukových záznamů a najít důležité informace.[25]
Huang odvedl důležitou práci v multimodálním režimu interakce člověka s počítačem a design rozhraní.[26] Byl jedním z prvních výzkumníků, kteří kombinovali zvukové a video techniky pro identifikaci lidských afektivních stavů.[27] Novější práce Huanga a dalších se pokouší „vyvinout řadu algoritmů pro optimální získání informací z multimodality“,[28] prověřování velkého množství dat z více zdrojů a optimalizace typů a množství dat, která jsou komprimována a přenášena. Takovýto oportunistický průzkum má použití jak pro vojenské, tak pro civilní použití.[28][29]
Huang také doufal, že vyvine přirozenější a efektivnější způsoby interakce člověka s počítačem nebo virtuálním prostředím pomocí řeči a gesta.[3] Výzkumné projekty zahrnují vizuální sledování rukou a rozpoznávání gest;[30] použití vizuálního čtení rtů ke zvýšení přesnosti rozpoznávání zvukové řeči; a integrace rozpoznávání řeči a vizuální analýza gest při ovládání displejů ve virtuálních prostředích.[23]
Pracoval také na audiovizuálním rozpoznávání pohlaví, věkové skupiny a emocí. Jeho práce v oblasti pohlaví a detekce emocí získal pozornost médií, když byl jeho software použit k prozkoumání Mona Lisa, k závěru, že portrét byl ženy (ne, jak někteří domnívali, na základě Da Vinci sám) a že její záhadný úsměv byl více šťastný než smutný.[31][32]
V roce 2015 Huang spolupracoval s Ann Willemsen-Dunlap v interdisciplinárním projektu na vývoji 3D počítačově generovaného avatara, který je schopen prokázat vhodné emoce a který bude použit při online komunikaci lékařských informací s pacienty.[33]
Rovněž prozkoumal použití vysoce výkonné výpočty a velká data vyvinout lepší techniky pro hluboké učení.[11] Není divu, že jedním ze studovaných úkolů je rozpoznávání tváře. V dalším projektu pracuje jeho tým astronom Robert Brunner trénovat a dopředná neuronová síť identifikovat obrázky galaxie.[34]
Publikovaná práce
Prostředky knihovny o Thomas Huang |
Thomas Huang |
---|
Od roku 2010[Aktualizace] Huang vydal více než 21 knih a byl autorem na více než 600 příspěvcích.[35] Reprezentativní publikace Thomase Huanga zahrnují:
- Qi, G. J., Aggarwal, C., Tian, Q., Ji, H., Huang, T. S. (2012), „Exploring Context and Content Links in Social Media: a Latent Space Method“, Transakce IEEE na analýze vzorů a strojové inteligenci, str. 850–862.
- Jaimes, A., Gatica-Perez, D., Sebe, N., Huang, T.S. (2007), „Výpočet zaměřený na člověka: Směrem k lidské revoluci“, IEEE Computer, 40 (5), str. 30–34.
- Cohen, I., Cozman, F., Sebe, N., Cirelo, M., Huang, T.S. (2004), „Semi-supervised Learning of Classifiers: Theory, Algorithms and their Applications to human-computer Interaction“, Transakce IEEE na analýze vzorů a strojové inteligenci, 26 (12), str. 1553–1567.
- Pan, H., Levinson, S.E., Huang, T.S. a Liang, Z.P. (2004), „Fúzovaný model HMM s aplikací na zpracování bimodální řeči,“ IEEE Transakce při zpracování signálu, 52/3, str. 573– 581.
- Zhou, X.S. a Huang, T.S. (2003), „Relevance Feedback in Image Retrieval: A Comprehensive Review,“ ACM Multimedia Systems Journal, str. 536–544.
- Bruckstein, A.M., Holt, R.J., Huang, T.S. a Netravali, A.N. (2000), „New Devices for 3D Pose Estimation: Mantis Eyes, Agam Paintings, Sundials, and Other Space Fiducials,“ International Journal of Computer Vision, pp. 131–139.
- Rui, Yong; Huang, Thomas S .; Chang, Shih-Fu (1999). „Načítání obrázků: současné techniky, slibné směry a otevřené problémy“ (PDF). Journal of Visual Communication and Image Representation. 10: 39–62. CiteSeerX 10.1.1.32.7819. doi:10.1006 / jvci.1999.0413. Citováno 23. července 2015. - Tento dokument získal cenu Nejcitovanější papír dekády od organizace Journal of Visual Communication and Image Representation, 2010[35]
- Lew, M.S., Wong, K. a Huang, T.S. (1994), „Learning and Feature Selection in Stereo Matching,“ Transakce IEEE na analýze vzorů a strojové inteligenci, str. 869–881.
- Arun, K., Huang, T.S. a Blostein, S.D. (1987), „Least-Squares Fitting of Two 3-D Point Sets, Transakce IEEE na analýze vzorů a strojové inteligenci, str. 698–700.
- R. Y. Tsai a T.S. Huang, (1984) „Jedinečnost a odhad parametrů trojrozměrného pohybu tuhých objektů se zakřivenými povrchy“ Transakce IEEE na analýze vzorů a strojové inteligenci, s. 13–27.
Vyznamenání
Huang získal ve své kariéře řadu vyznamenání a ocenění, včetně:[36]
Členství
- Zahraniční člen, Čínská akademie věd, 2002[37]
- Zahraniční člen, Čínská akademie inženýrství, 2001
- Člen, United States National Academy of Engineering, 2001[38][39]
- Chlapík, Japonská společnost pro podporu vědy, 1986
- Chlapík, SPIE
- Kolega, Mezinárodní asociace pro rozpoznávání vzorů (IAPR )
- Chlapík, Optická společnost Ameriky, 1986
- Životní kolega, IEEE, 1979
Ocenění
- Cena Azriel Rosenfeld, 2011
- Cena HP Innovation Research Award 2009[40]
- Picture Coding Symposium: Pioneering Research in Picture Coding Award, 2006
- Stojím SPIE Ocenění Scientist of the Year Award, 2006[41]
- Cena Okawa za informační a telekomunikační technologie, 2005[42]
- Tau Beta Pi Cena fakulty Daniela C. Druckera, 2005.
- Cena Pan Wen-Yuan za mimořádný výzkum, Nadace Pan Wen-Yuan, 2002
- Cena King-Sun Fu, Mezinárodní asociace pro rozpoznávání vzorů (IAPR ), 2002[43]
- Cena za informační vědu, Asociace inteligentních strojů, 2002
- Medaile za zpracování signálu IEEE Jacka S. Kilbyho 2001 (společně s Arun N. Netravali )[44][45]
- IEEE Cena za přínos k analýze pohybu, 2000
- IEEE Třetí medaile tisíciletí, 2000
- Cena Společnosti, Společnost pro zpracování signálů IEEE, 1991
- IEEE Cena technického úspěchu společnosti ASSP, 1988
- Cena amerického vědce A. V. Humboldta, 1976–77
- Guggenheim Fellow, 1971–72
Ocenění pojmenována
Huang dohlížel na více než 100 postgraduálních studentů. V roce 2012 byl vytvořen Fond pro postgraduální výzkum Thomase a Margaret Huangových v reakci na výzvy bývalých studentů Jamese J. Kucha a Chang Wen Chena, aby oslavili příspěvky Huanga a jeho manželky jako mentorů a učitelů, jakož i jeho příspěvků jako výzkumník. Fond poskytne stipendia na podporu studentů v oblasti inteligentních interakcí člověk-počítač v Beckmanově institutu.[46][47]
Reference
- ^ Bovik, Alan C .; Chen, Chang Wen; Goldgof, Dmitry (2002). Bovik, Alan C .; Chen, Chang Wen; Goldgof, Dmitry (eds.). Pokroky ve zpracování obrazu a porozumění: Festschrift pro Thomase S. Huanga. Série ve strojovém vnímání a umělé inteligenci. 52. Singapur: World Scientific. doi:10.1142/5042. ISBN 978-981-238-091-3.
- ^ Zprávy prezidenta a pokladníka. John Simon Guggenheim Memorial Foundation. 1971. s. 56.
- ^ A b C d E F G h i j k l Goldstein, Andrew (20. března 1997). „THOMAS HUANG: Rozhovor provedený Andrewem Goldsteinem (Rozhovor č. 331 pro Centrum pro dějiny elektrotechniky)“. Centrum pro dějiny elektrotechniky. Hoboken, NJ: The Institute of Electrical and Electronics Engineers, Inc.. Citováno 22. července 2015.
- ^ Huang, Thomas Shi-Tao (1960). Statistika obrázků a lineární interpolační kódování (Diplomová práce ed.). Cambridge, Massachusetts: Massachusetts Institute of Technology, Katedra elektrotechniky.
- ^ Huang, Thomas Shi-Tao (1963). Obrazový šum (Sc.D. Diplomová práce ed.). Cambridge, Massachusetts: Massachusetts Institute of Technology, Katedra elektrotechniky.
- ^ „Profesorství: William L. Everitt profesor elektrotechniky“. ECE Illinois. University of Illinois. 1996. Citováno 23. července 2015.
- ^ A b Xiong, Ziyou; Radhakrishnan, Regunathan; Divakaran, Ajay; Rui, Yong; Huang, Thomas S. (2006). „O autorech“. Jednotný rámec pro shrnutí videa, procházení a načítání s aplikacemi pro spotřebitelské a sledovací video. Amsterdam: Elsevier / Academic Press. 263–264. ISBN 978-0-12-369387-7.
- ^ „Adresář institutu Beckman: Thomas S. Huang“. Beckman Institute pro pokročilé vědy a technologie. Citováno 28. května 2010.
- ^ „Pět profesorů jménem Swanlund Chairs“. News-Gazette. 2012-12-05. Citováno 23. července 2015.
- ^ „Chair: Swanlund Chair“. ECE Illinois. Citováno 23. července 2015.
- ^ A b Valentine, Ashish (5. prosince 2014). „Loui, Huang a Polychronopoulos odcházejí z výuky na ECE Illinois“. ECE Illinois. Citováno 27. července 2015.
- ^ Huang, T. (červen 1972). "Stabilita dvourozměrných rekurzivních filtrů". Transakce IEEE se zvukem a elektroakustikou. 20 (2): 158–163. doi:10.1109 / TAU.1972.1162364.
- ^ Huang, T.S. (1971). "Digitální holografie". Sborník IEEE. 59 (9): 1335–1346. doi:10.1109 / PROC.1971.8408.
- ^ Huang, T .; Yang, G .; Tang, G. (1979). "Rychlý dvourozměrný mediánový algoritmus filtrování". Transakce IEEE na akustiku, řeč a zpracování signálu. 27 (1): 13–18. doi:10.1109 / tassp.1979.1163188.
- ^ Anderson, Grant; Huang, Thomas S. (1971). Msgstr "Obrázek komprese šířky pásma po částech Fourierova transformace". Transakce IEEE na komunikaci. 19 (2): 133–140. doi:10.1109 / tcom.1971.1090630.
Předchozí verze tohoto příspěvku se objevila ve sborníku Centennial Symposium University of Purdue o systémech a informačních vědách, které se konalo 28. – 30. Dubna 1969.
- ^ Huang, J. J. Y .; Schultheiss, Peter M. (1963). "Blokovat kvantování korelovaných Gaussových náhodných proměnných". Transakce IEEE na komunikačních systémech. 11 (3): 289–296. doi:10.1109 / tcom.1963.1088759.
- ^ Nebeker, Frederik (1998). „Going Digital: The 1960s“ (PDF). Zpracování signálu: Vznik disciplíny, 1948-1998. Piscataway, NJ: IEEE Press. str. 55–87. Archivovány od originál (PDF) dne 25. července 2015. Citováno 24. července 2015.
- ^ Tsai, R .; Huang, T. (1984). Msgstr "Obnova a registrace vícekrálového obrazu". Pokroky v počítačovém vidění a zpracování obrazu. JAI Press Inc. str. 317–339.
- ^ Pokročilé techniky vylepšení obrazu a videa, Quang H. Luong
- ^ Zhou, Xiang Sean; Huang, Thomas S. (1. dubna 2003). "Relevantní zpětná vazba při načítání obrázků: Komplexní recenze". Multimediální systémy. 8 (6): 536–544. CiteSeerX 10.1.1.89.8025. doi:10.1007 / s00530-002-0070-3. S2CID 9664339.
- ^ Xiong, Ziyou; Radhakrishnan, Regunathan; Divakaran, Ajay; Rui, Yong; Huang, Thomas S. (2006). Jednotný rámec pro shrnutí videa, procházení a načítání s aplikacemi pro spotřebitelské a sledovací video. Amsterdam: Elsevier / Academic Press. ISBN 978-0-12-369387-7.
- ^ Huang, T.S .; Netravali, A.N. (2002). Msgstr "Pohyb a struktura z korespondence prvků: recenze". Sborník IEEE. 82 (2): 252–268. doi:10.1109/5.265351.
- ^ A b Wen, Zhen; Huang, Thomas S. (2004). 3D zpracování tváře: modelování, analýza a syntéza. Boston: Kluwer Academic Publishers. ISBN 978-1402080470.
- ^ Lee, B .; Hasegawa-Johnson, M .; Goudeseune, C .; Kamdar, S .; Borys, S .; Liu, M .; Huang, T. S. (2004). AVICAR: audiovizuální korpus řeči v prostředí automobilu. INTERSPEECH: ISCA.
- ^ Dickinson, Meg. „Studie určují, jaké zvuky přitahují pozornost, jak je přesně určit“. ECE Illinois (17. února 2014). Citováno 27. července 2015.
- ^ Sharma, R .; Pavlovic, V.I .; Huang, T.S. (Květen 1998). "Směrem k multimodálnímu rozhraní člověk-počítač". Sborník IEEE. 86 (5): 853–869. doi:10.1109/5.664275.
- ^ Huang, Thomas S .; Chen, Lawrence S .; Tao, Hai (duben 1998). "Rozpoznávání bimodálních emocí člověkem a strojem". Sborník seminářů ATR o virtuálních komunikačních prostředích.
- ^ A b Kelly, Megan (14. prosince 2009). „Fakulta ECE dostává grant ministerstva obrany ve výši 1,5 milionu USD na studium oportunistického snímání“. ECE Illinois. Citováno 27. července 2015.
- ^ Dahlquist, duben (8. srpna 2011). „Matematika vs. divočina: Vědci používají k identifikaci divočiny počítačové vidění“. ECE Illinois. Citováno 27. července 2015.
- ^ Pavlovic, V.I .; Sharma, R .; Huang, T.S. (Červenec 1997). "Vizuální interpretace gest rukou pro interakci člověka s počítačem: recenze". Transakce IEEE na analýze vzorů a strojové inteligenci. 19 (7): 677–695. doi:10.1109/34.598226.
- ^ Kline, Greg (6. března 2006). „Software ukazuje, že Mona Lisa není ani muž, ani da Vinci“. News-Gazette. Citováno 27. července 2015.
- ^ Beckman Institute na University of Illinois (2005). „Profil výzkumu: Thomas Huang“ (PDF). Výroční zpráva 2005-06. University of Illinois v Urbana-Champaign. 18–19.
- ^ „Jump ARCHES financuje Huangův 3-D avatarový projekt“. CSL: Coordinated Science Lab, ECE Illinois. 24. února 2015. Citováno 23. července 2015.
- ^ Koon, Mike (11. listopadu 2014). „Superpočítač zrychluje pokrok v hlubokých neuronových sítích“. Engineering Communications Office, Illinois. Citováno 27. července 2015.
- ^ A b „Huang vyhrál nejcitovanější referát Dekády“. Beckman Institute. 30. června 2010.
- ^ „Thomas S. Huang“. ECE Illinois, Department of Electrical and Computer Engineering. Citováno 28. května 2010.
- ^ "Adresář zahraničních členů CAS v roce 2009 (podle příjmení)". Čínská akademie věd. Citováno 23. července 2015.
- ^ „National Academy of Engineering Volí 74 členů a osm zahraničních spolupracovníků“. Novinky National Academy of Engineering. 16. února 2001. Citováno 23. července 2015.
- ^ „Dr. Thomas S. Huang“. National Academy of Engineering. Citováno 23. července 2015.
- ^ Gudeman, Kim (16. června 2009). „Tři vědci CSL vyhrávají ceny HP Labs Innovation Research Awards“. CSL: Coordinated Science Laboratory. Citováno 23. července 2015.
- ^ „Huang jmenován vědcem roku EI“. Beckman Institute. 3. února 2006. Citováno 23. července 2015.
- ^ „Cena Okawa“. Nadace Okawa pro informace a telekomunikace. Citováno 23. července 2015.
- ^ „Ceny IAPR: Cena King-Sun Fu“. Mezinárodní asociace pro rozpoznávání vzorů (IAPR). Citováno 23. července 2015.
- ^ „Příjemci medaile IEEE Jack S. Kilby za zpracování signálu“ (PDF). IEEE. Citováno 27. února 2011.
- ^ „Příjemci medaile za zpracování signálu IEEE Jack S. Kilby - 2001 - Thomas S. Huang a Arun N. Netravali“. IEEE. Citováno 27. února 2011.
- ^ McGaughey, Steve (8. ledna 2012). „Fond Huang a výzva jsou poctou originálu Beckman“. Beckman Institute.
- ^ „Fond Thomase a Margaret Huangových pro postgraduální výzkum“. Beckman Institute. Citováno 23. července 2015.