Hermann Moisl - Hermann Moisl
Dr. Hermann Moisl je v důchodu [1] Odborný asistent a hostující pracovník v Lingvistika na Newcastle University. Byl vzděláván na různých ústavech, včetně Trinity College v Dublinu a University of Oxford.
Mezi výzkumné zájmy patří mimo jiné: výpočetní lingvistika, Zpracování přirozeného jazyka, korpusová lingvistika, kulturní role gramotnost a Keltské jazyky a historie.
Byl klíčovým vyšetřovatelem Newcastle Electronic Corpus of Tyneside English Project po boku bývalé kolegyně profesorky Karen Corriganové, profesorky lingvistiky a anglického jazyka.
Další odborné znalosti
Starý / Střední angličtina a Starý irský / Střední irský jazyk a literatura.
Vybrané publikace
- Moisl HL, Maguire W, Allen W. Fonetická variace v Tyneside: Průzkumná vícerozměrná analýza Newcastle Electronic Corpus of Tyneside English. In: Frans Hinskens, ed. Jazyková variace - Evropské perspektivy: Vybrané příspěvky ze třetí mezinárodní konference o jazykových variacích v Evropě (ICLaVE 3), Amsterdam, červen 2005. Amsterdam: John Benjamins Publishing Co, 2006, s. 127–141.
- Moisl HL, Maguire W. Identifikace hlavních determinantů fonetické variace v Newcastle Electronic Corpus of Tyneside English. Journal of Quantitative Linguistics 2008, 15, 46-69
- Moisl HL, Jones VM. Cluster Analysis of Newcastle Electronic Corpus of Tyneside English: A Comparison of Methods. Literary and Linguistic Computing 2005, 20 (Suppl 1), 125-146
- Moisl HL. Průzkumná vícerozměrná analýza. In: Lüdeling A, Kytö M, ed. Korpusová lingvistika. International Handbook (Series: Handbücher zur Sprache und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science). Berlin: Mouton de Gruyter (v tisku), 2008.
- Moisl HL, Corrigan K, Beal J. The Newcastle Electronic Corpus of Tyneside English. Rada pro výzkum v oblasti umění a humanitních věd, 2005. Dostupné na: https://web.archive.org/web/20080925210840/http://www.ncl.ac.uk/necte/.
- Moisl HL. Lingvistické výpočty se stavovými kosmickými trajektoriemi. In: Stefan Wermter, Jim Austin, David Willshaw, ed. Naléhavé neurální výpočetní architektury založené na neurovědě: Směrem k výpočetní technice inspirované neurovědy. Springer, 2001, s. 442–460.
- Moisl HL. Lingvistické výpočty se stavovými kosmickými trajektoriemi. In: Stefan Wermter, Jim Austin, David Willshaw, ed. Naléhavé neurální výpočetní architektury založené na neurovědě: Směrem k výpočetní technice inspirované neurovědy. Springer, 2001, s. 442–460.
Projekty
Jazykový Časová kapsle: The Newcastle Electronic Corpus of Tyneside English (NECTE), AHRB project code RE11776 Vedoucí projektu: K. Corrigan, J. Beal, H. Moisl Postgraduate Supervision
Modelování přirozeným jazykem a zpracování textu. Moje specifické oblasti zájmu jsou porozumění přirozenému jazyku systémy a vícerozměrná analýza textových korpusů.
Kvalifikace
BA (McGill University ) MPhil (Trinity College v Dublinu ) DPhil (University of Oxford ) MSc (Newcastle University )
Postgraduální výuka
Postgraduální supervize
Modelování přirozeným jazykem a zpracování textu. Jeho specifickými oblastmi zájmu jsou systémy pro porozumění přirozenému jazyku a vícerozměrná analýza textových korpusů.
Vysokoškolská výuka
- SEL1007 Povaha jazyka
- SEL2008 Text a Hyper-textový
- SEL 2092 Výpočetní lingvistika
Současná práce
- Implementace porozumění přirozenému jazyku systémy využívající sekvence dynamického atraktoru
Dr. Moisl vyvíjí přísně sekvenční architekturu porozumění přirozenému jazyku, která se obejde bez dvou základních principů generativní lingvistiky, tradiční kognitivní vědy a velké části umělé inteligence - že řetězce přirozeného jazyka mají složitou syntaktickou strukturu zpracovávanou strukturně citlivými algoritmy a struktura je rozhodující při určování sémantiky řetězce. Tato sekvenční architektura byla původně uvedena z hlediska standardní teorie automatů jako systém spolupracujících automatů konečných stavů, ale v poslední době jsem se začal zajímat o neurovědeckou práci, která identifikuje trajektorii chaotického přitahovače ve stavovém prostoru jako základní princip funkce mozku na výše uvedené úrovni individuálního neuronu, což naznačuje, že smyslové zpracování a obecně vyšší kognice jsou implementovány spolupracujícími procesy atraktorové sekvence. Některé relevantní publikace jsou:
- Moisl, H., (1992) „Connectionist finite state natural language processing“, Connection Science 4, 67-91.
- Moisl, H., (1997) „Rekurentní neuronové sítě a zpracování přirozeného jazyka“, New Methods in Language Processing, ed. D. Jones & H. Somers, UCL Press, Londýn, 69-82
- Moisl, H., (2000) Handbook of Natural Language Processing, Marcel Dekker (s R. Daleem z Macquarie University a H. Somersem z UMIST)
- Moisl, H., (2001) 'Umělé neuronové sítě a zpracování přirozeného jazyka ', Encyclopedia of Library and Information Science, ed. M. Drake, Marcel Dekker (v tisku)
- Moisl, H., (2001) 'Jazykový výpočet with state space trajektories ', in Emergent Neural Computational Architectures based on Neuroscience, ed. Stefan Wermter, Jim Austin, David Willshaw, Springer, 2001
- Tvorba korpusu přirozeným jazykem
Spolu s Karen Corrigan z Newcastle University a Joan Beal z Sheffield University nedávno dokončil Newcastle Electronic Corpus of Tyneside English (NECTE), korpus dialektové řeči z Tyneside v severovýchodní Anglii. Je založen na dvou již existujících korpusech, jeden z nich shromáždil koncem šedesátých let projekt Tyneside Linguistic Survey (TLS) a druhý v roce 1994 projekt Phonological Variation and Change in Contemporary Spoken English (PVC). NECTE spojuje materiály TLS a PVC do jediného korpusu kódovaného XML v souladu s iniciativou Text Encoding Initiative (TEI) a zpřístupňuje je v různých sladěných formátech: digitalizovaný zvuk, standardní ortografický přepis, fonetický přepis a část řeči . Tato webová stránka podrobně popisuje korpus NECTE a poskytuje jej akademickým vědcům, pedagogům, médiím v nekomerčních aplikacích a organizacím, jako jsou jazykové společnosti a jednotlivci, kteří mají vážný zájem o historické dialektické materiály.
- Průzkumná vícerozměrná analýza textových korpusů
Od dokončení projektu NECTE vyvíjí metodiku sociolingvistického a dialektologického studia korpusu, jejímž cílem je pokusit se najít zajímavé zákonitosti ve fonetické variaci informátoři v korpusu a jakékoli korelace mezi takovou variací a souvisejícími sociálními faktory. Metodika je založena na metodě formulované původci velké části korpusu NECTE, Tyneside Linguistic Survey (TLS). V té době to bylo radikální a zůstává tomu tak i dnes: na rozdíl od tehdejšího univerzálního a stále dominantního přístupu založeného na teorii, kdy sociální a jazykové faktory vybírá analytik na základě nějaké kombinace nezávisle specifikovaného teoretického rámce, existujícího případové studie a osobní zkušenosti z oblasti dotazování navrhla TLS zásadně empirický přístup, při kterém jsou z údajů samotných extrahovány významné faktory, které pak slouží jako základ pro konstrukci modelu. K implementaci svého přístupu použila TLS konkrétní průzkumnou vícerozměrnou analytickou techniku, hierarchickou klastrovou analýzu, ale její práce nikdy nepokročila za předběžné studie z různých teoretických a praktických důvodů. Jeho vývoj metodiky TLS
- i. kromě hierarchické klastrové analýzy používá řadu lineárních a nelineárních průzkumných analytických metod, jako je vícerozměrné škálování a samoorganizující se mapy a
- ii. věnuje zvláštní pozornost problémům při vytváření dat, které jsou zásadní pro platnost analytických výsledků: normalizace délky dokumentu, zmenšení rozměrů a nelinearita dat.
- Relevantní publikace jsou
- Moisl, H. a Beal, J.C. (2001) „Corpus Analysis and Results: Visualization using Self-Organizing Maps“, Corpus Linguistics 2001, Lancaster University, 386-391. Elektronická publikace.
- Moisl, H, Jones, V (2005) Klastrová analýza elektronického korpusu Newcastle z Tyneside English: srovnání metod. Centrum pro telematiku a informační technologie [CTIT]; TR 2005/65) {A-53328} University of Twente.
- Moisl, H, Jones V., (2005) „Cluster analysis of the Newcastle Electronic Corpus of Tyneside English: a comparison of methods“, Literary and Linguistic Computing 20, 125-46. [Online verze deníku] [Předtisk]
- Moisl, H., Maguire W, Allen W., (2006) „Fonetická variace v Tyneside: průzkumná vícerozměrná analýza Newcastle Electronic Corpus of Tyneside English“. In: F. Hinskens, vyd. Jazyková variace. Evropské perspektivy. Amsterdam: Meertensův institut. [Předtisk]
- Allen, W. H., Beal, J. C., Corrigan, K. P., Maguire, W. a Moisl, H. L. (2007) „A Linguistic„ Time-Capsule “: The Newcastle Electronic Corpus of Tyneside English“ in Beal, J.C., Corrigan, K.P. a Moisl, H.L. (eds.) Creating and Digitalizing Language Corpora, sv. 2: Diachronické databáze. Houndmills: Palgrave Macmillan, 16-48. [Předtisk]
- Moisl, H. (2007) Nelinearita dat v průzkumné vícerozměrné analýze jazykových korpusů, Computing and Historical Phonology. Sborník příspěvků z devátého zasedání Zvláštní zájmové skupiny ACL ve výpočetní morfologii a fonologii, 28. června 2007, ed. J. Nerbonne, M.Ellison, G.Kondrak, Association for Computational Linguistics, 93-100. [Online publikace]
- Moisl, H. (2008) 'Exploratory Multivariate Analysis', In: Lüdeling A, Kytö M, ed. Korpusová lingvistika. International Handbook (Series: Handbücher zur Sprache und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science). Berlín: Mouton de Gruyter. [Předtisk]
- Moisl, H., Maguire, W. (2008) „Identifikace hlavních determinantů fonetické variace v Newcastle Electronic Corpus of Tyneside English“, Journal of Quantitative Linguistics 15, 46-69. [Předtisk]
- Moisl, H. (2008) „Používání elektronických korpusů ke studiu jazykových variací: problém datové sparity“, v současné době přezkoumáváno ve Studii jazykových variací. Vybrané příspěvky z ICLaVE 4, ed. P. Pavlou, University of Cyprus [Předtisk]
- Moisl, H. (2008) „Využívání elektronických korpusů v historickém dialektologickém výzkumu: problém variací délky dokumentu“, v současné době přezkoumáván pro Proceedings of the Second International Conference on English Historical Dialectology, University of Bergamo, ed. M. Dossena [Preprint]
- Moisl, H. (2008) Normalizace pro změnu délky dokumentu v průzkumné vícerozměrné analýze textových korpusů, sborník z INFOS2008: 6. mezinárodní konference o informatice a systémech, Káhirská univerzita, 27. – 29. března 2008 [Preprint]