Hermann Moisl - Hermann Moisl

Dr. Hermann Moisl je v důchodu [1] Odborný asistent a hostující pracovník v Lingvistika na Newcastle University. Byl vzděláván na různých ústavech, včetně Trinity College v Dublinu a University of Oxford.

Mezi výzkumné zájmy patří mimo jiné: výpočetní lingvistika, Zpracování přirozeného jazyka, korpusová lingvistika, kulturní role gramotnost a Keltské jazyky a historie.

Byl klíčovým vyšetřovatelem Newcastle Electronic Corpus of Tyneside English Project po boku bývalé kolegyně profesorky Karen Corriganové, profesorky lingvistiky a anglického jazyka.

Další odborné znalosti

Starý / Střední angličtina a Starý irský / Střední irský jazyk a literatura.

Vybrané publikace

  • Moisl HL, Maguire W, Allen W. Fonetická variace v Tyneside: Průzkumná vícerozměrná analýza Newcastle Electronic Corpus of Tyneside English. In: Frans Hinskens, ed. Jazyková variace - Evropské perspektivy: Vybrané příspěvky ze třetí mezinárodní konference o jazykových variacích v Evropě (ICLaVE 3), Amsterdam, červen 2005. Amsterdam: John Benjamins Publishing Co, 2006, s. 127–141.
  • Moisl HL, Maguire W. Identifikace hlavních determinantů fonetické variace v Newcastle Electronic Corpus of Tyneside English. Journal of Quantitative Linguistics 2008, 15, 46-69
  • Moisl HL, Jones VM. Cluster Analysis of Newcastle Electronic Corpus of Tyneside English: A Comparison of Methods. Literary and Linguistic Computing 2005, 20 (Suppl 1), 125-146
  • Moisl HL. Průzkumná vícerozměrná analýza. In: Lüdeling A, Kytö M, ed. Korpusová lingvistika. International Handbook (Series: Handbücher zur Sprache und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science). Berlin: Mouton de Gruyter (v tisku), 2008.
  • Moisl HL, Corrigan K, Beal J. The Newcastle Electronic Corpus of Tyneside English. Rada pro výzkum v oblasti umění a humanitních věd, 2005. Dostupné na: https://web.archive.org/web/20080925210840/http://www.ncl.ac.uk/necte/.
  • Moisl HL. Lingvistické výpočty se stavovými kosmickými trajektoriemi. In: Stefan Wermter, Jim Austin, David Willshaw, ed. Naléhavé neurální výpočetní architektury založené na neurovědě: Směrem k výpočetní technice inspirované neurovědy. Springer, 2001, s. 442–460.
  • Moisl HL. Lingvistické výpočty se stavovými kosmickými trajektoriemi. In: Stefan Wermter, Jim Austin, David Willshaw, ed. Naléhavé neurální výpočetní architektury založené na neurovědě: Směrem k výpočetní technice inspirované neurovědy. Springer, 2001, s. 442–460.

Projekty

Jazykový Časová kapsle: The Newcastle Electronic Corpus of Tyneside English (NECTE), AHRB project code RE11776 Vedoucí projektu: K. Corrigan, J. Beal, H. Moisl Postgraduate Supervision

Modelování přirozeným jazykem a zpracování textu. Moje specifické oblasti zájmu jsou porozumění přirozenému jazyku systémy a vícerozměrná analýza textových korpusů.

Kvalifikace

BA (McGill University ) MPhil (Trinity College v Dublinu ) DPhil (University of Oxford ) MSc (Newcastle University )

Postgraduální výuka

Postgraduální supervize

Modelování přirozeným jazykem a zpracování textu. Jeho specifickými oblastmi zájmu jsou systémy pro porozumění přirozenému jazyku a vícerozměrná analýza textových korpusů.

Vysokoškolská výuka

Současná práce

Implementace porozumění přirozenému jazyku systémy využívající sekvence dynamického atraktoru

Dr. Moisl vyvíjí přísně sekvenční architekturu porozumění přirozenému jazyku, která se obejde bez dvou základních principů generativní lingvistiky, tradiční kognitivní vědy a velké části umělé inteligence - že řetězce přirozeného jazyka mají složitou syntaktickou strukturu zpracovávanou strukturně citlivými algoritmy a struktura je rozhodující při určování sémantiky řetězce. Tato sekvenční architektura byla původně uvedena z hlediska standardní teorie automatů jako systém spolupracujících automatů konečných stavů, ale v poslední době jsem se začal zajímat o neurovědeckou práci, která identifikuje trajektorii chaotického přitahovače ve stavovém prostoru jako základní princip funkce mozku na výše uvedené úrovni individuálního neuronu, což naznačuje, že smyslové zpracování a obecně vyšší kognice jsou implementovány spolupracujícími procesy atraktorové sekvence. Některé relevantní publikace jsou:

  • Moisl, H., (1992) „Connectionist finite state natural language processing“, Connection Science 4, 67-91.
  • Moisl, H., (1997) „Rekurentní neuronové sítě a zpracování přirozeného jazyka“, New Methods in Language Processing, ed. D. Jones & H. Somers, UCL Press, Londýn, 69-82
  • Moisl, H., (2000) Handbook of Natural Language Processing, Marcel Dekker (s R. Daleem z Macquarie University a H. Somersem z UMIST)
  • Moisl, H., (2001) 'Umělé neuronové sítě a zpracování přirozeného jazyka ', Encyclopedia of Library and Information Science, ed. M. Drake, Marcel Dekker (v tisku)
  • Moisl, H., (2001) 'Jazykový výpočet with state space trajektories ', in Emergent Neural Computational Architectures based on Neuroscience, ed. Stefan Wermter, Jim Austin, David Willshaw, Springer, 2001
Tvorba korpusu přirozeným jazykem

Spolu s Karen Corrigan z Newcastle University a Joan Beal z Sheffield University nedávno dokončil Newcastle Electronic Corpus of Tyneside English (NECTE), korpus dialektové řeči z Tyneside v severovýchodní Anglii. Je založen na dvou již existujících korpusech, jeden z nich shromáždil koncem šedesátých let projekt Tyneside Linguistic Survey (TLS) a druhý v roce 1994 projekt Phonological Variation and Change in Contemporary Spoken English (PVC). NECTE spojuje materiály TLS a PVC do jediného korpusu kódovaného XML v souladu s iniciativou Text Encoding Initiative (TEI) a zpřístupňuje je v různých sladěných formátech: digitalizovaný zvuk, standardní ortografický přepis, fonetický přepis a část řeči . Tato webová stránka podrobně popisuje korpus NECTE a poskytuje jej akademickým vědcům, pedagogům, médiím v nekomerčních aplikacích a organizacím, jako jsou jazykové společnosti a jednotlivci, kteří mají vážný zájem o historické dialektické materiály.

Průzkumná vícerozměrná analýza textových korpusů

Od dokončení projektu NECTE vyvíjí metodiku sociolingvistického a dialektologického studia korpusu, jejímž cílem je pokusit se najít zajímavé zákonitosti ve fonetické variaci informátoři v korpusu a jakékoli korelace mezi takovou variací a souvisejícími sociálními faktory. Metodika je založena na metodě formulované původci velké části korpusu NECTE, Tyneside Linguistic Survey (TLS). V té době to bylo radikální a zůstává tomu tak i dnes: na rozdíl od tehdejšího univerzálního a stále dominantního přístupu založeného na teorii, kdy sociální a jazykové faktory vybírá analytik na základě nějaké kombinace nezávisle specifikovaného teoretického rámce, existujícího případové studie a osobní zkušenosti z oblasti dotazování navrhla TLS zásadně empirický přístup, při kterém jsou z údajů samotných extrahovány významné faktory, které pak slouží jako základ pro konstrukci modelu. K implementaci svého přístupu použila TLS konkrétní průzkumnou vícerozměrnou analytickou techniku, hierarchickou klastrovou analýzu, ale její práce nikdy nepokročila za předběžné studie z různých teoretických a praktických důvodů. Jeho vývoj metodiky TLS

  • i. kromě hierarchické klastrové analýzy používá řadu lineárních a nelineárních průzkumných analytických metod, jako je vícerozměrné škálování a samoorganizující se mapy a
  • ii. věnuje zvláštní pozornost problémům při vytváření dat, které jsou zásadní pro platnost analytických výsledků: normalizace délky dokumentu, zmenšení rozměrů a nelinearita dat.
Relevantní publikace jsou
  • Moisl, H. a Beal, J.C. (2001) „Corpus Analysis and Results: Visualization using Self-Organizing Maps“, Corpus Linguistics 2001, Lancaster University, 386-391. Elektronická publikace.
  • Moisl, H, Jones, V (2005) Klastrová analýza elektronického korpusu Newcastle z Tyneside English: srovnání metod. Centrum pro telematiku a informační technologie [CTIT]; TR 2005/65) {A-53328} University of Twente.
  • Moisl, H, Jones V., (2005) „Cluster analysis of the Newcastle Electronic Corpus of Tyneside English: a comparison of methods“, Literary and Linguistic Computing 20, 125-46. [Online verze deníku] [Předtisk]
  • Moisl, H., Maguire W, Allen W., (2006) „Fonetická variace v Tyneside: průzkumná vícerozměrná analýza Newcastle Electronic Corpus of Tyneside English“. In: F. Hinskens, vyd. Jazyková variace. Evropské perspektivy. Amsterdam: Meertensův institut. [Předtisk]
  • Allen, W. H., Beal, J. C., Corrigan, K. P., Maguire, W. a Moisl, H. L. (2007) „A Linguistic„ Time-Capsule “: The Newcastle Electronic Corpus of Tyneside English“ in Beal, J.C., Corrigan, K.P. a Moisl, H.L. (eds.) Creating and Digitalizing Language Corpora, sv. 2: Diachronické databáze. Houndmills: Palgrave Macmillan, 16-48. [Předtisk]
  • Moisl, H. (2007) Nelinearita dat v průzkumné vícerozměrné analýze jazykových korpusů, Computing and Historical Phonology. Sborník příspěvků z devátého zasedání Zvláštní zájmové skupiny ACL ve výpočetní morfologii a fonologii, 28. června 2007, ed. J. Nerbonne, M.Ellison, G.Kondrak, Association for Computational Linguistics, 93-100. [Online publikace]
  • Moisl, H. (2008) 'Exploratory Multivariate Analysis', In: Lüdeling A, Kytö M, ed. Korpusová lingvistika. International Handbook (Series: Handbücher zur Sprache und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science). Berlín: Mouton de Gruyter. [Předtisk]
  • Moisl, H., Maguire, W. (2008) „Identifikace hlavních determinantů fonetické variace v Newcastle Electronic Corpus of Tyneside English“, Journal of Quantitative Linguistics 15, 46-69. [Předtisk]
  • Moisl, H. (2008) „Používání elektronických korpusů ke studiu jazykových variací: problém datové sparity“, v současné době přezkoumáváno ve Studii jazykových variací. Vybrané příspěvky z ICLaVE 4, ed. P. Pavlou, University of Cyprus [Předtisk]
  • Moisl, H. (2008) „Využívání elektronických korpusů v historickém dialektologickém výzkumu: problém variací délky dokumentu“, v současné době přezkoumáván pro Proceedings of the Second International Conference on English Historical Dialectology, University of Bergamo, ed. M. Dossena [Preprint]
  • Moisl, H. (2008) Normalizace pro změnu délky dokumentu v průzkumné vícerozměrné analýze textových korpusů, sborník z INFOS2008: 6. mezinárodní konference o informatice a systémech, Káhirská univerzita, 27. – 29. března 2008 [Preprint]

Reference

externí odkazy