Studie diskurzu za pomoci korpusu - Corpus-assisted discourse studies - Wikipedia

Studie diskurzu za pomoci korpusu (skr.: CADS) historicky a metodicky souvisí s disciplínou korpusová lingvistika. Hlavním úsilím diskurzních studií podporovaných korpusem je vyšetřování a srovnání konkrétních rysů typy diskurzu, integrující do analýzy techniky a nástroje vyvinuté v rámci korpusové lingvistiky. Patří mezi ně kompilace specializovaných korpusů a analýzy seznamů frekvencí slov a shluků slov, srovnávací seznamy klíčových slov a především konkordance.

Širší pojetí diskurzivních studií podporovaných korpusem by zahrnovalo jakoukoli studii, jejímž cílem je spojit lingvistiku korpusu a analýzu diskurzu. Takový výzkum je často označován jako na bázi korpusu nebo analýza diskurzu za pomoci korpusu, s termínem CADS vytvořeným výzkumnou skupinou v Itálii pro konkrétní typ diskurzních analýz založených na korpusu (viz níže část „v různých zemích“).

Cíle

Cílem diskurzních studií s pomocí korpusu je odhalit zřejmý význam, to znamená význam, který nemusí být snadno dostupný pouhým okem. Mnoho z toho, co v textech nese význam, není otevřeno přímému pozorování: „svět nelze pochopit pouhým pohledem na něj“ (Stubbs [after Gellner 1959] 1996: 92). Jazyk používáme „poloautomaticky“ v tom smyslu, že řečníci a spisovatelé volí polovědomá rozhodnutí v rámci různých komplexních překrývajících se systémů, z nichž je jazyk složen, včetně těch, které jsou tranzitivní a modální (Michael Halliday 1994), lexikální množiny (např. svoboda, svoboda, vysvobození), úpravy atd. Samotní autoři, skvěle, obecně nevědí o všech významech, které jejich texty sdělují. Kombinací kvantitativní výzkum přístup, tj. statistická analýza velkého množství dotyčného diskurzu - přesněji velkého počtu tokenů studovaného diskurzního typu obsažených v korpusu - s více kvalitativní výzkum přístup typický pro diskurzivní analýzu, tj. důkladné a podrobné prozkoumání jednotlivých úseků diskurzu, je možné lépe porozumět procesům, které se hrají v diskurzním typu, a získat přístup k nezjistitelným významům.

Cíle se mohou lišit v jiných typech analýzy diskurzu na základě korpusu nebo korpusu; ale obecně takové studie kombinují kvantitativní a kvalitativní výzkum a zaměřují se na objasnění diskurzů, registrů, diskurzních vzorů atd. pomocí korpusového lingvistického přístupu. Konkrétní cíle a techniky závisí na příslušném projektu.

V různých zemích

  • V německy mluvících zemích: Průkopnické práce v analýze diskurzu založené na korpusu byly provedeny v Evropě, zejména Hardt-Mautner / Mautner (1995, 2000) a Stubbs (1996, 2001). CADS a další typy diskurzní analýzy založené na korpusu jsou inspirovány touto důležitou ranou prací.
  • V Itálii: Značný soubor výzkumu byl v Itálii proveden buď jednotlivými výzkumnými pracovníky, nebo pod záštitou kombinovaných meziuniverzitních projektů, jako jsou Newspool (Partington et al. 2004) a CorDis (Morley a Bayley eds, 2009). Soustředila se na politický a mediální jazyk, zejména proto, že jádro lingvistů na italských univerzitách pracuje na politologických fakultách a stále více se zajímají o použití korpusových technik k provedení určitého typu sociopolitické analýzy diskurzu, včetně odhalení pozoruhodných ideologických metafor a motivy v jazyce politických osobností a institucí. Také se vyvinuli italští vědci Moderní diachronní korpusové diskurzní studie (MD-CADS). Tento přístup kontrastuje s jazykem obsaženým ve srovnatelných korpusech z různých, ale nedávných okamžiků, aby bylo možné sledovat změny v používání moderních jazyků, ale také sociální, kulturní a politické změny v moderní době, jak se projevují - a sdílejí mezi lidmi - v jazyce. Právě tento italský soubor výzkumu nejvíce využívá označení CADS.
  • Ve Velké Británii: Lingvisté ve Velké Británii inklinují k korpusu kritická diskursivní analýza (CDA). CDA obecně zaujímá levicový politický postoj se zaměřením na způsoby, jakými je sociální a politická nadvláda reprodukována textem a rozhovory. Tento typ korpusového výzkumu byl původně spojen s Lancaster University (Pekař et al. 2008), ale od té doby se rozšířil více. Taková práce typicky studuje diskurzy o konkrétních skupinách lidí (např. Muslimové, lidé se zdravotním postižením) nebo koncepty / události (např. Feminismus, manželství osob stejného pohlaví).
  • V Austrálii: Analýzu diskurzu založenou na korpusu provádí rostoucí počet australských vědců, nejčastěji na mediálních textech. Část této práce si klade za cíl objasnit specifické rysy typů diskurzu (zprávy, sociální média, televizní seriály atd.), Zatímco jiná práce má kořeny v tradici kritické analýzy diskurzu založené na korpusu.

Srovnání s tradiční korpusovou lingvistikou

Tradiční korpusová lingvistika má přirozeně tendenci privilegovat kvantitativní přístup. V úsilí o vytvoření autentičtějších slovníků a gramatik jazyka byla charakterizována kompilací některých velmi velkých korpusů heterogenních typů diskurzu ve snaze získat přehled o co největším množství a rozmanitosti typů diskurzu, v jiných slova, z chimérické, ale užitečné fikce zvané „obecný jazyk“ („obecná angličtina“, „obecná italština“ atd.). To vedlo ke konstrukci nesmírně cenných výzkumných nástrojů, jako je Bank of English a Britský národní korpus. Některá odvětví korpusové lingvistiky rovněž prosazují přístup „korpusový“, ve kterém potřebujeme, gramaticky řečeno, mentální tabula rasa abychom se osvobodili od zlověstných předsudků vyvolaných tradičními modely a nechali data mluvit zcela sama za sebe.

Cíl studií diskurzu za pomoci korpusu a souvisejících přístupů je radikálně odlišný. Zde je cílem cvičení co nejvíce se seznámit s typem diskurzu v ruce. Vědci obvykle spolupracují se svým korpusem různými způsoby. Stejně jako prostřednictvím seznamů slov a konkordancí mohou intuice pro další výzkum vycházet také ze čtení nebo sledování nebo poslechu částí datového souboru, což je proces, který může pomoci poskytnout pocit, jak se věci jazykově dějí ve studovaném typu diskurzu. .

Analýza diskurzu podporovaná korpusem je také typicky charakterizována kompilací ad hoc specializovaných korpusů, protože velmi často neexistuje žádná dříve dostupná sbírka daného typu diskurzu. V průběhu studie se pro účely srovnání často používají jiné korpusy. Mohou zahrnovat již existující korpusy nebo je může sám sestavit výzkumný pracovník. V určitém smyslu je veškerá práce s korpusy - stejně jako diskurz - správně srovnávací. I když je použit jediný korpus, slouží k testování dat, která obsahuje, na jiném souboru dat. Může se skládat z intuice výzkumníka nebo z údajů nalezených v referenčních pracích, jako jsou slovníky a gramatiky, nebo to mohou být výroky učiněné předchozími autory v oboru.

CADS jako specifický typ diskurzivní analýzy založené na korpusu

Vědci v Itálii vyvinuli CADS jako specifický typ diskurzivní analýzy založené na korpusu a vytvořili standardní sadu metod:

'Základní standardní metodika v CADS se může podobat následujícímu: '

  1. Krok 1: Rozhodněte se o výzkumné otázce;
  2. Krok 2: Vyberte, zkompilujte nebo upravte vhodný korpus;
  3. Krok 3: Vyberte, zkompilujte nebo upravte příslušný referenční korpus / korpusy;
  4. Krok 4: Vytvořte seznamy frekvencí a spusťte srovnání klíčových slov korpusů;
  5. Krok 5: Zjistěte existenci sad klíčových položek;
  6. Krok 6: Shoda zajímavých klíčových položek (s různým množstvím co-textu);
  7. Krok 7: (Možná) zdokonalte výzkumnou otázku a vraťte se ke kroku 2.

Tento základní postup se samozřejmě může lišit podle individuálních okolností a požadavků výzkumu.

Zvláštní způsob konceptualizace výzkumných otázek bylo také navrženo v takových projektech CADS:

  • Vzhledem k tomu, že P je účastníkem diskurzu (nebo možná instituce) a G je cíl, často politický cíl:
  1. Jak P dosáhne G s jazykem?
  2. Co nám to říká o P?
  3. Srovnávací studie: jak se P1 a P2 liší v používání jazyka? Říká nám to něco o jejich různých principech a cílech?

Druhý obecný typ výzkumné otázky CADS, který může být položen na základě interaktivních diskurzních dat, byl koncipován následovně:

  • Vzhledem k tomu, že P (x) je konkrétní účastník nebo skupina účastníků, DT je ​​typ diskurzu a R je pozorovaný vztah mezi účastníky nebo mezi nimi:
  • Jak {P (a), P (b) ... P (n)} dosáhnout / udržovat R v DT [pomocí jazyka]?

Další běžný typ výzkumné otázky byl pojat takto:

  • Vzhledem k tomu, že A je autor, Ph (x) je fenomén nebo praxe nebo chování a DT (x) je určitý typ diskurzu.
  • A uvedl, že P (x) je případ v DT (a)
  • Je případ Ph (x) v DT (b)?

Jedná se o klasickou výzkumnou otázku „testování hypotéz“: testujeme hypotézu, že jakákoli praxe, kterou pozoroval předchozí autor v nějakém typu diskurzu, bude pozorovatelná v jiném. Je to proces, který bychom mohli nazvat para-replikace, tj. replikace experimentu buď s čerstvým souborem textů stejného typu diskurzu, nebo příbuzného typu diskurzu, „aby bylo možné zjistit, zda [nálezy] byly artefaktem jediného souboru dat“ (Stubbs 2001: 124).

Posledním příkladem konceptualizace výzkumné otázky CADS je následující:

  • Vzhledem k tomu, že P (x) je účastník nebo jeho kategorie a LF (x) je zvláštní jazyková funkce:
  • Používají {P (a)} a {P (b)} LF (x) stejným způsobem?

Cílem tohoto výzkumu je zjistit, zda různí účastníci používají určitou jazykovou vlastnost stejným nebo odlišným způsobem. Výzkum může pokračovat a pokusit se vysvětlit, proč tomu tak je.

Nějaký výzkum k dnešnímu dni

Studie, které spojují lingvistiku korpusu a analýzu diskurzu, zahrnují následující:

  • Jak jsou myšlenky o skupinách lidí a rasy konstruovány a šířeny opakovaným používáním jazyka (Krishnamurthy 1996).
  • Studie německých přejatých slov v angličtině a jejich souvislost s kulturními stereotypy (Stubbs 1998).
  • Analýzy jazyka euroskeptické debaty ve Velké Británii (Teubert 2000; viz také Mautner 2000).
  • Typické jazykové strategie, metafory a motivy používané novináři a mluvčími na tiskových konferencích v USA a to, jak odrážejí jejich příslušné světonázory (Partington 2003, 2007).
  • Jak probíhá predikce v ekonomických textech, to znamená, jak jsou prezentovány a zajištěny ekonomické prognózy (Walsh 2004).
  • Jak si vládní svědci v Huttonově šetření vytvořili svou profesionální identitu (Duguid 2007, 2008).
  • Typické jazykové rysy amerických televizních seriálů a to, jak jsou podobné nebo odlišné od improvizované konverzace (Bednarek 2010, 2018).
  • Jak reproduktory používají posouzení na Twitteru k vytváření sdílených komunit (Zappavigna 2012).
  • Jak je v britském tisku zastoupen islám a muslimové (Baker et al. 2013).
  • Projekt CorDis. Jak byl konflikt v Iráku projednáván a reportován v Senátu a parlamentu, na tiskových briefingech USA a Huttonově dotazu, v novinách a televizních zprávách z USA / Velké Británie (Marchi a Taylor 2009; Morley a Bayley 2009; Haarman a Lombardo 2008).
  • Projekt SiBol (univerzity v Sieně a Boloni) analyzoval rozdíly mezi dvěma korpusy novinových textů ve Velké Británii, první pochází z roku 1993 (100 milionů slov), druhý z roku 2005 (140 milionů slov).
  • Projekt Intune 2004-9 (pracovní skupina mediálních lingvistů). Projekt financovaný EU, který má prozkoumat, jak tisk ve Francii, Itálii, Polsku a Velké Británii představuje problémy spojené s evropským občanstvím a identitou [1].

Bibliografie

Baker, P. (2006) Využití korpusů při diskurzní analýze. London: Continuum.

Baker, P., Gabrielatos, C., Khosravinik, M., Krzyzanowski, M., McEnery, T. & Wodak, R. (2008) Užitečná metodologická synergie? Kombinace kritické diskurzivní analýzy a lingvistiky korpusu k prozkoumání diskurzů uprchlíků a žadatelů o azyl v britském tisku. Pojednání a společnost 19(3), 273-306.

Baker, P. Gabrielatos, C. a McEnery. T. (2013) Analýza diskurzu a mediální postoje: Zastoupení islámu v britském tisku. Cambridge: Cambridge University Press.

Bednarek, M. (2010). Jazyk fiktivní televize. Drama a identita. London: Continuum.

Bednarek, M. (2018). Jazyk a televizní seriál. Lingvistický přístup k televiznímu dialogu. Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108559553

Duguid, A. (2007) Muži v práci: jak si lidé v čísle 10 vytvářejí svou pracovní identitu. In Garzone, G. and Srikant, S. (eds) Pojednání, ideologie a specializovaná komunikace. Bern: Peter Lang, str. 453–484.

Duguid, A. (2007) Soundbiters Bit. Smluvní dialogistický prostor a textové vztahy prostřednictvím diskurzních studií podporovaných korpusem. Ve Fairclough, N., Cortese, G. a Ardizzone, P. (eds) Diskurz a současné sociální změny. Bern: Peter Lang, str. 73–93.

Gabrielatos, C. & Baker, P. (2008). Útěk, plížení, záplavy: Korpusová analýza diskurzivních konstrukcí uprchlíků a žadatelů o azyl ve Velké Británii Press 1996-2005. Journal of English Linguistics 36 (1), 5-38.

Gellner, E. (1959) Slova a věci. Londýn: Gollancz.

Krishnamurthy, R. (1996) Etnické, rasové a kmenové: jazyk rasismu? In R Caldas-Coulthard a M. Coulthard (eds), Texty a postupy: Čtení v analýze kritických diskursů. London: Routledge, str. 129–49.

Haarman, L. a L. Lombardo (eds) (2008) Hodnocení a postoj ve válečných zprávách: Jazyková analýza amerických, britských a italských televizních zpráv o irácké válce z roku 2003. London: Continuum.

Halliday, M. (1994) Úvod do funkční gramatiky, 2. vyd. Londýn: Edward Arnold.

Hardt-Mautner, G. (1995) „Only Connect.“ Kritická analýza diskurzu a lingvistika korpusu, University of Lancaster. Online k dispozici HTTP: <http://ucrel.lancs.ac.uk/papers/techpaper/vol6.pdf >

Marchi, A. a Taylor, C. (2009) Kdo bojoval a kdo / co se bojovalo? Konstrukce identit účastníků ve zprávách o válce v Iráku ve Velké Británii a USA. In Garzone, G. a Catenaccio, P. (eds) Identity napříč médii a režimy: diskurzivní vyhlídky. Bern: Peter Lang.

Mautner, Gerlinde. 2000. Der britische Europa-Diskurs: Methodenreflexion und Fallstudien zur Berichterstattung in der Tagespresse. Vídeň: Passagen-Verlag.

Morley, J. a Bayley, P. (eds) (2009). Korpusové diskurzní studie o iráckém konfliktu. Formulace války. London: Routledge.

Partington, A. (2003) Lingvistika o. London: Routledge.

Partington, A. (2007) Ironie a obrácení hodnocení. Journal of Pragmatics 39, 1547-1569.

Partington, A., Morley, J. a Haarman L. (eds) (2004) Korpusy a diskurz. Bern: Peter Lang.

Stubbs, M. (1996) Analýza textu a korpusu. Oxford: Blackwell.

Stubbs, M. (1998) Německé výpůjčky a kulturní stereotypy. Angličtina dnes 14, s. 19–26.

Stubbs, M. (2001) Slova a fráze: Korpusová studia lexikální sémantiky. Oxford: Blackwell.

Teubert, W. (2001) Provincie federálního superstátu, kde vládne nevolená byrokracie. Klíčová slova euroskeptického diskurzu v Británii. In Musolff, A., Good, C., Points, P. and Wittlinger, R. (eds), Postoje k Evropě. Jazyk v procesu sjednocení, Aldershot: Ashgate, str. 45–88.

Walsh, P. (2004) Vrhání světla na predikci: Pohledy z korpusu článků finančních zpráv. V Partington et al. (eds), str. 335–48.

Zappavigna, M. (2012). Pojednání o Twitteru a sociálních médiích. Jak používáme jazyk k vytvoření přidružení na webu. London: Continuum.