Skrytá analýza korespondence - Detrended correspondence analysis - Wikipedia

Detrended korespondenční analýza (DCA) je vícerozměrný statistický technika široce používaná ekologové najít hlavní faktory nebo přechody ve velkých, druhově bohatých, ale obvykle řídkých datových maticích, které typizují ekologická komunita data. DCA se často používá k potlačení artefaktů obsažených ve většině ostatních vícerozměrné analýzy při aplikaci na spád data.[1]

Dějiny

DCA vytvořil v roce 1979 Mark Hill of the Spojené království Institut pro suchozemskou ekologii (nyní sloučen do) Centrum pro ekologii a hydrologii ) a implementováno v FORTRAN balíček kódu nazvaný DECORANA (Detrended Correspondence Analysis), a korespondenční analýza metoda. DCA se někdy chybně označuje jako DECORANA; DCA je však základním algoritmem, zatímco DECORANA je nástrojem, který jej implementuje.

Řešené problémy

Podle Hill a Gauch,[2] DCA při použití potlačuje dva artefakty, které jsou vlastní většině ostatních analýz s více proměnnými spád data. Příkladem je časová řada druhů rostlin kolonizujících nové stanoviště; brzy následné druhy jsou nahrazeny středně posloupnými druhy, poté pozdně posloupnými (viz příklad níže). Když jsou taková data analyzována standardem vysvěcení jako je korespondenční analýza:

  • skóre ordinace vzorků bude vykazovat „hranový efekt“, tj. rozptyl skóre na začátku a na konci pravidelné řady druhů bude podstatně menší než ve středu,
  • když jsou prezentovány jako graf, body budou sledovány a podkova tvarovaná křivka spíše než přímka („efekt oblouku“), přestože analyzovaný proces představuje trvalou a kontinuální změnu, kterou by lidská intuice raději viděla jako lineární trend.

Mimo ekologii dochází ke stejným artefaktům, když se analyzují data gradientu (např. Vlastnosti půdy podél transektu probíhajícího mezi 2 různými geologiemi nebo údaje o chování po celou dobu životnosti jednotlivce), protože zakřivená projekce je přesnou reprezentací tvaru dat v vícerozměrný prostor.

Ter Braak a Prentice (1987, s. 121) uvádějí a simulace studie analyzující modely balení dvourozměrných druhů, jejichž výsledkem je lepší výkonnost DCA ve srovnání s CA.

Metoda

DCA je iterační algoritmus který se ukázal jako vysoce spolehlivý a užitečný nástroj pro průzkum a sumarizaci dat v komunitní ekologii (Shaw 2003). Začíná to spuštěním standardní ordinace (CA nebo reciproční průměrování) na datech, aby se vytvořila počáteční křivka podkovy, ve které se 1. ordinační osa zkreslí na 2. osu. Poté rozdělí první osu na segmenty (výchozí = 26) a každý segment znovu změní tak, aby měl na druhé ose střední hodnotu nula - to efektivně roztáhne křivku naplocho. Rovněž změní měřítko osy tak, aby konce již nebyly stlačeny vzhledem ke středu, takže 1 jednotka DCA se přibližuje stejné rychlosti obratu po celou dobu dat: pravidlem je, že 4 jednotky DCA znamenají, že má byl celkový obrat v komunitě. Ter Braak a Prentice (1987, s. 122) varují před nelineárním změnou měřítka os kvůli problémům s robustností a doporučují používat pouze detrending-by-polynomials.

Nevýhody

Ne testy významnosti jsou k dispozici s DCA, i když existuje omezená (kanonická) verze zvaná DCCA, ve které jsou osy nuceny Vícenásobná lineární regrese optimálně korelovat s a lineární kombinace dalších (obvykle environmentálních) proměnných; to umožňuje testování nulového modelu Monte-Carlo permutace analýza.

Příklad

Příklad ukazuje ideální datovou sadu: Údaje o druzích jsou v řádcích, vzorky ve sloupcích. Pro každý vzorek podél gradientu je zaveden nový druh, ale jiný druh již není přítomen. Výsledkem je řídká matice. Jeden naznačuje přítomnost druhu ve vzorku. Kromě okrajů obsahuje každý vzorek pět druhů.

Srovnání Korespondenční analýzy a Detrended Korespondenční analýzy na příkladu (ideálních) datech. Podívejte se na efekt archu v CA a jeho řešení v DCA.
Ideální data vysvěcení
1234567891011121314151617181920
SP111100000000000000000
SP211110000000000000000
SP311111000000000000000
SP401111100000000000000
SP500111110000000000000
SP600011111000000000000
SP700001111100000000000
SP800000111110000000000
SP900000011111000000000
SP1000000001111100000000
SP1100000000111110000000
SP1200000000011111000000
SP1300000000001111100000
SP1400000000000111110000
SP1500000000000011111000
SP1600000000000001111100
SP1700000000000000111110
SP1800000000000000011111
SP1900000000000000001111
SP2000000000000000000111

Graf prvních dvou os výsledku výsledku korespondenční analýzy na pravé straně jasně ukazuje nevýhody tohoto postupu: efekt hrany, tj. Body jsou seskupeny na okrajích první osy, a efekt oblouku.

Viz také

Reference

  1. ^ Hill and Gauch (1980)
  2. ^ Hill and Gauch (1980)
  • Hill, M.O. (1979). DECORANA - program FORTRAN pro analýzu zadržené korespondence a vzájemné průměrování. Sekce ekologie a systematiky, Cornell University, Ithaca, New York, 52pp.
  • Hill, M.O. a Gauch, H.G. (1980). Detrended Correspondence Analysis: An Improved Ordination Technique. Vegetatio 42, 47–58.
  • Oksanen J a Minchin PR (1997). Nestabilita výsledků ordinace při změnách v pořadí vstupních dat: vysvětlení a nápravná opatření. Journal of vegetation science 8, 447–454
  • Shaw PJA (2003). Statistika více proměnných pro vědy o životním prostředí. Londýn: Hodder Arnold
  • Ter Braak, C.J.F. a Prentice, I.C. (1988). Teorie gradientní analýzy. Pokroky v ekologickém výzkumu 18, 271–371. ISBN  0-12-013918-9. Přetištěno v: Ter Braak, C.J.F. (1987). Unimodální modely vztahující se k životnímu prostředí. Wageningen: Doktorská práce Agricultural Mathematics Group, 101–146.

externí odkazy

  • MINULOST (PAeontologická statistika) - bezplatný software včetně DCA s úpravami podle Oksanena a Minchina (1997)
  • WINBASP - bezplatný software včetně DCA s detrending-by-polynomials podle Ter Braaka a Prentice (1988)
  • vegan: Community Ecology Package pro R - svobodný software včetně funkce decorana: Detrended Correspondence Analysis and Basic Reciprocal Averaging from Hill and Gauch (1980)