Skrytá analýza korespondence - Detrended correspondence analysis - Wikipedia
Detrended korespondenční analýza (DCA) je vícerozměrný statistický technika široce používaná ekologové najít hlavní faktory nebo přechody ve velkých, druhově bohatých, ale obvykle řídkých datových maticích, které typizují ekologická komunita data. DCA se často používá k potlačení artefaktů obsažených ve většině ostatních vícerozměrné analýzy při aplikaci na spád data.[1]
Dějiny
DCA vytvořil v roce 1979 Mark Hill of the Spojené království Institut pro suchozemskou ekologii (nyní sloučen do) Centrum pro ekologii a hydrologii ) a implementováno v FORTRAN balíček kódu nazvaný DECORANA (Detrended Correspondence Analysis), a korespondenční analýza metoda. DCA se někdy chybně označuje jako DECORANA; DCA je však základním algoritmem, zatímco DECORANA je nástrojem, který jej implementuje.
Řešené problémy
Podle Hill a Gauch,[2] DCA při použití potlačuje dva artefakty, které jsou vlastní většině ostatních analýz s více proměnnými spád data. Příkladem je časová řada druhů rostlin kolonizujících nové stanoviště; brzy následné druhy jsou nahrazeny středně posloupnými druhy, poté pozdně posloupnými (viz příklad níže). Když jsou taková data analyzována standardem vysvěcení jako je korespondenční analýza:
- skóre ordinace vzorků bude vykazovat „hranový efekt“, tj. rozptyl skóre na začátku a na konci pravidelné řady druhů bude podstatně menší než ve středu,
- když jsou prezentovány jako graf, body budou sledovány a podkova tvarovaná křivka spíše než přímka („efekt oblouku“), přestože analyzovaný proces představuje trvalou a kontinuální změnu, kterou by lidská intuice raději viděla jako lineární trend.
Mimo ekologii dochází ke stejným artefaktům, když se analyzují data gradientu (např. Vlastnosti půdy podél transektu probíhajícího mezi 2 různými geologiemi nebo údaje o chování po celou dobu životnosti jednotlivce), protože zakřivená projekce je přesnou reprezentací tvaru dat v vícerozměrný prostor.
Ter Braak a Prentice (1987, s. 121) uvádějí a simulace studie analyzující modely balení dvourozměrných druhů, jejichž výsledkem je lepší výkonnost DCA ve srovnání s CA.
Metoda
DCA je iterační algoritmus který se ukázal jako vysoce spolehlivý a užitečný nástroj pro průzkum a sumarizaci dat v komunitní ekologii (Shaw 2003). Začíná to spuštěním standardní ordinace (CA nebo reciproční průměrování) na datech, aby se vytvořila počáteční křivka podkovy, ve které se 1. ordinační osa zkreslí na 2. osu. Poté rozdělí první osu na segmenty (výchozí = 26) a každý segment znovu změní tak, aby měl na druhé ose střední hodnotu nula - to efektivně roztáhne křivku naplocho. Rovněž změní měřítko osy tak, aby konce již nebyly stlačeny vzhledem ke středu, takže 1 jednotka DCA se přibližuje stejné rychlosti obratu po celou dobu dat: pravidlem je, že 4 jednotky DCA znamenají, že má byl celkový obrat v komunitě. Ter Braak a Prentice (1987, s. 122) varují před nelineárním změnou měřítka os kvůli problémům s robustností a doporučují používat pouze detrending-by-polynomials.
Nevýhody
Ne testy významnosti jsou k dispozici s DCA, i když existuje omezená (kanonická) verze zvaná DCCA, ve které jsou osy nuceny Vícenásobná lineární regrese optimálně korelovat s a lineární kombinace dalších (obvykle environmentálních) proměnných; to umožňuje testování nulového modelu Monte-Carlo permutace analýza.
Příklad
Příklad ukazuje ideální datovou sadu: Údaje o druzích jsou v řádcích, vzorky ve sloupcích. Pro každý vzorek podél gradientu je zaveden nový druh, ale jiný druh již není přítomen. Výsledkem je řídká matice. Jeden naznačuje přítomnost druhu ve vzorku. Kromě okrajů obsahuje každý vzorek pět druhů.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
SP1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP2 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP3 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP4 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP5 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP6 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP7 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP8 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP9 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP10 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP11 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP12 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
SP13 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
SP14 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
SP15 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
SP16 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
SP17 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 |
SP18 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
SP19 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |
SP20 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 |
Graf prvních dvou os výsledku výsledku korespondenční analýzy na pravé straně jasně ukazuje nevýhody tohoto postupu: efekt hrany, tj. Body jsou seskupeny na okrajích první osy, a efekt oblouku.
Viz také
- Vlastní analýza
- Vysvěcení (statistika)
- Seriace (archeologie) - včetně dalších příkladů pro efekt oblouku
- Analýza hlavních komponent
Reference
- Hill, M.O. (1979). DECORANA - program FORTRAN pro analýzu zadržené korespondence a vzájemné průměrování. Sekce ekologie a systematiky, Cornell University, Ithaca, New York, 52pp.
- Hill, M.O. a Gauch, H.G. (1980). Detrended Correspondence Analysis: An Improved Ordination Technique. Vegetatio 42, 47–58.
- Oksanen J a Minchin PR (1997). Nestabilita výsledků ordinace při změnách v pořadí vstupních dat: vysvětlení a nápravná opatření. Journal of vegetation science 8, 447–454
- Shaw PJA (2003). Statistika více proměnných pro vědy o životním prostředí. Londýn: Hodder Arnold
- Ter Braak, C.J.F. a Prentice, I.C. (1988). Teorie gradientní analýzy. Pokroky v ekologickém výzkumu 18, 271–371. ISBN 0-12-013918-9. Přetištěno v: Ter Braak, C.J.F. (1987). Unimodální modely vztahující se k životnímu prostředí. Wageningen: Doktorská práce Agricultural Mathematics Group, 101–146.
externí odkazy
- MINULOST (PAeontologická statistika) - bezplatný software včetně DCA s úpravami podle Oksanena a Minchina (1997)
- WINBASP - bezplatný software včetně DCA s detrending-by-polynomials podle Ter Braaka a Prentice (1988)
- vegan: Community Ecology Package pro R - svobodný software včetně funkce decorana: Detrended Correspondence Analysis and Basic Reciprocal Averaging from Hill and Gauch (1980)