Spiknutí sopky (statistika) - Volcano plot (statistics) - Wikipedia

Ve statistikách a spiknutí sopky je typ bodový diagram který se používá k rychlé identifikaci změn ve velkých souborech dat složených z replikovaných dat.[1] Vykresluje význam versus fold-change na osách y a x. Tyto grafy jsou stále častější omic experimenty jako genomika, proteomika, a metabolomika kde jeden často má seznam mnoha tisíců replikovaných datových bodů mezi dvěma podmínkami a jeden si přeje rychle identifikovat nejvýznamnější změny. Vulkánový graf kombinuje míru statistické významnosti ze statistického testu (např hodnota p z ANOVA model) s velikostí změny, což umožňuje rychlou vizuální identifikaci těch datových bodů (genů atd.), které zobrazují velké změny velikosti, které jsou také statisticky významný.
Sopkový pozemek je sestrojen vynesením záporného logaritmu hodnota p na osa y (obvykle základ 10). To má za následek, že se datové body s nízkými hodnotami p (vysoce významné) objevují v horní části grafu. The osa x je protokol složit změnu mezi těmito dvěma podmínkami. Protokol změny skladu se používá tak, aby se změny v obou směrech objevovaly ve stejné vzdálenosti od středu. Plotování bodů tímto způsobem má za následek dvě oblasti zájmu v grafu: ty body, které se nacházejí směrem k horní části grafu, které jsou daleko k levé nebo pravé straně. Jedná se o hodnoty, které zobrazují velké přehyby ohybu (tedy nalevo nebo napravo od středu) a také vysoké statistická významnost (odtud tedy směrem nahoru).
Další informace lze přidat zbarvením bodů podle třetí dimenze dat (například intenzita signálu), ale není to jednotně použito. Sopky se také používají ke grafickému zobrazení a analýza významnosti microarrays Kritérium výběru genů (SAM), příklad regulace.[2]
Koncept sopky lze zobecnit na jiné aplikace, kde osa x souvisí s mírou síly statistického signálu a osa y souvisí s opatřením statistická významnost signálu. Například v a genetická asociace kontrola případů studium, jako např Celomanomová asociační studie, bod na vulkánském pozemku představuje a jedno-nukleotidový polymorfismus.Jeho hodnota x může být poměr šancí a jeho hodnota y může být -log10 z hodnota p od a Test chí-kvadrát nebo chí-kvadrát statistika testu.[3]
Pozemky sopek ukazují charakteristický vzestupný tvar paže, protože podkladová data jsou obecně a Gaussian_function s x = hodnota p. Gaussian má podobu
- .
Takže z toho je
a negativní je
což je parabola, jejíž paže dosahují nahoru na levou a pravou stranu. Horní hranice dat je jedna parabola a dolní hranice je další parabola.
Reference
- ^ Cui, X .; Churchill, G. A. (2003). "Statistické testy pro diferenciální expresi v cDNA microarray experimentech". Genome Biology. 4 (4): 210. doi:10.1186 / gb-2003-4-4-210. PMC 154570. PMID 12702200.
- ^ Li, W. (2012). "Vulkánové grafy při analýze diferenciálních výrazů pomocí mRNA mikročipů". Journal of Bioinformatics and Computational Biology. 10 (6): 1231003. arXiv:1103.3434. doi:10.1142 / S0219720012310038. PMID 23075208.
- ^ Li, W.; Freudenberg, J .; Suh, Y. J .; Yang, Y. (2014). "Využití sopek a statistik regularizovaných chi v genetických asociačních studiích". Výpočetní biologie a chemie. 48: 77–83. arXiv:1308.6245. doi:10.1016 / j.compbiolchem.2013.02.003. PMID 23602812. S2CID 12399345.