Index fixace - Fixation index
The index fixace (FSVATÝ) je míra populační diferenciace kvůli genetická struktura. Často se odhaduje z genetický polymorfismus data, jako např jedno-nukleotidové polymorfismy (SNP) nebo mikrosatelity. Vyvinuto jako speciální případ Wrightova F-statistiky, je to jedna z nejčastěji používaných statistik v populační genetika.
Definice
Dvě z nejčastěji používaných definic pro FSVATÝ v daném místě jsou založeny na rozptylu frekvence alel mezi populacemi a na pravděpodobnosti Identita podle původu.
Li je průměrná frekvence alely v celkové populaci, je rozptyl ve frekvenci alely mezi různými subpopulacemi, vážený velikostí subpopulací, a je rozptyl alelického stavu v celkové populaci, FSVATÝ je definován jako [1]
Wrightova definice ilustruje, že FSVATÝ měří míru genetické variance, kterou lze vysvětlit strukturou populace. Lze to také považovat za zlomek celkové diverzity, který není důsledkem průměrné diverzity v subpopulacích, kde se diverzita měří pravděpodobností, že dvě náhodně vybrané alely jsou odlišné, a to . Pokud je alelová frekvence v Tato populace je a relativní velikost souboru Tato populace je , pak
Alternativně,[2]
kde je pravděpodobnost identity po sestupu dvou jedinců vzhledem k tomu, že tito dva jedinci jsou ve stejné subpopulaci, a je pravděpodobnost, že dva jedinci z celkové populace jsou shodní podle původu. Pomocí této definice FSVATÝ lze interpretovat jako měření toho, o kolik jsou si bližší dva jedinci ze stejné subpopulace ve srovnání s celkovou populací. Pokud rychlost mutace je malý, lze tuto interpretaci objasnit spojením pravděpodobnosti identity sestupem do splývající časy: Nechť T0 a T označují průměrný čas do koalescence u jedinců ze stejné subpopulace a celkové populace. Pak,
Tato formulace má tu výhodu, že očekávanou dobu do koalescence lze snadno odhadnout z genetických údajů, což vedlo k vývoji různých odhadů pro FSVATÝ.
Odhad
V praxi nelze snadno změřit žádné z množství použitých pro definice. V důsledku toho byly navrženy různé odhady. Obzvláště jednoduchý odhad použitelný pro data sekvence DNA je:[3]
kde a představují průměrný počet párových rozdílů mezi dvěma jednotlivci odebranými z různých subpopulací () nebo ze stejné dílčí populace (). Průměrný párový rozdíl v populaci lze vypočítat jako součet párových rozdílů dělený počtem párů. Tento odhad je však zkreslený, když jsou velikosti vzorků malé nebo pokud se liší mezi populacemi. Proto se k výpočtu F používají složitější metodySVATÝ v praxi. Dva z nejpoužívanějších postupů jsou odhad Weir & Cockerham (1984),[4] nebo předvádění Analýza molekulární variance. Seznam implementací je k dispozici na konci tohoto článku.
Výklad
Toto srovnání genetické variability uvnitř a mezi populacemi se často používá v aplikovaném populační genetika. Hodnoty se pohybují od 0 do 1. Nulová hodnota znamená kompletní panmixis; to znamená, že se obě populace volně chovají. Hodnota jednoho znamená, že všechny genetické variace jsou vysvětleny populační strukturou a že tyto dvě populace nesdílejí žádnou genetickou rozmanitost.
Pro idealizované modely, jako je Wrightův model konečných ostrovů, FSVATÝ lze použít k odhadu rychlosti migrace. Podle tohoto modelu je rychlost migrace
- ,
kde m je míra migrace na generaci a je rychlost mutace na generaci.[5]
Výklad FSVATÝ může být obtížné, když jsou analyzovaná data vysoce polymorfní. V tomto případě je pravděpodobnost sestupu velmi nízká a FSVATÝ může mít libovolně nízkou horní mez, což by mohlo vést k nesprávné interpretaci dat. Také přísně vzato FSVATÝ není vzdálenost v matematickém smyslu, protože nesplňuje nerovnost trojúhelníku.
Pro populace rostliny které jasně patří ke stejnému druh, hodnoty FSVATÝ větší než 15% se považuje za „velkou“ nebo „významnou“ diferenciaci, zatímco hodnoty pod 5% se považují za „malou“ nebo „nevýznamnou“ diferenciaci.[6]Hodnoty pro savec populace mezi poddruh nebo blízce příbuzné druhy, typické hodnoty jsou řádově 5% až 20%. FSVATÝ mezi euroasijský a severoamerické populace šedý vlk byly hlášeny na 9,9%, ty mezi Červený Vlk a šedý vlk populace mezi 17% a 18%. The Východní vlk, nedávno rozpoznaný vysoce přimíchaný „druh podobný vlku“ má hodnoty FSVATÝ pod 10% ve srovnání s euroasijskými (7,6%) a severoamerickými vlky šedými (5,7%), s červeným vlkem (8,5%), a dokonce ještě nižší hodnotou, pokud je spárován s Kojot (4.5%).[7]
FSVATÝ u lidí
FSVATÝ hodnoty silně závisí na výběru populací. Úzce spjaté etnické skupiny, jako např Dánové vs. holandský, nebo francouzština vs. Španělé zobrazit hodnoty významně pod 1%, k nerozeznání od panmixie. V rámci Evropy bylo zjištěno, že nejodlišnější etnické skupiny mají hodnoty řádově 7% (Laponci vs. Sardinians ).
Větší hodnoty jsou nalezeny, jsou-li porovnány vysoce odlišné homogenní skupiny: nejvyšší zjištěná hodnota byla téměř 46%, mezi Mbuti a Papuánci.[8]
Autosomální genetické vzdálenosti založené na klasických markerech
Ve své studii Dějiny a geografie lidských genů (1994), Cavalli-Sforza, Menozzi a Piazza poskytují jedny z nejpodrobnějších a nejkomplexnějších odhadů genetických vzdáleností mezi lidskými populacemi na kontinentech i mezi nimi. Jejich počáteční databáze obsahuje 76 676 genových frekvencí (pomocí 120 krevních polymorfismů), což odpovídá 6633 vzorkům na různých místech. Vyřazením a shromážděním takových vzorků omezují svou analýzu na 491 populací. Zaměřují se na domorodé populace které byly na jejich současném místě na konci 15. století, kdy začala velká evropská migrace.[9] Při studiu genetických rozdílů na světové úrovni je počet snížen na 42 reprezentativních populací, což agreguje subpopulace charakterizované vysokou úrovní genetické podobnosti. U těchto 42 populací uvádí Cavalli-Sforza a spoluautoři bilaterální vzdálenosti vypočítané ze 120 alel. Z této sady 42 světových populací je největší pozorovaná genetická vzdálenost mezi Mbuti Pygmies a Papuou-Novou Guineou, kde je první vzdálenost 0,4573, zatímco nejmenší genetická vzdálenost (0,0021) je mezi dánštinou a angličtinou. Když vezmeme v úvahu více členěných údajů pro 26 evropských populací, nejmenší genetická vzdálenost (0,0009) je mezi Holanďany a Dány a největší (0,0667) je mezi Lapony a Sardinany. Průměrná genetická vzdálenost mezi 861 dostupnými páry 42 vybraných populací byla 0,1338.[stránka potřebná ]. Genetická vzdálenost 0,1338 znamená, že příbuznost mezi nepříbuznými jedinci stejného původu ve vztahu k světové populaci je ekvivalentní příbuznosti mezi nevlastními sourozenci v populaci náhodného páření. To také znamená, že pokud má člověk z dané populace předků smíšeného nevlastního sourozence, je tento člověk geneticky blíže nepříbuznému jedinci jejich populace předků než jejich smíšenému nevlastnímu sourozenci. [10]
Autosomální genetické vzdálenosti založené na SNP
Studie z roku 2012 založená na Mezinárodní projekt HapMap odhadovaná data FSVATÝmezi třemi hlavními "kontinentálními" populacemi Evropané (v kombinaci s obyvateli Utahu ze severních a západoevropských předků ze sbírky CEPH a Italy z Toskánska), Východní Asiaté (kombinace čínských Han z Pekingu, čínských z metropolitního Denveru a Japonců z japonského Tokia) a Subsaharští Afričané (kombinace Luhya z Webuye v Keni, Masajové z Kinyawy, Keni a Yoruba Ibadan, Nigérie). Uvádí hodnotu blízkou 12% mezi kontinentální populací a hodnoty blízké panmixie (menší než 1%) v rámci kontinentálních populací.[11]
Evropa (CEU) | Subsaharská Afrika (Yoruba) | Východní Asie (japonština) | |
---|---|---|---|
Subsaharská Afrika (Yoruba) | 0.153 | ||
Východní Asie (japonština) | 0.111 | 0.190 | |
Východní Asie (čínština) | 0.110 | 0.192 | 0.007 |
Italové | Palestinci | švédský | Finové | španělština | Němci | Rusové | francouzština | Řekové | |
---|---|---|---|---|---|---|---|---|---|
Palestinci | 0.0064 | ||||||||
švédský | 0.0064-0.0090 | 0.0191 | |||||||
Finové | 0.0130-0.0230 | 0.0050-0.0110 | |||||||
španělština | 0.0010-0.0050 | 0.0101 | 0.0040-0055 | 0.0110-0.0170 | |||||
Němci | 0.0029-0.0080 | 0.0136 | 0.0007-0.0010 | 0.0060-0.0130 | 0.0015-0.0030 | ||||
Rusové | 0.0088-0.0120 | 0.0202 | 0.0030-0.0036 | 0.0060-0.0120 | 0.0070-0.0079 | 0.0030-0.0037 | |||
francouzština | 0.0030-0.0050 | 0.0020 | 0.0080-0.0150 | 0.0010 | 0.0010 | 0.0050 | |||
Řekové | 0.0000 | 0.0057 | 0.0084 | 0.0035 | 0.0039 | 0.0108 |
Programy pro výpočet FSVATÝ
- Arlequin
- Fstat
- SMOGD[14]
- rozmanitost (Balíček R)
- hierfstat (Balíček R)
- FinePop[15] (Balíček R)
- Mikrosatelitní analyzátor (MSA)
- VCFtools
- DnaSP
Moduly pro výpočet FSVATÝ
Reference
- ^ Holsinger, Kent E .; Bruce S. Weir (2009). „Genetika v geograficky strukturovaných populacích: definování, odhad a interpretace FST“. Nat Rev Genet. 10 (9): 639–650. doi:10.1038 / nrg2611. ISSN 1471-0056. PMC 4687486. PMID 19687804.
- ^ Richard Durrett (12. srpna 2008). Pravděpodobnostní modely pro vývoj sekvence DNA. Springer. ISBN 978-0-387-78168-6. Citováno 25. října 2012.
- ^ Hudson, RR .; Slatkin, M .; Maddison, WP. (Říjen 1992). „Odhad úrovní toku genů z dat sekvence DNA“. Genetika. 132 (2): 583–9. PMC 1205159. PMID 1427045.
- ^ Weir, B. S .; Cockerham, C. Clark (1984). "Odhad F-statistik pro analýzu populační struktury". Vývoj. 38 (6): 1358–1370. doi:10.2307/2408641. ISSN 0014-3820. JSTOR 2408641. PMID 28563791.
- ^ Peter Beerli, Odhad rychlostí migrace a velikosti populace v geograficky strukturovaných populacích (1998), Pokroky v molekulární ekologii (ed. G. Carvalho). NATO Science Series A: Life Sciences, IOS Press, Amsterdam, 39-53.
- ^ Frankham, R., Ballou, J.D., Briscoe, D.A., 2002. Úvod do genetiky ochrany. Cambridge University Press, Cambridge. Hartl DL, Clark AG (1997) Principles of Population Genetics, 3. vydání. Sinauer Associates, Inc, Sunderland, MA.
- ^ B. M. von Holdt a kol., „Analýza sekvence celého genomu ukazuje, že dva endemické druhy severoamerického vlka jsou příměsi kojota a šedého vlka“, Vědecké zálohy 27. července 2016: sv. 2, č. 7, e1501714, doi: 10,1126 / sciadv.1501714.
- ^ Cavalli-Sforza a kol. (1994), citovaný po V. Ginsburgh, S. Weber, Palgrave Handbook of Economics and LanguageSpringer (2016), p. 182.
- ^ Cavalli-Sforza a kol., 1994, s. 24
- ^ Harpending, Henry (2002). „Rozdělení příbuzenských a populačních skupin“. Populace a životní prostředí. 24 (2): 141–147. doi:10.1023 / A: 1020815420693. S2CID 15208802.
- ^ Elhaik, Eran (2012). „Empirické distribuce FST z rozsáhlých dat o lidském polymorfismu“. PLOS ONE. 7 (11): e49837. Bibcode:2012PLoSO ... 749837E. doi:10.1371 / journal.pone.0049837. PMC 3504095. PMID 23185452.
- ^ A b Nelis, Mari; et al. (08.05.2009). Fleischer, Robert C. (ed.). „Genetická struktura Evropanů: Pohled ze severovýchodu“. PLOS ONE. 4 (5): e5472. Bibcode:2009PLoSO ... 4.5472N. doi:10.1371 / journal.pone.0005472. PMC 2675054. PMID 19424496., viz tabulka
- ^ Tian, Chao; et al. (Listopad 2009). „Evropská populační genetická podstruktura: Další definice předků, informativní ukazatele pro rozlišování mezi různými evropskými etnickými skupinami“. Molekulární medicína. 15 (11–12): 371–383. doi:10,2119 / molmed.2009,00094. ISSN 1076-1551. PMC 2730349. PMID 19707526., viz tabulka
- ^ Crawford, Nicholas G. (2010). "smogd: software pro měření genetické rozmanitosti ". Zdroje molekulární ekologie. 10 (3): 556–557. doi:10.1111 / j.1755-0998.2009.02801.x. PMID 21565057.
- ^ Kitada S, Kitakado T, Kishino H (2007). „Empirická Bayesova inference párového F (ST) a jeho distribuce v genomu“. Genetika. 177 (2): 861–73. doi:10.1534 / genetika.107.077263. PMC 2034649. PMID 17660541.
Další čtení
- Evoluce a genetika populací Svazek 2: Teorie genových frekvencí, str. 294–295, S. Wright, Univ. of Chicago Press, Chicago, 1969
- Haplotypová mapa lidského genomu, The International HapMap Consortium, Nature 2005