Referenční databáze chromozomů haplotypu - Y Chromosome Haplotype Reference Database
The Referenční databáze chromozomů haplotypu (YHRD) je otevřená, anotovaná sbírka vzorků populace typovaných pro varianty chromozomální sekvence Y. Sledovány jsou dva důležité cíle: (1) tvorba spolehlivých odhadů četnosti pro Haplotypy Y-STR a Haplotypy Y-SNP být použit při kvantitativním hodnocení shody v soudních a příbuzenských případech a (2) charakterizaci mužských linií k vyvození závěrů o původu a historii lidských populací. Databáze je schválena Mezinárodní společnost pro forenzní genetiku (ISFG) Do prosince 2019 307 169 9-STR lokusové haplotypy, mezi nimi 246 821 17-STR lokusové haplotypy, 73,006 23-STR lokusové haplotypy, 73,810 27-STR lokusové haplotypy a 25 672 Y profily SNP vzorky ve 136 zemích byly přímo předloženy forenzními institucemi a univerzitami ze 73 zemí. Z geografického hlediska pochází 47% vzorků YHRD z Asie, 23% z Evropy, 14% ze Severní Ameriky, 11% z Latinské Ameriky, 3% z Afriky, 1% z Oceánie / Austrálie a 0,3% z Arktidy (vydání 62 z 31. prosince 2019). 1348 jednotlivých projektů odběru vzorků je popsáno ve více než 600 recenzovaných publikacích [1]
Předložení a registrace
YHRD je tvořeno přímým zadáváním populačních dat z jednotlivých laboratoří. Po obdržení podání pracovníci YHRD prozkoumají originalitu údajů a přidělí přístupové číslo vzorku populace a provedou kontroly zajištění kvality. Příspěvky se poté zaregistrují do veřejné databáze, kde je lze načíst Vyhledávání pro haplotypy, populace, přispěvatele nebo přístupová čísla. Veškerá data o populaci publikovaná ve forenzních časopisech jako FSI: Genetika nebo International Journal of Legal Medicine jsou povinni ověřovat správci YHRD a jsou následně zahrnuti do YHRD.[2]
Struktura databáze
Databáze podporuje nejčastěji používané formáty haplotypů (např. Minimal (minHt), Powerplex Y12,[3] YFiler,[4] Powerplex Y23 [5] , YfilerPlus a Maximal (maxHt), pro které existují databáze různých velikostí.
Protože existují silné korelace mezi geografickými oblastmi a Y chromozomálními variantami, byla databáze populace YHRD strukturována tak, aby zobrazovala geografický, jazykový a fylogenetický vztah prohledávaných profilů haplotypu. V současné době databáze YHRD rozeznává čtyři samostatné „metapopulační“ struktury: národní, kontinentální, jazykovou / etnickou a fylogenetickou příslušnost s několika kategoriemi uvnitř. V populační genetice termín metapopulace popisuje diskrétní prostorově distribuované skupiny populace, které jsou vzájemně propojeny genovým tokem a migrací.[6] Analogicky se termín metapopulace používá ve forenzní genetice k popisu souboru geograficky rozptýlených populací se sdíleným původem a pokračujícím genovým tokem. Skupiny populace jsou tedy v rámci metapopulace podobnější než skupiny mimo metapopulaci.[7]
Národní
Koncept sdružování údajů za účelem vytváření „národních databází“ má velmi přímé vysvětlení: donucovací orgány a forenzní služby se spoléhají na to, že jejich národní obyvatelstvo vytvoří referenční databáze. Pachatelé a oběti ve většině případů pocházejí z národního obyvatelstva a jejich genetické profily by proto měly být v databázi zastoupeny. V zemích jako USA, Brazílie, Velká Británie nebo Čína, které se vyznačují silnou populační strukturou, jsou národní referenční databáze často budovány na základě historického konceptu etnické příslušnosti, např. populace USA je strukturována do bělošské, africké, hispánské, asijské a indiánské populace nebo Spojené království rozlišuje angličtinu, afro-karibštinu, indicko-pákistánskou a čínštinu. Vnitrostátní databáze jsou díky svému významu ve vnitrostátních právních předpisech prohledávatelné v YHRD. Každá národní metapopulace v YHRD zahrnuje všechny jednotlivce, kterým byly odebrány vzorky v konkrétní zemi bez ohledu na jejich původ.
Kontinentální
Kontinentální metapopulace v YHRD zahrnuje všechny jednotlivce, kterým byly odebrány vzorky na konkrétním kontinentu bez ohledu na jejich předky. YHRD definuje sedm kontinentálních metapopulací podle klasifikace zeměpisných oblastí OSN: Afrika, Arktida, Asie, Evropa, Latinská Amerika, Severní Amerika, Oceánie / Austrálie.
Jazykové / etnické
Struktura metapopulace založená na „etnické / jazykové příslušnosti“ bere ve větší míře v úvahu původ předaných jedinců. „Původ“ je pojem, který shrnuje historické, kulturní, geografické a jazykové kategorie. Koncept metapopulace na základě „etnického původu“ samozřejmě není v žádném případě ideální, plně racionální nebo plně přeložitelný, ale jednoduše bere v úvahu skutečnost, že na globální úrovni mnohem lépe popisují kategorie jiné než „národ“ nebo „zeměpis“. pozorované genetické shlukování a nehomogenita vzorců Y chromozomu.
Pro globální referenční databázi se zdá být nejvhodnější kritérium „skupiny hlavních jazyků“ pro seskupení údajů tím, že se zohlední rodový původ a vytvoří subdatabáze s ohledem na genetickou podobnost. Důvod je přitom dvojí: zaprvé, jazyk je zděděným kulturním znakem, a proto jazykové kmeny často korelují s genetickými znaky, v neposlední řadě s polymorfismy chromozomů Y. Zadruhé, protože jazyky jsou vědou dobře prozkoumány a většinou jim veřejnost rozumí kvůli dlouhé tradici výzkumu jazyků, je lingvistická terminologie v zásadě srozumitelnější a přenositelnější do praxe než jejich genetický přívěsek. Kromě čisté jazykové kategorizace (např Altajský jazyková rodina zahrnující mluvící lidi Turek a Mongolské jazyky ) převzali jsme také sjednocující geografická kritéria (Subsaharská Afrika obsahující reproduktory různých Afričan jazykové skupiny, které žijí jižně od Sahara ).
Je důležité konstatovat, že současná struktura metapopulace je apriorní kategorizací, která vyžaduje průběžné hodnocení a ověřování pomocí statistických metod ke kvantifikaci genetické podobnosti / odlišnosti mezi vzorky. Zatímco současná kategorizace osmi velkých metapopulací získává určitou podporu z genetické analýzy vzdálenosti prováděné na základě ~ 41 000 haplotypů [7] další členění "euroasijsko - evropské metapopulace" bylo provedeno pouze na základě Haplotypy Y-STR. Analýza ~ 12 000 evropských haplotypů AMOVA ukazuje, že existují tři větší skupiny evropských haplotypů: západní, východní a jihovýchodní metapopulace.[8]
V současné době má YHRD sedm nepřekrývajících se široce definovaných metapopulací: africké, afroasijské, domorodé Američany, australské domorodce, východoasijské, eskymácké aleuty a euroasijské. Některé z těchto metapopulací se dále dělí, např. Euroasijský do šesti podkategorií, z nichž se evropská podskupina dále dělí na tři skupiny západních, východních a jihovýchodních Evropanů.
Fylogenetické
Profilování DNA chromozomů Y předložených YHRD je nyní kontinuálně rozšiřováno pro binární polymorfismy Y-SNP. Fylogeneze chromozomu Y definovaná binárními polymorfismy je dobře zavedená a stabilní (Underhill et al. (2000), Hammer et al. (2001), Jobling and Tyler-Smith (2003) a Karafet et al. (2008)). Všechny chromozomy Y sdílející mutaci jsou příbuzné sestupem, dokud další mutace nerozdělí větev. Haplotypy v haploskupině mohou být velmi podobné nebo dokonce „identické podle původu“ (IBD). Haploskupinu lze tedy použít jako kritérium pro substrukturu databáze podle fylogenetického původu vzorků. I když je chronologie mutací SNP mnohem méně jistá než struktura stromu, mnoho haploskupin lze srovnávat s událostmi v lidské prehistorii. Celosvětová distribuce vzorců rozmanitosti lidského Y-chromozomu odhalila jasné geograficky spojené haploskupiny (Underhill et al. (2000)).
Databázové nástroje
AMOVA
Analýza molekulární variance (AMOVA) je metoda pro analýzu populační variace pomocí molekulárních dat, např. Haplotypy Y-STR.[9] Pomocí AMOVA je možné vyhodnotit a kvantifikovat rozsah diferenciace mezi dvěma nebo více populačními vzorky. AMOVA je implementována jako online nástroj v YHRD a poskytuje způsob odhadu ΦSVATÝ a FSVATÝ hodnoty. Online nástroj přijímá soubory aplikace Excel a vytváří z nich vstupní soubory. K analýze AMOVA lze přidat až 9 referenčních populací vybraných z YHRD i populačních sad. Výsledkem online výpočtu bude výsledkem tabulka * .csv s párováním FSVATÝ nebo ΦSVATÝ(RSVATÝ) hodnoty plus hodnoty p jako test významnosti (10 000 permutací). Kromě toho Pozemek MDS je generováno pro grafické znázornění genetické vzdálenosti mezi analyzovanými populacemi. Program zobrazuje odkazy na vybrané populační studie, což usnadňuje správnou citaci.
Směs
Nástroj lze použít pro forenzní případy, kdy by měla být analyzována smíšená stopa (2 nebo více mužských přispěvatelů). Výsledkem bude poměr pravděpodobnosti dárcovství vs. nedárcovství předpokládaného přispěvatele ke stopě.
Příbuzenství
Tento nástroj lze použít v případech příbuzenských vztahů, kdy by měl být analyzován vztah mezi příbuznými proti proudu a proti proudu (např. Otec-syn nebo dědeček-vnuk). Výsledkem bude poměr pravděpodobnosti (neboli příbuzenského indexu) patrilinealního vztahu vs. patrilinealního vztahu analyzovaných osob.
Statistiky zápasů
Hledání YHRD bude mít za následek shodu nebo nesoulad mezi prohledávaným haplotypem a databázovými referenčními vzorky. Relativní počet shod je popsán jako frekvence profilu. Ve forenzních případech je pravděpodobnost shody, která je založena na frekvenci profilu, hodnocena pomocí různých metod. Některé z nich doporučují národní směrnice, např. metoda rozšířeného počítání s intervaly spolehlivosti a / nebo korekce subpopulace theta (SWGDAM Interpretation Guidelines for Y-Chromosome STR typing by Forensic Laboratories in USA, 2014) nebo metoda Discrete Laplace (Andersen et al. 2013) podle doporučení v Německu (Willuweit et. al. 2018). Jak rozšířené počítání, tak hodnoty DL poskytuje YHRD pro různé metapopulace.
Zprávy
datum | Uvolnění | Haplotypy | Milník |
---|---|---|---|
1. srpna 1999 | 1 | 2,517 | YHRD 1.0 |
16. června 2000 | 1a | 3,589 | |
1. ledna 2003 | 2 | 18,050 | |
18. srpna 2003 | 3 | 19,482 | |
30. října 2003 | 4 | 20,152 | |
11. července 2003 | 5 | 20,320 | |
12. října 2003 | 6 | 20,865 | |
29. prosince 2003 | 8,9 | 21,446 | |
24. února 2004 | 10 | 21,546 | |
26. února 2004 | 11 | 22,872 | |
13.dubna 2004 | 12 | 24,524 | YHRD 2.0 |
24. května 2004 | 13 | 25,066 | |
1. července 2004 | 14 | 26,325 | |
18. září 2004 | 15 | 28,649 | |
17. prosince 2004 | 16 | 32,196 | |
31. května 2005 | 17 | 34,558 | |
14. října 2005 | 18 | 38,761 | |
31. ledna 2006 | 19 | 41,965 | |
1. srpna 2006 | 20 | 46,831 | |
28. prosince 2006 | 21 | 51,253 | |
13.dubna 2007 | 22 | 52,655 | |
10. srpna 2007 | 23 | 54,833 | |
23. července 2008 | 24 | 59,004 | YHRD 3.0 |
1. října 2008 | 25 | 65,165 | |
29. ledna 2009 | 26 | 68,108 | |
13. února 2009 | 27 | 72,082 | |
23. března 2009 | 28 | 72,055 | |
12. června 2009 | 29 | 74,742 | |
21. srpna 2009 | 30 | 79,147 | |
16. listopadu 2009 | 31 | 81,099 | |
18. prosince 2009 | 32 | 84,047 | |
3. března 2010 | 33 | 86,568 | |
16. července 2010 | 34 | 89,237 | |
30. prosince 2010 | 35 | 91,601 | |
15. května 2011 | 36 | 93,290 | |
21. června 2011 | 37 | 97,575 | |
30. prosince 2011 | 38 | 99,881 | |
17. února 2012 | 39 | 101,055 | |
29. srpna 2012 | 40 | 104,174 | |
1. října 2012 | 41 | 105,498 | |
11. ledna 2013 | 42 | 108,949 | |
18. ledna 2013 | 43 | 112,005 | |
12. července 2013 | 44 | 114,256 | |
31. října 2013 | 45 | 124,343 | |
20. prosince 2013 | 46 | 126,931 | |
15. srpna 2014 | 47 | 132,553 | YHRD 4.0 |
10. listopadu 2014 | 48 | 136,184 | |
17. února 2015 | 49 | 143,044 | |
18. července 2015 | 50 | 154,329 | |
6. ledna 2016 | 51 | 160,693 | |
27. října 2016 | 52 | 178,171 | |
1. března 2017 | 53 | 183,655 | |
6. června 2017 | 54 | 188,209 | |
20. října 2017 | 55 | 197,102 | |
9. dubna 2018 | 56 | 207,467 | |
15. června 2018 | 57 | 216,562 | |
9. září 2018 | 58 | 255,811 | |
1. listopadu 2018 | 59 | 265,324 | |
14. ledna 2019 | 60 | 269,383 | |
24. června 2019 | 61 | 285,406 | |
31. prosince 2019 | 62 | 307,169 |
Viz také
- Y chromozom
- Populační genetika
- Profilování DNA
- Krátký tandemový opakování
- Jednonukleotidový polymorfismus
- Seznam online databází
Reference
- ^ „Domovská stránka YHRD“. Citováno 2. ledna 2020.
- ^ „Pokyny pro publikování FSIGEN“ (PDF). Citováno 25. září 2013.
- ^ „Promega PowerPlex Y“. Citováno 25. září 2013.
- ^ „Applied Biosystem Yfiler“. Citováno 25. září 2013.
- ^ „Promega PowerPlex Y23“. Citováno 25. září 2013.
- ^ Hanski, I. a Gilpin, M. (1997). Metapopulation Biology: Ecology, Genetics, and Evolution., Academic Press, San Diego.
- ^ A b Willuweit, S., Roewer, L. a The International Forensic Y Chromosome User Group (2007). Referenční databáze chromozomů haplotypu Y (YHRD): Aktualizace., Forensic Sci Int Genet 1 (2): 83–87.
- ^ Roewer, L., Croucher, PJP, Willuweit, S., Lu, TT, Kayser, M., Lessig, R., de Knijff, P., Jobling, MA, Tyler-Smith, C. a Krawczak, M. ( 2005). Podpis nedávných historických událostí v evropské distribuci haplotypu STR y-chromozomů., Hum Genet 116 (4): 279--291.
- ^ Roewer, L., Kayser, M., Dieltjes, P., Nagy, M., Bakker, E., Krawczak, M. a de Knijff, P. (1996). Analýza molekulární variance (AMOVA) y-chromozomově specifických mikrosatelitů u dvou blízce příbuzných lidských populací., Hum Mol Genet 5 (7): 1029–1033.