Referenční databáze chromozomů haplotypu - Y Chromosome Haplotype Reference Database

Logo referenční databáze haplotypů chromozomu Y (YHRD) verze 4.0

The Referenční databáze chromozomů haplotypu (YHRD) je otevřená, anotovaná sbírka vzorků populace typovaných pro varianty chromozomální sekvence Y. Sledovány jsou dva důležité cíle: (1) tvorba spolehlivých odhadů četnosti pro Haplotypy Y-STR a Haplotypy Y-SNP být použit při kvantitativním hodnocení shody v soudních a příbuzenských případech a (2) charakterizaci mužských linií k vyvození závěrů o původu a historii lidských populací. Databáze je schválena Mezinárodní společnost pro forenzní genetiku (ISFG) Do prosince 2019 307 169 9-STR lokusové haplotypy, mezi nimi 246 821 17-STR lokusové haplotypy, 73,006 23-STR lokusové haplotypy, 73,810 27-STR lokusové haplotypy a 25 672 Y profily SNP vzorky ve 136 zemích byly přímo předloženy forenzními institucemi a univerzitami ze 73 zemí. Z geografického hlediska pochází 47% vzorků YHRD z Asie, 23% z Evropy, 14% ze Severní Ameriky, 11% z Latinské Ameriky, 3% z Afriky, 1% z Oceánie / Austrálie a 0,3% z Arktidy (vydání 62 z 31. prosince 2019). 1348 jednotlivých projektů odběru vzorků je popsáno ve více než 600 recenzovaných publikacích [1]

Předložení a registrace

YHRD je tvořeno přímým zadáváním populačních dat z jednotlivých laboratoří. Po obdržení podání pracovníci YHRD prozkoumají originalitu údajů a přidělí přístupové číslo vzorku populace a provedou kontroly zajištění kvality. Příspěvky se poté zaregistrují do veřejné databáze, kde je lze načíst Vyhledávání pro haplotypy, populace, přispěvatele nebo přístupová čísla. Veškerá data o populaci publikovaná ve forenzních časopisech jako FSI: Genetika nebo International Journal of Legal Medicine jsou povinni ověřovat správci YHRD a jsou následně zahrnuti do YHRD.[2]

Struktura databáze

Databáze podporuje nejčastěji používané formáty haplotypů (např. Minimal (minHt), Powerplex Y12,[3] YFiler,[4] Powerplex Y23 [5] , YfilerPlus a Maximal (maxHt), pro které existují databáze různých velikostí.

Protože existují silné korelace mezi geografickými oblastmi a Y chromozomálními variantami, byla databáze populace YHRD strukturována tak, aby zobrazovala geografický, jazykový a fylogenetický vztah prohledávaných profilů haplotypu. V současné době databáze YHRD rozeznává čtyři samostatné „metapopulační“ struktury: národní, kontinentální, jazykovou / etnickou a fylogenetickou příslušnost s několika kategoriemi uvnitř. V populační genetice termín metapopulace popisuje diskrétní prostorově distribuované skupiny populace, které jsou vzájemně propojeny genovým tokem a migrací.[6] Analogicky se termín metapopulace používá ve forenzní genetice k popisu souboru geograficky rozptýlených populací se sdíleným původem a pokračujícím genovým tokem. Skupiny populace jsou tedy v rámci metapopulace podobnější než skupiny mimo metapopulaci.[7]

Národní

Koncept sdružování údajů za účelem vytváření „národních databází“ má velmi přímé vysvětlení: donucovací orgány a forenzní služby se spoléhají na to, že jejich národní obyvatelstvo vytvoří referenční databáze. Pachatelé a oběti ve většině případů pocházejí z národního obyvatelstva a jejich genetické profily by proto měly být v databázi zastoupeny. V zemích jako USA, Brazílie, Velká Británie nebo Čína, které se vyznačují silnou populační strukturou, jsou národní referenční databáze často budovány na základě historického konceptu etnické příslušnosti, např. populace USA je strukturována do bělošské, africké, hispánské, asijské a indiánské populace nebo Spojené království rozlišuje angličtinu, afro-karibštinu, indicko-pákistánskou a čínštinu. Vnitrostátní databáze jsou díky svému významu ve vnitrostátních právních předpisech prohledávatelné v YHRD. Každá národní metapopulace v YHRD zahrnuje všechny jednotlivce, kterým byly odebrány vzorky v konkrétní zemi bez ohledu na jejich původ.

Kontinentální

Kontinentální metapopulace v YHRD zahrnuje všechny jednotlivce, kterým byly odebrány vzorky na konkrétním kontinentu bez ohledu na jejich předky. YHRD definuje sedm kontinentálních metapopulací podle klasifikace zeměpisných oblastí OSN: Afrika, Arktida, Asie, Evropa, Latinská Amerika, Severní Amerika, Oceánie / Austrálie.

Jazykové / etnické

Struktura metapopulace založená na „etnické / jazykové příslušnosti“ bere ve větší míře v úvahu původ předaných jedinců. „Původ“ je pojem, který shrnuje historické, kulturní, geografické a jazykové kategorie. Koncept metapopulace na základě „etnického původu“ samozřejmě není v žádném případě ideální, plně racionální nebo plně přeložitelný, ale jednoduše bere v úvahu skutečnost, že na globální úrovni mnohem lépe popisují kategorie jiné než „národ“ nebo „zeměpis“. pozorované genetické shlukování a nehomogenita vzorců Y chromozomu.

Pro globální referenční databázi se zdá být nejvhodnější kritérium „skupiny hlavních jazyků“ pro seskupení údajů tím, že se zohlední rodový původ a vytvoří subdatabáze s ohledem na genetickou podobnost. Důvod je přitom dvojí: zaprvé, jazyk je zděděným kulturním znakem, a proto jazykové kmeny často korelují s genetickými znaky, v neposlední řadě s polymorfismy chromozomů Y. Zadruhé, protože jazyky jsou vědou dobře prozkoumány a většinou jim veřejnost rozumí kvůli dlouhé tradici výzkumu jazyků, je lingvistická terminologie v zásadě srozumitelnější a přenositelnější do praxe než jejich genetický přívěsek. Kromě čisté jazykové kategorizace (např Altajský jazyková rodina zahrnující mluvící lidi Turek a Mongolské jazyky ) převzali jsme také sjednocující geografická kritéria (Subsaharská Afrika obsahující reproduktory různých Afričan jazykové skupiny, které žijí jižně od Sahara ).

Je důležité konstatovat, že současná struktura metapopulace je apriorní kategorizací, která vyžaduje průběžné hodnocení a ověřování pomocí statistických metod ke kvantifikaci genetické podobnosti / odlišnosti mezi vzorky. Zatímco současná kategorizace osmi velkých metapopulací získává určitou podporu z genetické analýzy vzdálenosti prováděné na základě ~ 41 000 haplotypů [7] další členění "euroasijsko - evropské metapopulace" bylo provedeno pouze na základě Haplotypy Y-STR. Analýza ~ 12 000 evropských haplotypů AMOVA ukazuje, že existují tři větší skupiny evropských haplotypů: západní, východní a jihovýchodní metapopulace.[8]

V současné době má YHRD sedm nepřekrývajících se široce definovaných metapopulací: africké, afroasijské, domorodé Američany, australské domorodce, východoasijské, eskymácké aleuty a euroasijské. Některé z těchto metapopulací se dále dělí, např. Euroasijský do šesti podkategorií, z nichž se evropská podskupina dále dělí na tři skupiny západních, východních a jihovýchodních Evropanů.

Fylogenetické

Profilování DNA chromozomů Y předložených YHRD je nyní kontinuálně rozšiřováno pro binární polymorfismy Y-SNP. Fylogeneze chromozomu Y definovaná binárními polymorfismy je dobře zavedená a stabilní (Underhill et al. (2000), Hammer et al. (2001), Jobling and Tyler-Smith (2003) a Karafet et al. (2008)). Všechny chromozomy Y sdílející mutaci jsou příbuzné sestupem, dokud další mutace nerozdělí větev. Haplotypy v haploskupině mohou být velmi podobné nebo dokonce „identické podle původu“ (IBD). Haploskupinu lze tedy použít jako kritérium pro substrukturu databáze podle fylogenetického původu vzorků. I když je chronologie mutací SNP mnohem méně jistá než struktura stromu, mnoho haploskupin lze srovnávat s událostmi v lidské prehistorii. Celosvětová distribuce vzorců rozmanitosti lidského Y-chromozomu odhalila jasné geograficky spojené haploskupiny (Underhill et al. (2000)).

Databázové nástroje

AMOVA

Analýza molekulární variance (AMOVA) je metoda pro analýzu populační variace pomocí molekulárních dat, např. Haplotypy Y-STR.[9] Pomocí AMOVA je možné vyhodnotit a kvantifikovat rozsah diferenciace mezi dvěma nebo více populačními vzorky. AMOVA je implementována jako online nástroj v YHRD a poskytuje způsob odhadu ΦSVATÝ a FSVATÝ hodnoty. Online nástroj přijímá soubory aplikace Excel a vytváří z nich vstupní soubory. K analýze AMOVA lze přidat až 9 referenčních populací vybraných z YHRD i populačních sad. Výsledkem online výpočtu bude výsledkem tabulka * .csv s párováním FSVATÝ nebo ΦSVATÝ(RSVATÝ) hodnoty plus hodnoty p jako test významnosti (10 000 permutací). Kromě toho Pozemek MDS je generováno pro grafické znázornění genetické vzdálenosti mezi analyzovanými populacemi. Program zobrazuje odkazy na vybrané populační studie, což usnadňuje správnou citaci.

Směs

Nástroj lze použít pro forenzní případy, kdy by měla být analyzována smíšená stopa (2 nebo více mužských přispěvatelů). Výsledkem bude poměr pravděpodobnosti dárcovství vs. nedárcovství předpokládaného přispěvatele ke stopě.

Příbuzenství

Tento nástroj lze použít v případech příbuzenských vztahů, kdy by měl být analyzován vztah mezi příbuznými proti proudu a proti proudu (např. Otec-syn nebo dědeček-vnuk). Výsledkem bude poměr pravděpodobnosti (neboli příbuzenského indexu) patrilinealního vztahu vs. patrilinealního vztahu analyzovaných osob.

Statistiky zápasů

Hledání YHRD bude mít za následek shodu nebo nesoulad mezi prohledávaným haplotypem a databázovými referenčními vzorky. Relativní počet shod je popsán jako frekvence profilu. Ve forenzních případech je pravděpodobnost shody, která je založena na frekvenci profilu, hodnocena pomocí různých metod. Některé z nich doporučují národní směrnice, např. metoda rozšířeného počítání s intervaly spolehlivosti a / nebo korekce subpopulace theta (SWGDAM Interpretation Guidelines for Y-Chromosome STR typing by Forensic Laboratories in USA, 2014) nebo metoda Discrete Laplace (Andersen et al. 2013) podle doporučení v Německu (Willuweit et. al. 2018). Jak rozšířené počítání, tak hodnoty DL poskytuje YHRD pro různé metapopulace.

Zprávy

datumUvolněníHaplotypyMilník
1. srpna 199912,517YHRD 1.0
16. června 20001a3,589
1. ledna 2003218,050
18. srpna 2003319,482
30. října 2003420,152
11. července 2003520,320
12. října 2003620,865
29. prosince 20038,921,446
24. února 20041021,546
26. února 20041122,872
13.dubna 20041224,524YHRD 2.0
24. května 20041325,066
1. července 20041426,325
18. září 20041528,649
17. prosince 20041632,196
31. května 20051734,558
14. října 20051838,761
31. ledna 20061941,965
1. srpna 20062046,831
28. prosince 20062151,253
13.dubna 20072252,655
10. srpna 20072354,833
23. července 20082459,004YHRD 3.0
1. října 20082565,165
29. ledna 20092668,108
13. února 20092772,082
23. března 20092872,055
12. června 20092974,742
21. srpna 20093079,147
16. listopadu 20093181,099
18. prosince 20093284,047
3. března 20103386,568
16. července 20103489,237
30. prosince 20103591,601
15. května 20113693,290
21. června 20113797,575
30. prosince 20113899,881
17. února 201239101,055
29. srpna 201240104,174
1. října 201241105,498
11. ledna 201342108,949
18. ledna 201343112,005
12. července 201344114,256
31. října 201345124,343
20. prosince 201346126,931
15. srpna 201447132,553YHRD 4.0
10. listopadu 201448136,184
17. února 201549143,044
18. července 201550154,329
6. ledna 201651160,693
27. října 201652178,171
1. března 201753183,655
6. června 201754188,209
20. října 201755197,102
9. dubna 201856207,467
15. června 201857216,562
9. září 201858255,811
1. listopadu 201859265,324
14. ledna 201960269,383
24. června 201961285,406
31. prosince 201962307,169

Viz také

Reference

  1. ^ „Domovská stránka YHRD“. Citováno 2. ledna 2020.
  2. ^ „Pokyny pro publikování FSIGEN“ (PDF). Citováno 25. září 2013.
  3. ^ „Promega PowerPlex Y“. Citováno 25. září 2013.
  4. ^ „Applied Biosystem Yfiler“. Citováno 25. září 2013.
  5. ^ „Promega PowerPlex Y23“. Citováno 25. září 2013.
  6. ^ Hanski, I. a Gilpin, M. (1997). Metapopulation Biology: Ecology, Genetics, and Evolution., Academic Press, San Diego.
  7. ^ A b Willuweit, S., Roewer, L. a The International Forensic Y Chromosome User Group (2007). Referenční databáze chromozomů haplotypu Y (YHRD): Aktualizace., Forensic Sci Int Genet 1 (2): 83–87.
  8. ^ Roewer, L., Croucher, PJP, Willuweit, S., Lu, TT, Kayser, M., Lessig, R., de Knijff, P., Jobling, MA, Tyler-Smith, C. a Krawczak, M. ( 2005). Podpis nedávných historických událostí v evropské distribuci haplotypu STR y-chromozomů., Hum Genet 116 (4): 279--291.
  9. ^ Roewer, L., Kayser, M., Dieltjes, P., Nagy, M., Bakker, E., Krawczak, M. a de Knijff, P. (1996). Analýza molekulární variance (AMOVA) y-chromozomově specifických mikrosatelitů u dvou blízce příbuzných lidských populací., Hum Mol Genet 5 (7): 1029–1033.

externí odkazy