Přísně standardizovaný průměrný rozdíl - Strictly standardized mean difference
![]() | Zdá se, že hlavní přispěvatel do tohoto článku má úzké spojení s jeho předmětem.Červenec 2011) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v statistika, přísně standardizovaný průměrný rozdíl (SSMD) je měřítkem velikost efektu. To je znamenat děleno standardní odchylka rozdílu mezi dvěma náhodnými hodnotami, každá z jedné ze dvou skupin. Původně byl navržen pro kontrolu kvality[1]a výběr zásahu[2]v vysoce výkonný screening (HTS) a stal se statistickým parametrem měřícím velikost efektu účinku pro srovnání libovolných dvou skupin s náhodnými hodnotami.[3]
Pozadí
v vysokovýkonný screening (HTS), kontrola kvality (QC) je zásadní. Důležitá charakteristika QC v HTS test kolik pozitivní kontroly testují sloučeniny a negativní kontroly se navzájem liší. Tuto charakteristiku QC lze vyhodnotit pomocí srovnání dvou typů jamek v HTS testy. Poměr signálu k šumu (S / N), poměr signálu k pozadí (S / B) a Z-faktor byly přijaty k hodnocení kvality HTS testy prostřednictvím srovnání dvou vyšetřovaných typů jamek. S / B však nebere v úvahu žádné informace o variabilitě; a S / N může zachytit variabilitu pouze v jedné skupině, a proto nemůže posoudit kvalitu test když tyto dvě skupiny mají různé variability.[1]Zhang JH a kol. navrhl Z-faktor.[4] Výhodou Z-faktor nad S / N a S / B je to, že bere v úvahu variabilitu v obou srovnávaných skupinách. V důsledku toho Z-faktor byl široce používán jako metrika QC v HTS testech.[Citace je zapotřebí ] Absolutní znaménko v Z-faktor dělá to nepohodlné odvodit jeho statistický závěr matematicky.
Chcete-li odvodit lépe interpretovatelný parametr pro měření diferenciace mezi dvěma skupinami, Zhang XHD[1]navrhla SSMD k vyhodnocení diferenciace mezi pozitivní kontrolou a negativní kontrolou v HTS testech. SSMD má pravděpodobnostní základ díky své silné vazbě na d+-pravděpodobnost (tj. pravděpodobnost, že rozdíl mezi dvěma skupinami je pozitivní).[2] Do určité míry d+-pravděpodobnost je ekvivalentní dobře zavedenému pravděpodobnostnímu indexu P (X > Y), který byl studován a aplikován v mnoha oblastech.[5][6][7][8][9] Na základě své pravděpodobnostní základny byl SSMD používán jak pro kontrolu kvality, tak pro výběr zásahu při vysoce výkonném screeningu.[1][2][10][11][12][13][14][15][16][17][18][19][20][21]
Pojem
Statistický parametr
Jako statistický parametr, SSMD (označeno jako ) je definován jako poměr znamenat na standardní odchylka rozdílu dvou náhodných hodnot ze dvou skupin. Předpokládejme, že jedna skupina s náhodnými hodnotami má znamenat a rozptyl a další skupina má znamenat a rozptyl . The kovariance mezi těmito dvěma skupinami je Poté je SSMD pro srovnání těchto dvou skupin definována jako[1]
Pokud jsou obě skupiny nezávislé,
Pokud mají dvě nezávislé skupiny stejné odchylky ,
V situaci, kdy jsou tyto dvě skupiny ve vzájemném vztahu, se běžně používá strategie, jak se vyhnout výpočtu je nejprve získat spárovaná pozorování od obou skupin a poté odhadnout SSMD na základě spárovaných pozorování. Na základě spárovaného rozdílu s populací znamenat a , SSMD je
Statistický odhad
V situaci, kdy jsou obě skupiny nezávislé, Zhang XHD[1]odvodil odhad maximální pravděpodobnosti (MLE) a odhad momentální metody (MM) SSMD. Předpokládejme, že skupiny 1 a 2 mají vzorek znamenat a vzorek odchylky . MM odhad SSMD je tedy[1]
Když mají obě skupiny normální rozdělení se stejnou rozptyl, jednotně minimální rozptyl nestranný odhad (UMVUE) SSMD je,[10]
kde jsou velikosti vzorků ve dvou skupinách a.[3]
V situaci, kdy jsou tyto dvě skupiny korelované, na základě spárovaného rozdílu s velikostí vzorku , vzorek znamenat a vzorek rozptyl , MM odhad SSMD je
Odhad UMVUE pro SSMD je[22]
SSMD vypadá podobně jako t-statistika a Cohenova d, ale navzájem se liší, jak je znázorněno v.[3]
Aplikace ve vysoce výkonných screeningových testech
SSMD je poměr znamenat do standardní odchylka rozdílu mezi dvěma skupinami. Když jsou data předzpracována pomocí logaritmické transformace, jak to běžně děláme v experimentech HTS, je SSMD znamenat změny skládání protokolu děleno standardní odchylka změny záhybu protokolu s ohledem na negativní referenci. Jinými slovy, SSMD je průměrná změna složení (na stupnici protokolu) penalizovaná variabilitou změny složení (na stupnici protokolu)[23]. Pro kontrolu kvality je jedním indexem kvality testu HTS velikost rozdílu mezi pozitivní kontrolou a negativní referencí v test talíř. Pro výběr zásahu velikost efektů a sloučenina (tj. a malá molekula nebo siRNA ) představuje velikost rozdílu mezi sloučenina a negativní reference. SSMD přímo měří velikost rozdílu mezi dvěma skupinami. Proto může být SSMD použit jak pro kontrolu kvality, tak pro výběr zásahů v HTS experimentech.
Kontrola kvality
Počet jamek pro pozitivní a negativní kontroly v destičce na platformě s 384 jamkami nebo 1536 jamkami je obvykle navržen tak, aby byl přiměřeně velký.[24]Předpokládejme, že pozitivní a negativní kontroly na destičce mají vzorek znamenat , vzorek odchylky a velikosti vzorků . Obvykle platí předpoklad, že ovládací prvky mají stejnou odchylku v destičce. V takovém případě se SSMD pro hodnocení kvality na této desce odhaduje na[10]
kde Pokud neplatí předpoklad stejného rozptylu, odhaduje se SSMD pro hodnocení kvality na této desce jako[1]
Pokud existují jasně odlehlé hodnoty v ovládacích prvcích lze SSMD odhadnout na[23]
kde jsou mediány a střední absolutní odchylky v pozitivní, respektive negativní kontrole.
The Z-faktor Kritérium QC založené na bázi se populárně používá v HTS testech. Bylo však prokázáno, že toto kritérium QC je nejvhodnější pro test s velmi nebo extrémně silnými pozitivními kontrolami.[10] V RNAi HTS test, silná nebo střední pozitivní kontrola je obvykle poučenější než velmi nebo extrémně silná pozitivní kontrola, protože účinnost této kontroly je více podobná požadovaným zásahům. Kromě toho mají pozitivní kontroly ve dvou experimentech HTS teoreticky různé velikosti účinků. Následně by se prahy QC pro střední kontrolu měly lišit od prahových hodnot pro silnou kontrolu v těchto dvou experimentech. Dále je běžné, že jsou v jednom experimentu přijaty dvě nebo více pozitivních kontrol.[11] Stejné použití Z-faktor Kritéria QC založená na obou ovládacích prvcích vedou k nekonzistentním výsledkům, jak je znázorněno v literaturách.[10][11]
Kritéria QC založená na SSMD uvedená v následující tabulce[20] vezměte v úvahu velikost účinku pozitivní kontroly v HTS testu, kde pozitivní kontrola (jako je inhibiční kontrola) má teoreticky hodnoty menší než negativní reference.
Typ kvality | A: Mírná kontrola | B: Silná kontrola | C: Velmi silná kontrola | D: Extrémně silná kontrola |
---|---|---|---|---|
Vynikající | ||||
Dobrý | ||||
Nižší | ||||
Chudý |
V případě, že je velikost účinku pozitivní kontroly biologicky známa, přijměte odpovídající kritérium založené na této tabulce. V opačném případě by následující strategie měla pomoci určit, které kritérium QC by se mělo použít: (i) v mnoha HTS testech s malou molekulou s jednou pozitivní kontrolou by mělo být obvykle přijato kritérium D (a příležitostně kritérium C), protože tato kontrola má obvykle velmi nebo extrémně silné účinky; ii) pro testy RNAi HTS, ve kterých je životaschopnost buněk měřenou odpovědí, by mělo být přijato kritérium D pro kontroly bez buněk (jmenovitě jamky bez přidaných buněk) nebo kontroly pozadí; (iii) ve viru test kde je zájem o množství virů v hostitelských buňkách, obvykle se používá kritérium C a kritérium D se příležitostně používá pro pozitivní kontrolu sestávající ze siRNA z viru.[20]
Podobná kritéria QC založená na SSMD mohou být vytvořena pro HTS test, kde pozitivní kontrola (jako je aktivační kontrola) má teoreticky hodnoty vyšší než negativní reference. Další podrobnosti o tom, jak použít kritéria QC založená na SSMD v experimentech HTS, najdete v knize.[20]
Výběr zásahu
V testu HTS je jedním primárním cílem výběr sloučeniny s požadovanou velikostí inhibičního nebo aktivačního účinku. Velikost složeného efektu je reprezentována velikostí rozdílu mezi testem sloučenina a negativní referenční skupina bez specifických účinků inhibice / aktivace. A sloučenina s požadovanou velikostí efektů na obrazovce HTS se nazývá hit. Proces výběru zásahů se nazývá výběr zásahů. Existují dvě hlavní strategie výběru zásahů s velkými efekty.[20] Jedním z nich je použití určitých metrik k zařazení a / nebo klasifikaci sloučeniny podle jejich účinků a poté vyberte největší počet silných sloučeniny to je praktické pro validaci testy.[17][19][22]Druhou strategií je otestovat, zda a sloučenina má dostatečně silné účinky k dosažení předem nastavené úrovně. V této strategii musí být kontrolovány míry falešně negativních (FNR) a / nebo falešně pozitivních (FPR).[14][15][16][25][26]
SSMD může nejen hodnotit velikost efektů, ale také klasifikovat efekty, jak je uvedeno v následující tabulce, na základě hodnoty populace () SSMD.[20][27]
Podtyp efektu | Prahové hodnoty pro negativní SSMD | Prahové hodnoty pro pozitivní SSMD |
---|---|---|
Mimořádně silný | ||
Velmi silný | ||
Silný | ||
Docela silné | ||
Mírný | ||
Docela mírné | ||
Docela slabý | ||
Slabý | ||
Velmi slabá | ||
Extrémně slabý | ||
Žádný efekt |
Odhad SSMD pro obrazovky bez replikátů se liší od odhadu pro obrazovky s replikáty.[20][23]
Na primární obrazovce bez replikátů, za předpokladu, že naměřená hodnota (obvykle v měřítku protokolu) v jamce pro testované sloučenina je a negativní reference na této desce má velikost vzorku , vzorek znamenat , medián , standardní odchylka a střední absolutní odchylka , SSMD za to sloučenina se odhaduje na[20][23]
kde .Když jsou v test což je obvykle běžné v experimentech HTS, robustní verze SSMD [23] lze získat pomocí
Na potvrzovací nebo primární obrazovce s replikáty pro i-tý test sloučenina s replikátů, vypočítáme spárovaný rozdíl mezi naměřenou hodnotou (obvykle na logaritmické stupnici) sloučenina a medián hodnotu negativní kontroly na destičce, pak získejte znamenat a rozptyl spárovaného rozdílu napříč replikáty. SSMD za to sloučenina se odhaduje na[20]
V mnoha případech mohou vědci pro výběr zásahů v experimentech HTS použít jak SSMD, tak průměrnou změnu složení. Zápletka se dvěma baterkami[28]může zobrazit průměrnou změnu složení a SSMD pro všechny testy sloučeniny v test a pomáhají integrovat oba při výběru zásahů v experimentech HTS[29]. Krok za krokem je ilustrováno použití SSMD pro výběr zásahů v HTS experimentech[23]
Viz také
- Velikost efektu
- vysoce výkonný screening
- Z-faktor
- Výběr zásahu
- SMCV
- C+-pravděpodobnost
- Proměnná kontrastu
- Zápletka se dvěma baterkami
Další čtení
- Zhang XHD (2011) „Optimální vysokovýkonný screening: Praktický experimentální design a analýza dat pro výzkum RNAi v genomovém měřítku, Cambridge University Press“
Reference
- ^ A b C d E F G h Zhang XHD (2007). „Dvojice nových statistických parametrů pro kontrolu kvality ve vysoce výkonných screeningových testech na interferenci RNA“. Genomika. 89 (4): 552–61. doi:10.1016 / j.ygeno.2006.12.014. PMID 17276655.
- ^ A b C Zhang XHD (2007). „Nová metoda s flexibilní a vyváženou kontrolou falešných negativů a falešných poplachů pro výběr zásahů ve vysoce výkonných screeningových testech interference RNA“. Journal of Biomolecular Screening. 12 (5): 645–55. doi:10.1177/1087057107300645. PMID 17517904.
- ^ A b C Zhang XHD (2010). "Přísně standardizovaný průměrný rozdíl, standardizovaný průměrný rozdíl a klasický t-test pro srovnání dvou skupin". Statistiky v biofarmaceutickém výzkumu. 2 (2): 292–99. doi:10.1198 / sbr.2009.0074.
- ^ Zhang JH, Chung TDY, Oldenburg KR (1999). Msgstr "Jednoduchý statistický parametr pro použití při hodnocení a validaci vysoce výkonných screeningových testů". Journal of Biomolecular Screening. 4 (2): 67–73. doi:10.1177/108705719900400206. PMID 10838414.
- ^ Owen DB, Graswell KJ, Hanson DL (1964). "Neparametrické horní hranice spolehlivosti pro P (Y
Y < X) když X a Y jsou normální ". Journal of the American Statistical Association. 59 (307): 906–24. doi:10.2307/2283110. hdl:2027 / mdp. 39015094992651. JSTOR 2283110. - ^ Church JD, Harris B (1970). "Odhad spolehlivosti ze vztahů stres-síla". Technometrics. 12: 49–54. doi:10.1080/00401706.1970.10488633.
- ^ Downton F (1973). Msgstr "Odhad Pr (Y
Technometrics. 15 (3): 551–8. doi:10.2307/1266860. JSTOR 1266860. - ^ Reiser B, Guttman I (1986). "Statistická inference pro Pr (Y-less-thaqn-X) - normální případ". Technometrics. 28 (3): 253–7. doi:10.2307/1269081. JSTOR 1269081.
- ^ Acion L, Peterson JJ, Temple S, Arndt S (2006). „Pravděpodobnostní index: intuitivní neparametrický přístup k měření velikosti efektů léčby“. Statistika v medicíně. 25 (4): 591–602. doi:10.1002 / sim.2256. PMID 16143965.
- ^ A b C d E Zhang XHD (2008). „Nová analytická kritéria a efektivní designy desek pro kontrolu kvality v screeningu RNAi v celém genomu“. Journal of Biomolecular Screening. 13 (5): 363–77. doi:10.1177/1087057108317062. PMID 18567841.
- ^ A b C Zhang XHD, Espeseth AS, Johnson E, Chin J, Gates A, Mitnaul L, Marine SD, Tian J, Stec EM, Kunapuli P, Holder DJ, Heyse JF, Stulovici B, Ferrer M (2008). „Integrace experimentálních a analytických přístupů ke zlepšení kvality dat na screenech RNAi v celém genomu“. Journal of Biomolecular Screening. 13 (5): 378–89. doi:10.1177/1087057108317145. PMID 18480473.
- ^ Zhang XHD, Ferrer M, Espeseth AS, Marine SD, Stec EM, Crackower MA, Holder DJ, Heyse JF, Strulovici B (2007). „Použití přísně standardizovaného průměrného rozdílu pro výběr zásahu v vysoce výkonných screeningových experimentech s interferencí primární RNA“. Journal of Biomolecular Screening. 12 (4): 645–55. doi:10.1177/1087057107300646. PMID 17435171.
- ^ Quon K, Kassner PD (2009). "RNA interferenční screening pro objev onkologických cílů". Znalecký posudek na terapeutické cíle. 13 (9): 1027–35. doi:10.1517/14728220903179338. PMID 19650760.
- ^ A b Zhang XHD (2010). „Efektivní metoda kontroly falešných objevů a falešných neobjevení na obrazovkách RNAi v měřítku genomu“. Journal of Biomolecular Screening. 15 (9): 1116–22. doi:10.1177/1087057110381783. PMID 20855561.
- ^ A b Zhang XHD, Lacson R, Yang R, Marine SD, McCampbell A, Toolan DM, Hare TR, Kajdas J, Berger JP, Holder DJ, Heyse JF, Ferrer M (2010). „Využití falešných objevů založených na SSMD a falešných neobjevení na obrazovkách RNAi v měřítku genomu“. Journal of Biomolecular Screening. 15 (9): 1123–31. doi:10.1177/1087057110381919. PMID 20852024.
- ^ A b Zhang XHD, Marine SD, Ferrer M (2009). „Míra chyb a síla na obrazovkách RNAi v měřítku genomu“. Journal of Biomolecular Screening. 14 (3): 230–38. doi:10.1177/1087057109331475. PMID 19211781.
- ^ A b Birmingham A, Selfors LM, Forster T, Wrobel D, Kennedy CJ, Shanks E, Santoyo-Lopez J, Dunican DJ, Long A, Kelleher D, Smith Q, Beijersbergen RL, Ghazal P, Shamu CE (2009). „Statistické metody pro analýzu vysoce výkonných interferenčních obrazovek RNA“. Přírodní metody. 6 (8): 569–75. doi:10.1038 / nmeth.1351. PMC 2789971. PMID 19644458.
- ^ Klinghoffer RA, Frazier J, Annis J, Berndt JD, Roberts BS, Arthur WT, Lacson R, Zhang XHD, Ferrer M, Moon RT, Cleary MA (2010). Bereswill S (ed.). „Genetický screening zprostředkovaný lentivirem identifikuje dihydrofolátreduktázu (DHFR) jako modulátor signalizace beta-katenin / GSK3“. PLOS ONE. 4 (9): e6892. doi:10.1371 / journal.pone.0006892. PMC 2731218. PMID 19727391.
- ^ A b Malo N, Hanley JA, Carlile G, Liu J, Pelletier J, Thomas D, Nadon R (2010). "Experimentální návrh a statistické metody pro lepší detekci zásahů při vysoce výkonném screeningu". Journal of Biomolecular Screening. 15 (8): 990–1000. doi:10.1177/1087057110377497. PMID 20817887.
- ^ A b C d E F G h i Zhang XHD (2011). Optimální vysokovýkonný screening: Praktický experimentální design a analýza dat pro výzkum RNAi v genomovém měřítku. Cambridge University Press. ISBN 978-0-521-73444-8.
- ^ Zhou HL, Xu M, Huang Q, Gates AT, Zhang XD, Castle JC, Stec E, Ferrer M, Strulovici B, Hazuda DJ, Espeseth AS (2008). "Screening RNAi v měřítku genomu na faktory hostitele potřebné pro replikaci HIV". Mobilní hostitel a mikrob. 4 (5): 495–504. doi:10.1016 / j.chom.2008.10.004. PMID 18976975.
- ^ A b Zhang XHD (2010). „Screening v celém genomu pro efektivní siRNA prostřednictvím hodnocení velikosti účinků siRNA“. Poznámky k výzkumu BMC. 1: 33. doi:10.1186/1756-0500-1-33. PMC 2526086. PMID 18710486.
- ^ A b C d E F Zhang XHD (2011). „Ilustrace SSMD, skóre z, SSMD *, z * skóre at Statistika pro výběr zásahu na obrazovkách s vysokou propustností RNAi“. Journal of Biomolecular Screening. 16 (7): 775–85. doi:10.1177/1087057111405851. PMID 21515799.
- ^ Zhang XHD, Heyse JF (2009). „Stanovení velikosti vzorku na obrazovkách RNAi v měřítku genomu“. Bioinformatika. 25 (7): 841–44. doi:10.1093 / bioinformatika / btp082. PMID 19223447.
- ^ Malo N, Hanley JA, Cerquozzi S, Pelletier J, Nadon R (2006). "Statistická praxe ve vysokoprůchodové screeningové analýze dat". Přírodní biotechnologie. 24 (2): 167–75. doi:10.1038 / nbt1186. PMID 16465162.
- ^ Zhang XHD, Kuan PF, Ferrer M, Shu X, Liu YC, Gates AT, Kunapuli P, Stec EM, Xu M, Marine SD, Holder DJ, Stulovici B, Heyse JF, Espeseth AS (2009). „Výběr výběru s falešnou kontrolou rychlosti objevu na obrazovkách RNAi v genomovém měřítku“. Výzkum nukleových kyselin. 36 (14): 4667–79. doi:10.1093 / nar / gkn435. PMC 2504311. PMID 18628291.
- ^ Zhang XHD (2009). „Metoda pro efektivní srovnání genových účinků ve více podmínkách v RNAi a výzkumu profilování exprese“. Farmakogenomika. 10 (3): 345–58. doi:10.2217/14622416.10.3.345. PMID 20397965.
- ^ Zhang XHD (2010). "Posouzení velikosti účinků genu nebo RNAi v multifaktorových vysoce výkonných experimentech". Farmakogenomika. 11 (2): 199–213. doi:10.2217 / PGS.09.136. PMID 20136359.
- ^ Zhao WQ, Santini F, Breese R, Ross D, Zhang XD, Stone DJ, Ferrer M, Townsend M, Wolfe AL, Seager MA, Kinney GG, Shughrue PJ, Ray WJ (2010). „Inhibice kalcineurinem zprostředkované endocytózy a receptorů alfa-amino-3-hydroxy-5-methyl-4-isoxazolepropionové kyseliny (AMPA) brání synaptickému narušení vyvolanému amyloidem beta oligomerem“. Journal of Biological Chemistry. 285 (10): 7619–32. doi:10.1074 / jbc.M109.057182. PMC 2844209. PMID 20032460.