Odvození trajektorie - Trajectory inference
Odvození trajektorie nebo pseudotemporální objednávání je výpočetní technika používaná v jednobuněčné transkriptomiky určit vzor dynamického procesu, kterému buňky čelí, a poté uspořádat buňky na základě jejich postupu procesem. Protokoly s jednou buňkou mají mnohem vyšší úroveň šumu než hromadné RNA sekvence,[1] společným krokem v pracovním postupu transkriptomiky jedné buňky je shlukování buněk do podskupin.[2] Shlukování může s touto inherentní variací bojovat kombinací signálu z mnoha buněk, přičemž umožňuje identifikaci typů buněk.[3] Některé rozdíly v genová exprese mezi buňkami jsou výsledkem dynamických procesů, jako je buněčný cyklus, diferenciace buněk nebo reakce na vnější podněty. Trajektorická inference se snaží charakterizovat takové rozdíly umístěním buněk podél kontinuální cesty, která představuje vývoj procesu, spíše než rozdělením buněk na jednotlivé klastry.[4] U některých metod se to provádí promítnutím buněk na osu zvanou pseudotime, která představuje postup procesem.[5]
Metody
Od roku 2015 bylo vytvořeno více než 50 algoritmů pro odvození trajektorie.[6] I když jsou zvolené přístupy různorodé, existují určité společné metody. Kroky v algoritmu se obvykle skládají z snížení rozměrů ke snížení složitosti dat, vytváření trajektorie k určení struktury dynamického procesu a promítnutí dat na trajektorii tak, aby byly buňky umístěny podle jejich vývoje procesem a buňky s podobnými profily exprese byly umístěny blízko sebe.[6] Algoritmy odvození trajektorie se liší v konkrétním postupu použitém pro redukci rozměrů, v druzích struktur, které lze použít k reprezentaci dynamického procesu, a v předběžných informacích, které jsou požadovány nebo mohou být poskytnuty.[7]
Snížení rozměrů
Data produkovaná jednobuněčným RNA-seq mohou sestávat z tisíců buněk, z nichž každá má úrovně exprese zaznamenané napříč tisíci genů.[8] Aby bylo možné efektivně zpracovávat data s tak vysokou dimenzionálností, mnoho algoritmů odvození trajektorie používá postup redukce dimenze, jako je analýza hlavních komponent (PCA), analýza nezávislých komponent (ICA) nebo t-SNE jako jejich první krok.[9] Účelem tohoto kroku je spojit mnoho funkcí dat do více informativní míry dat.[4] Například souřadnice vyplývající ze snížení dimenze může kombinovat úrovně exprese z mnoha genů, které jsou spojeny s buněčným cyklem, do jedné hodnoty, která představuje pozici buňky v buněčném cyklu.[9] Taková transformace odpovídá zmenšení dimenze v prostoru funkcí, ale zmenšení dimenze lze také aplikovat na ukázkový prostor seskupením skupin podobných buněk.[1]
Budova trajektorie
Mnoho metod představuje strukturu dynamického procesu pomocí a graf - na základě přístupu. V takovém přístupu vrcholy grafu odpovídá stavům v dynamickém procesu, jako jsou typy buněk v diferenciaci buněk, a hrany mezi uzly odpovídají přechodům mezi stavy.[6] Vytvoření grafu trajektorie lze provést pomocí k-nejbližší sousedé nebo minimální algoritmy spanning tree.[10] Topologie trajektorie odkazuje na strukturu grafu a různé algoritmy jsou omezeny na vytváření topologií grafů konkrétního typu, jako je lineární, větvení nebo cyklický.[4]
Použití předběžných informací
Některé metody vyžadují nebo umožňují zadání předběžných informací, které se používají jako vodítko pro vytvoření trajektorie. Použití dřívějších informací může vést k přesnějšímu určení trajektorie, ale špatní dřívější uživatelé mohou vyvést algoritmus z cesty nebo zkreslit výsledky směrem k očekávání.[6] Příklady předchozích informací, které lze použít při odvozování trajektorie, jsou výběr počátečních buněk, které jsou na začátku trajektorie, počet větví v trajektorii a počet koncových stavů pro trajektorii.[11]
Software
Monokl
Monocle nejprve používá test diferenciální exprese ke snížení počtu genů a poté se použije analýza nezávislých komponent pro další snížení rozměrů. Pro sestavení trajektorie počítá Monocle a minimální kostra, pak najde nejdelší připojená cesta v tom stromu. Buňky se promítají na nejbližší bod k nim podél této cesty.[5]
p-Creode
p-Creode najde nejpravděpodobnější cestu přes upravenou hustotu k-graf nejbližšího souseda. Grafy ze souboru jsou hodnoceny metrikou podobnosti grafů pro výběr nejreprezentativnější topologie. p-Creode byl testován na řadě jednobuněčných platforem, včetně hmotnostní cytometrie multiplexní imunofluorescence,[12] a jednobuněčný RNA sekvence. Nejsou vyžadovány žádné předchozí informace.[13]
Prak
Slingshot vezme štítky klastrů jako vstup a poté uspořádá tyto klastry do linií podle konstrukce a minimální kostra. Cesty stromem jsou vyhlazeny přizpůsobením simultánních hlavních křivek a hodnota pseudotimu buňky je určena jeho projekcí na jednu nebo více z těchto křivek. Předchozí informace, jako je počáteční a koncový klastr, jsou volitelné.[11]
TSCAN
TSCAN provádí redukci rozměrů pomocí analýza hlavních komponent a shlukuje buňky pomocí a směsný model. A minimální kostra se vypočítá pomocí středů klastrů a trajektorie se určí jako nejdelší připojená cesta toho stromu. TSCAN je bez dozoru algoritmus, který nevyžaduje žádné předchozí informace.[14]
Wanderlust / Wishbone
Wanderlust byl vyvinut pro analýzu hmotnostní cytometrie data, ale byla upravena pro jednobuněčné transkriptomiky aplikace. A Algoritmus k-nejbližších sousedů se používá ke konstrukci grafu, který spojuje každou buňku s nejbližší buňkou vzhledem k a metrický jako Euklidovská vzdálenost nebo kosinová vzdálenost. Wanderlust vyžaduje vstup počáteční buňky jako předběžnou informaci.[15]
Wishbone je postaven na Wanderlustu a umožňuje bifurkaci v topologii grafů, zatímco Wanderlust vytváří lineární graf. Wishbone kombinuje analýzu hlavních komponent a difúzní mapy k dosažení snížení rozměrů pak také vytvoří a KNN graf.[16]
Vodopád
Waterfall provádí redukci rozměrů pomocí analýza hlavních komponent a používá a Algoritmus k-means najít shluky buněk. A minimální kostra je postaven mezi středy klastrů. Vodopád je zcela bez dozoru, nevyžaduje žádné předchozí informace a produkuje lineární trajektorie.[17]
Reference
- ^ A b Bacher, Rhonda; Kendziorski, Christina (2016-04-07). „Návrh a výpočetní analýza jednobuněčných experimentů sekvenování RNA“. Genome Biology. 17 (1): 63. doi:10.1186 / s13059-016-0927-r. ISSN 1474-760X. PMC 4823857. PMID 27052890.
- ^ Hwang, Byungjin; Lee, Ji Hyun; Bang, Duhee (07.08.2018). „Jednobuněčné technologie sekvenování RNA a bioinformatické potrubí“. Experimentální a molekulární medicína. 50 (8): 96. doi:10.1038 / s12276-018-0071-8. ISSN 2092-6413. PMC 6082860. PMID 30089861.
- ^ Stegle, Oliver; Teichmann, Sarah A .; Marioni, John C. (2015-01-28). „Výpočtové a analytické výzvy v transkriptomice jedné buňky“. Genetika hodnocení přírody. 16 (3): 133–145. doi:10.1038 / nrg3833. ISSN 1471-0056. PMID 25628217. S2CID 205486032.
- ^ A b C Cannoodt, Robrecht; Saelens, Wouter; Saeys, Yvan (2016-10-19). "Výpočtové metody pro odvození trajektorie z transkriptomiky jedné buňky". European Journal of Immunology. 46 (11): 2496–2506. doi:10.1002 / eji.201646347. ISSN 0014-2980. PMID 27682842. S2CID 19562455.
- ^ A b Trapnell, Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J; Livak, Kenneth J; Mikkelsen, Tarjei S (2014-03-23). „Dynamika a regulátory rozhodování o osudu buněk jsou odhaleny pseudotemporálním uspořádáním jednotlivých buněk“. Přírodní biotechnologie. 32 (4): 381–386. doi:10,1038 / nbt.2859. ISSN 1087-0156. PMC 4122333. PMID 24658644.
- ^ A b C d Saelens, Wouter; Cannoodt, Robrecht; Todorov, Helena; Saeys, Yvan (01.01.2019). „Srovnání metod odvození trajektorie jedné buňky“. Přírodní biotechnologie. 37 (5): 547–555. doi:10.1038 / s41587-019-0071-9. PMID 30936559. S2CID 89616753.
- ^ Bang, Duhee; Lee, Ji Hyun; Hwang, Byungjin (07.08.2018). „Jednobuněčné technologie sekvenování RNA a bioinformatické potrubí“. Experimentální a molekulární medicína. 50 (8): 96. doi:10.1038 / s12276-018-0071-8. ISSN 2092-6413. PMC 6082860. PMID 30089861.
- ^ Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J .; Elo, Laura L. (2016-01-26). „Průzkum osvědčených postupů pro analýzu dat RNA-seq“. Genome Biology. 17 (1): 13. doi:10.1186 / s13059-016-0881-8. ISSN 1474-760X. PMC 4728800. PMID 26813401.
- ^ A b Yosef, Nir; Regev, Aviv; Wagner, Allon (listopad 2016). „Odhalení vektorů buněčné identity s jednobuněčnou genomikou“. Přírodní biotechnologie. 34 (11): 1145–1160. doi:10.1038 / nbt.3711. ISSN 1546-1696. PMC 5465644. PMID 27824854.
- ^ Cahan, Patrick; Tan, Yuqi; Kumar, Pavithra (01.01.2017). „Pochopení vývoje a kmenových buněk pomocí analýz genové exprese na základě jednotlivých buněk“. Rozvoj. 144 (1): 17–32. doi:10.1242 / dev.133058. ISSN 1477-9129. PMC 5278625. PMID 28049689.
- ^ A b Street, Kelly; Risso, Davide; Fletcher, Russell B .; Das, Diya; Ngai, John; Yosef, Nir; Purdom, Elizabeth; Dudoit, Sandrine (2018-06-19). „Prak: odvození buněčné linie a pseudotimu pro jednobuněčné transkriptomiky“. BMC Genomics. 19 (1): 477. doi:10.1186 / s12864-018-4772-0. PMC 6007078. PMID 29914354.
- ^ Gerdes, M. J .; Sevinsky, C. J .; Sood, A .; Adak, S .; Bello, M. O .; Bordwell, A .; Can, A .; Corwin, A .; Dinn, S. (01.07.2013). „Vysoce multiplexovaná jednobuněčná analýza rakovinné tkáně fixované ve formalínu a zalité v parafinu“. Sborník Národní akademie věd. 110 (29): 11982–11987. Bibcode:2013PNAS..11011982G. doi:10.1073 / pnas.1300136110. ISSN 0027-8424. PMC 3718135. PMID 23818604.
- ^ Lau, Ken S .; Coffey, Robert J .; Gerdes, Michael J .; Liu, Qi; Franklin, Jeffrey L .; Roland, Joseph T .; Ping, Jie; Simmons, Alan J .; McKinley, Eliot T. (2018-01-24). „Nekontrolovaná trajektorická analýza jednobuněčných RNA-Seq a zobrazovacích dat odhaluje alternativní původ chomáčků ve střevě“. Buněčné systémy. 6 (1): 37–51.e9. doi:10.1016 / j.cels.2017.10.012. ISSN 2405-4712. PMC 5799016. PMID 29153838.
- ^ Ji, Zhicheng; Ji, Hongkai (2016-05-13). „TSCAN: Rekonstrukce a vyhodnocení pseudo-času v jednobuněčné RNA-seq analýze“. Výzkum nukleových kyselin. 44 (13): e117. doi:10.1093 / nar / gkw430. ISSN 0305-1048. PMC 4994863. PMID 27179027.
- ^ Bendall, Sean C .; Davis, Kara L .; Amir, El-ad David; Tadmor, Michelle D .; Simonds, Erin F .; Chen, Tiffany J .; Shenfeld, Daniel K .; Nolan, Garry P .; Pe'Er, Dana (2014-04-24). „Detekce jednobuněčné trajektorie odhaluje progresi a regulační koordinaci ve vývoji lidských B buněk“. Buňka. 157 (3): 714–725. doi:10.1016 / j.cell.2014.04.005. ISSN 0092-8674. PMC 4045247. PMID 24766814.
- ^ Setty, Manu; Tadmor, Michelle D; Reich-Zeliger, Shlomit; Angel, Omer; Salame, Tomer Meir; Kathail, Pooja; Choi, Kristy; Bendall, Sean; Friedman, Nir (02.05.2016). „Wishbone identifikuje rozdvojené vývojové trajektorie z jednobuněčných dat“. Přírodní biotechnologie. 34 (6): 637–645. doi:10,1038 / nbt.3569. ISSN 1087-0156. PMC 4900897. PMID 27136076.
- ^ Shin, Jaehoon; Berg, Daniel A .; Zhu, Yunhua; Shin, Joseph Y .; Song, Juan; Bonaguidi, Michael A .; Enikolopov, Grigori; Nauen, David W .; Christian, Kimberly M .; Ming, Guo-li; Song, Hongjun (03.09.2015). „Jednobuněčná RNA-Seq s vodopádem odhaluje molekulární kaskády, které jsou základem neurogeneze dospělých“. Buňková kmenová buňka. 17 (3): 360–372. doi:10.1016 / j.stem.2015.07.013. ISSN 1934-5909. PMID 26299571.