Odvození trajektorie - Trajectory inference

Dráha trajektorie implementovaná v Slingshotu pro (a) simulovaný dvourozměrný datový soubor a (b) a jednobuněčná RNA sekv datová sada čichový epitel.

Odvození trajektorie nebo pseudotemporální objednávání je výpočetní technika používaná v jednobuněčné transkriptomiky určit vzor dynamického procesu, kterému buňky čelí, a poté uspořádat buňky na základě jejich postupu procesem. Protokoly s jednou buňkou mají mnohem vyšší úroveň šumu než hromadné RNA sekvence,[1] společným krokem v pracovním postupu transkriptomiky jedné buňky je shlukování buněk do podskupin.[2] Shlukování může s touto inherentní variací bojovat kombinací signálu z mnoha buněk, přičemž umožňuje identifikaci typů buněk.[3] Některé rozdíly v genová exprese mezi buňkami jsou výsledkem dynamických procesů, jako je buněčný cyklus, diferenciace buněk nebo reakce na vnější podněty. Trajektorická inference se snaží charakterizovat takové rozdíly umístěním buněk podél kontinuální cesty, která představuje vývoj procesu, spíše než rozdělením buněk na jednotlivé klastry.[4] U některých metod se to provádí promítnutím buněk na osu zvanou pseudotime, která představuje postup procesem.[5]

Metody

Od roku 2015 bylo vytvořeno více než 50 algoritmů pro odvození trajektorie.[6] I když jsou zvolené přístupy různorodé, existují určité společné metody. Kroky v algoritmu se obvykle skládají z snížení rozměrů ke snížení složitosti dat, vytváření trajektorie k určení struktury dynamického procesu a promítnutí dat na trajektorii tak, aby byly buňky umístěny podle jejich vývoje procesem a buňky s podobnými profily exprese byly umístěny blízko sebe.[6] Algoritmy odvození trajektorie se liší v konkrétním postupu použitém pro redukci rozměrů, v druzích struktur, které lze použít k reprezentaci dynamického procesu, a v předběžných informacích, které jsou požadovány nebo mohou být poskytnuty.[7]

PCA a vícerozměrná Gaussova distribuce. Zobrazené vektory jsou první (delší vektor) a druhá hlavní složka, které označují směry maximální odchylky.

Snížení rozměrů

Data produkovaná jednobuněčným RNA-seq mohou sestávat z tisíců buněk, z nichž každá má úrovně exprese zaznamenané napříč tisíci genů.[8] Aby bylo možné efektivně zpracovávat data s tak vysokou dimenzionálností, mnoho algoritmů odvození trajektorie používá postup redukce dimenze, jako je analýza hlavních komponent (PCA), analýza nezávislých komponent (ICA) nebo t-SNE jako jejich první krok.[9] Účelem tohoto kroku je spojit mnoho funkcí dat do více informativní míry dat.[4] Například souřadnice vyplývající ze snížení dimenze může kombinovat úrovně exprese z mnoha genů, které jsou spojeny s buněčným cyklem, do jedné hodnoty, která představuje pozici buňky v buněčném cyklu.[9] Taková transformace odpovídá zmenšení dimenze v prostoru funkcí, ale zmenšení dimenze lze také aplikovat na ukázkový prostor seskupením skupin podobných buněk.[1]

Budova trajektorie

Graf se šesti vrcholy. Mnoho algoritmů odvození trajektorie používá k sestavení trajektorie grafy.

Mnoho metod představuje strukturu dynamického procesu pomocí a graf - na základě přístupu. V takovém přístupu vrcholy grafu odpovídá stavům v dynamickém procesu, jako jsou typy buněk v diferenciaci buněk, a hrany mezi uzly odpovídají přechodům mezi stavy.[6] Vytvoření grafu trajektorie lze provést pomocí k-nejbližší sousedé nebo minimální algoritmy spanning tree.[10] Topologie trajektorie odkazuje na strukturu grafu a různé algoritmy jsou omezeny na vytváření topologií grafů konkrétního typu, jako je lineární, větvení nebo cyklický.[4]

Použití předběžných informací

Některé metody vyžadují nebo umožňují zadání předběžných informací, které se používají jako vodítko pro vytvoření trajektorie. Použití dřívějších informací může vést k přesnějšímu určení trajektorie, ale špatní dřívější uživatelé mohou vyvést algoritmus z cesty nebo zkreslit výsledky směrem k očekávání.[6] Příklady předchozích informací, které lze použít při odvozování trajektorie, jsou výběr počátečních buněk, které jsou na začátku trajektorie, počet větví v trajektorii a počet koncových stavů pro trajektorii.[11]

Software

Monokl

Monocle nejprve používá test diferenciální exprese ke snížení počtu genů a poté se použije analýza nezávislých komponent pro další snížení rozměrů. Pro sestavení trajektorie počítá Monocle a minimální kostra, pak najde nejdelší připojená cesta v tom stromu. Buňky se promítají na nejbližší bod k nim podél této cesty.[5]

p-Creode

p-Creode najde nejpravděpodobnější cestu přes upravenou hustotu k-graf nejbližšího souseda. Grafy ze souboru jsou hodnoceny metrikou podobnosti grafů pro výběr nejreprezentativnější topologie. p-Creode byl testován na řadě jednobuněčných platforem, včetně hmotnostní cytometrie multiplexní imunofluorescence,[12] a jednobuněčný RNA sekvence. Nejsou vyžadovány žádné předchozí informace.[13]

Prak

Slingshot vezme štítky klastrů jako vstup a poté uspořádá tyto klastry do linií podle konstrukce a minimální kostra. Cesty stromem jsou vyhlazeny přizpůsobením simultánních hlavních křivek a hodnota pseudotimu buňky je určena jeho projekcí na jednu nebo více z těchto křivek. Předchozí informace, jako je počáteční a koncový klastr, jsou volitelné.[11]

TSCAN

TSCAN provádí redukci rozměrů pomocí analýza hlavních komponent a shlukuje buňky pomocí a směsný model. A minimální kostra se vypočítá pomocí středů klastrů a trajektorie se určí jako nejdelší připojená cesta toho stromu. TSCAN je bez dozoru algoritmus, který nevyžaduje žádné předchozí informace.[14]

Wanderlust / Wishbone

Wanderlust byl vyvinut pro analýzu hmotnostní cytometrie data, ale byla upravena pro jednobuněčné transkriptomiky aplikace. A Algoritmus k-nejbližších sousedů se používá ke konstrukci grafu, který spojuje každou buňku s nejbližší buňkou vzhledem k a metrický jako Euklidovská vzdálenost nebo kosinová vzdálenost. Wanderlust vyžaduje vstup počáteční buňky jako předběžnou informaci.[15]

Wishbone je postaven na Wanderlustu a umožňuje bifurkaci v topologii grafů, zatímco Wanderlust vytváří lineární graf. Wishbone kombinuje analýzu hlavních komponent a difúzní mapy k dosažení snížení rozměrů pak také vytvoří a KNN graf.[16]

Vodopád

Waterfall provádí redukci rozměrů pomocí analýza hlavních komponent a používá a Algoritmus k-means najít shluky buněk. A minimální kostra je postaven mezi středy klastrů. Vodopád je zcela bez dozoru, nevyžaduje žádné předchozí informace a produkuje lineární trajektorie.[17]

Reference

  1. ^ A b Bacher, Rhonda; Kendziorski, Christina (2016-04-07). „Návrh a výpočetní analýza jednobuněčných experimentů sekvenování RNA“. Genome Biology. 17 (1): 63. doi:10.1186 / s13059-016-0927-r. ISSN  1474-760X. PMC  4823857. PMID  27052890.
  2. ^ Hwang, Byungjin; Lee, Ji Hyun; Bang, Duhee (07.08.2018). „Jednobuněčné technologie sekvenování RNA a bioinformatické potrubí“. Experimentální a molekulární medicína. 50 (8): 96. doi:10.1038 / s12276-018-0071-8. ISSN  2092-6413. PMC  6082860. PMID  30089861.
  3. ^ Stegle, Oliver; Teichmann, Sarah A .; Marioni, John C. (2015-01-28). „Výpočtové a analytické výzvy v transkriptomice jedné buňky“. Genetika hodnocení přírody. 16 (3): 133–145. doi:10.1038 / nrg3833. ISSN  1471-0056. PMID  25628217. S2CID  205486032.
  4. ^ A b C Cannoodt, Robrecht; Saelens, Wouter; Saeys, Yvan (2016-10-19). "Výpočtové metody pro odvození trajektorie z transkriptomiky jedné buňky". European Journal of Immunology. 46 (11): 2496–2506. doi:10.1002 / eji.201646347. ISSN  0014-2980. PMID  27682842. S2CID  19562455.
  5. ^ A b Trapnell, Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J; Livak, Kenneth J; Mikkelsen, Tarjei S (2014-03-23). „Dynamika a regulátory rozhodování o osudu buněk jsou odhaleny pseudotemporálním uspořádáním jednotlivých buněk“. Přírodní biotechnologie. 32 (4): 381–386. doi:10,1038 / nbt.2859. ISSN  1087-0156. PMC  4122333. PMID  24658644.
  6. ^ A b C d Saelens, Wouter; Cannoodt, Robrecht; Todorov, Helena; Saeys, Yvan (01.01.2019). „Srovnání metod odvození trajektorie jedné buňky“. Přírodní biotechnologie. 37 (5): 547–555. doi:10.1038 / s41587-019-0071-9. PMID  30936559. S2CID  89616753.
  7. ^ Bang, Duhee; Lee, Ji Hyun; Hwang, Byungjin (07.08.2018). „Jednobuněčné technologie sekvenování RNA a bioinformatické potrubí“. Experimentální a molekulární medicína. 50 (8): 96. doi:10.1038 / s12276-018-0071-8. ISSN  2092-6413. PMC  6082860. PMID  30089861.
  8. ^ Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J .; Elo, Laura L. (2016-01-26). „Průzkum osvědčených postupů pro analýzu dat RNA-seq“. Genome Biology. 17 (1): 13. doi:10.1186 / s13059-016-0881-8. ISSN  1474-760X. PMC  4728800. PMID  26813401.
  9. ^ A b Yosef, Nir; Regev, Aviv; Wagner, Allon (listopad 2016). „Odhalení vektorů buněčné identity s jednobuněčnou genomikou“. Přírodní biotechnologie. 34 (11): 1145–1160. doi:10.1038 / nbt.3711. ISSN  1546-1696. PMC  5465644. PMID  27824854.
  10. ^ Cahan, Patrick; Tan, Yuqi; Kumar, Pavithra (01.01.2017). „Pochopení vývoje a kmenových buněk pomocí analýz genové exprese na základě jednotlivých buněk“. Rozvoj. 144 (1): 17–32. doi:10.1242 / dev.133058. ISSN  1477-9129. PMC  5278625. PMID  28049689.
  11. ^ A b Street, Kelly; Risso, Davide; Fletcher, Russell B .; Das, Diya; Ngai, John; Yosef, Nir; Purdom, Elizabeth; Dudoit, Sandrine (2018-06-19). „Prak: odvození buněčné linie a pseudotimu pro jednobuněčné transkriptomiky“. BMC Genomics. 19 (1): 477. doi:10.1186 / s12864-018-4772-0. PMC  6007078. PMID  29914354.
  12. ^ Gerdes, M. J .; Sevinsky, C. J .; Sood, A .; Adak, S .; Bello, M. O .; Bordwell, A .; Can, A .; Corwin, A .; Dinn, S. (01.07.2013). „Vysoce multiplexovaná jednobuněčná analýza rakovinné tkáně fixované ve formalínu a zalité v parafinu“. Sborník Národní akademie věd. 110 (29): 11982–11987. Bibcode:2013PNAS..11011982G. doi:10.1073 / pnas.1300136110. ISSN  0027-8424. PMC  3718135. PMID  23818604.
  13. ^ Lau, Ken S .; Coffey, Robert J .; Gerdes, Michael J .; Liu, Qi; Franklin, Jeffrey L .; Roland, Joseph T .; Ping, Jie; Simmons, Alan J .; McKinley, Eliot T. (2018-01-24). „Nekontrolovaná trajektorická analýza jednobuněčných RNA-Seq a zobrazovacích dat odhaluje alternativní původ chomáčků ve střevě“. Buněčné systémy. 6 (1): 37–51.e9. doi:10.1016 / j.cels.2017.10.012. ISSN  2405-4712. PMC  5799016. PMID  29153838.
  14. ^ Ji, Zhicheng; Ji, Hongkai (2016-05-13). „TSCAN: Rekonstrukce a vyhodnocení pseudo-času v jednobuněčné RNA-seq analýze“. Výzkum nukleových kyselin. 44 (13): e117. doi:10.1093 / nar / gkw430. ISSN  0305-1048. PMC  4994863. PMID  27179027.
  15. ^ Bendall, Sean C .; Davis, Kara L .; Amir, El-ad David; Tadmor, Michelle D .; Simonds, Erin F .; Chen, Tiffany J .; Shenfeld, Daniel K .; Nolan, Garry P .; Pe'Er, Dana (2014-04-24). „Detekce jednobuněčné trajektorie odhaluje progresi a regulační koordinaci ve vývoji lidských B buněk“. Buňka. 157 (3): 714–725. doi:10.1016 / j.cell.2014.04.005. ISSN  0092-8674. PMC  4045247. PMID  24766814.
  16. ^ Setty, Manu; Tadmor, Michelle D; Reich-Zeliger, Shlomit; Angel, Omer; Salame, Tomer Meir; Kathail, Pooja; Choi, Kristy; Bendall, Sean; Friedman, Nir (02.05.2016). „Wishbone identifikuje rozdvojené vývojové trajektorie z jednobuněčných dat“. Přírodní biotechnologie. 34 (6): 637–645. doi:10,1038 / nbt.3569. ISSN  1087-0156. PMC  4900897. PMID  27136076.
  17. ^ Shin, Jaehoon; Berg, Daniel A .; Zhu, Yunhua; Shin, Joseph Y .; Song, Juan; Bonaguidi, Michael A .; Enikolopov, Grigori; Nauen, David W .; Christian, Kimberly M .; Ming, Guo-li; Song, Hongjun (03.09.2015). „Jednobuněčná RNA-Seq s vodopádem odhaluje molekulární kaskády, které jsou základem neurogeneze dospělých“. Buňková kmenová buňka. 17 (3): 360–372. doi:10.1016 / j.stem.2015.07.013. ISSN  1934-5909. PMID  26299571.

externí odkazy