Jednobuněčná transkriptomika - Single-cell transcriptomics
Jednobuněčná transkriptomika zkoumá gen úroveň vyjádření jednotlivce buňky v dané populaci současným měřením messenger RNA (mRNA) koncentrace stovek až tisíců genů.[1]Rozluštění heterogenní buněčné populace, rekonstrukce buněčných vývojových trajektorií a modelování transkripční dynamiky - vše dříve maskované hromadně přepis měření - jsou umožněna analýzou těchto transkriptomických dat.[2]
Pozadí
Analýza genové exprese se stala rutinou díky vývoji vysoké propustnosti Sekvenování RNA (RNA-seq) a mikročipy. Analýza RNA, která byla dříve omezena na sledování jednotlivce přepisy podle Northern blot nebo kvantitativní PCR se nyní často používá k charakterizaci profilů exprese populací tisíců buněk. Data vytvořená z hromadných údajů testy vedl k identifikaci genů, které jsou odlišně exprimovány v odlišných populacích buněk a biomarker objev.[3]
Tyto genomové studie jsou omezené, protože poskytují měření pro celé tkáně a ve výsledku ukazují průměrný profil exprese pro všechny základní buňky. V mnohobuněčných organismech mohou mít různé typy buněk ve stejné populaci odlišné role a vytvářet subpopulace s různými transkripčními profily. Korelace v genové expresi subpopulací mohou často chybět kvůli nedostatečné identifikaci subpopulace.[4]Kromě toho hromadné testy nedokážou určit, zda je změna v profilu exprese způsobena změnou regulace nebo složení, ve kterém jeden buněčný typ dominuje populaci. A konečně, když zkoumáme buněčnou progresi skrz diferenciace, průměrné profily exprese jsou schopné uspořádat buňky pouze podle času, spíše než podle jejich stadia vývoje, a proto nejsou schopné ukázat trendy v úrovních genové exprese specifické pro určité fáze.[5]
Nedávný pokrok v biotechnologiích umožňuje měření genové exprese ve stovkách až tisících jednotlivých buněk současně. Zatímco tyto průlomy v transkriptomické technologie umožnily generování jednobuněčných transkriptomických dat, jsou vytvořeny nové výpočetní a analytické výzvy. Techniky používané k analýze dat RNA-seq z populací buněčných populací lze použít pro data z jedné buňky, ale pro tento datový typ bylo navrženo mnoho nových výpočetních přístupů, které usnadňují úplné a podrobné studium profilů exprese jedné buňky.[6]
Experimentální kroky
V současné době neexistuje standardizovaná technika pro generování jednobuněčných dat, všechny metody musí zahrnovat izolaci buněk z populace, lyzát tvorba, zesílení skrz reverzní transkripce a kvantifikace úrovní exprese. Běžné techniky pro měření exprese jsou kvantitativní PCR nebo RNA-seq.[7]
Izolace jednotlivých buněk
Existuje několik metod k izolaci a amplifikaci buněk pro analýzu jednotlivých buněk. Techniky s nízkou propustností jsou schopny izolovat stovky buněk, jsou pomalé a umožňují výběr. Mezi tyto metody patří:
Metody s vysokou propustností jsou schopny rychle izolovat stovky až desítky tisíc buněk.[8] Mezi běžné techniky patří:
- Třídění buněk aktivované fluorescencí (FACS)
- Mikrofluidní zařízení
Kvantitativní PCR (qPCR)
K měření úrovně exprese každého přepisu lze použít qPCR. Genově specifické primery se používají k amplifikaci odpovídajícího genu jako u běžných PCR a jako výsledek se data obvykle získávají pouze pro velikosti vzorků menší než 100 genů. Zahrnutí geny pro úklid, jehož výraz by měl být za daných podmínek konstantní, se používá pro normalizaci. Mezi nejčastěji používané geny pro vedení domácnosti patří GAPDH a α-aktin, ačkoli spolehlivost normalizace prostřednictvím tohoto procesu je sporná, protože existují důkazy, že úroveň vyjádření se může výrazně lišit.[9] Fluorescenční barviva se používají jako reportérové molekuly detekovat produkt PCR a sledovat postup amplifikace - zvýšení intenzity fluorescence je úměrné amplikon koncentrace. Provede se graf fluorescence vs. počet cyklů a prahová úroveň fluorescence se použije k nalezení čísla cyklu, při kterém graf dosáhne této hodnoty. Číslo cyklu v tomto bodě je známé jako prahový cyklus (Ct) a měří se pro každý gen.[10]
Jednobuněčná RNA sekv
The Jediná buňka RNA sekvence technika převádí populaci RNA na knihovnu cDNA fragmenty. Tyto fragmenty jsou sekvenovány vysokou propustností sekvenování nové generace techniky a čtení jsou mapována zpět do referenčního genomu, což poskytuje počet počtu čtení asociovaných s každým genem.[11]
Normalizace dat RNA-seq odpovídá za variabilitu mezi buňkami v účinnosti tvorby a sekvenování cDNA knihovny. Jedna metoda se spoléhá na použití vnější Spike-iny RNA (sekvence RNA se známou sekvencí a množstvím), které se přidávají ve stejných množstvích do každé buňky lyzát a slouží k normalizaci počtu čtení podle počtu čtení mapovaných na spike-in mRNA.[12]
Používá jiný ovládací prvek jedinečné molekulární identifikátory (UMI) - krátké sekvence DNA (6–10nt), které se přidávají do každé cDNA před amplifikací a fungují jako čárový kód pro každou molekulu cDNA. Normalizace se dosáhne použitím počtu jedinečných UMI spojených s každým genem, aby se zohlednily rozdíly v účinnosti amplifikace.[13]
Pro přesnější normalizaci byla zkombinována kombinace obou spike-inů, UMI a dalších přístupů.
Úvahy
Problém spojený s jednobuněčnými daty nastává ve formě distribucí exprese genů bez nafouknutí, známých jako technické výpadky, které jsou běžné kvůli nízkým koncentracím mRNA méně exprimovaných genů, které nejsou zachyceny v procesu reverzní transkripce. Procento detekovaných molekul mRNA v buněčném lyzátu je často pouze 10–20%.[14]
Při použití spike-inů RNA pro normalizaci se předpokládá, že účinnost amplifikace a sekvenování pro endogenní a spike-in RNA jsou stejné. Důkazy naznačují, že tomu tak není vzhledem k zásadním rozdílům ve velikosti a vlastnostech, jako je nedostatek a polyadenylovaný ocas ve špičkách, a proto kratší délka.[15] Normalizace pomocí UMI navíc předpokládá, že knihovna cDNA je sekvenována do saturace, což není vždy případ.[16]
Analýza dat
Statistiky založené na analýze dat z jedné buňky předpokládají, že vstupem je matice počtů normalizovaných genových expresí generovaných výše uvedenými přístupy a může poskytnout příležitosti, které nelze získat hromadně.
Poskytnuty tři hlavní informace:[17]
- Identifikace a charakterizace typů buněk a jejich prostorová organizace v čase
- Závěr genové regulační sítě a jejich síla napříč jednotlivými buňkami
- Klasifikace stochastický složka transkripce
Uvedené techniky byly navrženy tak, aby pomohly vizualizovat a prozkoumat vzory v datech, aby se usnadnilo odhalení těchto tří funkcí.
Shlukování
Shlukování umožňuje vytváření podskupin v buněčné populaci. Buňky mohou být seskupeny podle svého transkriptomického profilu, aby bylo možné analyzovat strukturu subpopulace a identifikovat vzácné typy buněk nebo podtypy buněk. Alternativně mohou být geny seskupeny podle jejich stavů exprese za účelem identifikace covarying genů. Kombinace obou shlukovacích přístupů, známá jako biclustering, bylo použito k současnému shlukování podle genů a buněk k nalezení genů, které se chovají podobně v buněčných shlucích.[18]
Použité metody shlukování mohou být K znamená shlukování, tvořící disjunktní skupiny nebo Hierarchické shlukování, tvořící vnořené oddíly.
Biclustering
Biclustering poskytuje několik výhod vylepšením rozlišení shlukování. Geny, které jsou pouze informativní pro podmnožinu buněk, a jsou tedy pouze exprimovány tam, lze identifikovat pomocí mikluslusteru. Pomocí této metody lze navíc identifikovat podobně se chující geny, které odlišují jeden buněčný klastr od druhého.[19]
Snížení rozměrů
Snížení rozměrů algoritmy jako např Analýza hlavních komponent (PCA) a t-SNE lze použít ke zjednodušení dat pro vizualizaci a detekci vzorů transformací buněk z vysokého na nižší dimenzionální prostor. Výsledkem této metody jsou grafy s každou buňkou jako bodem v 2D nebo 3D prostoru. Redukce rozměrů se před shlukováním často používá, protože buňky ve vysokých dimenzích se mohou nesprávně zdát blízké kvůli tomu, že se metriky vzdálenosti chovají neintuitivně.[20]
Analýza hlavních komponent
Nejčastěji používanou technikou je PCA, která identifikuje směry největší rozptyl hlavní komponenty a transformuje data tak, že první hlavní komponenta má největší možnou odchylku, a po sobě následující hlavní komponenty mají zase každou možnou nejvyšší odchylku, zatímco zůstávají kolmé k předchozím komponentám. Příspěvek každého genu ke každé složce se používá k vyvození, které geny přispívají nejvíce k odchylkám v populaci a podílejí se na diferenciaci různých subpopulací.[21]
Diferenciální výraz
Detekce rozdílů v úrovni genové exprese mezi dvěma populacemi se používá jak jednobuněčných, tak hromadných transkriptomických dat. Byly navrženy specializované metody pro jednobunková data, která zohledňují funkce jednotlivých buněk, jako jsou technické výpadky a tvar distribuce, např. Bimodální vs. unimodální.[22]
Obohacování genové ontologie
Genová ontologie termíny popisují genové funkce a vztahy mezi těmito funkcemi do tří tříd:
- Molekulární funkce
- Buněčná složka
- Biologický proces
Obohacení termínu genové ontologie (GO) je technika používaná k identifikaci, které termíny GO jsou v dané sadě genů nadměrně nebo nedostatečně zastoupeny. V analýze s jednou buňkou lze vybrat vstupní seznam požadovaných genů na základě odlišně exprimovaných genů nebo skupin genů generovaných biclusterem. Počet genů anotovaných na termín GO ve vstupním seznamu je normalizován proti počtu genů anotovaných na termín GO v sadě pozadí všech genů v genomu, aby se určila statistická významnost.[23]
Pseudotemporální uspořádání
Pseudo-temporální uspořádání (nebo odvození trajektorie) je technika, jejímž cílem je odvodit dynamiku genové exprese ze snímků jednobuněčných dat. Metoda se pokusí uspořádat buňky takovým způsobem, aby byly podobné buňky navzájem těsně umístěny. Tato trajektorie buněk může být lineární, ale může také rozdvojovat nebo sledovat složitější struktury grafů. Trajektorie tedy umožňuje odvodit dynamiku genové exprese a pořadí buněk podle jejich progrese prostřednictvím diferenciace nebo reakce na vnější podněty. Metoda se opírá o předpoklady, že buňky sledují stejnou cestu procesem zájmu a že jejich transkripční stav koreluje k jejich postupu. Algoritmus lze použít jak pro smíšené populace, tak pro časové vzorky.
Bylo vyvinuto více než 50 metod pro pseudo-temporální uspořádání a každá z nich má své vlastní požadavky na předchozí informace (jako jsou počáteční buňky nebo data časového průběhu), detekovatelné topologie a metodika [24]. Příkladem algoritmu je algoritmus Monocle[25] který provádí redukci rozměrů dat, vytváří a minimální kostra pomocí transformovaných dat objednává buňky v pseudo-čase sledováním nejdelší připojené cesty stromu a následně označuje buňky podle typu. Dalším příkladem je DPT,[je zapotřebí objasnění ][23] který využívá difúzní mapu a difúzní proces.
Odvození sítě
Inference genové regulační sítě je technika, jejímž cílem je vybudovat síť zobrazenou jako graf, ve kterém uzly představují geny a hrany označují koregulační interakce. Metoda se opírá o předpoklad, že silný statistický vztah mezi expresí genů je známkou potenciálního funkčního vztahu.[26] Nejběžněji používanou metodou pro měření síly statistického vztahu je korelace. Korelaci však nelze identifikovat nelineární vztahy a vzájemné informace se používá jako alternativa. Genové klastry spojené v síti znamenají geny, které procházejí koordinovanými změnami ve výrazu.[27]
Integrace
Jednobuněčné transkriptomické datové soubory generované pomocí různých experimentálních protokolů a za různých experimentálních podmínek se kromě jiných faktorů často liší přítomností nebo silou technických účinků a pozorovanými typy buněk. To má za následek silné dávkové efekty což může zkreslit zjištění statistických metod použitých u šarží, zejména za přítomnosti matoucí.[28]V důsledku výše uvedených vlastností transkriptomických dat jednotlivých buněk byly pozorovány špatné výsledky metod dávkové korekce vyvinutých pro hromadné sekvenční údaje. To mělo za následek vývoj statistických metod pro korekci dávkových efektů, které jsou robustní vůči vlastnostem transkriptomických dat jednotlivých buněk, aby bylo možné integrovat data z různých zdrojů nebo experimentálních dávek. Základní práci v tomto ohledu provedl Laleh Haghverdi při formulování použití vzájemných nejbližších sousedů mezi každou dávkou k definici vektorů korekce dávky.[29] Tyto vektory lze použít ke sloučení datových sad, z nichž každá zahrnuje alespoň jeden typ sdílené buňky. Ortogonální přístup zahrnuje projekci každé datové sady do sdíleného nízkodimenzionálního prostoru pomocí kanonická korelační analýza.[30] Vzájemně nejbližší sousedé a kanonická korelační analýza byly také kombinovány k definování integračních „kotev“ zahrnujících referenční buňky v jedné datové sadě, na které jsou normalizovány dotazovací buňky v jiné datové sadě.[31]
Viz také
Reference
- ^ Kanter, Itamar; Kalisky, Tomer (1. ledna 2015). „Transkriptomika jedné buňky: metody a aplikace“. Hranice v onkologii. 5: 53. doi:10,3389 / fonc.2015.00053. ISSN 2234-943X. PMC 4354386. PMID 25806353.
- ^ Liu, Serena; Trapnell, Cole (17. února 2016). „Sekvenování transkriptomů podle jedné buňky: nedávné pokroky a zbývající výzvy“. F1000Výzkum. 5: F1000 Faculty Rev – 182. doi:10.12688 / F1000Research.7223.1. ISSN 2046-1402. PMC 4758375. PMID 26949524.
- ^ Szabo, David T. (10.03.2014). „Kapitola 62 - Transkriptomické biomarkery v hodnocení bezpečnosti a rizik chemických látek“. Biomarkery v toxikologii. Akademický tisk. str. 1033–1038. ISBN 9780124046306.
- ^ Kanter, Itamar; Kalisky, Tomer (10. března 2015). „Transkriptomika jedné buňky: metody a aplikace“. Hranice v onkologii. 5: 53. doi:10.3389 / fonc.2015.00053. ISSN 2234-943X. PMC 4354386. PMID 25806353.
- ^ Trapnell, Cole (1. října 2015). „Definování typů a stavů buněk pomocí jednobuněčné genomiky“. Výzkum genomu. 25 (10): 1491–1498. doi:10,1101 / gr.190595.115. ISSN 1088-9051. PMC 4579334. PMID 26430159.
- ^ Stegle, Oliver; Teichmann, Sarah A .; Marioni, John C. (1. března 2015). „Výpočtové a analytické výzvy v transkriptomice jedné buňky“. Genetika hodnocení přírody. 16 (3): 133–145. doi:10.1038 / nrg3833. ISSN 1471-0056. PMID 25628217. S2CID 205486032.
- ^ Kolodziejczyk, Aleksandra A .; Kim, Jong Kyoung; Svensson, Valentine; Marioni, John C .; Teichmann, Sarah A. (květen 2015). „Technologie a biologie jednobuněčného sekvenování RNA“. Molekulární buňka. 58 (4): 610–620. doi:10.1016 / j.molcel.2015.04.005. PMID 26000846.
- ^ Poulin, Jean-Francois; Tasic, Bosiljka; Hjerling-Leffler, Jens; Trimarchi, Jeffrey M .; Awatramani, Rajeshwar (1. září 2016). "Rozdělení neurální buněčné diverzity pomocí jednobuněčných transkriptomik". Přírodní neurovědy. 19 (9): 1131–1141. doi:10.1038 / č. 4366. ISSN 1097-6256. PMID 27571192. S2CID 14461377.
- ^ Radonić, Aleksandar; Thulke, Stefanie; Mackay, Ian M .; Landt, Olfert; Siegert, Wolfgang; Nitsche, Andreas (23. ledna 2004). "Pokyny k výběru referenčního genu pro kvantitativní PCR v reálném čase". Sdělení o biochemickém a biofyzikálním výzkumu. 313 (4): 856–862. doi:10.1016 / j.bbrc.2003.11.177. ISSN 0006-291X. PMID 14706621.
- ^ Wildsmith, S.E .; Archer, G. E .; Winkley, A. J .; Lane, P. W .; Bugelski, P. J. (1. ledna 2001). "Maximalizace signálu odvozeného z cDNA microarrays". Biotechniky. 30 (1): 202–206, 208. doi:10.2144 / 01301dd04. ISSN 0736-6205. PMID 11196312.
- ^ Wang, Zhong; Gerstein, Mark; Snyder, Michael (23. března 2017). „RNA-Seq: revoluční nástroj pro transkriptomiku“. Recenze přírody. Genetika. 10 (1): 57–63. doi:10.1038 / nrg2484. ISSN 1471-0056. PMC 2949280. PMID 19015660.
- ^ Jiang, Lichun; Schlesinger, Felix; Davis, Carrie A .; Zhang, Yu; Li, Renhua; Salit, Marc; Gingeras, Thomas R .; Oliver, Brian (23. března 2017). "Syntetické špendlíkové standardy pro RNA-seq experimenty". Výzkum genomu. 21 (9): 1543–1551. doi:10.1101 / gr.121095.111. ISSN 1088-9051. PMC 3166838. PMID 21816910.
- ^ Islám, Saiful; Zeisel, Amit; Joost, Simon; La Manno, Gioele; Zajac, Pawel; Kasper, Maria; Lönnerberg, Peter; Linnarsson, Sten (1. února 2014). "Kvantitativní jednobuněčný RNA-seq s jedinečnými molekulárními identifikátory". Přírodní metody. 11 (2): 163–166. doi:10.1038 / nmeth.2772. ISSN 1548-7091. PMID 24363023. S2CID 6765530.
- ^ Kharchenko, Peter V .; Silberstein, Lev; Scadden, David T. (1. července 2014). „Bayesiánský přístup k jednobuněčné diferenciální analýze exprese“. Přírodní metody. 11 (7): 740–742. doi:10.1038 / nmeth.2967. ISSN 1548-7091. PMC 4112276. PMID 24836921.
- ^ Svensson, Valentine; Natarajan, Kedar Nath; Ly, Lam-Ha; Miragaia, Ricardo J .; Labalette, Charlotte; Macaulay, Iain C .; Cvejic, Ana; Teichmann, Sarah A. (6. března 2017). „Analýza výkonu jednobuněčných experimentů sekvenování RNA“. Přírodní metody. předběžná online publikace (4): 381–387. doi:10.1038 / nmeth.4220. ISSN 1548-7105. PMC 5376499. PMID 28263961.
- ^ Islám, Saiful; Zeisel, Amit; Joost, Simon; La Manno, Gioele; Zajac, Pawel; Kasper, Maria; Lönnerberg, Peter; Linnarsson, Sten (1. února 2014). "Kvantitativní jednobuněčný RNA-seq s jedinečnými molekulárními identifikátory". Přírodní metody. 11 (2): 163–166. doi:10.1038 / nmeth.2772. ISSN 1548-7091. PMID 24363023. S2CID 6765530.
- ^ Stegle, Oliver; Teichmann, Sarah A .; Marioni, John C. (1. března 2015). „Výpočetní a analytické výzvy v transkriptomice jedné buňky“. Genetika hodnocení přírody. 16 (3): 133–145. doi:10.1038 / nrg3833. ISSN 1471-0056. PMID 25628217. S2CID 205486032.
- ^ Buettner, Florian; Natarajan, Kedar N .; Casale, F. Paolo; Proserpio, Valentina; Scialdone, Antonio; Theis, Fabian J .; Teichmann, Sarah A .; Marioni, John C .; Stegle, Oliver (1. února 2015). „Výpočtová analýza heterogenity mezi buňkami v jednobuněčných datech sekvenování RNA odhaluje skryté subpopulace buněk“. Přírodní biotechnologie. 33 (2): 155–160. doi:10.1038 / nbt.3102. ISSN 1087-0156. PMID 25599176.
- ^ Ntranos, Vasilis; Kamath, Govinda M .; Zhang, Jesse M .; Pachter, Lior; Tse, David N. (26. května 2016). „Rychlá a přesná jednobuněčná analýza RNA-seq seskupením počtů kompatibility přepisu“. Genome Biology. 17 (1): 112. doi:10.1186 / s13059-016-0970-8. ISSN 1474-7596. PMC 4881296. PMID 27230763.
- ^ Pierson, Emma; Yau, Christopher (1. ledna 2015). „ZIFA: Snížení rozměrů pro analýzu exprese genu s jednobuněčným genem bez nuly“. Genome Biology. 16: 241. doi:10.1186 / s13059-015-0805-z. ISSN 1474-760X. PMC 4630968. PMID 26527291.
- ^ Treutlein, Barbara; Brownfield, Doug G .; Wu, Angela R .; Neff, Norma F .; Mantalas, Gary L .; Espinoza, F. Hernan; Desai, Tushar J .; Krasnow, Mark A .; Quake, Stephen R. (15. května 2014). „Rekonstrukce hierarchií linií distálního epitelu plic pomocí jednobuněčného RNA-seq“. Příroda. 509 (7500): 371–375. Bibcode:2014 Natur.509..371T. doi:10.1038 / příroda13173. PMC 4145853. PMID 24739965.
- ^ Korthauer, Keegan D .; Chu, Li-Fang; Newton, Michael A .; Li, Yuan; Thomson, James; Stewart, Ron; Kendziorski, Christina (1. ledna 2016). „Statistický přístup k identifikaci diferenciálních distribucí v jednobuněčných experimentech RNA-seq“. Genome Biology. 17 (1): 222. doi:10.1186 / s13059-016-1077-r. ISSN 1474-760X. PMC 5080738. PMID 27782827.
- ^ A b Haghverdi, Laleh; Büttner, Maren; Wolf, F. Alexander; Buettner, Florian; Theis, Fabian J. (1. října 2016). „Difúzní pseudočas robustně rekonstruuje větvení linie“ (PDF). Přírodní metody. 13 (10): 845–848. doi:10.1038 / nmeth.3971. ISSN 1548-7091. PMID 27571553. S2CID 3594049.
- ^ Saelens, Wouter; Cannoodt, Robrecht; Todorov, Helena; Saeys, Yvan (05.03.2018). „Srovnání metod odvození trajektorie jedné buňky: směrem k přesnějším a robustnějším nástrojům“. bioRxiv: 276907. doi:10.1101/276907. Citováno 2018-03-12.
- ^ Trapnell, Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J .; Livak, Kenneth J .; Mikkelsen, Tarjei S .; Rinn, John L. (23. března 2017). „Pseudo-temporální uspořádání jednotlivých buněk odhaluje dynamiku a regulátory rozhodování o osudu buněk“. Přírodní biotechnologie. 32 (4): 381–386. doi:10,1038 / nbt.2859. ISSN 1087-0156. PMC 4122333. PMID 24658644.
- ^ Wei, J .; Hu, X .; Zou, X .; Tian, T. (1. prosince 2016). "Inference genetické regulační sítě pro kmenové buňky využívající data exprese jednotlivých buněk". 2016 Mezinárodní konference IEEE o bioinformatice a biomedicíně (BIBM): 217–222. doi:10.1109 / BIBM.2016.7822521. ISBN 978-1-5090-1611-2. S2CID 27737735.
- ^ Moignard, Victoria; Macaulay, Iain C .; Swiers, Gemma; Buettner, Florian; Schütte, Judith; Calero-Nieto, Fernando J .; Kinston, Sarah; Joshi, Anagha; Hannah, Rebecca; Theis, Fabian J .; Jacobsen, Sten Eirik; de Bruijn, Marella F .; Göttgens, Berthold (1. dubna 2013). „Charakterizace transkripčních sítí v krevních kmenových a progenitorových buňkách pomocí vysoce výkonné analýzy exprese jednobuněčného genu“. Přírodní buněčná biologie. 15 (4): 363–372. doi:10.1038 / ncb2709. ISSN 1465-7392. PMC 3796878. PMID 23524953.
- ^ Hicks, Stephanie C; Townes, William F; Teng, Mingxiang; Irizarry, Rafael A (6. listopadu 2017). „Chybějící data a technická variabilita v jednobuněčných experimentech sekvenování RNA“. Biostatistika. 19 (4): 562–578. doi:10.1093 / biostatistics / kxx053. PMC 6215955. PMID 29121214.
- ^ Haghverdi, Laleh; Lun, Aaron TL; Morgan, Michael D; Marioni, John C (2. dubna 2018). „Dávkové efekty v jednobuněčných datech sekvenování RNA jsou opraveny porovnáním vzájemných nejbližších sousedů“. Přírodní biotechnologie. 36 (5): 421–427. doi:10,1038 / nbt.4091. PMC 6152897. PMID 29608177.
- ^ Butler, Andrew; Hoffman, Paul; Smibert, Peter; Papalexi, Efthymia; Satija, Rahul (2. dubna 2018). „Integrace transkriptomických dat z jedné buňky napříč různými podmínkami, technologiemi a druhy“. Přírodní biotechnologie. 36 (5): 421–427. doi:10,1038 / nbt.4096. PMC 6700744. PMID 29608179.
- ^ Stuart, Tim; Butler, Andrew; Hoffman, Paul; Hafemeister, Christoph; Papalexia, Efthymia; Mauck, William M III; Hao, Yuhan; Marlon, Stoeckius; Smibert, Peter; Satija, Rahul (6. června 2019). „Komplexní integrace jednobuněčných dat“. Buňka. 177 (7): 1888–1902. doi:10.1016 / j.cell.2019.05.031. PMC 6687398. PMID 31178118.