Horizontální korelace - Horizontal correlation - Wikipedia
![]() | tento článek potřebuje další citace pro ověření.Leden 2008) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Horizontální korelace je metodika pro genová sekvence analýza. Spíše než odkazovat na jednu konkrétní techniku, horizontální korelace místo toho zahrnuje celou řadu přístupů k sekvenční analýze, které jsou sjednoceny dvěma konkrétními tématy:
- Sekvenční analýza se provádí porovnáním horizontálněpo délce jedné genetické sekvence; to je na rozdíl od vertikální metody, které srovnávají několik různých genetických sekvencí.
- Provedená srovnání obecně měří teoretická informace množství, jako je hodnota vzájemné informace funkce mezi dvěma oblastmi sekvence.
Základní myšlenky přístupu horizontální korelace byly poprvé představeny v článku z roku 2000 Grosse, Herzel, Buldyrev a Stanley (Grosse, et al. 2000). V této první formulaci se Grosse a kolegové snažili charakterizovat velkou genetickou sekvenci rozdělením sekvence na kódování a nekódující oblasti. Zatímco tradiční přístupy k problému kódování vs. nekódování se obecně spoléhaly na sofistikované systémy rozpoznávání vzorů, které byly nejprve trénovány na malých vstupech a poté běžely po celé sekvenci (Ohler, et al. 1999), horizontální korelační přístup Grosse a kolegové místo toho pracovali rozbitím sekvence na mnoho relativně krátkých fragmentů sekvence, každý o délce pouze 500 párů bází. Poté se snažili charakterizovat každý z těchto fragmentů jako kódující nebo nekódující. Toho bylo dosaženo porovnáním každého okna velikosti 3 po délce fragmentu s prvním oknem velikosti 3 v tomto fragmentu a poté měřením hodnoty funkce vzájemné informace mezi těmito dvěma okny. Bylo zjištěno, že kódovací sekvence zobrazují stylizovaný vzor 3-periodicity, který nekódující sekvence ne. Takový vzor byl snadno rozpoznatelný a umožnil podstatně rychlejší a druhově nezávislou identifikaci kódujících oblastí (Grosse, et al. 2000).
Od roku 2000 se rozšířily metodiky horizontální korelace zdůrazňující měření teoretických veličin informací po celé délce genové sekvence, které dokonce našly uplatnění v sekvenování brokovnice sestava fragmentů (Otu & Sayood, 2004).
Reference
- Grosse, Ivo; Herzel, Hanspeter; Buldyrev, Sergey V .; Stanley, H. Eugene (01.05.2000). "Druhová nezávislost vzájemných informací v kódování a nekódování DNA". Fyzický přehled E. Americká fyzická společnost (APS). 61 (5): 5624–5629. doi:10.1103 / physreve.61.5624. ISSN 1063-651X. PMID 11031617.
- Ohler, U .; Harbeck, S .; Niemann, H .; Noth, E .; Reese, M. G. (01.05.1999). „Interpolované Markovovy řetězce pro rozpoznávání eukaryotických promotorů“. Bioinformatika. Oxford University Press (OUP). 15 (5): 362–369. doi:10.1093 / bioinformatika / 15.5.362. ISSN 1367-4803. PMID 10366656.
- Otu, H. H .; Sayood, K. (01.01.2003). „Přístup rozděl a panuj k sestavení fragmentů“. Bioinformatika. Oxford University Press (OUP). 19 (1): 22–29. doi:10.1093 / bioinformatika / 19.1.22. ISSN 1367-4803. PMID 12499289.