Analýza topologických dat - Topological data analysis
v aplikovaná matematika, topologická analýza dat (TDA) je přístup k analýze datových souborů pomocí technik z topologie. Extrakce informací z datových souborů, které jsou vysoce dimenzionální, neúplné a hlučné, je obecně náročná. TDA poskytuje obecný rámec pro analýzu takových dat způsobem, který je necitlivý na konkrétní údaje metrický vybrána a poskytuje snížení rozměrů a odolnost vůči hluku. Kromě toho to zdědí funkčnost, základní koncept moderní matematiky, z její topologické podstaty, která jí umožňuje přizpůsobit se novým matematickým nástrojům.
Počáteční motivací je studium tvaru dat. TDA se spojila algebraická topologie a další nástroje z čisté matematiky, které umožňují matematicky důkladné studium „tvaru“. Hlavním nástrojem je trvalá homologie, adaptace homologie na mračno bodů data. Trvalá homologie byla aplikována na mnoho typů dat napříč mnoha poli. Navíc jeho matematický základ má také teoretický význam. Díky jedinečným vlastnostem TDA je slibným mostem mezi topologií a geometrií.
Základní teorie
Intuice
Tento článek je tón nebo styl nemusí odrážet encyklopedický tón použitý na Wikipedii.Ledna 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Základním předpokladem TDA je, že na tvaru záleží. Skutečná data ve vysokých dimenzích jsou téměř vždy řídká a mají tendenci mít relevantní nízko dimenzionální funkce. Jedním z úkolů TDA je poskytnout přesnou charakteristiku této skutečnosti. Ilustrativním příkladem je jednoduchý systém predátor-kořist řízený Rovnice Lotka – Volterra.[1] Lze snadno pozorovat, že trajektorie systému tvoří uzavřený kruh ve stavovém prostoru. TDA poskytuje nástroje k detekci a kvantifikaci takového opakovaného pohybu.[2]
Mnoho algoritmů pro analýzu dat, včetně těch, které se používají v TDA, vyžaduje výběr různých parametrů. Bez předchozích znalostí domény je obtížné zvolit správné shromažďování parametrů pro datovou sadu. Hlavní pohled na trvalá homologie je, že můžeme použít informace získané ze všech hodnot parametru. Tento vhled je samozřejmě snadno proveditelný; těžkou součástí je kódování tohoto obrovského množství informací do srozumitelné a snadno reprezentovatelné formy. V případě TDA existuje matematická interpretace, pokud jsou informace homologní skupinou. Obecně se předpokládá, že funkce, které přetrvávají pro širokou škálu parametrů, jsou „skutečné“ funkce. Funkce přetrvávající pouze v úzkém rozsahu parametrů se považují za šum, i když teoretické zdůvodnění je nejasné.[3]
Raná historie
Předchůdci úplné koncepce trvalé homologie se objevovali postupně v průběhu času.[4] V roce 1990 představil Patrizio Frosini velikostní funkci, která je ekvivalentní k 0. perzistentní homologii.[5] Téměř o deset let později Vanessa Robins studoval obrazy homomorfismů vyvolaných inkluzí.[6] Nakonec krátce nato Edelsbrunner et al. představil koncept trvalé homologie spolu s účinným algoritmem a jeho vizualizací jako perzistenční diagram.[7] Carlsson a kol. přeformuloval počáteční definici a dal ekvivalentní vizualizační metodu zvanou persistence barcodes,[8] tlumočení perzistence v jazyce komutativní algebry.[9]
V algebraické topologii se vytrvalá homologie objevila prací Barannikova na Morseově teorii. Sada kritických hodnot hladké Morseovy funkce byla kanonicky rozdělena do dvojic „narození-smrt“, filtrované komplexy byly klasifikovány a vizualizace jejich invarianty, ekvivalentní perzistenčnímu diagramu a perzistenčnímu čárovému kódu, byla dána v roce 1994 Barannikovovou kanonickou formou.[10]
Koncepty
Níže jsou uvedeny některé široce používané pojmy. Některé definice se mohou u jednotlivých autorů lišit.
A mračno bodů je často definován jako konečná množina bodů v nějakém euklidovském prostoru, ale může být považován za jakýkoli konečný metrický prostor.
The Čechův komplex mraku bodů je nerv z Pokrýt koulí o pevném poloměru kolem každého bodu v oblaku.
A modul perzistence indexováno podle je vektorový prostor pro každého a lineární mapa kdykoli , takový, že pro všechny a kdykoli [11] Ekvivalentní definicí je funktor z považována za částečně uspořádanou množinu do kategorie vektorových prostorů.
The skupina trvalé homologie mraku bodů je modul perzistence definovaný jako , kde je Čechův komplex o poloměru mraku bodů a je skupina homologie.
A persistence barcode je multiset intervalů v a diagram perzistence je multiset bodů v ().
The Wassersteinova vzdálenost mezi dvěma diagramy perzistence a je definován jako
The vzdálenost úzkého hrdla mezi a je
Základní vlastnost
Věta o struktuře
První klasifikační věta pro perzistentní homologii se objevila v roce 1994[10] prostřednictvím Barannikovových kanonických forem. Klasifikační věta interpretující perzistenci v jazyce komutativní algebry se objevila v roce 2005:[9] pro konečně vygenerovaný modul perzistence s polem koeficienty,
Trvalá homologie je vizualizována čárovým kódem nebo diagramem stálosti. Čárový kód má kořeny v abstraktní matematice. Jmenovitě je kategorie konečných filtrovaných komplexů přes pole částečně jednoduchá. Libovolný filtrovaný komplex je izomorfní se svou kanonickou formou, přímým součtem jednorozměrných a dvourozměrných jednoduchých filtrovaných komplexů.
Stabilita
Stabilita je žádoucí, protože poskytuje odolnost proti hluku. Li je jakýkoli prostor, který je homeomorfní se zjednodušeným komplexem, a jsou neustále krotké[13] funkce, pak vektorové prostory persistence a jsou definitivně prezentovány a , kde odkazuje na úzkou vzdálenost[14] a je mapa, která využívá průběžnou krotkou funkci k perzistenčnímu diagramu -th homologie.
Pracovní postup
Základní pracovní postup v TDA je:[15]
mračno bodů | vnořené komplexy | modul perzistence | čárový kód nebo diagram |
- Li je mračno bodů, vyměňte s vnořenou rodinou zjednodušené komplexy (například komplex Čech nebo Vietoris-Rips). Tento proces převádí mračno bodů na filtraci zjednodušených komplexů. Vezmeme-li homologii každého komplexu v této filtraci, získáme modul perzistence
- Aplikujte větu o struktuře a poskytněte parametrizovanou verzi Betti číslo, diagram vytrvalosti, nebo ekvivalentně čárový kód.
Graficky vzato,
Výpočet
První algoritmus pro všechna pole pro trvalou homologii v nastavení algebraické topologie popsal Barannikov[10] prostřednictvím redukce do kanonické podoby maticemi s horními trojúhelníky. První algoritmus pro trvalou homologii byl dán Edelsbrunnerem a kol.[7] Zomorodian a Carlsson poskytli první praktický algoritmus pro výpočet trvalé homologie ve všech oblastech.[9] Kniha Edelsbrunnera a Harera poskytuje obecné vodítko pro výpočetní topologii.[17]
Jednou z otázek, která vyvstává při výpočtu, je volba komplexu. The Čechův komplex a Vietoris – Rips komplex jsou na první pohled nejpřirozenější; jejich velikost však rychle roste s počtem datových bodů. Komplex Vietoris – Rips je upřednostňován před Čechovým komplexem, protože jeho definice je jednodušší a Čechův komplex vyžaduje další úsilí k definování v obecném konečném metrickém prostoru. Byly studovány účinné způsoby, jak snížit výpočetní náklady na homologii. Například komplex α a komplex svědků se používají ke zmenšení rozměru a velikosti komplexů.[18]
Nedávno, Diskrétní Morseova teorie prokázal slib pro výpočetní homologii, protože může redukovat daný zjednodušující komplex na mnohem menší celulární komplex, který je homotopický k původnímu.[19] Tuto redukci lze ve skutečnosti provést, protože komplex je konstruován pomocí teorie matroidů, což vede k dalšímu zvýšení výkonu.[20] Další nedávný algoritmus šetří čas ignorováním tříd homologie s nízkou perzistencí.[21]
K dispozici jsou různé softwarové balíčky, například javaPlex, Dionýsos, Perseus, PHAT, DIPHA, GUDHI, Ripser, a TDAstats. Srovnání mezi těmito nástroji provádí Otter et al.[22] Giotto-tda je balíček Pythonu věnovaný integraci TDA do pracovního toku strojového učení pomocí a scikit-učit se API. Balíček R. TDA je schopen vypočítat nedávno vynalezené koncepty jako krajina a odhad vzdálenosti jádra.[23] The Topologie ToolKit se specializuje na spojitá data definovaná na varietách nízké dimenze (1, 2 nebo 3), jak se obvykle nacházejí v vědecká vizualizace. Další balíček R, TDAstats, implementuje rychlou knihovnu C ++ Ripser pro výpočet trvalé homologie.[24] Používá také všudypřítomné ggplot2 balíček pro generování reprodukovatelných, přizpůsobitelných vizualizací trvalé kvality v publikační kvalitě, konkrétně topologických čárových kódů a diagramů perzistence. Níže uvedený ukázkový kód uvádí příklad toho, jak Programovací jazyk R. lze použít k výpočtu trvalé homologie.
# nainstalujte balíček z CRANu a načtěte datové sadyinstall.packages(„TDAstats“)knihovna(„TDAstats“)data("unif2d")data(„circle2d“)# vypočítat trvalou homologii pro oba soubory datunif.phom <- vypočítat_homologii(unif2d)circ.phom <- vypočítat_homologii(circle2d)# vykreslete rovnoměrně distribuovaný mrak bodů jako diagram perzistenceplot_persist(unif.phom)# vykreslit mračno kruhových bodů jako topologický čárový kód# vidíme jednu trvalou lištu podle očekávání pro kruh (jeden 1 cyklus / smyčka)plot_barcode(circ.phom)
Vizualizace
Přímo vizualizovat vysoce dimenzionální data není možné. Bylo vyvinuto mnoho metod pro extrakci nízkodimenzionální struktury ze souboru dat, jako je například analýza hlavních komponent a vícerozměrné škálování.[25] Je však důležité si uvědomit, že samotný problém je nepředstavitelný, protože ve stejné datové sadě lze nalézt mnoho různých topologických rysů. Studie vizualizace prostorů vysokých rozměrů má tedy pro TDA zásadní význam, i když nutně nezahrnuje použití trvalé homologie. Byly však provedeny nedávné pokusy o použití trvalé homologie při vizualizaci dat.[26]
Carlsson a kol. navrhli obecnou metodu nazvanou MAPPER.[27] Zdědil myšlenku Serre, že krytina zachovává homotopii.[28] Zobecněná formulace MAPPER je následující:
Nechat a být topologické prostory a nechat být spojitá mapa. Nechat být konečnou otevřenou pokrývkou . Výstup MAPPERU je nervem stahovacího krytu , kde je každá preimage rozdělena na připojené komponenty.[26] Jedná se o velmi obecný koncept, jehož grafem je Reeb [29] a sloučení stromů jsou zvláštní případy.
To není zcela původní definice.[27] Carlsson a kol. Vybrat být nebo a zakryjte jej otevřenými množinami tak, aby se protínaly maximálně dvě.[3] Toto omezení znamená, že výstup je ve formě a komplexní síť. Protože topologie mračna konečných bodů je triviální, shlukovací metody (například jednoduché propojení ) se používají k výrobě analogu připojených sad v preimage když je MAPPER aplikován na skutečná data.
Matematicky vzato je MAPPER variantou Reebový graf. Pokud je nanejvýš jednorozměrný, pak pro každý ,
Tři úspěšné aplikace MAPPER lze nalézt v Carlsson et al.[32] Komentář k aplikacím v tomto článku od J. Curryho je, že „společným rysem zájmu o aplikace je přítomnost světlic nebo úponků“.[33]
K dispozici je bezplatná implementace MAPPER online napsal Daniel Müllner a Aravindakshan Babu. MAPPER také tvoří základ Ayasdi AI platforma.
Vícerozměrná vytrvalost
Multidimenzionální vytrvalost je pro TDA důležitá. Koncept vzniká jak v teorii, tak v praxi. První vyšetřování vícerozměrné perzistence bylo počátkem vývoje TDA,[34] a je jedním ze zakládajících dokumentů TDA.[9] První aplikací, která se objevila v literatuře, je metoda pro srovnání tvarů, podobná vynálezu TDA.[35]
Definice n-dimenzionální modul perzistence v je[33]
- vektorový prostor je přiřazen ke každému bodu v
- mapa je přiřazeno, pokud (
- mapy uspokojí pro všechny
Za zmínku stojí, že o definici vícerozměrné perzistence se vedou spory.[33]
Jednou z výhod jednorozměrné perzistence je její reprezentovatelnost pomocí diagramu nebo čárového kódu. Diskrétní úplné invarianty modulů vícerozměrné perzistence však neexistují.[36] Hlavním důvodem je to, že struktura sběru nerozložitelných položek je extrémně komplikována Gabrielova věta v teorii toulcových reprezentací,[37] i když konečně n-dimenzionální modul perzistence lze jednoznačně rozložit na přímý součet nerozložitelných kvůli Krull-Schmidtově teorému.[38]
Bylo však zjištěno mnoho výsledků. Carlsson a Zomorodian představili hodnost neměnná , definovaný jako , ve kterém je konečně generovaný modul třídy n. V jedné dimenzi je to ekvivalent čárového kódu. V literatuře je invariant hodnosti často označován jako perzistentní čísla Betti (PBN).[17] V mnoha teoretických pracích autoři použili omezenější definici, analogii z perlevence množiny podúrovní. Konkrétně persistence Bettiho čísla funkce jsou dány funkcí , přičemž každý na , kde a .
Některé základní vlastnosti zahrnují monotónnost a diagonální skok.[39] Trvalá čísla Betti budou konečná, pokud je kompaktní a lokálně stahovatelný podprostor o .[40]
Použitím foliační metody lze k-dim PBN rozložit na rodinu 1-dim PBN pomocí dedukce rozměrů.[41] Tato metoda také vedla k důkazu, že vícedimenzionální PBN jsou stabilní.[42] K diskontinuitám PBN dochází pouze v bodech kde buď je nesouvislý bod nebo je nesouvislý bod za předpokladu, že a je kompaktní, triangulovatelný topologický prostor.[43]
Persistentní prostor, zobecnění perzistentního diagramu, je definován jako multiset všech bodů s multiplicitou větší než 0 a úhlopříčkou.[44] Poskytuje stabilní a úplné zastoupení PBN. Probíhající práce Carlssona a kol. se pokouší poskytnout geometrickou interpretaci perzistentní homologie, která by mohla poskytnout poznatky o tom, jak kombinovat teorii strojového učení s analýzou topologických dat.[45]
První praktický algoritmus pro výpočet vícerozměrné stálosti byl vynalezen velmi brzy.[46] Poté bylo navrženo mnoho dalších algoritmů založených na takových koncepcích, jako je diskrétní morseova teorie[47] a konečný odhad vzorku.[48]
Další perzistence
Standardní paradigma v TDA se často označuje jako dílčí vytrvalost. Kromě vícerozměrné vytrvalosti bylo pro rozšíření tohoto zvláštního případu provedeno mnoho prací.
Cikcak vytrvalost
Nenulové mapy v modulu perzistence jsou omezeny vztahem předobjednávky v kategorii. Matematici však zjistili, že jednomyslnost směru není pro mnoho výsledků nezbytná. „Filozofickým bodem je, že teorie rozkladu grafových reprezentací je poněkud nezávislá na orientaci okrajů grafu“.[49] Cikcaková vytrvalost je důležitá z teoretické stránky. Příklady uvedené v recenzním článku Carlssona pro ilustraci důležitosti funkcionality sdílejí některé z jejích funkcí.[3]
Rozšířená perzistence a perzistence sady úrovní
Některé pokusy spočívají ve ztrátě přísnějšího omezení funkce.[50] Přečtěte si prosím Kategorizace a cosheaves a Dopad na matematiku sekce pro více informací.
Je přirozené rozšířit perzistenční homologii na další základní pojmy v algebraické topologii, jako je kohomologie a relativní homologie / kohomologie.[51] Zajímavou aplikací je výpočet kruhových souřadnic pro soubor dat prostřednictvím první perzistentní kohomologické skupiny.[52]
Kruhová perzistence
Normální perzistenční homologie studuje funkce se skutečnou hodnotou. Kruhová mapa může být užitečná, „slibuje teorie perzistence pro mapy s kruhovou hodnotou, že bude hrát roli u některých vektorových polí, stejně jako standardní teorie perzistence pro skalární pole“, jak uvedl D. Burghelea et al.[53] Hlavní rozdíl spočívá v tom, že buňky Jordan (formátem velmi podobné formátu Jordan bloky v lineární algebře) jsou netriviální ve funkcích s kruhovou hodnotou, které by byly v reálném případě nulové, a kombinace s čárovými kódy dává invarianty krotké mapy za mírných podmínek.[53]
Dvě techniky, které používají, jsou Morse-Novikovova teorie[54] a teorie reprezentace grafů.[55] Novější výsledky lze nalézt v D. Burghelea et al.[56] Například požadavek na krotkost lze nahradit mnohem slabším stavem, kontinuálním.
Perzistence s kroucením
Důkaz o konstrukční větě se opírá o pole základní domény, takže nebylo provedeno mnoho pokusů o perzistenční homologii s torzí. Frosini na tomto konkrétním modulu definoval pseudometrii a prokázal jeho stabilitu.[57] Jednou z jeho novinek je, že definování metriky nezávisí na nějaké teorii klasifikace.[58]
Kategorizace a cosheaves
Jedna výhoda teorie kategorií je jeho schopnost pozvednout konkrétní výsledky na vyšší úroveň a ukázat vztahy mezi zdánlivě nespojenými objekty. Bubenik a kol.[59] nabízí krátké představení teorie kategorií přizpůsobené pro TDA.
Teorie kategorií je jazykem moderní algebry a byla široce používána při studiu algebraické geometrie a topologie. Bylo poznamenáno, že „klíčové pozorování [9] je to, že perzistenční diagram produkovaný [7] záleží pouze na algebraické struktuře nesené tímto diagramem. “[60] Ukázalo se, že použití teorie kategorií v TDA je plodné.[59][60]
V návaznosti na poznámky učiněné v Bubenik et al.,[60] the kategorie indexování je jakýkoli předobjednaná sada (ne nutně nebo ), cílová kategorie je libovolná kategorie (místo běžně používaných ), a funktory se nazývají generalizované moduly perzistence v , přes .
Jednou z výhod používání teorie kategorií v TDA je jasnější pochopení konceptů a objevení nových vztahů mezi důkazy. Pro ilustraci si vezměte dva příklady. Pochopení korespondence mezi prokládáním a párováním má obrovský význam, protože párování bylo metodou používanou na začátku (modifikovanou z Morseovy teorie). Souhrn prací lze nalézt ve Vin de Silva et al.[61] Mnoho vět lze dokázat mnohem snadněji v intuitivnějším prostředí.[58] Dalším příkladem je vztah mezi konstrukcí různých komplexů z mračen bodů. Již dlouho si všimli, že komplexy Čech a Vietoris-Rips jsou příbuzné. Konkrétně .[62] Základní vztah mezi Cechovými a Ripsovými komplexy lze mnohem jasněji vidět v kategorickém jazyce.[61]
Jazyk teorie kategorií také pomáhá sesílat výsledky v termínech rozpoznatelných širší matematické komunitě. Vzdálenost úzkého hrdla je v TDA široce používána kvůli výsledkům stability s ohledem na vzdálenost úzkého hrdla.[11][14] Ve skutečnosti je prokládací vzdálenost koncový objekt v kategorii poset stabilních metrik na vícerozměrných modulech perzistence v a hlavní pole.[58][63]
Snopy, ústřední pojem v moderní algebraická geometrie, jsou skutečně spojené s teorií kategorií. Zhruba řečeno, snopy jsou matematickým nástrojem pro pochopení toho, jak místní informace určují globální informace. Justin Curry považuje perzistenci na úrovni úrovní za studium vlákna spojitých funkcí. Objekty, které studuje, jsou velmi podobné těm od MAPPERA, ale s teorií svazků jako teoretickým základem.[33] Ačkoli žádný průlom v teorii TDA dosud nepoužil teorii svazků, je slibný, protože v algebraické geometrii existuje mnoho krásných vět o teorii svazků. Například přirozenou teoretickou otázkou je, zda různé metody filtrace vedou ke stejnému výstupu.[64]
Stabilita
Stabilita má pro analýzu dat zásadní význam, protože skutečná data nesou zvuky. Použitím teorie kategorií Bubenik et al. rozlišovali mezi měkkými a tvrdými větami o stabilitě a dokázali, že měkké případy jsou formální.[60] Obecně platí, že obecný pracovní postup TDA je
data | modul topologické perzistence | modul algebraické perzistence | diskrétní invariant |
Věta o měkké stabilitě to potvrzuje je Lipschitz kontinuální, a tvrdá věta o stabilitě to tvrdí je Lipschitz kontinuální.
Vzdálenost úzkého hrdla je v TDA široce používána. Věta o izometrii tvrdí, že prokládací vzdálenost se rovná vzdálenosti úzkého místa.[58] Bubenik a kol. abstrahovali definici na definici mezi funktory když je vybaven sublineární projekcí nebo superlineární rodinou, ve které stále zůstává pseudometrická.[60] Vzhledem k velkolepým postavám prokládané vzdálenosti,[65] zde uvádíme obecnou definici vzdálenosti prokládání (namísto první zavedené):[11] Nechat (funkce z na který je monotónní a vyhovuje pro všechny ). A - prokládání mezi F a G sestává z přirozených transformací a , takový, že a .
Dva hlavní výsledky jsou[60]
- Nechat být předobjednaná množina s sublineární projekcí nebo superlineární rodinou. Nechat být funktorem mezi libovolnými kategoriemi . Pak pro kterékoli dva funktory , my máme .
- Nechat být poset metrického prostoru , být topologickým prostorem. A nechte (nemusí být nutně spojité) být funkcemi a být odpovídajícím diagramem perzistence. Pak .
Tyto dva výsledky shrnují mnoho výsledků týkajících se stability různých modelů perzistence.
Teorém o stabilitě vícerozměrné perzistence najdete v podsekci perzistence.
Věta o struktuře
Věta o struktuře má pro TDA zásadní význam; jak poznamenal G. Carlsson, „to, co činí homologii užitečnou jako diskriminátor mezi topologickými prostory, je skutečnost, že existuje klasifikační věta pro konečně generované abelianské skupiny.“[3] (viz základní věta o konečně generovaných abelianských skupinách ).
Hlavním argumentem použitým v důkazu věty o původní struktuře je standard věta o struktuře pro konečně generované moduly nad hlavní ideální doménou.[9] Tento argument však selže, pokud je sada indexování .[3]
Obecně platí, že ne každý modul perzistence lze rozložit na intervaly.[66] Bylo učiněno mnoho pokusů o uvolnění omezení věty o původní struktuře.[je zapotřebí objasnění ] Případ bodových modulů konečně-dimenzionální perzistence indexovaných lokálně konečnou podmnožinou je řešen na základě práce Webba.[67] Nejpozoruhodnější výsledek je Crawley-Boevey, který vyřešil případ . Crawley-Boeveyova věta uvádí, že jakýkoli bodově konečný rozměrný modul perzistence je přímým součtem intervalových modulů.[68]
Abychom porozuměli definici jeho věty, je třeba zavést některé koncepty. An interval v je definována jako podmnožina mít vlastnost, že pokud a pokud existuje takhle , pak také. An intervalový modul přiřadí každému prvku vektorový prostor a přiřadí nulový vektorový prostor prvkům v . Všechny mapy jsou nulová mapa, pokud a , v jakém případě je mapa identity.[33] Intervalové moduly jsou nerozložitelné.[69]
Přestože je výsledek Crawley-Boevey velmi silné věty, stále se nevztahuje na případ q-tame.[66] Modul perzistence je q-krotit pokud je hodnost je konečný pro všechny . Existují příklady modulů persistence q-tame, které nejsou bodově konečné.[70] Ukázalo se však, že věta o podobné struktuře stále platí, pokud jsou odstraněny funkce, které existují pouze při jedné hodnotě indexu.[69] To platí, protože nekonečné dimenzionální části při každé hodnotě indexu nepřetrvávají kvůli podmínce konečné pozice.[71] Formálně pozorovatelná kategorie je definován jako , ve kterém označuje celou podkategorii jejichž objekty jsou pomíjivé moduly ( kdykoli ).[69]
Všimněte si, že zde uvedené rozšířené výsledky se nevztahují na perzistenci cikcaku, protože analoga modulu perzistence cikcaku přes není okamžitě zřejmé.
Statistika
Reálná data jsou vždy konečná, a proto jejich studie vyžaduje, abychom vzali v úvahu stochasticitu. Statistická analýza nám dává možnost oddělit skutečné vlastnosti dat od artefaktů zavedených náhodným šumem. Trvalá homologie nemá žádný vlastní mechanismus k rozlišení mezi prvky s nízkou pravděpodobností a vlastnostmi s vysokou pravděpodobností.
Jedním ze způsobů, jak aplikovat statistiku na analýzu topologických dat, je studium statistických vlastností topologických vlastností mračen bodů. Studium náhodných zjednodušených komplexů nabízí určitý pohled na statistickou topologii. K. Turner a kol.[72] nabízí shrnutí práce v tomto duchu.
Druhým způsobem je studium rozdělení pravděpodobnosti v prostoru perzistence. Prostor vytrvalosti je , kde je prostor všech čárových kódů obsahujících přesně intervaly a ekvivalence jsou -li .[73] Tento prostor je poměrně komplikovaný; například není pod metrikou úzkého místa úplná. První pokus o jeho studium provedli Y. Mileyko a kol.[74] Prostor perzistence diagramů v jejich příspěvku je definován jako
Třetím způsobem je uvažovat přímo o kohomologii pravděpodobnostního prostoru nebo statistických systémů, která se nazývá informační struktury a která v zásadě spočívá v trojici (), ukázkový prostor, náhodné proměnné a zákony pravděpodobnosti [78] [79]. Náhodné proměnné jsou považovány za oddíly n atomových pravděpodobností (vnímáno jako pravděpodobnost (n-1) -simplex, ) na mřížce oddílů (). Náhodné proměnné nebo moduly měřitelných funkcí poskytují komplexy řetězců, zatímco hranice je považována za obecnou homologickou algebru, kterou poprvé objevil Hochschild s levou akcí provádějící akci kondicionování. První podmínka cyklu odpovídá pravidlu řetězení entropie, což umožňuje jednoznačně odvodit až do multiplikativní konstanty, Shannonova entropie jako první třída cohomologie. Úvaha o deformované levé akci zobecňuje rámec na Tsallisovy entropie. Informační kohomologie je příkladem prstencových toposů. Vícerozměrný k-Vzájemné informace objevují se ve výrazech coboundaries a jejich mizení, související s podmínkou cyklu, poskytuje rovnocenné podmínky pro statistickou nezávislost [80]. Minima vzájemných informací, nazývaná také synergie, vede k zajímavým konfiguracím nezávislosti analogickým s homotopickými vazbami. Vzhledem ke své kombinatorické složitosti byl na datech zkoumán pouze zjednodušený podskupina kohomologie a informační struktury. Tyto cohomologické nástroje aplikované na data kvantifikují statistické závislosti a nezávislosti, včetně Markovovy řetězy a podmíněná nezávislost, v případě více proměnných [81]. Zejména se vzájemné informace zobecňují korelační koeficient a kovariance k nelineárním statistickým závislostem. Tyto přístupy byly vyvinuty nezávisle a pouze nepřímo související s metodami perzistence, ale lze je zhruba pochopit v jednoduchém případě pomocí věty Hu Kuo Tin, která stanoví vzájemnou korespondenci mezi funkcemi vzájemných informací a konečnou měřitelnou funkcí množiny s operátorem průniku , postavit Čechův komplex kostra. Informační kohomologie nabízí určitou přímou interpretaci a aplikaci z hlediska neurovědy (teorie neurální sestavy a kvalitativní poznání [82]), statistická fyzika a hluboká neuronová síť, pro které je struktura a algoritmus učení uložen komplexem náhodných proměnných a pravidlem informačního řetězce [83].
Persistence landscapes, introduced by Peter Bubenik, are a different way to represent barcodes, more amenable to statistical analysis.[84] The persistence landscape of a persistent module is defined as a function , , kde označuje prodloužená skutečná čára a . The space of persistence landscapes is very nice: it inherits all good properties of barcode representation (stability, easy representation, etc.), but statistical quantities can be readily defined, and some problems in Y. Mileyko et al.'s work, such as the non-uniqueness of expectations,[74] can be overcome. Effective algorithms for computation with persistence landscapes are available.[85] Another approach is to use revised persistence, which is image, kernel and cokernel persistence.[86]
Aplikace
Classification of applications
More than one way exists to classify the applications of TDA. Perhaps the most natural way is by field. A very incomplete list of successful applications includes [87] data skeletonization,[88] shape study,[89] graph reconstruction,[90][91][92] [93][94]image analysis,[95][96] materiál,[97] progression analysis of disease,[98][99] sensor network,[62] signal analysis,[100] cosmic web,[101] complex network,[102][103][104][105] fractal geometry,[106] viral evolution,[107] propagation of contagions on networks,[108] bacteria classification using molecular spectroscopy,[109] hyperspectral imaging in physical-chemistry [110] and remote sensing.[111]
Another way is by distinguishing the techniques by G. Carlsson,[73]
one being the study of homological invariants of data one individual data sets, and the other is the use of homological invariants in the study of databases where the data points themselves have geometric structure.
Characteristics of TDA in applications
There are several notable interesting features of the recent applications of TDA:
- Combining tools from several branches of mathematics. Besides the obvious need for algebra and topology, partial differential equations,[112] algebraic geometry,[36] representation theory,[49] statistics, combinatorics, and Riemannian geometry[71] have all found use in TDA.
- Kvantitativní analýza. Topology is considered to be very soft since many concepts are invariant under homotopy. However, persistent topology is able to record the birth (appearance) and death (disappearance) of topological features, thus extra geometric information is embedded in it. One evidence in theory is a partially positive result on the uniqueness of reconstruction of curves;[113] two in application are on the quantitative analysis of Fullerene stability and quantitative analysis of sebepodobnost, separately.[106][114]
- The role of short persistence. Short persistence has also been found to be useful, despite the common belief that noise is the cause of the phenomena.[115] This is interesting to the mathematical theory.
One of the main fields of data analysis today is strojové učení. Some examples of machine learning in TDA can be found in Adcock et al.[116] A konference is dedicated to the link between TDA and machine learning. In order to apply tools from machine learning, the information obtained from TDA should be represented in vector form. An ongoing and promising attempt is the persistence landscape discussed above. Another attempt uses the concept of persistence images.[117] However, one problem of this method is the loss of stability, since the hard stability theorem depends on the barcode representation.
Impact on mathematics
Topological data analysis and persistent homology have had impacts on Morseova teorie. Morse theory has played a very important role in the theory of TDA, including on computation. Some work in persistent homology has extended results about Morse functions to tame functions or, even to continuous functions. A forgotten result of R. Deheuvels long before the invention of persistent homology extends Morse theory to all continuous functions.[118]
One recent result is that the category of Reeb graphs is equivalent to a particular class of cosheaf.[119] This is motivated by theoretical work in TDA, since the Reeb graph is related to Morse theory and MAPPER is derived from it. The proof of this theorem relies on the interleaving distance.
Persistent homology is closely related to spektrální sekvence.[120] [121] In particular the algorithm bringing a filtered complex to its canonical form[10] permits much faster calculation of spectral sequences than the standard procedure of calculating groups page by page. Zigzag persistence may turn out to be of theoretical importance to spectral sequences.
Viz také
- Snížení rozměrů
- Dolování dat
- Počítačové vidění
- Výpočetní topologie
- Diskrétní Morseova teorie
- Analýza tvaru (digitální geometrie)
- Size theory
- Algebraická topologie
Reference
- ^ Epstein, Charles; Carlsson, Gunnar; Edelsbrunner, Herbert (2011-12-01). "Topological data analysis". Inverzní problémy. 27 (12): 120201. arXiv:1609.08227. Bibcode:2011InvPr..27a0101E. doi:10.1088/0266-5611/27/12/120201.
- ^ "diva-portal.org/smash/record.jsf?pid=diva2%253A575329&dswid=4297". www.diva-portal.org. Archivovány od originál dne 19. listopadu 2015. Citováno 2015-11-05.
- ^ A b C d E Carlsson, Gunnar (2009-01-01). "Topology and data". Bulletin of the American Mathematical Society. 46 (2): 255–308. doi:10.1090/S0273-0979-09-01249-X. ISSN 0273-0979.
- ^ Edelsbrunner H. Persistent homology: theory and practice[J]. 2014.
- ^ Frosini, Patrizio (1990-12-01). "A distance for similarity classes of submanifolds of a Euclidean space". Bulletin of the Australian Mathematical Society. 42 (3): 407–415. doi:10.1017/S0004972700028574. ISSN 1755-1633.
- ^ Robins V. Towards computing homology from finite approximations[C]//Topology proceedings. 1999, 24(1): 503-532.
- ^ A b C Edelsbrunner; Letscher; Zomorodian (2002-11-01). "Topological Persistence and Simplification". Diskrétní a výpočetní geometrie. 28 (4): 511–533. doi:10.1007/s00454-002-2885-2. ISSN 0179-5376.
- ^ Carlsson, Gunnar; Zomorodian, Afra; Collins, Anne; Guibas, Leonidas J. (2005-12-01). "Persistence barcodes for shapes". International Journal of Shape Modeling. 11 (2): 149–187. CiteSeerX 10.1.1.5.2718. doi:10.1142/S0218654305000761. ISSN 0218-6543.
- ^ A b C d E F Zomorodian, Afra; Carlsson, Gunnar (2004-11-19). "Computing Persistent Homology". Diskrétní a výpočetní geometrie. 33 (2): 249–274. doi:10.1007/s00454-004-1146-y. ISSN 0179-5376.
- ^ A b C d E Barannikov, Sergey (1994). "Framed Morse complex and its invariants". Advances in Soviet Mathematics. 21: 93–115.
- ^ A b C Chazal, Frédéric; Cohen-Steiner, David; Glisse, Marc; Guibas, Leonidas J.; Oudot, Steve Y. (2009-01-01). Proximity of Persistence Modules and Their Diagrams. Proceedings of the Twenty-fifth Annual Symposium on Computational Geometry. SCG '09. New York, NY, USA: ACM. 237–246. CiteSeerX 10.1.1.473.2112. doi:10.1145/1542362.1542407. ISBN 978-1-60558-501-7. S2CID 840484.
- ^ Munch E. Applications of persistent homology to time varying systems[D]. Duke University, 2013.
- ^ Shikhman, Vladimir (2011). Topological Aspects of Nonsmooth Optimization. Springer Science & Business Media. 169–170. ISBN 9781461418979. Citováno 22. listopadu 2017.
- ^ A b Cohen-Steiner, David; Edelsbrunner, Herbert; Harer, John (2006-12-12). "Stability of Persistence Diagrams". Diskrétní a výpočetní geometrie. 37 (1): 103–120. doi:10.1007/s00454-006-1276-5. ISSN 0179-5376.
- ^ Ghrist, Robert (2008-01-01). "Barcodes: The persistent topology of data". Bulletin of the American Mathematical Society. 45 (1): 61–75. doi:10.1090/S0273-0979-07-01191-3. ISSN 0273-0979.
- ^ Chazal, Frédéric; Glisse, Marc; Labruère, Catherine; Michel, Bertrand (2013-05-27). "Optimal rates of convergence for persistence diagrams in Topological Data Analysis". arXiv:1305.6239 [matematika ].
- ^ A b Edelsbrunner, Herbert; Harer, John (2010-01-01). Computational Topology: An Introduction. American Mathematical Soc. ISBN 9780821849255.
- ^ De Silva, Vin; Carlsson, Gunnar (2004-01-01). Topological Estimation Using Witness Complexes. Proceedings of the First Eurographics Conference on Point-Based Graphics. SPBG'04. Aire-la-Ville, Switzerland, Switzerland: Eurographics Association. str. 157–166. doi:10.2312/SPBG/SPBG04/157-166. ISBN 978-3-905673-09-8.
- ^ Mischaikow, Konstantin; Nanda, Vidit (2013-07-27). "Morse Theory for Filtrations and Efficient Computation of Persistent Homology". Diskrétní a výpočetní geometrie. 50 (2): 330–353. doi:10.1007 / s00454-013-9529-6. ISSN 0179-5376.
- ^ Henselman, Gregory; Ghrist, Robert (1 Jun 2016). "Matroid Filtrations and Computational Persistent Homology". arXiv:1606.00199. Bibcode:2016arXiv160600199H. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Chen, Chao; Kerber, Michael (2013-05-01). "An output-sensitive algorithm for persistent homology". Výpočetní geometrie. 27th Annual Symposium on Computational Geometry (SoCG 2011). 46 (4): 435–447. doi:10.1016/j.comgeo.2012.02.010.
- ^ Otter, Nina; Porter, Mason A.; Tillmann, Ulrike; Grindrod, Peter; Harrington, Heather A. (2015-06-29). "A roadmap for the computation of persistent homology". EPJ Data Science. 6 (1): 17. arXiv:1506.08903. Bibcode:2015arXiv150608903O. doi:10.1140/epjds/s13688-017-0109-5. PMC 6979512. PMID 32025466.
- ^ Fasy, Brittany Terese; Kim, Jisu; Lecci, Fabrizio; Maria, Clément (2014-11-07). "Introduction to the R package TDA". arXiv:1411.1830 [cs.MS ].
- ^ Wadhwa, Raoul; Williamson, Drew; Dhawan, Andrew; Scott, Jacob (2018). "TDAstats: R pipeline for computing persistent homology in topological data analysis". Journal of Open Source Software. 3 (28): 860. Bibcode:2018JOSS....3..860R. doi:10.21105/joss.00860.
- ^ Liu S, Maljovec D, Wang B, et al. Visualizing High-Dimensional Data: Advances in the Past Decade[J].
- ^ A b C Dey, Tamal K.; Memoli, Facundo; Wang, Yusu (2015-04-14). "Mutiscale Mapper: A Framework for Topological Summarization of Data and Maps". arXiv:1504.03763 [cs.CG ].
- ^ A b Msgstr "Byl překročen limit stahování". CiteSeerX 10.1.1.161.8956. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Bott, Raoul; Tu, Loring W. (2013-04-17). Diferenciální formy v algebraické topologii. Springer Science & Business Media. ISBN 978-1-4757-3951-0.
- ^ Pascucci, Valerio; Scorzelli, Giorgio; Bremer, Peer-Timo; Mascarenhas, Ajith (2007). "Robust on-line computation of Reeb graphs: simplicity and speed". Transakce ACM v grafice. 33: 58.1–58.9. doi:10.1145/1275808.1276449.
- ^ Curry, Justin (2013-03-13). "Sheaves, Cosheaves and Applications". arXiv:1303.3255 [math.AT ].
- ^ Liu, Xu; Xie, Zheng; Yi, Dongyun (2012-01-01). "A fast algorithm for constructing topological structure in large data". Homology, Homotopy and Applications. 14 (1): 221–238. doi:10.4310/hha.2012.v14.n1.a11. ISSN 1532-0073.
- ^ Lum, P. Y.; Singh, G .; Lehman, A.; Ishkanov, T.; Vejdemo-Johansson, M.; Alagappan, M.; Carlsson, J .; Carlsson, G. (2013-02-07). "Extracting insights from the shape of complex data using topology". Vědecké zprávy. 3: 1236. Bibcode:2013NatSR...3E1236L. doi:10.1038/srep01236. PMC 3566620. PMID 23393618.
- ^ A b C d E Curry, Justin (2014-11-03). "Topological Data Analysis and Cosheaves". arXiv:1411.0613 [math.AT ].
- ^ Frosini P, Mulazzani M. Size homotopy groups for computation of natural size distances[J]. Bulletin of the Belgian Mathematical Society Simon Stevin, 1999, 6(3): 455-464.
- ^ Biasotti, S.; Cerri, A.; Frosini, P.; Giorgi, D.; Landi, C. (2008-05-17). "Multidimensional Size Functions for Shape Comparison". Journal of Mathematical Imaging and Vision. 32 (2): 161–179. doi:10.1007/s10851-008-0096-z. ISSN 0924-9907. S2CID 13372132.
- ^ A b Carlsson, Gunnar; Zomorodian, Afra (2009-04-24). "The Theory of Multidimensional Persistence". Diskrétní a výpočetní geometrie. 42 (1): 71–93. doi:10.1007/s00454-009-9176-0. ISSN 0179-5376.
- ^ Derksen H, Weyman J. Quiver representations[J]. Notices of the AMS, 2005, 52(2): 200-206.
- ^ Atiyah M F. On the Krull-Schmidt theorem with application to sheaves[J]. Bulletin de la Société Mathématique de France, 1956, 84: 307-317.
- ^ Cerri A, Di Fabio B, Ferri M, et al. Multidimensional persistent homology is stable[J]. arXiv:0908.0064, 2009.
- ^ Cagliari, Francesca; Landi, Claudia (2011-04-01). "Finiteness of rank invariants of multidimensional persistent homology groups". Aplikovaná matematická písmena. 24 (4): 516–518. arXiv:1001.0358. doi:10.1016/j.aml.2010.11.004. S2CID 14337220.
- ^ Cagliari, Francesca; Di Fabio, Barbara; Ferri, Massimo (2010-01-01). "One-dimensional reduction of multidimensional persistent homology". Proceedings of the American Mathematical Society. 138 (8): 3003–3017. arXiv:math/0702713. doi:10.1090/S0002-9939-10-10312-8. ISSN 0002-9939. S2CID 18284958.
- ^ Cerri, Andrea; Fabio, Barbara Di; Ferri, Massimo; Frosini, Patrizio; Landi, Claudia (2013-08-01). "Betti numbers in multidimensional persistent homology are stable functions". Matematické metody v aplikovaných vědách. 36 (12): 1543–1557. Bibcode:2013MMAS...36.1543C. doi:10.1002/mma.2704. ISSN 1099-1476.
- ^ Cerri, Andrea; Frosini, Patrizio (2015-03-15). "Necessary conditions for discontinuities of multidimensional persistent Betti numbers". Matematické metody v aplikovaných vědách. 38 (4): 617–629. Bibcode:2015MMAS...38..617C. doi:10.1002/mma.3093. ISSN 1099-1476.
- ^ Cerri, Andrea; Landi, Claudia (2013-03-20). Gonzalez-Diaz, Rocio; Jimenez, Maria-Jose; Medrano, Belen (eds.). The Persistence Space in Multidimensional Persistent Homology. Přednášky z informatiky. Springer Berlin Heidelberg. 180–191. doi:10.1007/978-3-642-37067-0_16. ISBN 978-3-642-37066-3.
- ^ Skryzalin, Jacek; Carlsson, Gunnar (2014-11-14). "Numeric Invariants from Multidimensional Persistence". arXiv:1411.4022 [cs.CG ].
- ^ Carlsson, Gunnar; Singh, Gurjeet; Zomorodian, Afra (2009-12-16). Dong, Yingfei; Du, Ding-Zhu; Ibarra, Oscar (eds.). Computing Multidimensional Persistence. Přednášky z informatiky. Springer Berlin Heidelberg. pp. 730–739. CiteSeerX 10.1.1.313.7004. doi:10.1007/978-3-642-10631-6_74. ISBN 978-3-642-10630-9. S2CID 15529723.
- ^ Allili, Madjid; Kaczynski, Tomasz; Landi, Claudia (2013-10-30). "Reducing complexes in multidimensional persistent homology theory". arXiv:1310.8089 [cs.CG ].
- ^ Cavazza N, Ferri M, Landi C. Estimating multidimensional persistent homology through a finite sampling[J]. 2010.
- ^ A b Carlsson, Gunnar; Silva, Vin de (2010-04-21). "Zigzag Persistence". Základy výpočetní matematiky. 10 (4): 367–405. doi:10.1007/s10208-010-9066-0. ISSN 1615-3375.
- ^ Cohen-Steiner, David; Edelsbrunner, Herbert; Harer, John (2008-04-04). "Extending Persistence Using Poincaré and Lefschetz Duality". Základy výpočetní matematiky. 9 (1): 79–103. doi:10.1007/s10208-008-9027-z. ISSN 1615-3375. S2CID 33297537.
- ^ de Silva, Vin; Morozov, Dmitriy; Vejdemo-Johansson, Mikael (2011). "Dualities in persistent (co)homology". Inverzní problémy. 27 (12): 124003. arXiv:1107.5665. Bibcode:2011InvPr..27l4003D. doi:10.1088/0266-5611/27/12/124003. S2CID 5706682.
- ^ Silva, Vin de; Morozov, Dmitriy; Vejdemo-Johansson, Mikael (2011-03-30). "Persistent Cohomology and Circular Coordinates". Diskrétní a výpočetní geometrie. 45 (4): 737–759. arXiv:0905.4887. doi:10.1007/s00454-011-9344-x. ISSN 0179-5376. S2CID 31480083.
- ^ A b Burghelea, Dan; Dey, Tamal K. (2013-04-09). "Topological Persistence for Circle-Valued Maps". Diskrétní a výpočetní geometrie. 50 (1): 69–98. arXiv:1104.5646. doi:10.1007/s00454-013-9497-x. ISSN 0179-5376. S2CID 17407953.
- ^ Novikov S P. Quasiperiodic structures in topology[C]//Topological methods in modern mathematics, Proceedings of the symposium in honor of John Milnor’s sixtieth birthday held at the State University of New York, Stony Brook, New York. 1991: 223-233.
- ^ Gross, Jonathan L .; Yellen, Jay (2004-06-02). Příručka teorie grafů. CRC Press. ISBN 978-0-203-49020-4.
- ^ Burghelea, Dan; Haller, Stefan (2015-06-04). "Topology of angle valued maps, bar codes and Jordan blocks". arXiv:1303.4328 [math.AT ].
- ^ Frosini, Patrizio (2012-06-23). "Stable Comparison of Multidimensional Persistent Homology Groups with Torsion". Acta Applicandae Mathematicae. 124 (1): 43–54. arXiv:1012.4169. doi:10.1007/s10440-012-9769-0. ISSN 0167-8019. S2CID 4809929.
- ^ A b C d Lesnick, Michael (2015-03-24). "The Theory of the Interleaving Distance on Multidimensional Persistence Modules". Základy výpočetní matematiky. 15 (3): 613–650. arXiv:1106.5305. doi:10.1007/s10208-015-9255-y. ISSN 1615-3375. S2CID 17184609.
- ^ A b Bubenik, Peter; Scott, Jonathan A. (2014-01-28). "Categorification of Persistent Homology". Diskrétní a výpočetní geometrie. 51 (3): 600–627. arXiv:1205.3669. doi:10.1007/s00454-014-9573-x. ISSN 0179-5376. S2CID 11056619.
- ^ A b C d E F Bubenik, Peter; Silva, Vin de; Scott, Jonathan (2014-10-09). "Metrics for Generalized Persistence Modules". Základy výpočetní matematiky. 15 (6): 1501–1531. CiteSeerX 10.1.1.748.3101. doi:10.1007/s10208-014-9229-5. ISSN 1615-3375. S2CID 16351674.
- ^ A b de Silva, Vin; Nanda, Vidit (2013-01-01). Geometry in the Space of Persistence Modules. Proceedings of the Twenty-ninth Annual Symposium on Computational Geometry. SoCG '13. New York, NY, USA: ACM. pp. 397–404. doi:10.1145/2462356.2462402. ISBN 978-1-4503-2031-3. S2CID 16326608.
- ^ A b De Silva V, Ghrist R. Coverage in sensor networks via persistent homology[J]. Algebraic & Geometric Topology, 2007, 7(1): 339-358.
- ^ d’Amico, Michele; Frosini, Patrizio; Landi, Claudia (2008-10-14). "Natural Pseudo-Distance and Optimal Matching between Reduced Size Functions". Acta Applicandae Mathematicae. 109 (2): 527–554. arXiv:0804.3500. Bibcode:2008arXiv0804.3500D. doi:10.1007/s10440-008-9332-1. ISSN 0167-8019. S2CID 1704971.
- ^ Di Fabio, B.; Frosini, P. (2013-08-01). "Filtrations induced by continuous functions". Topologie a její aplikace. 160 (12): 1413–1422. arXiv:1304.1268. Bibcode:2013arXiv1304.1268D. doi:10.1016/j.topol.2013.05.013. S2CID 13971804.
- ^ Lesnick, Michael (2012-06-06). "Multidimensional Interleavings and Applications to Topological Inference". arXiv:1206.1365 [math.AT ].
- ^ A b Chazal, Frederic; de Silva, Vin; Glisse, Marc; Oudot, Steve (2012-07-16). "The structure and stability of persistence modules". arXiv:1207.3674 [math.AT ].
- ^ Webb, Cary (1985-01-01). "Decomposition of graded modules". Proceedings of the American Mathematical Society. 94 (4): 565–571. doi:10.1090/S0002-9939-1985-0792261-6. ISSN 0002-9939.
- ^ Crawley-Boevey, William (2015). "Decomposition of pointwise finite-dimensional persistence modules". Journal of Algebra and Its Applications. 14 (5): 1550066. arXiv:1210.0819. doi:10.1142/s0219498815500668. S2CID 119635797.
- ^ A b C Chazal, Frederic; Crawley-Boevey, William; de Silva, Vin (2014-05-22). "The observable structure of persistence modules". arXiv:1405.5644 [math.RT ].
- ^ Droz, Jean-Marie (2012-10-15). "A subset of Euclidean space with large Vietoris-Rips homology". arXiv:1210.4097 [matematika. GT ].
- ^ A b Weinberger S. What is... persistent homology?[J]. Notices of the AMS, 2011, 58(1): 36-39.
- ^ Turner, Katharine; Mileyko, Yuriy; Mukherjee, Sayan; Harer, John (2014-07-12). "Fréchet Means for Distributions of Persistence Diagrams". Diskrétní a výpočetní geometrie. 52 (1): 44–70. arXiv:1206.2790. doi:10.1007/s00454-014-9604-7. ISSN 0179-5376. S2CID 14293062.
- ^ A b Carlsson, Gunnar (2014-05-01). "Topological pattern recognition for point cloud data". Acta Numerica. 23: 289–368. doi:10.1017/S0962492914000051. ISSN 1474-0508.
- ^ A b Mileyko, Yuriy; Mukherjee, Sayan; Harer, John (2011-11-10). "Probability measures on the space of persistence diagrams". Inverzní problémy. 27 (12): 124007. Bibcode:2011InvPr..27l4007M. doi:10.1088/0266-5611/27/12/124007. ISSN 0266-5611. S2CID 250676.
- ^ Robinson, Andrew; Turner, Katharine (2013-10-28). "Hypothesis Testing for Topological Data Analysis". arXiv:1310.7467 [stat.AP ].
- ^ Fasy, Brittany Terese; Lecci, Fabrizio; Rinaldo, Alessandro; Wasserman, Larry; Balakrishnan, Sivaraman; Singh, Aarti (2014-12-01). "Confidence sets for persistence diagrams". Annals of Statistics. 42 (6): 2301–2339. doi:10.1214/14-AOS1252. ISSN 0090-5364.
- ^ Blumberg, Andrew J.; Gal, Itamar; Mandell, Michael A.; Pancia, Matthew (2014-05-15). "Robust Statistics, Hypothesis Testing, and Confidence Intervals for Persistent Homology on Metric Measure Spaces". Základy výpočetní matematiky. 14 (4): 745–789. arXiv:1206.4581. doi:10.1007/s10208-014-9201-4. ISSN 1615-3375. S2CID 17150103.
- ^ Baudot, Pierre; Bennequin, Daniel (2015). "The Homological Nature of Entropy". Entropie. 17 (5): 3253–3318. Bibcode:2015Entrp..17.3253B. doi:10.3390/e17053253.
- ^ Vigneaux, Juan-Pablo (2019). "Topology of Statistical Systems: A Cohomological Approach to Information Theory" (PDF). PHD Manuscript: 0–226.
- ^ Baudot, Pierre; Tapia, Monica; Bennequin, Daniel; Goaillard, Jean-Marc (2019). "Topological Information Data Analysis". Entropie. 21 (9): 881. Bibcode:2019Entrp..21..881B. doi:10.3390/e21090881.
- ^ Tapia, Monica; al., et (2018). "Neurotransmitter identity and electrophysiological phenotype are genetically coupled in midbrain dopaminergic neurons". Vědecké zprávy. 8 (1): 13637. Bibcode:2018NatSR...813637T. doi:10.1038/s41598-018-31765-z. PMC 6134142. PMID 30206240.
- ^ Baudot, Pierre (2019). "Elements of qualitative cognition: an Information Topology Perspective". Recenze fyziky života. 31: 263–275. arXiv:1807.04520. Bibcode:2019PhLRv..31..263B. doi:10.1016/j.plrev.2019.10.003. PMID 31679788.
- ^ Baudot, Pierre (2019). "The Poincaré-Shannon Machine: Statistical Physics and Machine Learning Aspects of Information Cohomology". Entropie. 21 (9): 881. Bibcode:2019Entrp..21..881B. doi:10.3390/e21090881.
- ^ Bubenik, Peter (2012-07-26). "Statistical topological data analysis using persistence landscapes". arXiv:1207.6437 [math.AT ].
- ^ Bubenik, Peter; Dlotko, Pawel (2014-12-31). "A persistence landscapes toolbox for topological statistics". Journal of Symbolic Computation. 78: 91–114. arXiv:1501.00179. Bibcode:2015arXiv150100179B. doi:10.1016/j.jsc.2016.03.009. S2CID 9789489.
- ^ Cohen-Steiner, David; Edelsbrunner, Herbert; Harer, John; Morozov, Dmitriy (2009). Proceedings of the Twentieth Annual ACM-SIAM Symposium on Discrete Algorithms. pp. 1011–1020. CiteSeerX 10.1.1.179.3236. doi:10.1137/1.9781611973068.110. ISBN 978-0-89871-680-1.
- ^ Kurlin, V. (2015). "A one-dimensional Homologically Persistent Skeleton of an unstructured point cloud in any metric space" (PDF). Computer Graphics Forum (CGF). 34 (5): 253–262. doi:10.1111/cgf.12713. S2CID 10610111.
- ^ Kurlin, V. (2014). "A fast and robust algorithm to count topologically persistent holes in noisy clouds". 2014 IEEE Conference on Computer Vision and Pattern Recognition (PDF). Konference IEEE o počítačovém vidění a rozpoznávání vzorů. pp. 1458–1463. arXiv:1312.1492. doi:10.1109/CVPR.2014.189. ISBN 978-1-4799-5118-5. S2CID 10118087.
- ^ Kurlin, V. (2015). "A Homologically Persistent Skeleton is a fast and robust descriptor of interest points in 2D images". Computer Analysis of Images and Patterns (PDF). Lecture Notes in Computer Science (Proceedings of CAIP: Computer Analysis of Images and Patterns). Přednášky z informatiky. 9256. pp. 606–617. doi:10.1007/978-3-319-23192-1_51. ISBN 978-3-319-23191-4.
- ^ Cerri, A.; Ferri, M.; Giorgi, D. (2006-09-01). "Retrieval of trademark images by means of size functions". Graphical Models. Special Issue on the Vision, Video and Graphics Conference 2005. 68 (5–6): 451–471. doi:10.1016/j.gmod.2006.07.001.
- ^ Chazal, Frédéric; Cohen-Steiner, David; Guibas, Leonidas J.; Mémoli, Facundo; Oudot, Steve Y. (2009-07-01). "Gromov-Hausdorff Stable Signatures for Shapes using Persistence". Fórum počítačové grafiky. 28 (5): 1393–1403. CiteSeerX 10.1.1.161.9103. doi:10.1111/j.1467-8659.2009.01516.x. ISSN 1467-8659. S2CID 8173320.
- ^ Biasotti, S.; Giorgi, D.; Spagnuolo, M.; Falcidieno, B. (2008-09-01). "Size functions for comparing 3D models". Rozpoznávání vzorů. 41 (9): 2855–2873. doi:10.1016/j.patcog.2008.02.003.
- ^ Li, C .; Ovsjanikov, M.; Chazal, F. (2014). "Persistence-based Structural Recognition" (PDF). Konference IEEE o počítačovém vidění a rozpoznávání vzorů.
- ^ Tapia, Monica; al., et (2018). "Neurotransmitter identity and electrophysiological phenotype are genetically coupled in midbrain dopaminergic neurons". Vědecké zprávy. 8 (1): 13637. Bibcode:2018NatSR...813637T. doi:10.1038/s41598-018-31765-z. PMC 6134142. PMID 30206240.
- ^ Bendich, P.; Edelsbrunner, H .; Kerber, M. (2010-11-01). "Computing Robustness and Persistence for Images". Transakce IEEE na vizualizaci a počítačové grafice. 16 (6): 1251–1260. CiteSeerX 10.1.1.185.523. doi:10.1109/TVCG.2010.139. ISSN 1077-2626. PMID 20975165. S2CID 8589124.
- ^ Carlsson, Gunnar; Ishkhanov, Tigran; Silva, Vin de; Zomorodian, Afra (2007-06-30). "On the Local Behavior of Spaces of Natural Images". International Journal of Computer Vision. 76 (1): 1–12. CiteSeerX 10.1.1.463.7101. doi:10.1007/s11263-007-0056-x. ISSN 0920-5691. S2CID 207252002.
- ^ Nakamura, Takenobu; Hiraoka, Yasuaki; Hirata, Akihiko; Escolar, Emerson G.; Nishiura, Yasumasa (2015-02-26). "Persistent Homology and Many-Body Atomic Structure for Medium-Range Order in the Glass". Nanotechnologie. 26 (30): 304001. arXiv:1502.07445. Bibcode:2015Nanot..26D4001N. doi:10.1088/0957-4484/26/30/304001. PMID 26150288. S2CID 7298655.
- ^ Nicolau, Monica; Levine, Arnold J.; Carlsson, Gunnar (2011-04-26). "Topology based data analysis identifies a subgroup of breast cancers with a unique mutational profile and excellent survival". Sborník Národní akademie věd. 108 (17): 7265–7270. Bibcode:2011PNAS..108.7265N. doi:10.1073/pnas.1102826108. ISSN 0027-8424. PMC 3084136. PMID 21482760.
- ^ Schmidt, Stephan; Post, Teun M.; Boroujerdi, Massoud A.; Kesteren, Charlotte van; Ploeger, Bart A.; Pasqua, Oscar E. Della; Danhof, Meindert (2011-01-01). Kimko, Holly H. C.; Peck, Carl C. (eds.). Disease Progression Analysis: Towards Mechanism-Based Models. AAPS Advances in the Pharmaceutical Sciences Series. Springer New York. pp. 433–455. doi:10.1007/978-1-4419-7415-0_19. ISBN 978-1-4419-7414-3.
- ^ Perea, Jose A.; Harer, John (2014-05-29). "Sliding Windows and Persistence: An Application of Topological Methods to Signal Analysis". Základy výpočetní matematiky. 15 (3): 799–838. CiteSeerX 10.1.1.357.6648. doi:10.1007/s10208-014-9206-z. ISSN 1615-3375. S2CID 592832.
- ^ van de Weygaert, Rien; Vegter, Gert; Edelsbrunner, Herbert; Jones, Bernard J. T.; Pranav, Pratyush; Park, Changbom; Hellwing, Wojciech A.; Eldering, Bob; Kruithof, Nico (2011-01-01). Gavrilova, Marina L .; Tan, C. Kenneth; Mostafavi, Mir Abolfazl (eds.). Transactions on Computational Science XIV. Berlin, Heidelberg: Springer-Verlag. pp. 60–101. ISBN 978-3-642-25248-8.
- ^ Horak, Danijela; Maletić, Slobodan; Rajković, Milan (2009-03-01). "Persistent homology of complex networks - IOPscience". Journal of Statistical Mechanics: Theory and Experiment. 2009 (3): P03034. arXiv:0811.2203. Bibcode:2009JSMTE..03..034H. doi:10.1088/1742-5468/2009/03/p03034. S2CID 15592802.
- ^ Carstens, C. J.; Horadam, K. J. (2013-06-04). "Persistent Homology of Collaboration Networks". Matematické problémy ve strojírenství. 2013: 1–7. doi:10.1155/2013/815035.
- ^ Lee, Hyekyoung; Kang, Hyejin; Chung, M.K.; Kim, Bung-Nyun; Lee, Dong Soo (2012-12-01). "Persistent Brain Network Homology From the Perspective of Dendrogram". Transakce IEEE na lékařském zobrazování. 31 (12): 2267–2277. CiteSeerX 10.1.1.259.2692. doi:10.1109/TMI.2012.2219590. ISSN 0278-0062. PMID 23008247. S2CID 858022.
- ^ Petri, G.; Expert, P.; Turkheimer, F.; Carhart-Harris, R.; Nutt, D.; Hellyer, P. J.; Vaccarino, F. (2014-12-06). "Homological scaffolds of brain functional networks". Journal of the Royal Society Interface. 11 (101): 20140873. doi:10.1098/rsif.2014.0873. ISSN 1742-5689. PMC 4223908. PMID 25401177.
- ^ A b MacPherson, Robert; Schweinhart, Benjamin (2012-07-01). "Measuring shape with topology". Journal of Mathematical Physics. 53 (7): 073516. arXiv:1011.2258. Bibcode:2012JMP....53g3516M. doi:10.1063/1.4737391. ISSN 0022-2488. S2CID 17423075.
- ^ Chan, Joseph Minhow; Carlsson, Gunnar; Rabadan, Raul (2013-11-12). "Topology of viral evolution". Sborník Národní akademie věd. 110 (46): 18566–18571. Bibcode:2013PNAS..11018566C. doi:10.1073/pnas.1313480110. ISSN 0027-8424. PMC 3831954. PMID 24170857.
- ^ Taylor, D .; al, et. (2015-08-21). "Topological data analysis of contagion maps for examining spreading processes on networks". Příroda komunikace. 6 (6): 7723. arXiv:1408.1168. Bibcode:2015NatCo...6E7723T. doi:10.1038/ncomms8723. ISSN 2041-1723. PMC 4566922. PMID 26194875.
- ^ Offroy, M. (2016). "Topological data analysis: A promising big data exploration tool in biology, analytical chemistry and physical chemistry". Analytica Chimica Acta. 910: 1–11. doi:10.1016/j.aca.2015.12.037. PMID 26873463.
- ^ Duponchel, L. (2018). "Exploring hyperspectral imaging data sets with topological data analysis". Analytica Chimica Acta. 1000: 123–131. doi:10.1016/j.aca.2017.11.029. PMID 29289301.
- ^ Duponchel, L. (2018). "When remote sensing meets topological data analysis". Journal of Spectral Imaging. 7: a1. doi:10.1255/jsi.2018.a1.
- ^ Wang, Bao; Wei, Guo-Wei (2014-12-07). "Objective-oriented Persistent Homology". arXiv:1412.2368 [q-bio.BM ].
- ^ Frosini, Patrizio; Landi, Claudia (2011). "Uniqueness of models in persistent homology: the case of curves". Inverzní problémy. 27 (12): 124005. arXiv:1012.5783. Bibcode:2011InvPr..27l4005F. doi:10.1088/0266-5611/27/12/124005. S2CID 16636182.
- ^ Xia, Kelin; Feng, Xin; Tong, Yiying; Wei, Guo Wei (2015-03-05). "Persistent homology for the quantitative prediction of fullerene stability". Journal of Computational Chemistry. 36 (6): 408–422. doi:10.1002/jcc.23816. ISSN 1096-987X. PMC 4324100. PMID 25523342.
- ^ Xia, Kelin; Wei, Guo-Wei (2014-08-01). "Persistent homology analysis of protein structure, flexibility, and folding". International Journal for Numerical Methods in Biomedical Engineering. 30 (8): 814–844. arXiv:1412.2779. Bibcode:2014arXiv1412.2779X. doi:10.1002/cnm.2655. ISSN 2040-7947. PMC 4131872. PMID 24902720.
- ^ Adcock, Aaron; Carlsson, Erik; Carlsson, Gunnar (2016-05-31). „Kruh algebraických funkcí na perzistenčních čárových kódech“ (PDF). Homologie, homotopie a aplikace. 18 (1): 381–402. doi:10.4310 / hha.2016.v18.n1.a21. S2CID 2964961.
- ^ Chepushtanova, Sofya; Emerson, Tegan; Hanson, Eric; Kirby, Michael; Motta, Francis; Neville, Rachel; Peterson, Chris; Shipman, Patrick; Ziegelmeier, Lori (2015-07-22). „Persistence Images: an Alternative Persistent Homology Reprezentation“. arXiv:1507.06217 [cs.CG ].
- ^ Deheuvels, Rene (01.01.1955). „Topologie D'Une Fonctionnelle“. Annals of Mathematics. Druhá série. 61 (1): 13–72. doi:10.2307/1969619. JSTOR 1969619.
- ^ de Silva, Vin; Munch, Elizabeth; Patel, Amit (2016-04-13). Msgstr "Kategorizované Reebové grafy". Diskrétní a výpočetní geometrie. 55 (4): 854–906. arXiv:1501.04147. doi:10.1007 / s00454-016-9763-9. S2CID 7111141.
- ^ Goodman, Jacob E. (01.01.2008). Průzkumy diskrétní a výpočetní geometrie: O dvacet let později: Společná letní výzkumná konference AMS-IMS-SIAM, 18. – 22. Června 2006, Snowbird, Utah. American Mathematical Soc. ISBN 9780821842393.
- ^ Edelsbrunner, Herbert; Harer, John (2008). Trvalá homologie - průzkum. Současná matematika. 453. AMS. str. 15–18. CiteSeerX 10.1.1.87.7764. doi:10.1090 / conm / 453/08802. ISBN 9780821842393.
Část 5
Další čtení
Stručný úvod
- Studium tvaru dat pomocí topologie od Michaela Lesnicka
- Zdrojový materiál pro analýzu topologických dat Mikael Vejdemo-Johansson
Monografie
Video přednáška
- Úvod do persistentní homologie a Topologie pro analýzu dat, Matthew Wright
- Tvar dat Gunnar Carlsson
Učebnice topologie
- Algebraická topologie, Allen Hatcher
- Výpočetní topologie: Úvod, Herbert Edelsbrunner a John L. Harer
- Elementární aplikovaná topologie autor: Robert Ghrist
Další zdroje TDA
- Aplikovaná topologie, Stanford
- Síť pro výzkum aplikované algebraické topologie , Ústavem pro matematiku a jeho aplikace
- Topologické učení jádra: Diskrétní Morseova teorie se používá k propojení strojového učení jádra s analýzou topologických dat. https://www.researchgate.net/publication/327427685_Topological_Kernel_Learning