Vícecestná analýza dat - Multiway data analysis - Wikipedia
Vícecestná analýza dat je metoda analýzy velkých souborů dat reprezentací dat jako vícerozměrné pole. Správná volba dimenzí pole a technik analýzy může odhalit vzory v podkladových datech nezjištěné jinými metodami.[1]
Dějiny
Studie vícecestné analýzy dat byla poprvé formalizována jako výsledek konference konané v roce 1988. Výsledkem této konference byl první text specificky zaměřený na tuto oblast, Coppiho a Bolascova Vícecestná analýza dat.[2] V té době byly zahrnuty oblasti použití pro vícecestnou analýzu statistika, ekonometrie a psychometrie. V posledních letech se aplikace rozšířily o chemometrie, zemědělství, analýza sociálních sítí a potravinářský průmysl.[3]
Složení vícecestné analýzy dat
Vícecestná data
Vícecestní datoví analytici tento termín používají způsob odkazovat na dimenzi dat při rezervování slova režimu pro metody nebo modely použité k analýze dat.[2]:xviii
V tomto smyslu můžeme definovat různé způsoby údajů k analýze:
- Jednosměrná data je vektor s jedinou datovou hodnotou pro každou diskrétní nebo spojitou hodnotu jedné dimenze.
- Obousměrná data je matice s jedinou datovou hodnotou pro každou diskrétní nebo spojitou hodnotu dvou samostatných dimenzí; A tabulkový kalkulátor lze použít k vizualizaci takových dat v případě diskrétních dimenzí.
- Třícestná data lze zobrazit jako hromadu matic (nebo podobně jako sešit několika tabulky ), přidáním třetí dimenze. Taková data mohou představovat teplotu na různých místech (obousměrná data) vzorkovaných v různých časech (třetí dimenze, což vede k třícestným datům)
- Čtyřcestná data, lze pomocí stejné analogie tabulky reprezentovat jako složku souborů plnou samostatných sešitů.
- Pětisměrná data a šestistranná data mohou být reprezentovány podobně vyššími úrovněmi agregace dat.
Obecně lze několik dimenzí zastoupených v datové sadě měřit v různých časech nebo na různých místech pomocí různých metodik a mohou obsahovat nekonzistence, jako jsou chybějící data nebo nesrovnalosti v reprezentaci dat.
Vícecestný model
Multiway aplikace
Vícecestná analýza dat může být použita v různých vícecestných aplikacích, aby se vyřešil problém hledání skryté multilineární struktury ve vícecestných datových sadách. Následuje příklad aplikací v různých oblastech:[4]
- Počítačové vidění
- Elektroanalytická chemie
- Neurovědy
- Procesní analýza
- Analýza sociálních sítí / těžba webu
Vícecestné zpracování
Vícecestné zpracování je provedení navrženého a určeného vícecestného modelu (modelů) transformujícího vícecestná data na požadovanou úroveň řešením specifické potřeby konkrétní vícecestné aplikace. Typický příklad dat generovaných potenciometrickým elektronickým jazykem ilustruje příslušné vícecestné zpracování.[5]
Viz také
Reference
- ^ Coppi, R .; Bolasco, S., eds. (1989). Vícecestná analýza dat. Amsterdam: Severní Holandsko. ISBN 9780444874108.
- ^ A b Kroonenberg, Pieter M. (2008). Aplikovaná analýza vícecestných dat. Wiley Series v Pravděpodobnost a statistika. 702. John Wiley & Sons. p. xv. ISBN 9780470237991.
- ^ Bro, Rasmus (20. listopadu 1998). Vícecestná analýza v potravinářském průmyslu: modely, algoritmy a aplikace (PDF) (Disertační práce). University of Amsterdam.
- ^ Acar, Evrim; Yener, Bulent. Nekontrolovaná analýza vícecestných dat: Průzkum literatury (PDF) (Teze). Rensselaer Polytechnic Institute.
- ^ Cartas, Raul; Mimendia, Aitor; Legin, Andrey; del Valle, Manel (2011). "Vícecestné zpracování dat generovaných potenciometrickým elektronickým jazykem v systému SIA". Elektroanalýza. doi:10.1002 / elan.201000642.