Transformace energie - Power transform
v statistika, a výkonová transformace je rodina funkcí, které se používají k vytvoření souboru monotónní transformace používání dat výkonové funkce. To je užitečné transformace dat technika používaná ke stabilizaci rozptylu, aby data byla více normální distribuce -zlepšit platnost asociačních opatření, jako je Pearsonova korelace mezi proměnnými a pro další postupy stabilizace dat.
Výkonové transformace se všudypřítomně používají v různých oblastech. Například, multi-rozlišení a vlnková analýza[1], statistická analýza dat, lékařský výzkum, modelování fyzikálních procesů[2], geochemická analýza dat[3], epidemiologie[4] a mnoho dalších oblastí klinického, environmentálního a sociálního výzkumu.
Definice
Transformace výkonu je definována jako kontinuálně se měnící funkce s ohledem na výkonový parametr λ, ve formě dílčí funkce, díky níž je spojitá v bodě singularity (λ = 0). Pro datové vektory (y1,..., yn) ve kterém každý yi > 0, transformace výkonu je
kde
je geometrický průměr pozorování y1, ..., yn. Důvod pro je limit jako přístupy 0. Chcete-li to vidět, všimněte si toho = . Pak = a všechno kromě se stane zanedbatelnou pro dostatečně malý.
Zahrnutí (λ - 1) ta síla geometrického průměru ve jmenovateli zjednodušuje vědecký výklad jakékoli rovnice zahrnující , protože měrné jednotky se nemění jako λ Změny.
Box a Cox (1964) zavedli do této transformace geometrický průměr tím, že nejprve zahrnuli Jacobian transformace energie se změněnou stupnicí
- .
s pravděpodobností. Tento Jacobian je následující:
To umožňuje normální zaznamenejte maximální pravděpodobnost psát následovně:
Odtud vstřebávání do výrazu pro vytvoří výraz, který stanoví, že minimalizuje součet čtverců zbytky z je ekvivalentní maximalizaci součtu normálu zaznamenat pravděpodobnost odchylek od a protokol jakobiána transformace.
Hodnota na Y = 1 pro všechny λ je 0 a derivát s ohledem na Y pro 1 je 1 λ. Někdy Y je verze nějaké jiné proměnné, jejíž měřítko je třeba dát Y = 1 při nějaké průměrné hodnotě.
Transformace je a Napájení transformace, ale provedená takovým způsobem, aby to bylo možné kontinuální s parametrem λ na λ = 0. Ukázalo se populární v regresní analýza, počítaje v to ekonometrie.
Box a Cox také navrhli obecnější formu transformace, která zahrnuje parametr posunu.
který platí, pokud yi + α> 0 pro všechnyi. Pokud τ (Y, λ, α) následuje a zkrácené normální rozdělení, pak Y následuje a Distribuce Box – Cox.
Bickel a Doksum eliminovali potřebu používat a zkrácená distribuce rozšířením rozsahu transformace na všechny y, jak následuje:
- ,
kde sgn (.) je znaková funkce. Tato změna definice má malý praktický význam, pokud je méně než , což obvykle je.[5]
Bickel a Doksum rovněž prokázali, že odhady parametrů jsou konzistentní a asymptoticky normální za vhodných pravidelných podmínek, i když standardem Cramér – Rao dolní mez může podstatně podcenit rozptyl, když jsou hodnoty parametrů malé vzhledem k rozptylu šumu.[5] Tento problém podcenění odchylky však nemusí být podstatným problémem v mnoha aplikacích.[6][7]
Box – Coxova transformace
Jednoparametrické transformace Box – Cox jsou definovány jako
a dvouparametrické transformace Box – Cox jako
jak je popsáno v původním článku.[8][9] První transformace navíc platí a druhý pro .[8]
Parametr se odhaduje pomocí pravděpodobnost profilu funkce.[Citace je zapotřebí ]
Interval spolehlivosti
Interval spolehlivosti pro transformaci Box – Cox může být asymptoticky konstruované použitím Wilksova věta na pravděpodobnost profilu funkce najít všechny možné hodnoty které splňují následující omezení:[10]
Příklad
Soubor dat jater BUPA[11] obsahuje údaje o jaterních enzymech ALT a γGT. Předpokládejme, že nás zajímá použití log (γGT) k předpovědi ALT. Graf dat se objeví v panelu (a) obrázku. Zdá se, že existuje nekonstantní variance a může pomoci transformace Box – Cox.
Pravděpodobnost logaritmu parametru výkonu se zobrazí v panelu (b). Vodorovná referenční čára je ve vzdálenosti χ12/ 2 z maxima a lze jej použít k odečtení přibližně 95% intervalu spolehlivosti pro λ. Vypadá to, že by hodnota blízká nule byla dobrá, takže vezmeme protokoly.
Je možné, že transformaci lze zlepšit přidáním parametru posunu k transformaci protokolu. Panel (c) na obrázku ukazuje pravděpodobnost log. V tomto případě se maximum pravděpodobnosti blíží nule, což naznačuje, že parametr posunu není nutný. Poslední panel zobrazuje transformovaná data se superponovanou regresní přímkou.
Všimněte si, že ačkoli transformace Box – Cox mohou udělat velká vylepšení přizpůsobení modelu, existují určité problémy, s nimiž transformace nemůže pomoci. V aktuálním příkladu jsou data spíše těžká, takže předpoklad normality není realistický a robustní regrese přístup vede k přesnějšímu modelu.
Ekonometrická aplikace
Ekonomové často charakterizují produkční vztahy nějakou variantou transformace Box – Cox.[12]
Zvažte společné zastoupení výroby Q závislé na službách poskytovaných základním kapitálem K. a podle pracovní doby N:
Řešení pro Q převrácením transformace Box – Cox, kterou jsme našli
který je známý jako konstantní elasticita substituce (CES) produkční funkce.
Produkční funkce CES je a homogenní funkce prvního stupně.
Když λ = 1, vytvoří se funkce lineární produkce:
Když λ → 0 to produkuje slavný Cobb – Douglas produkční funkce:
Činnosti a demonstrace
The SOCR stránky zdrojů obsahují řadu praktických interaktivních aktivit[13] demonstrace transformace Box – Cox (napájení) pomocí appletů a grafů Java. Ty přímo ilustrují účinky této transformace na Q-Q grafy, X-Y scatterplots, časové řady pozemky a histogramy.
Yeo-Johnsonova transformace
Transformace Yeo-Johnson[14]umožňuje také nulové a záporné hodnoty . může být jakékoli reálné číslo, kde vytváří transformaci identity. Zákon transformace zní:
Poznámky
- ^ Gao, Peisheng; Wu, Weilin (2006). "Klasifikace poruch kvality energie pomocí vlnkových a podpůrných vektorových strojů". Sborník ze šesté mezinárodní konference o návrhu a aplikacích inteligentních systémů - svazek 01. ISDA '06. Washington, DC, USA: IEEE Computer Society. 1: 201–206. doi:10.1109 / ISDA.2006.217. ISBN 9780769525280.
- ^ Gluzman, S .; Yukalov, V. I. (01.01.2006). Msgstr "Samopodobná moc se transformuje v problémech s extrapolací". Journal of Mathematical Chemistry. 39 (1): 47–56. arXiv:cond-mat / 0606104. Bibcode:2006. druhé mat. 6104G. doi:10.1007 / s10910-005-9003-7. ISSN 1572-8897.
- ^ Howarth, R. J .; Earle, S.A.M. (1979-02-01). "Aplikace generalizované transformace energie na geochemická data". Journal of the International Association for Mathematical Geology. 11 (1): 45–62. doi:10.1007 / BF01043245. ISSN 1573-8868.
- ^ Peters, J.L .; Rushton, L .; Sutton, A. J .; Jones, D. R .; Abrams, K. R .; Mugglestone, M. A. (2005). „Bayesovské metody křížové syntézy epidemiologických a toxikologických důkazů“. Journal of the Royal Statistical Society, Series C. 54: 159–172. doi:10.1111 / j.1467-9876.2005.00476.x.
- ^ A b Bickel, Peter J.; Doksum, Kjell A. (červen 1981). "Analýza transformací se vrátila". Journal of the American Statistical Association. 76 (374): 296–311. doi:10.1080/01621459.1981.10477649.
- ^ Sakia, R. M. (1992), „Technika transformace Box-Cox: recenze“, Statistik, 41 (2): 169–178, CiteSeerX 10.1.1.469.7176, doi:10.2307/2348250, JSTOR 2348250
- ^ Li, Fengfei (11. dubna 2005), Transformace Box – Cox: Přehled (PDF) (prezentace), Sao Paulo, Brazílie: University of Sao Paulo, Brazílie, vyvoláno 2014-11-02
- ^ A b Box, George E. P.; Cox, D. R. (1964). "Analýza transformací". Journal of the Royal Statistical Society, Series B. 26 (2): 211–252. JSTOR 2984418. PAN 0192611.
- ^ Johnston, J. (1984). Ekonometrické metody (Třetí vydání.). New York: McGraw-Hill. 61–74. ISBN 978-0-07-032685-9.
- ^ Abramovich, Felix; Ritov, Ya'acov (2013). Statistická teorie: Stručný úvod. CRC Press. s. 121–122. ISBN 978-1-4398-5184-5.
- ^ Soubor údajů o poruše jater BUPA
- ^ Zarembka, P. (1974). "Transformace proměnných v ekonometrii". Hranice v ekonometrii. New York: Academic Press. 81–104. ISBN 0-12-776150-0.
- ^ Grafy rodiny Power Transform, Webové stránky SOCR
- ^ Yeo, In-Kwon; Johnson, Richard A. (2000). "Nová rodina transformací síly ke zlepšení normality nebo symetrie". Biometrika. 87 (4): 954–959. doi:10.1093 / biomet / 87.4.954. JSTOR 2673623.
Reference
- Box, George E. P.; Cox, D. R. (1964). "Analýza transformací". Journal of the Royal Statistical Society, Series B. 26 (2): 211–252. JSTOR 2984418. PAN 0192611.
- Carroll, RJ; Ruppert, D. (1981). „O predikci a rodině transformace moci“ (PDF). Biometrika. 68 (3): 609–615. doi:10.1093 / biomet / 68.3.609.
- DeGroot, M. H. (1987). „Rozhovor s Georgem Boxem“. Statistická věda. 2 (3): 239–258. doi:10.1214 / ss / 1177013223.
- Handelsman, DJ (2002). "Optimální transformace energie pro analýzu koncentrace spermií a dalších proměnných spermatu". Journal of Andrology. 23 (5).
- Gluzman, S .; Yukalov, V. I. (2006). Msgstr "Samopodobná moc transformuje problémy s extrapolací". Journal of Mathematical Chemistry. 39 (1): 47–56. arXiv:cond-mat / 0606104. Bibcode:2006. druhé mat. 6104G. doi:10.1007 / s10910-005-9003-7.
- Howarth, R. J .; Earle, S. A. M. (1979). "Aplikace generalizované transformace energie na geochemická data". Journal of the International Association for Mathematical Geology. 11 (1): 45–62. doi:10.1007 / BF01043245.
externí odkazy
- Nishii, R. (2001) [1994], „Box – Coxova transformace“, Encyclopedia of Mathematics, Stiskněte EMS (pevný odkaz )
- Sanford Weisberg, Yeo-Johnson Power Transformations