Identifikovatelnost - Identifiability
v statistika, identifikovatelnost je vlastnost, která a Modelka musí uspokojit, aby byly přesné odvození aby to bylo možné. Model je identifikovatelný pokud je teoreticky možné získat skutečné hodnoty základních parametrů tohoto modelu po získání nekonečného počtu pozorování z něj. Matematicky to odpovídá tvrzení, že různé hodnoty parametrů musí generovat různé rozdělení pravděpodobnosti pozorovatelných proměnných. Obvykle je model identifikovatelný pouze za určitých technických omezení, v takovém případě se soubor těchto požadavků nazývá identifikační podmínky.
Model, který nelze identifikovat, se říká neidentifikovatelný nebo neidentifikovatelný: dva nebo více parametrizace jsou pozorovatelně ekvivalentní. V některých případech, i když je model neidentifikovatelný, je stále možné zjistit skutečné hodnoty určité podmnožiny parametrů modelu. V tomto případě říkáme, že model je částečně identifikovatelný. V ostatních případech je možné zjistit polohu skutečného parametru až do určité konečné oblasti prostoru parametrů, v takovém případě je model sada identifikovatelná.
Kromě přísně teoretického zkoumání vlastností modelu identifikovatelnost může být odkazováno v širším rozsahu, když je model testován s experimentálními datovými soubory, pomocí analýza identifikovatelnosti.[1]
Definice
Nechat být statistický model kde je prostor parametrů je buď konečná, nebo nekonečná. Říkáme to je identifikovatelný pokud mapování je jedna ku jedné:[2]
Tato definice znamená, že odlišné hodnoty θ by mělo odpovídat zřetelnému rozdělení pravděpodobnosti: pokud θ1≠θ2, pak také Pθ1≠Pθ2.[3] Pokud jsou distribuce definovány v podmínkách funkce hustoty pravděpodobnosti (pdf), pak dva soubory pdf by měly být považovány za odlišné, pouze pokud se liší v sadě nenulové míry (například dvě funkce ƒ1(X) = 10 ≤ X < 1 a ƒ2(X) = 10 ≤ X ≤ 1 se liší pouze v jednom bodě X = 1 - sada opatření nula - a proto ji nelze považovat za odlišné soubory PDF).
Identifikovatelnost modelu ve smyslu invertibility mapy je ekvivalentní schopnosti učit se skutečný parametr modelu, pokud lze model pozorovat neomezeně dlouho. Opravdu, pokud {Xt} ⊆ S je sled pozorování z modelu, pak pomocí silný zákon velkého počtu,
pro každou měřitelnou sadu A ⊆ S (tady 1{...} je funkce indikátoru ). Takže s nekonečným počtem pozorování budeme moci najít skutečné rozdělení pravděpodobnosti P0 v modelu a protože výše uvedená podmínka identifikovatelnosti vyžaduje, aby byla mapa být invertibilní, budeme také schopni najít skutečnou hodnotu parametru, který generoval danou distribuciP0.
Příklady
Příklad 1
Nechat být normální rodina v měřítku polohy:
Pak
Tento výraz se téměř u všech rovná nule X pouze když jsou všechny jeho koeficienty rovny nule, což je možné pouze tehdy, když |σ1| = |σ2| a μ1 = μ2. Protože v parametru měřítka σ je omezeno na větší než nulu, dospěli jsme k závěru, že model je identifikovatelný: ƒθ1 = ƒθ2 ⇔ θ1 = θ2.
Příklad 2
Nechat být standardem lineární regresní model:
(kde ′ označuje matici přemístit ). Pak parametr β je identifikovatelný právě tehdy, když je to matice je invertibilní. Toto je tedy podmínka identifikace v modelu.
Příklad 3
Předpokládat je klasický chyby v proměnných lineární model:
kde (ε,η,X*) jsou společně normální nezávislé náhodné proměnné s nulovou očekávanou hodnotou a neznámými odchylkami a pouze proměnné (X,y) jsou dodržovány. Pak tento model není identifikovatelný,[4] pouze produkt βσ²∗ je (kde σ²∗ je rozptyl latentního regresoru X*). Toto je také příklad a sada identifikovatelná model: ačkoli přesná hodnota β nelze se naučit, můžeme zaručit, že musí ležet někde v intervalu (βyx, 1÷βxy), kde βyx je koeficient v OLS regrese y na X, a βxy je koeficient v OLS regrese X na y.[5]
Pokud opustíme předpoklad normality a budeme to vyžadovat X* byly ne normálně distribuován, přičemž si zachovává pouze podmínku nezávislosti ε ⊥ η ⊥ X*, pak se model stane identifikovatelným.[4]
Software
V případě odhadu parametrů v částečně pozorovaných dynamických systémech platí: pravděpodobnost profilu lze také použít pro strukturální a praktickou analýzu identifikovatelnosti.[6] Implementace [1] je k dispozici v MATLAB Toolboxu Potterovo kolo.
Viz také
Reference
Citace
- ^ Raue, A .; Kreutz, C .; Maiwald, T .; Bachmann, J .; Schilling, M .; Klingmuller, U .; Timmer, J. (01.08.2009). „Strukturální a praktická analýza identifikovatelnosti částečně pozorovaných dynamických modelů využitím pravděpodobnosti profilu“. Bioinformatika. 25 (15): 1923–1929. doi:10.1093 / bioinformatika / btp358. PMID 19505944.
- ^ Lehmann & Casella 1998, Definice 1.5.2
- ^ van der Vaart 1998, str. 62
- ^ A b Reiersøl 1950
- ^ Casella & Berger 2001, str. 583
- ^ Raue, A; Kreutz, C; Maiwald, T; Bachmann, J; Schilling, M; Klingmüller, U; Timmer, J (2009), „Strukturální a praktická analýza identifikovatelnosti částečně pozorovaných dynamických modelů využitím pravděpodobnosti profilu“, Bioinformatika, 25 (15): 1923–9, doi:10.1093 / bioinformatika / btp358, PMID 19505944, archivovány z originál dne 2013-01-13.
Zdroje
- Casella, Georgi; Berger, Roger L. (2002), Statistická inference (2. vyd.), ISBN 0-534-24312-6, LCCN 2001025794
- Hsiao, Cheng (1983), Identifikace, Handbook of Econometrics, Vol. 1, kap. 4, Nakladatelská společnost North-Holland
- Lehmann, E. L.; Casella, G. (1998), Teorie odhadu bodu (2. vyd.), Springer, ISBN 0-387-98502-6
- Reiersøl, Olav (1950), „Identifikovatelnost lineárního vztahu mezi proměnnými, které podléhají chybám“, Econometrica, 18 (4): 375–389, doi:10.2307/1907835, JSTOR 1907835
- van der Vaart, A. W. (1998), Asymptotické statistiky, Cambridge University Press, ISBN 978-0-521-49603-2
Další čtení
- Walter, É.; Pronzato, L. (1997), Identifikace parametrických modelů z experimentálních datSpringer
Ekonometrie
- Lewbel, Arthur (2019-12-01). „Identifikační zoo: významy identifikace v ekonometrii“. Journal of Economic Literature. Americká ekonomická asociace. 57 (4): 835–903. doi:10.1257 / jel.20181361. ISSN 0022-0515.
- Matzkin, Rosa L. (2013). "Neparametrická identifikace ve strukturálních ekonomických modelech". Roční přehled ekonomie. 5 (1): 457–486. doi:10.1146 / annurev-economics-082912-110231.
- Rothenberg, Thomas J. (1971). Msgstr "Identifikace v parametrických modelech". Econometrica. 39 (3): 577–591. doi:10.2307/1913267. ISSN 0012-9682. JSTOR 1913267.