Ověření statistického modelu - Statistical model validation

v statistika, ověření modelu je úkolem potvrdit, že výstupy a statistický model jsou přijatelné s ohledem na skutečný proces generování dat. Jinými slovy, validace modelu je úkolem potvrdit, že výstupy statistického modelu mají dostatečnou věrnost výstupům procesu generování dat, aby bylo možné dosáhnout cílů vyšetřování.

Přehled

Ověření modelu může být založeno na dvou typech dat: data použitá při konstrukci modelu a data použitá při konstrukci. Ověření na základě prvního typu obvykle zahrnuje analýzu dobrota fit modelu nebo analyzovat, zda zbytky se zdají být náhodné (tj. zbytková diagnostika ). Ověření na základě druhého typu obvykle zahrnuje analýzu, zda je model prediktivní výkon při použití na relevantní nová data se nezanedbatelně zhoršuje.

Obrázek 1. Data (černé tečky), která byla generována přímkou ​​a nějakým přidaným šumem, dokonale zapadá do křivky polynomiální.

Validace založená pouze na prvním typu (data použitá při konstrukci modelu) je často nedostatečná. Extrémní příklad je znázorněn na obrázku 1. Obrázek zobrazuje data (černé tečky), která byla generována přímkou ​​+ šum. Obrázek také zobrazuje křivku, která je a polynomiální vybráno tak, aby dokonale odpovídalo datům. Všechny zbytky křivky jsou nulové. Ověření na základě pouze prvního typu dat by tedy vedlo k závěru, že křivka byla dobrým modelem. Přesto je křivka evidentně špatným modelem: interpolace, zejména mezi −5 a −4, by bývala velmi zavádějící; jakákoli podstatná extrapolace by byla navíc špatná.

Ověření tedy obvykle není založeno pouze na údajích, které byly použity při konstrukci modelu; spíše validace obvykle využívá data, která nebyla při konstrukci použita. Jinými slovy, ověření obvykle zahrnuje testování některých předpovědí modelu.

Model lze ověřit pouze ve vztahu k určité oblasti aplikace.[1][2] Model, který je platný pro jednu aplikaci, může být neplatný pro některé další aplikace. Jako příklad zvažte křivku na obrázku 1: pokud aplikace používala pouze vstupy z intervalu [0, 2], křivka by mohla být přijatelným modelem.

Metody pro validaci

Při ověřování existují tři významné příčiny potenciálních obtíží, podle Encyklopedie statistických věd.[3] Jsou tři příčiny: nedostatek údajů; nedostatečná kontrola vstupních proměnných; nejistota ohledně základních rozdělení pravděpodobnosti a korelací. Mezi obvyklé metody řešení potíží s ověřováním patří následující: kontrola předpokladů učiněných při konstrukci modelu; zkoumání dostupných údajů a souvisejících výstupů modelu; použití odborného úsudku.[1] Pamatujte, že odborný úsudek obvykle vyžaduje odborné znalosti v oblasti aplikace.[1]

K posouzení platnosti predikce lze někdy použít odborný úsudek bez získávání skutečných dat: např. pro křivku na obrázku 1 by odborník mohl dobře posoudit, že podstatná extrapolace bude neplatná. Kromě toho lze v jazyce použít odborný úsudek Turing -typové testy, kde jsou odborníkům předkládány jak reálná data, tak související výstupy z modelu a poté jsou žádáni o jejich rozlišení.[4]

Pro některé třídy statistických modelů jsou k dispozici specializované metody provádění validace. Například pokud byl statistický model získán pomocí a regrese, pak specializované analýzy pro validace regresního modelu existují a jsou obecně zaměstnáni.

Zbytková diagnostika

Zbytková diagnostika zahrnuje analýzy zbytky zjistit, zda se zbytky zdají být skutečně náhodné. Takové analýzy obvykle vyžadují odhady rozdělení pravděpodobnosti reziduí. Odhady rozdělení zbytků lze často získat opakovaným spuštěním modelu, tj. Použitím opakování stochastické simulace (zaměstnává a generátor pseudonáhodných čísel pro náhodné proměnné v modelu).

Pokud byl statistický model získán pomocí regrese, pak regresní-zbytková diagnostika existují a mohou být použity; taková diagnostika byla dobře prostudována.

Viz také

Reference

  1. ^ A b C Národní rada pro výzkum (2012), „Kapitola 5: Ověření modelu a predikce“, Posouzení spolehlivosti komplexních modelů: Matematické a statistické základy ověření, validace a kvantifikace nejistoty, Washington DC: Národní akademie Press, str. 52–85CS1 maint: více jmen: seznam autorů (odkaz).
  2. ^ Batzel, J. J .; Bachar, M .; Karemaker, J. M .; Kappel, F. (2013), „Kapitola 1: Sloučení matematických a fyziologických znalostí“, Batzel, J. J .; Bachar, M .; Kappel, F. (eds.), Matematické modelování a validace ve fyziologii, Springer, s. 3–19, doi:10.1007/978-3-642-32882-4_1.
  3. ^ Deaton, M. L. (2006), „Simulation models, validation of“, in Kotz, S.; et al. (eds.), Encyklopedie statistických věd, Wiley.
  4. ^ Mayer, D. G .; Butler, D.G. (1993), "Statistická validace", Ekologické modelování, 68: 21–32, doi:10.1016/0304-3800(93)90105-2.

Další čtení

externí odkazy