Experimentální analýza nejistoty - Experimental uncertainty analysis
![]() | Tento článek má několik problémů. Prosím pomozte vylepši to nebo diskutovat o těchto otázkách na internetu diskusní stránka. (Zjistěte, jak a kdy tyto zprávy ze šablony odebrat) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)
|
Experimentální analýza nejistoty je technika, která analyzuje a odvozený množství na základě nejistot v experimentu měřeno veličiny, které se používají v nějaké formě matematického vztahu ("Modelka ") pro výpočet odvozené veličiny. Model použitý k převodu měření na odvozenou veličinu je obvykle založen na základních principech vědecké nebo technické disciplíny.
Nejistota má dvě složky, jmenovitě zkreslení (související s přesnost ) a nevyhnutelné náhodná variace k tomu dochází při opakovaných měřeních (související s přesnost ). Měřené množství může mít předsudky, a určitě mají náhodné variace, takže je třeba se zabývat tím, jak jsou „šířeny“ do nejistoty odvozené veličiny. Analýza nejistoty se často nazývá „šíření chyby."
Bude vidět, že se jedná o obtížný a ve skutečnosti někdy neřešitelný problém, je-li zpracován podrobně. Naštěstí jsou k dispozici přibližná řešení, která poskytují velmi užitečné výsledky, a tato přiblížení budou diskutována v kontextu praktického experimentálního příkladu.
Úvod
Spíše než poskytnout suchou sbírku rovnic se tento článek zaměří na experimentální analýzu nejistoty vysokoškolského laboratorního experimentu, ve kterém kyvadlo se používá k odhadu hodnoty místní gravitační zrychlení konstantní G. Příslušná rovnice[1] pro idealizované jednoduché kyvadlo je přibližně
kde T je doba z kmitání (sekundy), L je délka (metry) a θ je počáteční úhel. Od té doby θ je jediná časově závislá souřadnice tohoto systému, může být lepší použít θ0 k označení počáteční (počáteční) přemístění úhel, ale pro notaci bude pohodlnější vynechat dolní index. Řešení rovnice (1) pro konstantu G,
Toto je rovnice nebo model, který se má použít pro odhad G ze sledovaných údajů. Do odhadu bude zavedeno určité mírné zkreslení G tím, že výraz v závorkách je pouze první dva výrazy a rozšíření série, ale v praktických experimentech může být toto zkreslení ignorováno a bude.
Postupem je měření délky kyvadla L a poté proveďte opakovaná měření periody T, při každém spuštění pohybu kyvadla ze stejného počátečního úhlu posunutí θ. Replikovaná měření T jsou průměrně a poté použit v Eq (2) k získání odhadu G. Rovnice (2) je prostředek, jak se dostat z měřeno množství L, T, a θ do odvozený Množství G.
Všimněte si, že alternativním přístupem by bylo převést všechny jednotlivce T měření k odhadům G, pomocí Eq (2), a pak k jejich průměrování G hodnoty k získání konečného výsledku. To by nebylo praktické bez nějaké formy mechanizované výpočetní kapacity (tj. Počítače nebo kalkulačky), protože množství numerického výpočtu při hodnocení Eq (2) pro mnoho T měření by byla zdlouhavá a náchylná k chybám. Který z těchto přístupů má být ve statistickém smyslu preferován, bude popsán níže.
Systematická analýza chyb / zkreslení / citlivosti
Úvod
Nejprve budou zváženy možné zdroje zkreslení. Existují tři veličiny, které je třeba měřit: (1) délka kyvadla od bodu zavěšení po těžiště „bobu“; (2) doba oscilace; (3) počáteční úhel posunutí. Délka se v tomto experimentu považuje za pevnou a je třeba ji měřit jednou, i když bylo možné provést opakovaná měření a výsledky zprůměrovat.
Počáteční úhel posunutí musí být nastaven pro každé opakované měření periody Ta předpokládá se, že tento úhel je konstantní. Počáteční úhel je často udržován malý (méně než asi 10 stupňů), takže korekce tohoto úhlu je považována za zanedbatelnou; tj. výraz v závorkách v rovnici (2) je považován za jednotu. Pro zde studovaný experiment je však tato korekce zajímavá, takže typická počáteční hodnota posunutí se může pohybovat od 30 do 45 stupňů.
Předpokládejme, že to byl případ, neznámý studentům, že měření délky byla příliš malá, řekněme o 5 mm. Může to být způsobeno vadným měřicím zařízením (např. Měřicí tyčí) nebo, a pravděpodobněji, a systematická chyba při používání tohoto zařízení při měření L. To by mohlo nastat, kdyby studenti zapomněli měřit do těžiště bobu a místo toho důsledně měřeno do bodu, kde se k němu připojil řetězec. Tato chyba tedy není náhodná; objevuje se pokaždé, když se měří délka.
Dále období oscilace T by mohla trpět systematickou chybou, kdyby například studenti důsledně chybně spočítal pohyby kyvadla tam a zpět, aby získal celočíselný počet cyklů. (Experimentální postup často vyžaduje načasování několika cyklů, např. Pět nebo deset, ne pouze jeden.) Nebo snad digitální stopky, které používali, měly elektronický problém a důsledně přečíst příliš velkou hodnotu, například o 0,02 sekundy. Samozřejmě budou také náhodné varianty časování; tento problém bude vyřešen později. Znepokojující je zde soustavná, systematická, nepravidelná chyba v měření doby oscilace kyvadla.
Nakonec bylo možné změřit počáteční úhel pomocí jednoduchého úhloměru. Je obtížné umístit a přečíst počáteční úhel s vysokou přesností (nebo přesněji, toto měření je špatné reprodukovatelnost ). Předpokládejme, že studenti důsledně nesprávně umístěte úhloměr tak, aby odečet úhlu byl příliš malý, řekněme o 5 stupňů. Pak jsou všechna počáteční měření úhlu předpjata o tuto částku.
Chyby citlivosti
Nicméně, během experimentu nejsou známa předpětí. Pokud bylo například známo, že měření délky byla nízká o 5 mm, mohli studenti buď opravit chybu v měření, nebo přidat 5 mm k jejich údajům, aby předpojatost odstranili. Více hodnotné je spíše studovat účinky náhodných možností systematické chyby před experiment se provádí. Toto je forma Analýza citlivosti.
Myšlenkou je odhadnout rozdíl nebo zlomkovou změnu v odvozené veličině zde G, vzhledem k tomu, že měřené veličiny jsou předpjaté o určitou danou částku Například pokud byl počáteční úhel důsledně nízko o 5 stupňů, jaký vliv by to mělo na odhad G? Pokud je délka důsledně krátká o 5 mm, jaká je změna v odhadu G? Pokud jsou měření období důsledně příliš dlouho o 0,02 sekundy, kolik odhaduje G změna? Co se stane s odhadem G pokud se tyto předsudky vyskytují v různých kombinacích?
Jedním z důvodů pro zkoumání těchto otázek je to, že experimentální návrh ve smyslu toho, jaké zařízení a postup má být použit (nikoli statistický smysl; kterému se budeme věnovat později), závisí na relativním účinku systematických chyb v měřených veličinách. Pokud by odchylka 5 stupňů v počátečním úhlu způsobila nepřijatelnou změnu odhadu G, pak je pro toto měření možná třeba vypracovat propracovanější a přesnější metodu. Na druhou stranu, pokud lze před provedením experimentu prokázat, že tento úhel má zanedbatelný vliv na G, pak je použití úhloměru přijatelné.
Existuje další motivace pro tuto formu analýzy citlivosti po experiment byl proveden a analýza dat ukazuje zkreslení v odhadu G. Zkoumání změny v G které by mohly vyplývat ze zkreslení v několika vstupních parametrech, tj. měřených veličinách, mohou vést k nahlédnutí do toho, co způsobilo zkreslení v odhadu G. Tato analýza může pomoci izolovat takové problémy, jako jsou chyby měření, problémy s aparátem, nesprávné předpoklady o modelu atd.
Přímý (přesný) výpočet zkreslení
Nejpřímějším, nemluvě o zřejmém, způsobu, jak k tomu přistupovat, by bylo přímo vypočítat změnu pomocí Eq (2) dvakrát, jednou s teoretizovanými zkreslenými hodnotami a znovu se skutečnými, nezaujatými hodnotami pro parametry:
kde ΔL atd. představují předpětí v příslušných měřených veličinách. (Karát přes G znamená odhadovanou hodnotu G.) Aby to bylo konkrétnější, zvažte idealizované kyvadlo o délce 0,5 metru s počátečním úhlem posunutí 30 stupňů; z Eq (1) pak bude období 1,443 sekundy. Předpokládejme, že předpětí jsou −5 mm, −5 stupňů a +0,02 sekundy L, θ, a T resp. Poté vezmeme v úvahu nejprve pouze délkové zkreslení ΔL sám o sobě,
a pro tento a další parametry měření T a θ změny v G jsou zaznamenány v stůl 1.
V analýze citlivosti je běžnou praxí vyjádřit změny jako zlomky (nebo procenta). Pak přesná zlomková změna G je
Výsledky těchto výpočtů pro ukázkový systém kyvadla jsou shrnuty v tabulce 1.
Linearizovaná aproximace; úvod
Dále předpokládejme, že je nepraktické použít přímý přístup k nalezení závislosti odvozené veličiny (G) na vstupu měřené parametry (L, T, θ). Existuje alternativní metoda? Z počtu je pojem celkový rozdíl[2] je zde užitečné:
kde z je nějaká funkce několika (str) proměnné X. Symbol ∂z / ∂x1 představuje „parciální derivace "funkce z s ohledem na jednu z několika proměnných X které ovlivňují z. Pro tento účel hledání této derivace spočívá v udržování konstantní všech proměnných jiných než té, ve vztahu k níž se parciální část nachází, a v nalezení první derivace obvyklým způsobem (který může a často zahrnuje řetězové pravidlo ). Ve funkcích, které zahrnují úhly, jako to dělá Eq (2), je úhly musí být změřeny v radiány.
Eq (5) je lineární funkce, která přibližný, např. křivka ve dvou rozměrech (str= 1) tečnou čárou v bodě na této křivce nebo ve třech rozměrech (str= 2) přibližuje povrch tečnou rovinou v bodě na tomto povrchu. Myšlenka je, že celková změna v z v těsné blízkosti konkrétního bodu je nalezen z Eq (5). V praxi se používají spíše konečné rozdíly než diferenciály
a to funguje velmi dobře, pokud se zvyšuje ΔX jsou dostatečně malé.[3] Dokonce i vysoce zakřivené funkce jsou téměř dostatečně lineární v dostatečně malé oblasti. Frakční změna je tedy
Alternativní, užitečný způsob zápisu Eq (6) používá formalismus s vektorovou maticí:
Při aplikaci těchto parciálních derivací si povšimněte, že se jedná o funkce, které budou hodnoceny v bodě, to znamená, že všechny parametry, které se zobrazují v částečkách, budou mít číselné hodnoty. Například vektorový produkt v Eq (8) bude mít za následek jednu číselnou hodnotu. U studií zkreslení jsou hodnoty použité v částečkách skutečnými hodnotami parametrů, protože aproximujeme funkci z v malé oblasti poblíž těchto skutečných hodnot.
Linearizovaná aproximace; příklad absolutní změny
Návrat k příkladu kyvadla a použití těchto rovnic, absolutní změna v odhadu G je
a nyní je úkolem najít parciální derivace v této rovnici. Výrazně to zjednoduší definování procesu
Přepis Eq (2) a převzetí partials
Zapojení těchto derivátů do Eq (9),
a poté aplikováním stejných číselných hodnot pro parametry a jejich předpětí jako dříve, jsou získány výsledky v tabulce 1. Hodnoty jsou přiměřeně blízké hodnotám nalezeným pomocí Eq (3), ale nejsou přesné, s výjimkou L. Důvodem je změna v G je lineární s L, což lze odvodit ze skutečnosti, že dílčí s ohledem na (w.r.t.) L nezávisí na L. Lineární „přiblížení“ se tedy ukazuje jako přesné L. Částečný w.r.t. θ je složitější a vyplývá z použití pravidla řetězu na α. Také při použití Eq (10) v Eq (9) nezapomeňte, že úhel měří, včetně Δθ, musí být převedeny ze stupňů na radiány.
Linearizovaná aproximace; příklad částečné změny
Linearizovaná aproximace částečná změna v odhadu G je aplikace Eq (7) na příklad kyvadla,
což vypadá velmi komplikovaně, ale v praxi to obvykle vede k jednoduchému vztahu pro zlomkovou změnu. Tím pádem,
což se snižuje na
To je až na poslední termín pozoruhodně jednoduchý výsledek. Rozšiřování posledního semestru jako série v θ,
takže výsledek pro linearizovanou aproximaci pro zlomkovou změnu v odhadu G je
Připomínáme, že úhly jsou v radiánové míře a že hodnota použitá v příkladu je 30 stupňů, je to asi 0,524 radiánů; na polovinu a na druhou jako koeficient částečné změny θ říká, tento koeficient je asi 0,07. Z Eq (12) pak lze snadno usoudit, že nejvlivnější parametry jsou T, L, θ. Jiným způsobem, jak to říci, je odvozená veličina G je citlivější například na měřené množství T než do L nebo θ. Nahrazením numerických hodnot příkladu jsou výsledky uvedeny v tabulce 1 a přiměřeně souhlasí s výsledky zjištěnými pomocí Eq (4).
Forma Eq (12) je obvykle cílem analýzy citlivosti, protože je obecná, tj. Není vázána na konkrétní sadu hodnot parametrů, jako tomu bylo v případě metody přímého výpočtu Eq (3) nebo ( 4) a v zásadě je kontrolou zřejmé, které parametry mají největší účinek, pokud mají systematické chyby. Například pokud je měření délky L byla vysoká o deset procent, pak odhad G by také byla vysoká o deset procent. Pokud období T byl pododhadem o 20 procent, pak odhadem G bylo by přesodhaduje o 40 procent (všimněte si záporného znaménka pro T období). Pokud počáteční úhel θ byl nadhodnocen o deset procent, odhad G by byl nadhodnocen asi o 0,7 procenta.
Tyto informace jsou velmi cenné při analýze dat po experimentu, aby bylo možné zjistit, která měření mohla přispět k pozorovanému zkreslení celkového výsledku (odhad G). Například úhel by mohl být rychle odstraněn jako jediný zdroj zkreslení G řekněme 10 procent. Úhel by musel být omylem asi o 140 procent, což by, jak doufáme, nebyl fyzicky věrohodný.
Tabulka výsledků
Nominální | Zaujatost | Poměr | Přesná Δg | Lineární Δg | Přesná Δg / g | Lineární Δg / g | |
Délka L | 0,5 m | - 0,005 m | 0.010 | − 0.098 | − 0.098 | − 0.010 | − 0.010 |
Doba T | 1,443 s | +0,02 s | 0.014 | − 0.266 | − 0.272 | − 0.027 | − 0.028 |
Úhel θ | 30 stupňů | - 5 stupňů | 0.17 | − 0.0968 | − 0.105 | − 0.01 | − 0.011 |
Všechno | −0.455 | − 0.475 | − 0.046 | − 0.049 | |||
Eq (3) | Eq (11) | Eq (4) | Eq (12) |
Náhodná chyba / přesnost
Úvod
Dále zvažte skutečnost, že jelikož studenti opakovaně měří dobu oscilace kyvadla, získají pro každé měření jiné hodnoty. Jedná se o náhodné výkyvy - malé rozdíly v reakční době při používání stopek, rozdíly v odhadu, kdy kyvadlo dosáhlo svého maximálního úhlového pohybu atd.; všechny tyto věci interagují a vytvářejí variace v měřené veličině. Tohle je ne zkreslení, o kterém se hovořilo výše, kde se předpokládalo, že mezi odečtem stopek a skutečným obdobím bude rozdíl 0,02 sekundy T. Předpětí je pevná konstantní hodnota; náhodná variace je právě to - náhodná, nepředvídatelná.
Náhodné variace nejsou předvídatelné, ale mají tendenci dodržovat některá pravidla a tato pravidla jsou obvykle shrnuta matematickým konstruktem zvaným a funkce hustoty pravděpodobnosti (PDF). Tato funkce má zase několik parametrů, které jsou velmi užitečné při popisu variace pozorovaných měření. Dva takové parametry jsou znamenat a rozptyl PDF. Průměr je v zásadě umístění PDF na řádku reálného čísla a rozptyl je popis rozptylu nebo rozptylu nebo šířky PDF.
Pro ilustraci, Obrázek 1 ukazuje tzv Normální PDF, což se bude považovat za distribuci pozorovaných časových období v kyvadlovém experimentu. Ignorujeme všechna předpětí v měření pro tuto chvíli, pak průměr tohoto PDF bude na skutečné hodnotě T pro idealizované kyvadlo 0,5 metru, které má počáteční úhel 30 stupňů, a to od rovnice (1), 1,443 sekundy. Na obrázku je 10 000 simulovaných měření v histogramu (který třídí data do košů s malou šířkou, aby se zobrazil tvar distribuce) a normální PDF je plná čára. Svislá čára je průměr.
Zajímavým problémem s náhodnými výkyvy je rozptyl. Kladná druhá odmocnina rozptylu je definována jako standardní odchylka, a je to míra šířky PDF; existují i jiná opatření, ale směrodatná odchylka symbolizovaná řeckým písmenem σ „sigma“ je zdaleka nejběžněji používaná. Pro tuto simulaci je sigma 0,03 sekundy pro měření T byl použit; měření L a θ předpokládaná zanedbatelná variabilita.
Na obrázku jsou šířky jedno-, dvou- a tří sigmat označeny svislými tečkovanými čarami se šipkami. Je vidět, že šířka tří sigma na obou stranách průměru obsahuje téměř všechna data pro normální PDF. Rozsah pozorovaných časových hodnot je od přibližně 1,35 do 1,55 sekundy, ale většina z těchto časových měření spadá do užšího intervalu.
Odvozené množství PDF
Obrázek 1 ukazuje výsledky měření pro mnoho opakovaných měření periody kyvadla T. Předpokládejme, že tato měření byla použita, jeden po druhém, v Eq (2) k odhadu G. Co by bylo za PDF G odhady? S tímto PDF, jaký je průměr a rozptyl souboru G odhady? To není jednoduchá otázka, na kterou byste měli odpovědět, takže simulace bude nejlepším způsobem, jak zjistit, co se stane. Na obrázku 2 je opět 10 000 měření T, které jsou poté použity v Eq (2) k odhadu G, a těchto 10 000 odhadů se umístí do histogramu. Průměr (svislá černá čára) úzce souhlasí[4] se známou hodnotou pro G 9,8 m / s2.
Někdy je možné odvodit skutečné PDF transformovaných dat. V příkladu kyvadla měření času T jsou v Eq (2) na druhou a rozděleny do několika faktorů, které prozatím lze považovat za konstanty. Používání pravidel pro transformaci náhodných proměnných[5] lze prokázat, že pokud T měření jsou normálně distribuována, jako na obrázku 1, pak odhady G sledovat další (komplikovanou) distribuci, kterou lze odvodit analyticky. Že G-PDF je vykreslen s histogramem (černá čára) a souhlas s údaji je velmi dobrý. Na obrázku 2 je také znázorněno a G-PDF křivka (červená přerušovaná čára) pro předpojatý hodnoty T které byly použity v předchozí diskusi o zaujatosti. Tedy průměr neobjektivníhoTg-PDF je na 9 800 - 0,266 m / s2 (viz tabulka 1).
Zvažte znovu funkci, jak bylo provedeno v diskusi o zkreslení výše
kde F nemusí být a často není lineární a X jsou náhodné proměnné, které obecně nemusí být normálně distribuovány a které mohou obecně vzájemně korelovat. Při analýze výsledků experimentu je průměr a rozptyl odvozené veličiny z, což bude náhodná proměnná, jsou zajímavé. Ty jsou definovány jako očekávané hodnoty
tj. první okamžik PDF o původu a druhý okamžik PDF o průměru odvozené náhodné proměnné z. Tyto očekávané hodnoty jsou nalezeny pomocí integrálu, přičemž zde se uvažuje o spojitých proměnných. Pro vyhodnocení těchto integrálů je však pro PDF odvozené veličiny zapotřebí funkční forma z. To bylo poznamenáno[6]
- Přesný výpočet [odchylek] nelineárních funkcí proměnných, které podléhají chybám, je obecně problém velké matematické složitosti. Ve skutečnosti se podstatná část matematické statistiky zabývá obecným problémem odvození úplného rozdělení kmitočtů [PDF] takových funkcí, ze kterých lze potom odvodit [odchylku].
Pro ilustraci je jednoduchým příkladem tohoto procesu najít průměr a rozptyl odvozené veličiny z = x2 kde měřené množství X je normálně distribuován se střední hodnotou μ a rozptyl σ2. Odvozené množství z bude mít nějaké nové PDF, které lze (někdy) najít pomocí pravidel pravděpodobnostního počtu.[7] V takovém případě lze pomocí těchto pravidel zobrazit soubor PDF z bude
Integrace toto z nuly na kladné nekonečno vrací jednotu, která ověří, že se jedná o PDF. Dále je zapotřebí průměr a rozptyl tohoto PDF, aby bylo možné charakterizovat odvozené množství z. Průměr a rozptyl (ve skutečnosti střední čtvercová chyba, rozdíl, který zde nebude sledován) lze najít z integrálů
pokud jsou tyto funkce vůbec integrovatelné. V tomto případě jsou možné analytické výsledky,[8] a zjistilo se, že
Tyto výsledky jsou přesné. Všimněte si, že průměr (očekávaná hodnota) z z není to, co by se logicky dalo očekávat, tj. jednoduše druhá mocnina průměru X. I když tedy použijeme pravděpodobně nejjednodušší nelineární funkci, druhou mocninu náhodné proměnné, je proces zjišťování střední hodnoty a rozptylu odvozené veličiny obtížný a u složitějších funkcí lze s jistotou říci, že tento proces není pro experimentální analýza dat.
Jak je v těchto studiích dobrým zvykem, výše uvedené výsledky lze ověřit pomocí simulace. Obrázek 3 ukazuje histogram 10 000 vzorků z, přičemž výše uvedené PDF je také graficky znázorněno; dohoda je vynikající. V této simulaci X data měla průměr 10 a směrodatnou odchylku 2. Tedy naivní očekávaná hodnota pro z by samozřejmě bylo 100. Svislá čára „zkresleného průměru“ je nalezena pomocí výše uvedeného výrazu pro μz, a to dobře souhlasí s pozorovaným průměrem (tj. počítáno z dat; přerušovaná svislá čára) a zkreslený průměr je nad „očekávanou“ hodnotou 100. Čárkovaná křivka zobrazená na tomto obrázku je normální PDF, který bude řešeno později.
Linearizované aproximace pro střední a rozptyl odvozeného množství
Pokud, jako je tomu obvykle, nebyl nalezen PDF odvozené veličiny, ai když PDF měřených veličin nejsou známy, ukázalo se, že je stále možné odhadnout průměr a rozptyl (a tedy , směrodatná odchylka) odvozené veličiny. Tato takzvaná „diferenciální metoda“[9] bude popsáno dále. (Odvození rovnic (13) a (14) viz tato sekce, níže.)
Jak je v aplikované matematice obvyklé, jeden způsob, jak se vyhnout složitosti, je aproximovat funkci jinou, jednodušší funkcí, a často se to provádí pomocí nízkého řádu Taylor série expanze. Může se to ukázat[10] to, pokud je funkce z je nahrazen rozšířením prvního řádu o bod definovaný středními hodnotami každého z str proměnné X, je rozptyl linearizované funkce aproximován
kde σij představuje kovariance dvou proměnných Xi a Xj. Převezme se dvojnásobná částka Všechno kombinace i a j, s tím, že kovariance proměnné sama o sobě je rozptylem této proměnné, tj. σii = σi2. Rovněž jsou kovariance symetrické σij = σji . Opět, jak tomu bylo v případě výpočtů zkreslení, jsou dílčí deriváty hodnoceny v konkrétním bodě, v tomto případě střední (průměrnou) hodnotou nebo jiným nejlepším odhadem každé z nezávislých proměnných. Všimněte si, že pokud F je pak lineární, a teprve potom, Eq (13) je přesný.
Očekávanou hodnotu (průměr) odvozeného PDF lze odhadnout pro případ, kdy z je funkce jedné nebo dvou měřených proměnných pomocí[11]
kde jsou částice vyhodnoceny jako průměr příslušné měřené proměnné. (U více než dvou vstupních proměnných je tato rovnice rozšířena, včetně různých smíšených částeček.)
Návrat k jednoduchému příkladu případu z = x2 průměr se odhaduje na
což je v tomto konkrétním případě stejné jako přesný výsledek. Pro rozptyl (ve skutečnosti čsE),
který se liší pouze absencí posledního termínu, který byl v přesném výsledku; od té doby σ by měl být malý ve srovnání s μ, to by neměl být zásadní problém.
Na obrázku 3 je zobrazen normální PDF (přerušované čáry) se střední hodnotou a odchylkou od těchto aproximací. Normální PDF nepopisuje tato odvozená data zvlášť dobře, zejména na dolním konci. Dosazením známého průměru (10) a rozptylu (4) z X hodnot v této simulaci nebo ve výše uvedených výrazech je vidět, že přibližné (1600) a přesné (1632) odchylky se liší jen nepatrně (2%).
Maticový formát aproximace rozptylu
Elegantnějším způsobem psaní tzv. Varianční rovnice „šíření chyby“ je použití matice.[12] Nejprve definujte vektor parciálních derivací, jak byl použit v Eq (8) výše:
kde horní index T označuje transpozici matice; poté definujte kovarianční matici
Šíření aproximace chyb lze potom stručně zapsat jako kvadratická forma
Pokud korelace mezi str proměnné jsou všechny nulové, jak se často předpokládá, pak kovarianční matice C se stane úhlopříčkou s jednotlivými odchylkami podél hlavní úhlopříčky. Chcete-li znovu zdůraznit bod, částice ve vektoru y jsou všechny hodnoceny v určitém bodě, takže Eq (15) vrací jeden číselný výsledek.
Bude užitečné podrobně napsat výraz pro odchylku pomocí Eq (13) nebo (15) pro případ str = 2. To vede k
which, since the last two terms above are the same thing, is
Linearized approximation: simple example for variance
Consider a relatively simple algebraic example, before returning to the more involved pendulum example. Nechat
aby
This expression could remain in this form, but it is common practice to divide through by z2 since this will cause many of the factors to cancel, and will also produce in a more useful result:
což se snižuje na
Since the standard deviation of z is usually of interest, its estimate is
where the use of the means (averages) of the variables is indicated by the overbars, and the carats indicate that the component (co)variances must also be estimated, unless there is some solid a priori knowledge of them. Generally this is not the case, so that the estimators
are frequently used,[13] na základě n observations (measurements).
Linearized approximation: pendulum example, mean
For simplicity, consider only the measured time as a random variable, so that the derived quantity, the estimate of G, amounts to
kde k collects the factors in Eq(2) that for the moment are constants. Again applying the rules for probability calculus, a PDF can be derived for the estimates of G (this PDF was graphed in Figure 2). In this case, unlike the example used previously, the mean and variance could not be found analytically. Thus there is no choice but to use the linearized approximations. For the mean, using Eq(14), with the simplified equation for the estimate of G,
Then the expected value of the estimated G bude
where, if the pendulum period times T are unbiased, the first term is 9.80 m/s2. This result says that the mean of the estimated G values is biased high. This will be checked with a simulation, below.
Linearized approximation: pendulum example, variance
Next, to find an estimate of the variance for the pendulum example, since the partial derivatives have already been found in Eq(10), all the variables will return to the problem. The partials go into the vector y. Following the usual practice, especially if there is no evidence to the contrary, it is assumed that the covariances are all zero, so that C je úhlopříčka.[14] Pak