Glosář pravděpodobnosti a statistiky - Glossary of probability and statistics
Slovník Wikipedie
Většina termínů uvedených ve slovnících Wikipedie je již definována a vysvětlena v samotné Wikipedii. Glosáře, jako je tento, jsou však užitečné pro vyhledávání, porovnávání a revizi velkého počtu výrazů dohromady. Tuto stránku můžete vylepšit přidáním nových výrazů nebo napsáním definic pro stávající.
Toto je a glosář pojmů použitých v matematický vědy statistika a pravděpodobnost.
A
pravidlo přípustného rozhodnutíalgebra náhodných proměnnýchalternativní hypotézaanalýza rozptyluatomová událostJiný název pro základní událostB
sloupcový grafBayesova větaBayesův odhadBayesův faktorBayesovský závěrzaujatost1. Vlastnost vzorku, která nereprezentuje populaci2. Rozdíl mezi očekávanou hodnotou odhadce a skutečnou hodnotoubinární dataData, která mohou nabývat pouze dvou hodnot, obvykle představovaných 0 a 1binomická distribucebivariantní analýzablokováníMetoda Box – Jenkinskrabicový grafC
kauzální studieStatistická studie, ve které je cílem měřit vliv určité proměnné na výsledek jiné proměnné. Například, jak se bude cítit moje bolest hlavy, když užívám aspirin, oproti tomu, když aspirin neužívám? Kauzální studie mohou být experimentální nebo observační.[1]teorém centrálního limitucentrální momentcharakteristická funkcedistribuce chí-kvadrátchí-kvadrát testshluková analýzavzorkování klastrudoplňková akcezcela náhodný designvýpočetní statistikadoprovodné látkyVe statistické studii jsou doprovodnými látkami jakékoli proměnné, jejichž hodnoty nejsou ovlivněny léčbou, jako je věk jednotky, pohlaví a hladina cholesterolu před zahájením diety (léčby).[1]podmíněné rozděleníVzhledem ke dvěma společně distribuovaným náhodným proměnným X a Ypodmíněné rozdělení pravděpodobnosti Y daný X (psaný "Y | X") je rozdělení pravděpodobnosti Y když X je známo, že je konkrétní hodnotoupodmíněná pravděpodobnostPravděpodobnost nějaké události A, za předpokladu, že událost B. Podmíněná pravděpodobnost je zapsána P (A|B) a čte se „pravděpodobnost A, vzhledem k tomu B"[2]podmíněné rozdělení pravděpodobnostiinterval spolehlivostiV inferenční statistice je CI rozsah věrohodných hodnot pro některý parametr, jako je průměr populace.[3] Například na základě studie spánkových návyků mezi 100 lidmi může výzkumník odhadnout, že celková populace spí někde mezi 5 a 9 hodinami za noc. To se liší od střední hodnoty vzorku, kterou lze měřit přímo.úroveň spolehlivostiÚroveň spolehlivosti, známá také jako koeficient spolehlivosti, označuje pravděpodobnost, že interval spolehlivosti (rozsah) zachycuje skutečný průměr populace. Například interval spolehlivosti s 95% úrovní spolehlivosti má 95% šanci zachytit průměrnou hodnotu populace. Technicky to znamená, že pokud by se experiment opakoval mnohokrát, 95 procent CI by obsahovalo skutečný průměr populace.[3]matoucípřed konjugátemspojitá proměnnápohodlí vzorkováníkorelaceTaké se nazývá korelační koeficient, numerická míra síly lineárního vztahu mezi dvěma náhodnými proměnnými (lze jej použít například ke kvantifikaci, jak je korelace velikosti a výšky obuvi v populaci). Příkladem je Pearsonův korelační koeficient produkt-moment, který se zjistí dělením kovariance dvou proměnných součinem jejich směrodatných odchylek. Nezávislé proměnné mají korelaci 0. Korelace populace je často reprezentována symbolem
, zatímco ukázková korelace od
.[2]počítat dataÚdaje vyplývající z počítací který může nabývat pouze nezáporných celočíselných hodnotkovarianceVzhledem k tomu, dvě náhodné proměnné X a Y, s očekávanými hodnotami
a
, kovariance je definována jako očekávaná hodnota náhodné proměnné
a je napsán
.[2] Používá se pro měření korelace.D
dataanalýza datsoubor datUkázka a související datové bodydatový bodTypové měření - může to být a Booleovský hodnota, skutečné číslo, vektor (v takovém případě se také nazývá datový vektor) atdRozhodovací pravidloteorie rozhodovánístupně svobodyodhad hustotyzávislostzávislá proměnnádeskriptivní statistikanávrh experimentůodchylkadiskrétní proměnnátečkovaný grafdvojité počítáníE
elementární událostUdálost pouze s jedním prvkem. Například při vytahování karty z balíčku je „získání piky“ základní událostí, zatímco „získání krále nebo esa“ neníteorie odhaduodhadceFunkce známých dat, která se používá k odhadu neznámého parametru; odhad je výsledkem skutečné aplikace funkce na konkrétní sadu dat. Průměr lze použít jako odhadočekávaná hodnotaSoučet pravděpodobnosti každého možného výsledku experimentu vynásobený jeho výplatou („hodnota“). Představuje tedy průměrnou částku, kterou „očekává“ výhra na jednu sázku, pokud se sázky se stejnými kurzy opakují mnohokrát. Například očekávaná hodnota šestistranného válcovacího stroje je 3,5. Koncept je podobný průměru. Očekávaná hodnota náhodné proměnné X je obvykle psáno E (X) pro operátora a
(mu ) pro parametr.[2]experimentJakýkoli postup, který lze nekonečně opakovat a má dobře definovanou sadu výsledkůexponenciální rodinaudálostPodmnožina prostoru vzorku (možný výsledek experimentu), ke kterému lze přiřadit pravděpodobnost. Například při hodu kostkou je „získání pětky nebo šestky“ událost (s pravděpodobností jedné třetiny, pokud je kostka spravedlivá)F
faktorová analýzafaktoriální experimentfrekvencerozdělení frekvencefrekvenční doménačastý závěrG
obecný lineární modelzobecněný lineární modelseskupená dataH
histogramJá
Nezávislost (teorie pravděpodobnosti)nezávislé proměnnéRozsah interkvartilníJ
společná distribuceVzhledem k tomu, dvě náhodné proměnné X a Y, společná distribuce X a Y je rozdělení pravděpodobnosti X a Y společněspolečná pravděpodobnostPravděpodobnost dvou událostí, které se vyskytnou společně. Společná pravděpodobnost A a B je psáno
[2] nebo 
K.
Kalmanův filtrjádroodhad hustoty jádrašpičatostMíra zřídka extrémních pozorování (odlehlých hodnot) rozdělení pravděpodobnosti reálné náhodné proměnné. Vyšší špičatost znamená, že větší část rozptylu je způsobena občasnými extrémními odchylkami, na rozdíl od častých odchylek o malé velikostiL
L-momentzákon velkých číselfunkce pravděpodobnostiFunkce podmíněné pravděpodobnosti se považovala za funkci svého druhého argumentu, přičemž jeho první argument zůstal pevný. Představte si například, že vytáhnete očíslovanou kouli s číslem k ze sáčku n koulí očíslovaných 1 až n. Pak byste mohli popsat funkci pravděpodobnosti pro náhodnou proměnnou N jako pravděpodobnost získání k vzhledem k tomu, že existuje n koulí: pravděpodobnost bude 1 / n pro n větší nebo rovna k a 0 pro n menší než k. Na rozdíl od funkce rozdělení pravděpodobnosti nebude tato funkce pravděpodobnosti v prostoru vzorku součet až 1funkce ztrátytest poměru pravděpodobnostiM
M-odhadmezní rozděleníVzhledem ke dvěma společně distribuovaným náhodným proměnným X a Y, mezní rozdělení X je jednoduše rozdělení pravděpodobnosti X ignorování informací o Ymezní pravděpodobnostmezní pravděpodobnostPravděpodobnost události, ignorování informací o dalších událostech. Mezní pravděpodobnost A je psáno P(A). Kontrast s podmíněnou pravděpodobnostíMarkovský řetězec Monte Carlomatematická statistikaodhad maximální věrohodnostiznamenat1. Očekávaná hodnota náhodné proměnné2. Aritmetický průměr je průměr množiny čísel nebo součet hodnot dělený počtem hodnotmediánstřední absolutní odchylkarežimuklouzavý průměrmultimodální distribucevícerozměrná analýzavícerozměrný odhad hustoty jádravícerozměrná náhodná proměnnáVektor, jehož komponenty jsou náhodné proměnné ve stejném prostoru pravděpodobnostivzájemná exkluzivitavzájemná nezávislostKolekce událostí je vzájemně nezávislá, pokud je u jakékoli podmnožiny kolekce společná pravděpodobnost výskytu všech událostí stejná jako součin společných pravděpodobností jednotlivých událostí. Přemýšlejte o výsledku řady mincí. To je silnější podmínka než párová nezávislostN
neparametrická regreseneparametrické statistikychyba bez vzorkovánínormální distribucenormální pravděpodobnostní grafnulová hypotézaVýrok testovaný v testu statistické významnosti Obvykle je nulovou hypotézou výrok „bez účinku“ nebo „bez rozdílu“. “[4] Například pokud bychom chtěli vyzkoušet, zda má světlo vliv na spánek, nulová hypotéza by byla, že žádný účinek neexistuje. To je často symbolizováno jako H0.Ó
průzkum veřejného míněníoptimální rozhodnutíoptimální designodlehlýP
p-hodnotapárová nezávislostPárově nezávislá sbírka náhodných proměnných je sada náhodných proměnných, z nichž dvě jsou nezávisléparametrMůže to být populační parametr, distribuční parametr, nepozorovaný parametr (s různými významovými odstíny). Ve statistikách se často jedná o množství, které je třeba odhadnoutčásticový filtrpercentilvýsečový grafbodový odhadNapájenípředchozí pravděpodobnostv Bayesovský závěr, to představuje předchozí přesvědčení nebo jiné informace, které jsou k dispozici před zohledněním nových údajů nebo pozorovánípopulační parametrViz parametrzadní pravděpodobnostVýsledek a Bayesovská analýza který zapouzdřuje kombinaci dřívějších přesvědčení nebo informací s pozorovanými údajianalýza hlavních komponentpravděpodobnosthustota pravděpodobnostiPopisuje pravděpodobnost v průběžném rozdělení pravděpodobnosti. Například nemůžete říci, že pravděpodobnost, že muž bude šest stop vysoký, je 20%, ale můžete říci, že má 20% šancí, že bude vysoký mezi pěti a šesti stopami. Hustota pravděpodobnosti je dána funkcí hustoty pravděpodobnosti. Kontrast s pravděpodobnostífunkce hustoty pravděpodobnostiUdává rozdělení pravděpodobnosti pro spojitou náhodnou proměnnourozdělení pravděpodobnostiFunkce, která dává pravděpodobnost všech prvků v daném prostoru: viz Seznam rozdělení pravděpodobnostimíra pravděpodobnostiPravděpodobnost událostí v prostoru pravděpodobnostigraf pravděpodobnostipravděpodobnostní prostorUkázkový prostor, ve kterém byla definována míra pravděpodobnostiQ
kvantilkvartilvzorkování kvótR
náhodná proměnnáMěřitelná funkce v prostoru pravděpodobnosti, často reálná. Distribuční funkce náhodné proměnné dává pravděpodobnost různých výsledků. Můžeme také odvodit průměr a rozptyl náhodné proměnnérandomized block designrozsahDélka nejmenšího intervalu, který obsahuje všechna datarekurzivní Bayesiánský odhadregresní analýzanávrh opakovaných opatřeníodpovědiVe statistické studii jsou všechny proměnné, jejichž hodnoty mohly být ovlivněny léčbou, jako jsou hladiny cholesterolu po dodržení určité stravy po dobu šesti měsíců.[1]omezená randomizacerobustní statistikychyba zaokrouhleníS
vzorekTa část populace, která je skutečně pozorovánaUkázkový průměr a kovarianceAritmetický průměr vzorku hodnot získaných z populace. Označuje to
.[2] Příkladem je průměrné skóre testu podmnožiny 10 studentů z třídy. Průměrný vzorek se používá jako odhad střední hodnoty populace, což by v tomto příkladu bylo průměrné skóre testu všech studentů ve třídě.ukázkový prostorSoubor možných výsledků experimentu. Například ukázkový prostor pro válcování šestistranné matrice bude {1, 2, 3, 4, 5, 6}vzorkováníProces výběru pozorování k získání znalostí o populaci. Existuje mnoho metod, jak vybrat, na kterém vzorku provést pozorovánízkreslení vzorkováníDistribuce vzorkůRozdělení pravděpodobnosti dané statistiky při opakovaném výběru populacechyba vzorkováníbodový diagramParametr měřítkaúroveň významnostijednoduchý náhodný vzorekSimpsonův paradoxšikmostMíra asymetrie distribuce pravděpodobnosti náhodné proměnné se skutečnou hodnotou. Zhruba řečeno, distribuce má pozitivní zkosení (pravoúhlé), pokud je vyšší ocas delší a záporné zkosení (levé šikmé), pokud je spodní ocas delší (matoucí dva je běžná chyba)spaghetti plotzkreslení spektrastandardní odchylkaNejčastěji používaným měřítkem statistické disperze. To je odmocnina odchylky a je obvykle psáno
(sigma )[2]standardní chybastandardní skórestatistickýVýsledek použití statistického algoritmu na datovou sadu. Lze jej také popsat jako pozorovatelnou náhodnou proměnnoustatistická disperzestatistická grafikastatistické testování hypotézstatistická nezávislostDvě události jsou nezávislé, pokud výsledek jedné nemá vliv na výsledek druhé (například získání 1 na jeden hod kostkou nemá vliv na pravděpodobnost získání 1 na druhý hod). Podobně, když tvrdíme, že dvě náhodné proměnné jsou nezávislé, intuitivně tím myslíme, že vědět něco o hodnotě jedné z nich nepřináší žádné informace o hodnotě druhéstatistická inferenceZávěr o populaci z náhodného vzorku odebraného z ní nebo, obecněji, o náhodném procesu z jeho pozorovaného chování během konečné dobystatistická interferencestatistický modelstatistická populaceSada entit, o nichž je třeba vyvodit statistické závěry, často založené na náhodném výběru. Lze také hovořit o populaci měření nebo hodnotstatistická disperzeStatistická variabilita je měřítkem toho, jak různorodá jsou některá data. Lze jej vyjádřit rozptylem nebo směrodatnou odchylkoustatistický parametrParametr, který indexuje rodinu distribucí pravděpodobnostistatistická významnoststatistikaStudentův t-testzobrazení stonku a listustratifikovaný odběr vzorkůmetodologie průzkumufunkce přežitízkreslení přežitísymetrické rozdělení pravděpodobnostisystematické vzorkováníT
statistika testučasová doménačasové řadyanalýza časových řadprognózy časových řadošetřeníProměnné ve statistické studii, které jsou koncepčně manipulovatelné. Například ve studii o zdraví je dodržování určité stravy léčbou, zatímco věk nikoli.[1]soudMůže hovořit o každém jednotlivém opakování, když hovoří o experimentu složeném z libovolného pevného počtu z nich. Jako příklad lze uvést, že experimentem je libovolné číslo od jedné do n Hody mincí, řekněme 17. V tomto případě lze jedno losování nazvat pokusem, aby nedošlo k záměně, protože celý experiment se skládá ze 17 pokusů.upravený odhadchyby typu I a typu IIU
unimodální rozdělení pravděpodobnostiJednotkyVe statistické studii objekty, ke kterým jsou přiřazeny léčby. Například ve studii zkoumající účinky kouření cigaret by jednotkami byli lidé.[1]PROTI
rozptylMíra jejího statistického rozptylu náhodné proměnné, která udává, jak daleko od očekávané hodnoty jsou její hodnoty obvykle. Rozptyl náhodné proměnné X je obvykle označen jako
,
nebo jednoduše
[2]Ž
vážený aritmetický průměrvážený mediánX
XOR, exkluzivní disjunkceY
Yatesova korekce na kontinuituZ
z-testViz také
Reference
externí odkazy
|
---|
|
|
|
|
|
|
|
Kategorie Matematický portál Commons WikiProject
|