Glosář pravděpodobnosti a statistiky - Glossary of probability and statistics

Toto je a glosář pojmů použitých v matematický vědy statistika a pravděpodobnost.

A

pravidlo přípustného rozhodnutí

algebra náhodných proměnných

alternativní hypotéza

analýza rozptylu

atomová událost

Jiný název pro základní událost

B

1. Vlastnost vzorku, která nereprezentuje populaci

2. Rozdíl mezi očekávanou hodnotou odhadce a skutečnou hodnotou

binární data

Data, která mohou nabývat pouze dvou hodnot, obvykle představovaných 0 a 1

C

kauzální studie

Statistická studie, ve které je cílem měřit vliv určité proměnné na výsledek jiné proměnné. Například, jak se bude cítit moje bolest hlavy, když užívám aspirin, oproti tomu, když aspirin neužívám? Kauzální studie mohou být experimentální nebo observační.^[1]

teorém centrálního limitu

centrální moment

charakteristická funkce

distribuce chí-kvadrát

doprovodné látky

Ve statistické studii jsou doprovodnými látkami jakékoli proměnné, jejichž hodnoty nejsou ovlivněny léčbou, jako je věk jednotky, pohlaví a hladina cholesterolu před zahájením diety (léčby).^[1]

podmíněné rozdělení

Vzhledem ke dvěma společně distribuovaným náhodným proměnným X a Ypodmíněné rozdělení pravděpodobnosti Y daný X (psaný "Y | X") je rozdělení pravděpodobnosti Y když X je známo, že je konkrétní hodnotou

podmíněná pravděpodobnost

Pravděpodobnost nějaké události A, za předpokladu, že událost B. Podmíněná pravděpodobnost je zapsána P (A|B) a čte se „pravděpodobnost A, vzhledem k tomu B"^[2]

podmíněné rozdělení pravděpodobnosti

interval spolehlivosti

V inferenční statistice je CI rozsah věrohodných hodnot pro některý parametr, jako je průměr populace.^[3] Například na základě studie spánkových návyků mezi 100 lidmi může výzkumník odhadnout, že celková populace spí někde mezi 5 a 9 hodinami za noc. To se liší od střední hodnoty vzorku, kterou lze měřit přímo.

úroveň spolehlivosti

Úroveň spolehlivosti, známá také jako koeficient spolehlivosti, označuje pravděpodobnost, že interval spolehlivosti (rozsah) zachycuje skutečný průměr populace. Například interval spolehlivosti s 95% úrovní spolehlivosti má 95% šanci zachytit průměrnou hodnotu populace. Technicky to znamená, že pokud by se experiment opakoval mnohokrát, 95 procent CI by obsahovalo skutečný průměr populace.^[3]

Také se nazývá korelační koeficient, numerická míra síly lineárního vztahu mezi dvěma náhodnými proměnnými (lze jej použít například ke kvantifikaci, jak je korelace velikosti a výšky obuvi v populaci). Příkladem je Pearsonův korelační koeficient produkt-moment, který se zjistí dělením kovariance dvou proměnných součinem jejich směrodatných odchylek. Nezávislé proměnné mají korelaci 0. Korelace populace je často reprezentována symbolem

{ displaystyle rho}

, zatímco ukázková korelace od

{ displaystyle r}

.^[2]

počítat data

Údaje vyplývající z počítací který může nabývat pouze nezáporných celočíselných hodnot

kovariance

Vzhledem k tomu, dvě náhodné proměnné X a Y, s očekávanými hodnotami

{ displaystyle E (X) = mu}

a

{ displaystyle E (Y) = nu}

, kovariance je definována jako očekávaná hodnota náhodné proměnné

{ displaystyle (X- mu) (Y- nu)}

a je napsán

{ displaystyle operatorname {cov} (X, Y)}

.^[2] Používá se pro měření korelace.

D

data

analýza dat

soubor dat

Ukázka a související datové body

datový bod

Typové měření - může to být a Booleovský hodnota, skutečné číslo, vektor (v takovém případě se také nazývá datový vektor) atd

deskriptivní statistika

E

elementární událost

Událost pouze s jedním prvkem. Například při vytahování karty z balíčku je „získání piky“ základní událostí, zatímco „získání krále nebo esa“ není

teorie odhadu

odhadce

Funkce známých dat, která se používá k odhadu neznámého parametru; odhad je výsledkem skutečné aplikace funkce na konkrétní sadu dat. Průměr lze použít jako odhad

očekávaná hodnota

Součet pravděpodobnosti každého možného výsledku experimentu vynásobený jeho výplatou („hodnota“). Představuje tedy průměrnou částku, kterou „očekává“ výhra na jednu sázku, pokud se sázky se stejnými kurzy opakují mnohokrát. Například očekávaná hodnota šestistranného válcovacího stroje je 3,5. Koncept je podobný průměru. Očekávaná hodnota náhodné proměnné X je obvykle psáno E (X) pro operátora a

{ displaystyle mu}

(mu ) pro parametr.^[2]

experiment

Jakýkoli postup, který lze nekonečně opakovat a má dobře definovanou sadu výsledků

exponenciální rodina

událost

Podmnožina prostoru vzorku (možný výsledek experimentu), ke kterému lze přiřadit pravděpodobnost. Například při hodu kostkou je „získání pětky nebo šestky“ událost (s pravděpodobností jedné třetiny, pokud je kostka spravedlivá)

F

faktorová analýza

faktoriální experiment

G

obecný lineární model

zobecněný lineární model

seskupená data

H

histogram

Já

Nezávislost (teorie pravděpodobnosti)

nezávislé proměnné

Rozsah interkvartilní

J

společná distribuce

Vzhledem k tomu, dvě náhodné proměnné X a Y, společná distribuce X a Y je rozdělení pravděpodobnosti X a Y společně

společná pravděpodobnost

Pravděpodobnost dvou událostí, které se vyskytnou společně. Společná pravděpodobnost A a B je psáno

{ displaystyle P (A cap B)}

^[2] nebo

{ displaystyle P (A, B).}

K.

Míra zřídka extrémních pozorování (odlehlých hodnot) rozdělení pravděpodobnosti reálné náhodné proměnné. Vyšší špičatost znamená, že větší část rozptylu je způsobena občasnými extrémními odchylkami, na rozdíl od častých odchylek o malé velikosti

L

L-moment

zákon velkých čísel

funkce pravděpodobnosti

Funkce podmíněné pravděpodobnosti se považovala za funkci svého druhého argumentu, přičemž jeho první argument zůstal pevný. Představte si například, že vytáhnete očíslovanou kouli s číslem k ze sáčku n koulí očíslovaných 1 až n. Pak byste mohli popsat funkci pravděpodobnosti pro náhodnou proměnnou N jako pravděpodobnost získání k vzhledem k tomu, že existuje n koulí: pravděpodobnost bude 1 / n pro n větší nebo rovna k a 0 pro n menší než k. Na rozdíl od funkce rozdělení pravděpodobnosti nebude tato funkce pravděpodobnosti v prostoru vzorku součet až 1

funkce ztráty

test poměru pravděpodobnosti

M

M-odhad

mezní rozdělení

Vzhledem ke dvěma společně distribuovaným náhodným proměnným X a Y, mezní rozdělení X je jednoduše rozdělení pravděpodobnosti X ignorování informací o Y

mezní pravděpodobnost

Pravděpodobnost události, ignorování informací o dalších událostech. Mezní pravděpodobnost A je psáno P(A). Kontrast s podmíněnou pravděpodobností

Markovský řetězec Monte Carlo

matematická statistika

odhad maximální věrohodnosti

znamenat

1. Očekávaná hodnota náhodné proměnné

2. Aritmetický průměr je průměr množiny čísel nebo součet hodnot dělený počtem hodnot

medián

střední absolutní odchylka

režimu

klouzavý průměr

multimodální distribuce

vícerozměrná analýza

vícerozměrný odhad hustoty jádra

vícerozměrná náhodná proměnná

Vektor, jehož komponenty jsou náhodné proměnné ve stejném prostoru pravděpodobnosti

vzájemná exkluzivita

vzájemná nezávislost

Kolekce událostí je vzájemně nezávislá, pokud je u jakékoli podmnožiny kolekce společná pravděpodobnost výskytu všech událostí stejná jako součin společných pravděpodobností jednotlivých událostí. Přemýšlejte o výsledku řady mincí. To je silnější podmínka než párová nezávislost

N

neparametrická regrese

neparametrické statistiky

chyba bez vzorkování

normální distribuce

normální pravděpodobnostní graf

nulová hypotéza

Výrok testovaný v testu statistické významnosti Obvykle je nulovou hypotézou výrok „bez účinku“ nebo „bez rozdílu“. “^[4] Například pokud bychom chtěli vyzkoušet, zda má světlo vliv na spánek, nulová hypotéza by byla, že žádný účinek neexistuje. To je často symbolizováno jako H₀.

Ó

průzkum veřejného mínění

optimální rozhodnutí

optimální design

odlehlý

P

p-hodnota

párová nezávislost

Párově nezávislá sbírka náhodných proměnných je sada náhodných proměnných, z nichž dvě jsou nezávislé

parametr

Může to být populační parametr, distribuční parametr, nepozorovaný parametr (s různými významovými odstíny). Ve statistikách se často jedná o množství, které je třeba odhadnout

předchozí pravděpodobnost

v Bayesovský závěr, to představuje předchozí přesvědčení nebo jiné informace, které jsou k dispozici před zohledněním nových údajů nebo pozorování

populační parametr

Viz parametr

zadní pravděpodobnost

Výsledek a Bayesovská analýza který zapouzdřuje kombinaci dřívějších přesvědčení nebo informací s pozorovanými údaji

analýza hlavních komponent

pravděpodobnost

hustota pravděpodobnosti

Popisuje pravděpodobnost v průběžném rozdělení pravděpodobnosti. Například nemůžete říci, že pravděpodobnost, že muž bude šest stop vysoký, je 20%, ale můžete říci, že má 20% šancí, že bude vysoký mezi pěti a šesti stopami. Hustota pravděpodobnosti je dána funkcí hustoty pravděpodobnosti. Kontrast s pravděpodobností

funkce hustoty pravděpodobnosti

Udává rozdělení pravděpodobnosti pro spojitou náhodnou proměnnou

rozdělení pravděpodobnosti

Funkce, která dává pravděpodobnost všech prvků v daném prostoru: viz Seznam rozdělení pravděpodobnosti

míra pravděpodobnosti

Pravděpodobnost událostí v prostoru pravděpodobnosti

graf pravděpodobnosti

pravděpodobnostní prostor

Ukázkový prostor, ve kterém byla definována míra pravděpodobnosti

Q

kvantil

kvartil

vzorkování kvót

R

náhodná proměnná

Měřitelná funkce v prostoru pravděpodobnosti, často reálná. Distribuční funkce náhodné proměnné dává pravděpodobnost různých výsledků. Můžeme také odvodit průměr a rozptyl náhodné proměnné

randomized block design

rozsah

Délka nejmenšího intervalu, který obsahuje všechna data

rekurzivní Bayesiánský odhad

regresní analýza

návrh opakovaných opatření

odpovědi

Ve statistické studii jsou všechny proměnné, jejichž hodnoty mohly být ovlivněny léčbou, jako jsou hladiny cholesterolu po dodržení určité stravy po dobu šesti měsíců.^[1]

omezená randomizace

robustní statistiky

chyba zaokrouhlení

S

vzorek

Ta část populace, která je skutečně pozorována

Ukázkový průměr a kovariance

Aritmetický průměr vzorku hodnot získaných z populace. Označuje to

{ displaystyle { overline {x}}}

.^[2] Příkladem je průměrné skóre testu podmnožiny 10 studentů z třídy. Průměrný vzorek se používá jako odhad střední hodnoty populace, což by v tomto příkladu bylo průměrné skóre testu všech studentů ve třídě.

ukázkový prostor

Soubor možných výsledků experimentu. Například ukázkový prostor pro válcování šestistranné matrice bude {1, 2, 3, 4, 5, 6}

vzorkování

Proces výběru pozorování k získání znalostí o populaci. Existuje mnoho metod, jak vybrat, na kterém vzorku provést pozorování

zkreslení vzorkování

Distribuce vzorků

Rozdělení pravděpodobnosti dané statistiky při opakovaném výběru populace

chyba vzorkování

bodový diagram

Parametr měřítka

úroveň významnosti

jednoduchý náhodný vzorek

Simpsonův paradox

šikmost

Míra asymetrie distribuce pravděpodobnosti náhodné proměnné se skutečnou hodnotou. Zhruba řečeno, distribuce má pozitivní zkosení (pravoúhlé), pokud je vyšší ocas delší a záporné zkosení (levé šikmé), pokud je spodní ocas delší (matoucí dva je běžná chyba)

spaghetti plot

zkreslení spektra

standardní odchylka

Nejčastěji používaným měřítkem statistické disperze. To je odmocnina odchylky a je obvykle psáno

{ displaystyle sigma}

(sigma )^[2]

standardní chyba

standardní skóre

statistický

Výsledek použití statistického algoritmu na datovou sadu. Lze jej také popsat jako pozorovatelnou náhodnou proměnnou

statistická disperze

statistická grafika

statistické testování hypotéz

statistická nezávislost

Dvě události jsou nezávislé, pokud výsledek jedné nemá vliv na výsledek druhé (například získání 1 na jeden hod kostkou nemá vliv na pravděpodobnost získání 1 na druhý hod). Podobně, když tvrdíme, že dvě náhodné proměnné jsou nezávislé, intuitivně tím myslíme, že vědět něco o hodnotě jedné z nich nepřináší žádné informace o hodnotě druhé

statistická inference

Závěr o populaci z náhodného vzorku odebraného z ní nebo, obecněji, o náhodném procesu z jeho pozorovaného chování během konečné doby

statistická interference

statistický model

statistická populace

Sada entit, o nichž je třeba vyvodit statistické závěry, často založené na náhodném výběru. Lze také hovořit o populaci měření nebo hodnot

statistická disperze

Statistická variabilita je měřítkem toho, jak různorodá jsou některá data. Lze jej vyjádřit rozptylem nebo směrodatnou odchylkou

statistický parametr

Parametr, který indexuje rodinu distribucí pravděpodobnosti

statistická významnost

statistika

Studentův t-test

zobrazení stonku a listu

stratifikovaný odběr vzorků

metodologie průzkumu

funkce přežití

zkreslení přežití

symetrické rozdělení pravděpodobnosti

systematické vzorkování

T

prognózy časových řad

ošetření

Proměnné ve statistické studii, které jsou koncepčně manipulovatelné. Například ve studii o zdraví je dodržování určité stravy léčbou, zatímco věk nikoli.^[1]

soud

Může hovořit o každém jednotlivém opakování, když hovoří o experimentu složeném z libovolného pevného počtu z nich. Jako příklad lze uvést, že experimentem je libovolné číslo od jedné do n Hody mincí, řekněme 17. V tomto případě lze jedno losování nazvat pokusem, aby nedošlo k záměně, protože celý experiment se skládá ze 17 pokusů.

upravený odhad

chyby typu I a typu II

U

unimodální rozdělení pravděpodobnosti

Jednotky

Ve statistické studii objekty, ke kterým jsou přiřazeny léčby. Například ve studii zkoumající účinky kouření cigaret by jednotkami byli lidé.^[1]

PROTI

rozptyl

Míra jejího statistického rozptylu náhodné proměnné, která udává, jak daleko od očekávané hodnoty jsou její hodnoty obvykle. Rozptyl náhodné proměnné X je obvykle označen jako

{ displaystyle operatorname {var} (X)}

,

{ displaystyle sigma _ {X} ^ {2}}

nebo jednoduše

{ displaystyle sigma ^ {2}}

^[2]

Ž

vážený aritmetický průměr

vážený medián

X

XOR, exkluzivní disjunkce

Y

Yatesova korekce na kontinuitu

Z

z-test

Viz také

Reference

^ ^A ^b ^C ^d ^E Reiter, Jerome (24. ledna 2000). "Využití statistik k určení kauzálních vztahů". Americký matematický měsíčník. 107 (1): 24–32. doi:10.2307/2589374. JSTOR 2589374.
^ ^A ^b ^C ^d ^E ^F ^G ^h „Pravděpodobnostní a statistické symboly“. Matematický trezor. Citováno 2020-09-10.
^ ^A ^b Pav Kalinowski. Porozumění intervalům spolehlivosti (CI) a odhad velikosti efektu. Asociace pro pozorovatele psychologických věd 10. dubna 2010. http://www.psychologicalscience.org/index.php/publications/observer/2010/april-10/understanding-confidence-intervals-cis-and-effect-size-estimation.html
^ Moore, David; McCabe, George (2003). Úvod do praxe statistiky (4. vyd.). New York: W.H. Freeman and Co. p. 438. ISBN 9780716796572.

externí odkazy

„Glosář terminologie DOE“, Elektronická příručka statistických metod NIST / SEMATECH, NIST, vyvoláno 28. února 2009
Statistický glosář, statistics.com, vyvoláno 28. února 2009
Pravděpodobnost a statistika nejstarších stránek (Univ. Of Southampton)

[Reiter-1] A ^b ^C ^d ^E Reiter, Jerome (24. ledna 2000). "Využití statistik k určení kauzálních vztahů". Americký matematický měsíčník. 107 (1): 24–32. doi:10.2307/2589374. JSTOR 2589374.

[probstatsymbols-2] A ^b ^C ^d ^E ^F ^G ^h „Pravděpodobnostní a statistické symboly“. Matematický trezor. Citováno 2020-09-10.

[Kalinowski-3] A ^b Pav Kalinowski. Porozumění intervalům spolehlivosti (CI) a odhad velikosti efektu. Asociace pro pozorovatele psychologických věd 10. dubna 2010. http://www.psychologicalscience.org/index.php/publications/observer/2010/april-10/understanding-confidence-intervals-cis-and-effect-size-estimation.html

[moore-4] Moore, David; McCabe, George (2003). Úvod do praxe statistiky (4. vyd.). New York: W.H. Freeman and Co. p. 438. ISBN 9780716796572.

[1]

[2]

[3]

[4]