Náhodná proměnná - Random variable
Část série na statistika |
Teorie pravděpodobnosti |
---|
v pravděpodobnost a statistika, a náhodná proměnná, náhodné množství, nejistá proměnnánebo stochastická proměnná je popisován neformálně jako a proměnná, jejíž hodnoty závisí na výsledky a náhodný jev.[1] Tématem je formální matematické zpracování náhodných proměnných teorie pravděpodobnosti. V této souvislosti je náhodná proměnná chápána jako a měřitelná funkce definované na a pravděpodobnostní prostor že mapy z ukázkový prostor do reálná čísla.[2]
Možné hodnoty náhodné proměnné mohou představovat možné výsledky experimentu, který je ještě třeba provést, nebo možné výsledky minulého experimentu, jehož již existující hodnota je nejistá (například kvůli nepřesným měřením nebo kvantová nejistota ). Mohou také koncepčně představovat buď výsledky „objektivně“ náhodného procesu (například válcování matricí), nebo „subjektivní“ náhodnost, která vyplývá z neúplné znalosti veličiny. Význam pravděpodobností přiřazených potenciálním hodnotám náhodné proměnné není součástí samotné teorie pravděpodobnosti, nýbrž souvisí s filozofickými argumenty o interpretace pravděpodobnosti. Matematika funguje stejně bez ohledu na konkrétní použitou interpretaci.
Jako funkce musí být náhodná proměnná měřitelný, což umožňuje přiřazení pravděpodobností k sadám jeho potenciálních hodnot. Je běžné, že výsledky závisí na některých fyzikálních proměnných, které nelze předvídat. Například když hodíte spravedlivou minci, konečný výsledek hlav nebo ocasů závisí na nejistých fyzických podmínkách, takže sledovaný výsledek je nejistý. Mince by se mohla zachytit trhlinou v podlaze, ale taková možnost je z úvahy vyloučena.
The doména náhodné proměnné se nazývá ukázkový prostor. Interpretuje se jako soubor možných výsledků náhodného jevu. Například v případě hodu mincí se berou v úvahu pouze dva možné výsledky, a to hlavy nebo ocasy.
Náhodná proměnná má a rozdělení pravděpodobnosti, která určuje pravděpodobnost Podmnožiny Borel jeho rozsahu. Náhodné proměnné mohou být oddělený, to znamená převzetí kteréhokoli ze specifikovaných konečných nebo spočítatelný seznam hodnot (majících spočetný rozsah), obdařen a funkce pravděpodobnostní hmotnosti to je charakteristické pro rozdělení pravděpodobnosti náhodné proměnné; nebo kontinuální, přičemž jakoukoli číselnou hodnotu v intervalu nebo soubor intervalů (s nespočet rozsah), přes a funkce hustoty pravděpodobnosti to je charakteristické pro rozdělení pravděpodobnosti náhodné proměnné; nebo směs obou.
Dvě náhodné proměnné se stejným rozdělením pravděpodobnosti se stále mohou lišit, pokud jde o jejich asociace s, nebo nezávislost z, jiné náhodné proměnné. Realizace náhodné proměnné, tj. Výsledky náhodného výběru hodnot podle funkce rozdělení pravděpodobnosti proměnné, se nazývají náhodné variace.
Definice
A náhodná proměnná je měřitelná funkce ze sady možných výsledky do a měřitelný prostor . Technická axiomatická definice vyžaduje být ukázkovým prostorem a trojnásobek pravděpodobnosti (viz míra-teoretická definice ). Náhodná proměnná je často označována kapitálem římská písmena jako , , , .[3][4]
Pravděpodobnost, že přebírá hodnotu v měřitelné sadě je psán jako
Standardní pouzdro
V mnoha případech, je skutečný, tj. . V některých kontextech termín náhodný prvek (vidět rozšíření ) se používá k označení náhodné proměnné, která nemá tento tvar.
Když obraz (nebo rozsah) z je počitatelný, náhodná proměnná se nazývá a diskrétní náhodná proměnná[5]:399 a jeho distribuce je a diskrétní rozdělení pravděpodobnosti, tj. může být popsán a funkce pravděpodobnostní hmotnosti která přiřadí pravděpodobnost každé hodnotě v obraze . Pokud je obraz nespočetně nekonečný (obvykle interval ) pak se nazývá a spojitá náhodná proměnná.[6][Citace je zapotřebí ] Ve zvláštním případě to je absolutně kontinuální, jeho distribuci lze popsat a funkce hustoty pravděpodobnosti, který přiřazuje pravděpodobnosti intervalům; zejména každý jednotlivý bod musí mít nutně nulovou pravděpodobnost pro absolutně spojitou náhodnou proměnnou. Ne všechny spojité náhodné proměnné jsou absolutně spojité,[7] A distribuce směsi je jeden takový protipříklad; takové náhodné proměnné nelze popsat hustotou pravděpodobnosti nebo funkcí pravděpodobnostní hmotnosti.
Libovolnou náhodnou proměnnou lze popsat pomocí kumulativní distribuční funkce, který popisuje pravděpodobnost, že náhodná proměnná bude menší nebo rovna určité hodnotě.
Rozšíření
Pojem „náhodná proměnná“ je ve statistice tradičně omezen na skutečný případ (). V tomto případě umožňuje struktura reálných čísel definovat veličiny, jako například očekávaná hodnota a rozptyl náhodné proměnné, její kumulativní distribuční funkce a momenty jeho distribuce.
Výše uvedená definice však platí pro všechny měřitelný prostor hodnot. Lze tedy uvažovat náhodné prvky jiných množin , například náhodný booleovské hodnoty, kategorické hodnoty, komplexní čísla, vektory, matice, sekvence, stromy, sady, tvary, rozdělovače, a funkce. Jeden pak může konkrétně odkazovat na a náhodná proměnná typ , nebo -hodnota náhodná proměnná.
Tento obecnější koncept a náhodný prvek je zvláště užitečný v oborech, jako je teorie grafů, strojové učení, zpracování přirozeného jazyka a další pole v diskrétní matematika a počítačová věda, kde je často zájem o modelování náhodných variací nečíselných datové struktury. V některých případech je nicméně vhodné představovat každý prvek pomocí jednoho nebo více reálných čísel. V tomto případě může být náhodný prvek volitelně reprezentován jako vektor náhodných proměnných se skutečnou hodnotou (vše je definováno ve stejném podkladovém prostoru pravděpodobnosti , což umožňuje různým náhodným proměnným covary ). Například:
- Náhodné slovo může být reprezentováno jako náhodné celé číslo, které slouží jako rejstřík do slovníku možných slov. Alternativně to může být reprezentováno jako náhodný indikátorový vektor, jehož délka se rovná velikosti slovníku, kde jediné hodnoty kladné pravděpodobnosti jsou , , a pozice 1 označuje slovo.
- Náhodná věta dané délky může být reprezentován jako vektor náhodná slova.
- A náhodný graf na dané vrcholy mohou být reprezentovány jako a matice náhodných proměnných, jejichž hodnoty určují matice sousedství náhodného grafu.
- A náhodná funkce mohou být reprezentovány jako soubor náhodných proměnných , udávající hodnoty funkce v různých bodech v doméně funkce. The jsou běžné náhodné proměnné se skutečnou hodnotou za předpokladu, že je funkce reálná. Například a stochastický proces je náhodná funkce času, a náhodný vektor je náhodná funkce nějaké sady indexů, jako je , a náhodné pole je náhodná funkce libovolné množiny (obvykle času, prostoru nebo diskrétní množiny).
Distribuční funkce
Pokud je náhodná proměnná definovaný na pravděpodobnostním prostoru , můžeme klást otázky jako „Jak pravděpodobné je, že hodnota je rovno 2? ". To je stejné jako pravděpodobnost události." který je často psán jako nebo v krátkosti.
Zaznamenávání všech těchto pravděpodobností výstupních rozsahů reálné náhodné proměnné výnosy rozdělení pravděpodobnosti z . Distribuce pravděpodobnosti „zapomíná“ na konkrétní pravděpodobnostní prostor použitý k definování a zaznamenává pouze pravděpodobnosti různých hodnot . Takové rozdělení pravděpodobnosti lze vždy zachytit jeho kumulativní distribuční funkce
a někdy také pomocí a funkce hustoty pravděpodobnosti, . v míra-teoretická používáme náhodnou proměnnou „posunout dopředu“ opatření na na míru na Základní prostor pravděpodobnosti je technické zařízení sloužící k zajištění existence náhodných proměnných, někdy k jejich konstrukci a definování pojmů jako např korelace a závislost nebo nezávislost na základě a společná distribuce dvou nebo více náhodných proměnných ve stejném prostoru pravděpodobnosti. V praxi člověk často disponuje prostorem dohromady a jen měří který přiřadí míru 1 celé reálné linii, tj. místo náhodných proměnných se pracuje s distribucemi pravděpodobnosti. Viz článek o kvantilové funkce pro plnější rozvoj.
Příklady
Diskrétní náhodná proměnná
V experimentu může být osoba vybrána náhodně a jednou náhodnou proměnnou může být její výška. Matematicky je náhodná proměnná interpretována jako funkce, která mapuje osobu na její výšku. S náhodnou proměnnou je spojeno rozdělení pravděpodobnosti, které umožňuje výpočet pravděpodobnosti, že výška je v jakékoli podmnožině možných hodnot, jako je pravděpodobnost, že výška je mezi 180 a 190 cm, nebo pravděpodobnost, že výška bude buď menší než 150 nebo více než 200 cm.
Další náhodnou proměnnou může být počet dětí dané osoby; toto je diskrétní náhodná proměnná s nezápornými celočíselnými hodnotami. Umožňuje výpočet pravděpodobností pro jednotlivé celočíselné hodnoty - funkci pravděpodobnostní hmotnosti (PMF) - nebo pro množiny hodnot, včetně nekonečných množin. Událostí zájmu může být například „sudý počet dětí“. U konečných i nekonečných množin událostí lze jejich pravděpodobnosti zjistit sečtením PMF prvků; to znamená, že pravděpodobnost sudého počtu dětí je nekonečný součet .
V takových příkladech je ukázkový prostor je často potlačeno, protože je matematicky obtížné to popsat, a možné hodnoty náhodných proměnných jsou poté považovány za ukázkový prostor. Ale když jsou naměřeny dvě náhodné proměnné na stejném vzorovém prostoru výsledků, jako je výška a počet dětí počítaných na stejných náhodných osobách, je snazší sledovat jejich vztah, pokud je uznáno, že jak výška, tak počet dětí přicházejí od stejné náhodné osoby, například tak, aby bylo možné položit otázky, zda takové náhodné proměnné souvisejí nebo ne.
Li jsou spočítatelné sady reálných čísel, a , pak je funkce diskrétní distribuce. Tady pro , pro . Vezmeme například výčet všech racionálních čísel jako , získá se funkce diskrétní distribuce, která není krokovou funkcí nebo po částech konstantní.[5]
Hod mincí
Možné výsledky pro jeden hod mincí lze popsat v prostoru vzorku . Můžeme zavést náhodnou proměnnou se skutečnou hodnotou který modeluje výplatu 1 $ za úspěšnou sázku na hlavy následujícím způsobem:
Pokud je mincí a spravedlivá mince, Y má funkce pravděpodobnostní hmotnosti dána:
Hod kostkami
Náhodnou proměnnou lze také použít k popisu procesu házení kostkami a možných výsledků. Nejviditelnějším znázorněním pro případ dvou kostek je vzít sadu dvojic čísel n1 a n2 od {1, 2, 3, 4, 5, 6} (představující čísla na dvou kostkách) jako ukázkový prostor. Celkový počet válců (součet čísel v každém páru) je pak náhodná proměnná X dané funkcí, která mapuje pár na součet:
a (pokud jsou kostky veletrh ) má funkci pravděpodobnostní hmotnosti ƒX dána:
Spojitá náhodná proměnná
Formálně je spojitá náhodná proměnná náhodná proměnná, jejíž kumulativní distribuční funkce je kontinuální všude.[8] Nejsou k dispozici žádné "mezery ", což by odpovídalo číslům, která mají konečnou pravděpodobnost vyskytující se. Místo toho spojité náhodné proměnné skoro nikdy vezměte přesně předepsanou hodnotu C (formálně, ), ale existuje pozitivní pravděpodobnost, že bude ležet zejména jeho hodnota intervaly který může být libovolně malý. Spojité náhodné proměnné obvykle připouštějí funkce hustoty pravděpodobnosti (PDF), které charakterizují jejich CDF a pravděpodobnostní opatření; tyto distribuce se také nazývají absolutně kontinuální; ale některé spojité distribuce jsou jednotné číslo nebo směsi absolutně spojité části a singulární části.
Příkladem spojité náhodné proměnné může být proměnná založená na rozmetávači, který může zvolit vodorovný směr. Hodnoty přijaté náhodnou proměnnou jsou pak směry. Tyto směry bychom mohli reprezentovat severem, západem, východem, jihem, jihovýchodem atd. Obvykle je však vhodnější namapovat prostor vzorku na náhodnou proměnnou, která bere hodnoty, které jsou reálnými čísly. Toho lze dosáhnout například mapováním směru k ložisku ve stupních ve směru hodinových ručiček od severu. Náhodná proměnná poté přebírá hodnoty, které jsou reálnými čísly z intervalu [0, 360], přičemž všechny části rozsahu jsou „stejně pravděpodobné“. V tomto případě, X = úhel otočení. Jakékoli reálné číslo má pravděpodobnost nula výběru, ale každému lze přiřadit kladnou pravděpodobnost rozsah hodnot. Například pravděpodobnost výběru čísla v [0, 180] je1⁄2. Místo toho, abychom mluvili o hromadné funkci pravděpodobnosti, říkáme, že pravděpodobnost hustota z X je 1/360. Pravděpodobnost podmnožiny [0, 360) lze vypočítat vynásobením míry sady 1/360. Obecně lze pravděpodobnost množiny pro danou spojitou náhodnou proměnnou vypočítat integrací hustoty přes danou množinu.
Více formálně, vzhledem k jakékoli interval , náhodná proměnná se nazývá „nepřetržitá uniforma náhodná proměnná "(CURV), pokud je pravděpodobnost, že získá hodnotu v a podinterval záleží pouze na délce podintervalu. To znamená, že pravděpodobnost spadající do jakéhokoli podintervalu je úměrný do délka subintervalu, tedy pokud A ≤ C ≤ d ≤ b, jeden má
kde poslední rovnost vyplývá z jednotný axiom pravděpodobnosti. The funkce hustoty pravděpodobnosti KŘIVKY je dán funkce indikátoru jeho intervalu Podpěra, podpora normalizováno délkou intervalu: