| tento článek případně obsahuje původní výzkum. Prosím vylepši to podle ověřování vznesené nároky a přidání vložené citace. Výroky sestávající pouze z původního výzkumu by měly být odstraněny. (Červenec 2014) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |
The statistika náhodných permutací, tak jako struktura cyklu a náhodná obměna mají zásadní význam v EU analýza algoritmů, zejména třídicích algoritmů, které fungují na náhodných permutacích. Předpokládejme například, že používáme rychlý výběr (bratranec quicksort ) pro výběr náhodného prvku náhodné permutace. Quickselect provede částečné třídění na poli, protože rozděluje pole podle pivot. Po provedení rychlého výběru bude tedy permutace méně narušená. Množství poruchy, které přetrvává, lze analyzovat pomocí generujících funkcí. Tyto generující funkce závisí zásadním způsobem na generujících funkcích statistik náhodné permutace. Proto je životně důležité vypočítat tyto generující funkce.
Článek o náhodné obměny obsahuje úvod do náhodných permutací.
Základní vztah
Permutace jsou sady označených cyklů. Pomocí označeného pouzdra Flajolet – Sedgewickova základní věta a psaní pro soubor permutací a pro singletonovou sadu máme
Překlad do exponenciální generující funkce (EFG), máme
kde jsme využili skutečnost, že EGF kombinatorické druhy permutací (existují n! obměny n prvků) je
Tato jedna rovnice umožňuje odvodit velké množství statistik permutací. Nejprve zrušením podmínek z , tj. exp, můžeme omezit počet cyklů že permutace obsahuje, např. omezením EFG na získáme permutace obsahující dva cykly. Zadruhé si povšimněte, že EGF značených cyklů, tj , je
protože tam jsou k! / k označené cykly. To znamená, že vypuštěním výrazů z této generující funkce můžeme omezit velikost cyklů které se vyskytují v permutaci a získají EGF permutací obsahujících pouze cykly dané velikosti.
Místo odebírání a výběru cyklů lze také dávat různé váhy různým velikostem cyklů. Li je váhová funkce, která závisí pouze na velikosti k cyklu a pro stručnost píšeme
definování hodnoty b pro obměnu být součtem jeho hodnot na cyklech, pak můžeme označit cykly délky k s ub(k) a získat funkci generování dvou proměnných
Toto je "smíšená" generující funkce: je to exponenciální generující funkce v z a obyčejná generující funkce v sekundárním parametru u. Diferenciace a hodnocení na u = 1, máme
To je funkce generující pravděpodobnost očekávání b. Jinými slovy, koeficient v této výkonové řadě je očekávaná hodnota b o permutacích v , vzhledem k tomu, že každá permutace je zvolena se stejnou pravděpodobností .
Tento článek používá operátor extrakce koeficientů [zn], zdokumentováno na stránce pro formální mocenské řady.
Počet permutací, které jsou involucemi
An involuce je permutace σ, takže σ2 = 1 při permutačním složení. Z toho vyplývá, že σ může obsahovat pouze cykly o délce jednoho nebo dvou, tj exponenciální generující funkce G(z) těchto permutací je[1]
To dává explicitní vzorec pro celkový počet involucí mezi permutacemi σ ∈Sn:[1]
Dělení n! poskytuje pravděpodobnost, že náhodná permutace je involuce. Tato čísla jsou známá jako telefonní čísla.
Počet permutací, které jsou mth kořeny jednoty
Tím se zobecňuje pojem involuce. An mth kořen jednoty je permutace σ, takže σm = 1 v permutačním složení. Nyní pokaždé, když použijeme σ, se pohybujeme paralelně o jeden krok ve všech jeho cyklech. Cyklus délky d aplikovaný d times vytvoří permutaci identity d elementy (d pevné body) a d je nejmenší hodnota. Proto m musí být násobkem všech velikostí cyklu d, tj. jediné možné cykly jsou ty, jejichž délka d je dělitel m. Z toho vyplývá, že EFG G(X) těchto permutací je
Když m = str, kde str je hlavní, tím se zjednodušuje
Počet permutací objednávky přesně k
Toho lze dosáhnout pomocí Möbiova inverze. Při práci se stejným konceptem jako v předchozím vstupu si povšimneme kombinatorických druhů permutací, jejichž pořadí se dělí k darováno
Překladem na exponenciální generující funkce získáme EGF permutací, jejichž pořadí se dělí k, který je
Nyní můžeme použít tuto generující funkci k přesnému výpočtu permutací řádu k. Nechat být počet permutací na n jehož pořadí je přesně d a počet permutací na n počet permutací, jejichž pořadí se dělí k. Pak máme
Z toho vyplývá Möbiova inverze že
Proto máme EGF
Požadovaný počet je pak dán vztahem
Tento vzorec produkuje např. pro k = 6 EGF
s posloupností hodnot začínajících na n = 5
- (sekvence A061121 v OEIS )
Pro k = 8 dostaneme EGF
s posloupností hodnot začínajících na n = 8
- (sekvence A061122 v OEIS )
Konečně pro k = 12 dostaneme EGF
s posloupností hodnot začínajících na n = 7
- (sekvence A061125 v OEIS )
Počet permutací, které jsou narušeny
Předpokládejme, že existují n lidé na večírku, z nichž každý přinesl deštník. Na konci večírku si každý vybere ze stohu deštníků a listí deštník. Jaká je pravděpodobnost, že nikdo neodjel se svým vlastním deštníkem? Tento problém je ekvivalentní počítání permutací bez pevných bodů (tzv poruchy ), a tedy EGF, kde odečtením pevných bodů odečteme pevné body z, je
Násobení nyní jen součty koeficientů, takže máme následující vzorec pro , celkový počet poruch:
Proto existuje asi odchylky a pravděpodobnost, že náhodná permutace je odchylka, je
Tento výsledek může být prokázán také začlenění – vyloučení. Pomocí sad kde k označení množiny permutací, které opravují str, my máme
Tento vzorec počítá počet permutací, které mají alespoň jeden pevný bod. Kardinality jsou následující:
Proto je počet permutací bez pevného bodu
nebo
a máme nárok.
Existuje zobecnění těchto čísel, které je známé jako obnovuje čísla, tj. číslo permutací z obsahující m pevné body. Odpovídající EGF se získá označením cyklů velikosti jedna proměnnou u, tj. výběr b(k) rovno jedné pro a jinak nula, která poskytuje generující funkci množiny permutací počtem pevných bodů:
Z toho vyplývá, že
a tudíž
To okamžitě naznačuje
pro n velký, m pevný.
Pořadí náhodné permutace
Li P je obměna, objednat z P je nejmenší kladné celé číslo n pro který je permutace identity. Toto je nejméně běžný násobek délek cyklů P.
Věta o Gohovi a Schmutzovi[2]uvádí, že pokud je očekávané pořadí náhodné permutace velikosti n, pak
kde konstanta C je
Odchylky obsahující sudý a lichý počet cyklů
K výpočtu počtu odchylek můžeme použít stejnou konstrukci jako v předchozí části obsahující sudý počet cyklů a počet obsahující lichý počet cyklů. K tomu musíme označit všechny cykly a odečíst pevné body, dávat
Nyní některé velmi základní úvahy ukazují, že EGF z darováno
Máme tedy
který je
Odečítání z , shledáváme
Rozdíl mezi těmito dvěma ( a ) je
Sto vězňů
Vězeňský dozorce chce ve své věznici uvolnit místo a uvažuje o osvobození sto vězňů, čímž uvolní sto cel. Shromáždí proto sto vězňů a požádá je, aby hráli následující hru: seřadí sto uren v řadě, každá obsahuje jméno jednoho vězně, kde se jméno každého vězně vyskytuje přesně jednou. Hra se hraje následovně: každý vězeň může nahlédnout do padesáti uren. Pokud nenajde své jméno v jedné z padesáti uren, budou okamžitě popraveni všichni vězni, jinak hra pokračuje. Vězni mají několik okamžiků, aby se rozhodli pro strategii, protože věděli, že jakmile hra začne, nebudou moci spolu komunikovat, žádným způsobem označovat urny nebo přesouvat urny nebo jména uvnitř. Při náhodném výběru urny je jejich šance na přežití téměř nulová, ale existuje strategie, která jim dává 30% šanci na přežití, za předpokladu, že jména jsou urnám přiřazena náhodně - co to je?
Nejprve je pravděpodobnost přežití pomocí náhodných voleb
to tedy rozhodně není praktická strategie.
Strategií 30% přežití je považovat obsah uren za permutaci vězňů a cykly procházení. Aby byl zápis jednoduchý, přiřaďte každému vězni číslo, například seřazením jeho jmen podle abecedy. Urny mohou být poté považovány za obsahující spíše čísla než jména. Nyní obsah urn jasně definuje permutaci. První vězeň otevře první urnu. Pokud najde své jméno, skončil a přežil. Jinak otevře urnu s číslem, které našel v první urně. Proces se opakuje: vězeň otevře urnu a přežije, pokud najde své jméno, jinak otevře urnu s právě načteným číslem, a to až do limitu padesáti uren. Druhý vězeň začíná s urnou číslo dva, třetí s urnou číslo tři atd. Tato strategie je přesně ekvivalentní průchodu cyklů permutace představovaných urnami. Každý vězeň začíná s urnou, která nese jeho číslo, a pokračuje ve svém cyklu až do limitu padesáti uren. Číslo urny, která obsahuje jeho číslo, je předobrazem tohoto čísla pod permutací. Vězni tedy přežijí, pokud všechny cykly obměny obsahují maximálně padesát prvků. Musíme ukázat, že tato pravděpodobnost je nejméně 30%.
Všimněte si, že to předpokládá, že dozorce volí permutaci náhodně; pokud dozorce předvídá tuto strategii, může jednoduše zvolit permutaci s cyklem délky 51. Aby to překonali, mohou se vězni předem dohodnout na náhodném obměně jejich jmen.
Zvažujeme obecný případ vězni a otevírání uren. Nejprve spočítáme doplňkovou pravděpodobnost, tj. Že existuje cyklus větší než elementy. S ohledem na tuto skutečnost vám představujeme
nebo
takže požadovaná pravděpodobnost je
protože cyklus více než prvky budou nutně jedinečné. S využitím toho, že , zjistíme, že
který přináší
Nakonec pomocí integrálního odhadu, jako je Součet Euler – Maclaurin nebo asymptotická expanze nth harmonické číslo, získáváme
aby
nebo alespoň 30%, jak je uvedeno.
Souvisejícím výsledkem je, že asymptoticky je očekávaná délka nejdelšího cyklu λn, kde λ je Konstanta Golomb – Dickman, přibližně 0,62.
Tento příklad si zaslouží Anna Gál a Peter Bro Miltersen; další informace najdete v příspěvku Petera Winklera a viz diskuse na Les-Mathematiques.net.Poraďte se s odkazy na 100 vězňů odkazy na tyto reference.
Výše uvedený výpočet lze provést jednodušším a přímým způsobem, a to následovně: nejprve si povšimněte, že permutace prvky obsahuje maximálně jeden cyklus délky striktně větší než . Pokud tedy označíme
pak
Pro , počet permutací, které obsahují přesně cyklus délky je
Vysvětlení: je počet způsobů výběru prvky, které tvoří cyklus; je počet způsobů uspořádání položky v cyklu; a je počet způsobů, jak permutovat zbývající prvky. Neexistuje zde žádné dvojí započítání, protože existuje maximálně jeden cyklus délky když . Tím pádem,
Došli jsme k závěru, že
Variace na problém 100 vězňů (klíče a krabice)
Existuje zde úzce související problém, který docela dobře odpovídá zde představené metodě. Řekněme, že máte n objednané krabice. Každé pole obsahuje klíč k nějaké jiné schránce nebo případně k samotné, která poskytuje permutaci klíčů. Máte povoleno vybrat k z nich n polí najednou a rozbijte je současně, abyste získali přístup k k klíče. Jaká je pravděpodobnost, že pomocí těchto klíčů můžete otevřít všechny n polí, kde pomocí nalezeného klíče otevřete pole, ke kterému patří, a opakujte.
Matematické vyjádření tohoto problému je následující: vyberte náhodnou permutaci n prvky a k hodnoty z rozsahu 1 na n, také náhodně, zavolejte tyto značky. Jaká je pravděpodobnost, že v každém cyklu permutace je alespoň jedna značka? Tvrzení je tato pravděpodobnost je k / n.
Druh permutačních cyklů s nějakou neprázdnou podmnožinou každého označovaného cyklu má specifikaci
Index ve vnitřním součtu začíná na jedné, protože v každém cyklu musíme mít alespoň značku.
Přeložením specifikace na generující funkce získáme funkci bivariate generující
To se zjednodušuje na
nebo
Aby bylo možné extrahovat koeficienty z tohoto přepisování, takhle
Z toho nyní vyplývá
a tudíž
Rozdělte získat
Nepotřebujeme dělit n! protože je exponenciální v z.
Počet permutací obsahujících m cykly
Uplatnění Flajolet – Sedgewickova základní věta, tj. označená věta o výčtu s , do sady
získáme generující funkci
Termín
dává podepsané Stirlingova čísla prvního druhu, a je EGF nepodepsaných Stirlingových čísel prvního druhu, tj.
Můžeme vypočítat OGF podepsaných Stirlingových čísel pro n pevné, tj.
Začít s
který přináší
Když to shrneme, získáme to
Použití vzorce zahrnujícího logaritmus pro vlevo definice napravo a binomická věta, získáváme
Porovnání koeficientů a za použití definice binomický koeficient, konečně máme
A klesající faktoriál. Výpočet OGF nepodepsaných Stirlingových čísel prvního druhu funguje podobným způsobem.
Očekávaný počet cyklů dané velikosti m
V tomto problému používáme funkci generování bivariate G(z, u), jak je popsáno v úvodu. Hodnota b pro cyklus, který nemá velikost m je nula a jedna pro cyklus velikosti m. My máme
nebo
To znamená, že očekávaný počet cyklů velikosti m v permutaci délky n méně než m je nula (samozřejmě). Minimálně náhodná permutace m obsahuje v průměru 1 /m cykly délky m. Zejména náhodná permutace obsahuje přibližně jeden pevný bod.
OGF očekávaného počtu cyklů o délce menší nebo rovné m je tedy
kde Hm je mth harmonické číslo. Proto je očekávaný maximální počet cyklů délky m v náhodné permutaci je asi lnm.
Okamžiky pevných bodů
Smíšený GF množiny permutací počtem pevných bodů je
Nechte náhodnou proměnnou X být počet pevných bodů náhodné permutace. Použití Stirlingova čísla druhého druhu, máme následující vzorec pro mTřetí okamžik X:
kde je klesající faktoriál.Použitím , my máme
což je nula, když a jeden jinak. Proto pouze termíny s přispějte k této částce
Očekávaný počet pevných bodů v náhodné permutaci zvýšený na určitou sílu k
Předpokládejme, že vyberete náhodnou permutaci a pozvednout to na nějakou moc , s kladné celé číslo a zeptat se na očekávaný počet pevných bodů ve výsledku. Označte tuto hodnotu .
Pro každého dělitele z cyklus délky rozděluje na pevné body při zvednutí na sílu Proto musíme tyto cykly označit Pro ilustraci to zvažte
Dostaneme
který je
Ještě jednou pokračujeme, jak je popsáno v úvodu, zjistíme
který je
Závěr je takový pro a v průměru existují čtyři pevné body.
Obecný postup je
Zjistili jsme, že ještě jednou pokračujeme jako předtím
Ukázali jsme, že hodnota je rovný (dále jen počet dělitelů z ) Jakmile Začíná to na pro a pokaždé se zvýší o jednu zasáhne dělitele až do sám.
Očekávaný počet cyklů libovolné délky náhodné permutace
Sestavíme funkci generování bivariate použitím , kde je jeden pro všechny cykly (každý cyklus přispívá jedním k celkovému počtu cyklů).
Všimněte si, že má uzavřenou formu
a generuje nepodepsané Stirlingova čísla prvního druhu.
My máme
Očekávaný počet cyklů je tedy harmonické číslo , nebo o .
Počet permutací s cyklem délky větším než n/2
(Všimněte si této části Sto vězňů obsahuje přesně stejný problém s velmi podobným výpočtem, plus také jednodušší elementární důkaz.)
Ještě jednou začněte s funkcí exponenciálního generování , tentokrát ve třídě permutací podle velikosti, kde cykly délky větší než jsou označeny proměnnou :
Může existovat pouze jeden cyklus délky větší než , proto je odpověď na otázku dána
nebo
který je
Exponent exponentu v termínu pozvednutí k moci je větší než a tedy žádná hodnota pro může případně přispět k
Z toho vyplývá, že odpověď je
Součet má alternativní zastoupení, se kterým se člověk setká např. v OEIS OEIS: A024167.
konečně dávat
Očekávaný počet transpozic náhodné permutace
Můžeme použít rozklad disjunktního cyklu permutace k jeho faktorizaci jako produktu transpozic nahrazením cyklu délky k podle k - 1 provedení. Např. cyklu faktory jako . Funkce pro cykly se rovná a získáme
a
Proto očekávaný počet provedení je
kde je Harmonické číslo Tento vzorec jsme mohli získat také tak, že si všimneme, že počet transpozic se získá přidáním délek všech cyklů (což dává n) a odečtením jednoho pro každý cyklus (což dává podle předchozí části).
Všimněte si, že opět generuje nepodepsané Stirlingova čísla prvního druhu, ale v opačném pořadí. Přesněji, máme
Chcete-li to vidět, nezapomeňte, že výše uvedené je ekvivalentní s
a to
které jsme viděli jako EGF nepodepsaných Stirlingových čísel prvního druhu v sekci o permutacích sestávajících z přesně m cykly.
Očekávaná velikost cyklu náhodného prvku
Vybereme náhodný prvek q náhodné permutace a zeptejte se na očekávanou velikost cyklu, který obsahuje q. Zde funkce je rovný , protože cyklus délky k přispívá k prvky, které jsou na délkových cyklech k. Všimněte si, že na rozdíl od předchozích výpočtů musíme tento parametr průměrovat poté, co jej extrahujeme z generující funkce (děleno n). My máme
Proto předpokládaná délka cyklu, který obsahuje q je
Pravděpodobnost, že náhodný prvek leží na cyklu velikosti m
Tento průměrný parametr představuje pravděpodobnost, že pokud znovu vybereme náhodný prvek náhodné permutace prvek leží na cyklu velikosti m. Funkce je rovný pro a nula jinak, protože pouze cykly délky m přispívat, jmenovitě m prvky, které leží na cyklu délky m. My máme
It follows that the probability that a random element lies on a cycle of length m je