v počítačové sítě, sebepodobnost je funkce dynamiky přenosu dat v síti. Při modelování dynamiky síťových dat se používají tradiční modely časových řad, například autoregresní model klouzavého průměru (ARMA (p, q)), nejsou vhodné. Je to proto, že tyto modely poskytují pouze konečný počet parametrů v modelu a tedy interakci v konečném časovém okně, ale síťová data mají obvykle závislé na velké vzdálenosti časová struktura. Self-podobný proces je jedním ze způsobů modelování dynamiky síťových dat s takovým dlouhým dosahem korelace. Tento článek definuje a popisuje dynamiku přenosu dat v síti v kontextu podobného procesu. Jsou uvedeny vlastnosti procesu a jsou uvedeny metody pro vytváření grafů a odhad parametrů modelování sebepodobnosti síťových dat.
Definice
Předpokládat
být slabě stacionární (stacionární) proces 2. řádu s průměrem
rozptyl
, a autokorelace funkce
Předpokládejme, že funkce autokorelace
má formu
tak jako
, kde
a
je pomalu se měnící funkce na nekonečno, to je
pro všechny
.Například,
a
jsou pomalu se měnící funkce.
Nechat
,kde
, označuje agregovanou řadu bodů přes nepřekrývající se bloky velikosti
, pro každého
je kladné celé číslo.
Přesně podobný proces
se nazývá přesně podobný proces, pokud existuje podobný parametr
takhle
má stejnou distribuci jako
. Příklad přesně podobného procesu s
je Frakční Gaussův šum (FGN) s
.
Definice: Fractional Gaussian Noise (FGN)
se nazývá Fractional Gaussian Noise, kde
je Frakční Brownův pohyb.[1]
přesně podobný proces druhého řádu
se nazývá přesně podobný samoobslužný proces druhého řádu, pokud existuje obdobný parametr
takhle
má stejnou odchylku a autokorelaci jako
.
asymptotický podobný proces druhého řádu
se nazývá asymptotické sebepodobný proces druhého řádu s obdobným parametrem
-li
tak jako
, 
Některé relativní situace podobných procesů
Závislost na velké vzdálenosti (LRD)
Předpokládat
být slabě stacionární (stacionární 2. řád) proces s průměrem
a rozptyl
. Funkce autokorelace (ACF) se zpožděním
darováno ![gamma (t) = {{ mathrm {cov}} (X (h), X (h + t)) over sigma ^ {2}} = {E [(X (h) - mu) ( X (h + t) - mu)] přes sigma ^ {2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/20e83e74582dbb3dfaeaac64f833ff4a333460ce)
Definice:
Za slabě stacionární proces se považuje „závislost na velké vzdálenosti“, pokud 
Proces, který uspokojuje
tak jako
se říká, že má závislost na velké vzdálenosti. The spektrální hustota následuje funkce závislosti na velké vzdálenosti a mocenský zákon blízko původu. Ekvivalentně k
,
má závislost na velké vzdálenosti, pokud je funkce spektrální hustoty autokorelační funkce,
, má podobu
tak jako
kde
,
se pomalu mění na 0.
také vidět
Pomalu se rozpadající odchylky

Když funkce autokorelace podobného procesu vyhovuje
tak jako
, to znamená, že také uspokojuje
tak jako
, kde
je konečná kladná konstanta nezávislá na m a 0 <β <1.
Odhad parametru vlastní podobnosti "H"
R / S analýza
Předpokládejme, že podkladový proces
je Fractional Gaussian Noise. Zvažte sérii
a nechte
.
Rozptyl vzorku z
je 
Definice: Statistika R / S
![{ frac {R} {S}} (n) = { frac {1} {S (n)}} [ max _ {{0 leq t leq n}} (Y_ {t} - { frac {t} {n}} Y_ {n}) - min _ {{0 leq t leq n}} (Y_ {t} - { frac {t} {n}} Y_ {n})]](https://wikimedia.org/api/rest_v1/media/math/render/svg/e1f742593cafcddd727721274a337af8f241432c)
Li
je tedy FGN 
Zvažte použití regresního modelu:
, kde
Zejména pro časovou řadu délky
rozdělit data časové řady na
skupiny každé velikosti
, vypočítat
pro každou skupinu.
Tak pro každé n máme
dvojice dat (
).Existují
body za každého
, takže se nám vejde a regresní model odhadovat
přesněji. Pokud je sklon regresní přímka je mezi 0,5 ~ 1, jedná se o podobný proces.
Časově závislý graf
Rozptyl výběrového průměru je dán vztahem
.
Pro odhad H vypočítat vzorek znamená
pro
dílčí řada délky
.
Celkový průměr může být dán vztahem
, rozptyl vzorku
.
Grafy rozptylu a času se získají vynesením
proti
a můžeme vložit jednoduchou nejmenší čtvercovou čáru přes výsledné body v rovině ignorující malé hodnoty k.
Pro velké hodnoty
se očekává, že body v grafu budou rozptýleny kolem přímky se záporným sklonem
Pro závislost na krátkém dosahu nebo nezávislost mezi pozorováními je sklon přímky roven -1.
Autopodobnost lze odvodit z hodnot odhadovaného sklonu, který je asymptoticky mezi –1 a 0, a odhad míry sebepodobnosti je dán vztahem 
Analýza založená na periodogramu
Whittleův přibližný odhad maximální pravděpodobnosti (MLE ) se používá k vyřešení parametru Hurst prostřednictvím spektrální hustota z
. Nejde jen o nástroj pro vizualizaci Hurstova parametru, ale také o metodu statistického odvození parametrů pomocí asymptotických vlastností MLE. Zejména,
následuje a Gaussův proces. Nechte spektrální hustotu
,
, kde
, a
postavit model autoregrese časových řad krátkého dosahu (AR), to znamená
,s
.
Tedy odhadce Whittle
z
minimalizovat funkci
, kde I (w) označuje periodogram X jako
a
. Tyto integrace lze posoudit Riemannovým součtem.
Pak
asymptoticky následuje normální rozdělení, pokud
lze vyjádřit jako formu modelu nekonečného klouzavého průměru.
Odhadovat
, nejprve je třeba vypočítat tento periodogram. Od té doby
je odhad spektrální hustoty, série se závislostí na velké vzdálenosti by měla mít periodogram, který je úměrný
blízký původu. Graf periodogramu se získá vynesením
proti
.
Pak se hodí regresní model
na
by měl dát sklon
. Sklon upravené přímky je také odhadem
. Tedy odhad
je získáno.
Poznámka:
Při použití metody periodogramu existují dva běžné problémy. Za prvé, pokud data nenásledují Gaussovo rozdělení, transformace dat může vyřešit tento druh problémů. Zadruhé, spektrum vzorku, které se odchyluje od předpokládané spektrální hustoty, je další. K řešení tohoto problému se navrhuje metoda agregace. Li
je Gaussův proces a funkce spektrální hustoty
splňuje
tak jako
, funkce,
, konverguje v distribuci na FGN as
.
Reference
- P. Whittle, „Odhad a informace ve stacionárních časových řadách“, čl. Rohož. 2, 423-434, 1953.
- K. PARK, W. WILLINGER, Self-Similar Network Traffic and Performance Evaluation, WILEY, 2000.
- W. E. Leland, W. Willinger, M. S. Taqqu, D. V. Wilson, „O sebepodobné povaze ethernetového provozu“, ACM SIGCOMM Computer Communication Review 25,202-213,1995.
- W. Willinger, M. S. Taqqu, W. E. Leland, D. V. Wilson, „Self-Podobnost ve vysokorychlostním paketovém provozu: Analýza a modelování měření ethernetového provozu“, Statistics Science 10,67-85,1995.
- ^ W. E. Leland, W. Willinger, M. S. Taqqu, D. V. Wilson, „O sebepodobné povaze ethernetového provozu“, ACM SIGCOMM Computer Communication Review 25,202-213,1995.