Vysokofrekvenční data - High frequency data

Vysokofrekvenční data odkazuje na data časových řad shromážděny v extrémně jemném měřítku. V důsledku pokročilého výpočetního výkonu v posledních desetiletích lze vysokofrekvenční data přesně sbírat účinnou rychlostí pro analýzu.[1] Většinou se používá ve finanční analýze a v vysokofrekvenční obchodování, poskytuje vysokofrekvenční data intraday pozorování, která lze použít k pochopení tržního chování, dynamiky a mikrostruktur.[2]

Vysokofrekvenční sběr dat byl původně formulován hromaděním údajů o trhu tick-by-tick, podle nichž je každá jednotlivá „událost“ (transakce, nabídka, pohyb ceny atd.) Charakterizována „tickem“ nebo jednou logickou jednotkou informací. Vzhledem k velkému množství klíšťat za jediný den vysokofrekvenční sběr dat obvykle obsahuje velké množství dat, což umožňuje vysokou statistickou přesnost.[3] Vysokofrekvenční pozorování během jednoho dne likvidního trhu se mohou rovnat množství denních údajů shromážděných za 30 let.[3]

Použití

Data shromážděná na vysokých frekvencích informují a aktualizují statistiky zásob v reálném čase

Z důvodu zavedení elektronických forem obchodování a Internet - poskytovatelé dat na základě dat, vysokofrekvenční data se stala mnohem dostupnějšími a mohou člověku umožnit sledovat tvorbu cen v reálném čase. To vyústilo ve velkou novou oblast výzkumu v oblasti vysokofrekvenčních dat, kde akademici a vědci využívají charakteristiky vysokofrekvenčních dat k vývoji adekvátních modelů pro předpovídání budoucích pohybů trhu a rizik.[3] Modelové předpovědi pokrývají širokou škálu tržního chování včetně objem, volatilita, pohyb cen a optimalizace umístění.[4]

O údaje o transakcích i nadále existuje zájem regulačních agentur i akademické obce kniha limitních objednávek data, z nichž lze pomocí vysokofrekvenčních datových modelů hodnotit větší dopady na obchod a tržní chování, jakož i tržní výsledky a dynamiku. Regulační agentury se o tyto modely velmi zajímají kvůli skutečnosti, že riziko likvidity a ceny není plně pochopeno z hlediska novějších forem automatizovaných obchodních aplikací.[4]

Vysokofrekvenční datové studie obsahují hodnotu v jejich schopnosti sledovat nepravidelné aktivity na trhu po určitou dobu. Tyto informace umožňují lepší pochopení cenové a obchodní aktivity a chování. Vzhledem k důležitosti načasování tržních událostí vyžadují vysokofrekvenční data analýzu pomocí bodové procesy, které závisí na pozorováních a historii, aby charakterizovaly náhodné výskyty událostí.[4] Toto porozumění bylo poprvé vyvinuto v roce 2003 nositelem Nobelovy ceny za ekonomii Robert Fry Engle III, který se specializuje na vývoj finanční ekonometrická analytické metody využívající finanční data a bodové procesy.[4]

Vysokofrekvenční datové formuláře

Vysokofrekvenční data se používají především ve finančním výzkumu a akciový trh analýza. Kdykoli se zpracovává obchod, nabídka nebo elektronická objednávka, jsou související údaje shromažďovány a zadávány do a časové řady formát. Jako taková jsou vysokofrekvenční data často označována jako transakční data.[4]

Existuje pět širokých úrovní vysokofrekvenčních dat, která se získávají a používají při průzkumu a analýze trhu:

Obchodní údaje

Jednotlivé obchodní údaje shromážděné v určitém intervalu v časové řadě.[4] Existují dvě hlavní proměnné, které popisují jeden bod obchodních údajů: čas transakce a vektor známý jako „značka“, který charakterizuje podrobnosti transakční události.[5]

Údaje o obchodu a nabídce

Data shromažďují podrobnosti o obchodech i nabídkách, včetně cenových změn a směru, časových razítek a objemu. Tyto informace lze najít na TAQ (Obchod a nabídka ) databáze provozovaná NYSE.[4] Pokud obchodní údaje podrobně popisují samotnou výměnu transakce, uveďte podrobnosti údajů o optimálních obchodních podmínkách pro danou výměnu. Tyto informace mohou naznačovat zastavení výměn a úvodních i závěrečných nabídek.[6]

Data knihy objednávek na pevné úrovni

Pomocí systémů, které byly zcela počítačové, lze hloubku trhu posoudit pomocí omezit objednávku činnosti, které se vyskytují na pozadí daného trhu.[4]

Zprávy o všech aktivitách s omezením objednávky

Tato datová úroveň zobrazuje veškeré okolní informace omezit objednávku činnosti a může vytvořit reprodukci obchodní tok kdykoli pomocí informací o časových razítcích, zrušeních a identifikaci kupujícího / prodejce.[4]

Údaje o snímcích knihy objednávek

Lze zaznamenávat snímky aktivit knihy objednávek stejně vzdálený založené mřížky, aby se omezila potřeba reprodukovat knihu objednávek. To však omezuje schopnost obchodní analýzy, a je proto užitečnější pro pochopení dynamiky než pro interakci knih a obchodování.[4]

Vlastnosti ve finanční analýze

Ve finanční analýze lze vysokofrekvenční data organizovat v různých časových měřítcích od minut po roky.[3] Jelikož vysokofrekvenční data přicházejí v převážně disagregované formě v průběhu časové řady ve srovnání s metodami sběru dat s nižší frekvencí, obsahují různé jedinečné vlastnosti, které mění způsob, jakým jsou data chápána a analyzována. Robert Fry Engle III kategorizuje tyto odlišné charakteristiky jako nepravidelný časový odstup, diskrétnost, denní vzorce a časová závislost.[7]

Vysokofrekvenční data vynesená v čase do indexového grafu FTSE 100

Nepravidelný časový odstup

Vysokofrekvenční data využívají shromažďování velkého množství dat v časové řadě a jako taková má frekvence sběru jednotlivých dat tendenci být v průběhu času rozložena v nepravidelných vzorcích. To je obzvláště jasné v analýze finančního trhu, kde mohou transakce probíhat postupně nebo po delší době nečinnosti.[7]

Diskrétnost

Vysokofrekvenční data z velké části zahrnují ceny a transakce, jejichž institucionální pravidla zabraňují drastickému růstu nebo pádu během krátké doby. To má za následek změny dat na základě míry jednoho klíště.[7] Tato snížená schopnost fluktuace činí data při jejich použití diskrétnějšími, například na burze cenných papírů, kde populární akcie mají tendenci zůstat do 5 tiků pohybu. Vzhledem k úrovni diskrétnosti vysokofrekvenčních dat má tendenci být vysoká úroveň špičatost přítomný v sadě.[7]

Denní vzory

Analýza, kterou poprvé provedli Engle a Russel v roce 1998, uvádí, že vysokofrekvenční data následují a denní vzor, přičemž doba mezi obchody je nejmenší na otevřeném a zavřeném trhu. Některé zahraniční trhy, které fungují 24 hodin denně, stále vykazují denní vzorce založené na denní době.[7]

Časová závislost

Vzhledem k diskrétnosti cen jsou údaje o vysoké frekvenci časově závislé. Rozpětí vynucené malými rozdíly v nákupních a prodejních cenách vytváří trend, který tlačí cenu konkrétním směrem. Podobně se doba trvání a transakční sazby mezi obchody mají tendenci shlukovat, což značí závislost na časových změnách ceny.[7]

Údaje o velmi vysoké frekvenci

V pozorování poznamenal Robert Fry Engle III, dostupnost vyšších frekvencí dat v průběhu času podněcovala k pohybu z let, na měsíce, do intraday sbírky finančních údajů. Tento pohyb však není nekonečný při přechodu na vyšší frekvence, ale čelí limitu, když jsou nakonec zaznamenány všechny transakce.[5] Engle vytvořil tuto mezní úroveň frekvence jako ultravysokofrekvenční data. Vynikající kvalitou této maximální frekvence jsou extrémně nepravidelně rozmístěná data, kvůli velkému rozpětí času, které ukládá disagregovaná sbírka.[5] Spíše než přerušovat sekvenci ultravysokofrekvenčních dat podle časových intervalů, což by v zásadě způsobilo ztrátu dat a způsobilo by nižší frekvenci sady, metody a modely, jako je autoregresní podmíněný model trvání lze použít ke zvážení různých čekacích dob mezi sběrem dat.[5] Efektivní zpracování ultravysokofrekvenčních dat lze použít ke zvýšení přesnosti ekonometrických analýz. Toho lze dosáhnout dvěma procesy: čištěním a správou dat.[6]

Čištění dat

Čištění datnebo čištění dat, je proces využívající algoritmické funkce k odstranění nepotřebných, irelevantních a nesprávných dat z vysokofrekvenčních datových sad.[6] Analýza ultravysokofrekvenčních dat vyžaduje čistý vzorek záznamů, aby byla užitečná pro studium. Jak se zvyšují rychlosti v ultravysokofrekvenčním sběru, bude pravděpodobně ve sběru identifikováno více chyb a irelevantních dat.[6] Chyby, které se vyskytnou, lze připsat lidská chyba, jak úmyslné (např. „fiktivní“ uvozovky), tak neúmyslné (např. chyba při psaní ) nebo chyba počítače, ke které dochází při technických poruchách.[8]

Správa dat

Správa dat odkazuje na proces výběru konkrétní časové řady zájmu v rámci souboru ultravysokofrekvenčních dat, která mají být vytažena a uspořádána pro účely analýzy. Mohou být hlášeny různé transakce současně a na různých cenových úrovních a ekonometrické modely obecně vyžadují jedno pozorování u každého časového razítka, což vyžaduje určitou formu agregace dat pro správnou analýzu.[6] Úsilí o správu dat může být efektivní k nápravě ultravysokofrekvenčních datových charakteristik, včetně nepravidelného rozestupu, odrazu nabídky a poptávky a otevření a uzavření trhu.[6]

Alternativní použití mimo finanční obchodování

Studie zveřejněná v Sladkovodní biologie časopis zaměřený na epizodické povětrnostní vlivy na jezera zdůrazňuje použití vysokofrekvenčních dat k dalšímu porozumění meteorologické řidiči a důsledky „událostí“ nebo náhlých změn fyzikálních, chemických a biologických parametrů jezera.[9] Vzhledem k pokroku v technologii sběru dat a lidských sítích spolu s umístěním vysokofrekvenčních monitorovacích stanic u různých typů jezer lze tyto události efektivněji prozkoumat. Použití vysokofrekvenčních dat v těchto studiích je považováno za důležitý faktor umožňující analýzy rychle se vyskytujících změn počasí na jezerech, jako je rychlost větru a srážky, lepší porozumění kapacitám jezer pro zvládnutí událostí v důsledku rostoucí závažnosti bouře a klimatická změna.[9]

Vysokofrekvenční data byla shledána užitečnými při predikci inflace. Studie od Michele Mondugno v International Journal of Forecasting naznačuje, že použití denních a měsíčních dat s vysokou frekvencí obecně zlepšilo přesnost předpovědi celkem CPI inflace ve Spojených státech.[10] Studie využila srovnání modelů s nižší frekvencí s modelem, který zohledňoval všechny proměnné s vysokou frekvencí. Nakonec bylo zjištěno, že vyšší přesnost vysoce volatilní dopravní a energetické složky cen ve vysokofrekvenčním modelu inflace vedla k vyššímu výkonu a přesnějším výsledkům.[10]

Použití poločas rozpadu odhad vyhodnotit rychlosti průměrná reverze v ekonomických a finančních proměnných čelil problémům, pokud jde o odběr vzorků, protože poločas asi 13,53 let by vyžadoval 147 let ročních údajů podle raných Procesní modely AR.[11] Výsledkem je, že někteří vědci využili vysokofrekvenční data k odhadu ročních dat poločasu. Zatímco použití vysokofrekvenčních dat může čelit určitým omezením při objevování skutečného poločasu, zejména prostřednictvím zaujatost odhadce, využívající vysokou frekvenci ARMA model bylo zjištěno, že důsledně a efektivně odhaduje poločas s dlouhými ročními daty.[11]

Viz také

Reference

  1. ^ Ruey S. Tsay (2000) Úvod editora do panelové diskuse o analýze vysokofrekvenčních dat, Journal of Business & Economic Statistics, 18:2, 139-139, doi:10.1080/07350015.2000.10524855
  2. ^ Andersen, T. G. (2000). Některé úvahy o analýze vysokofrekvenčních dat. Journal of Business & Economic Statistics, 18(2), 146-153. doi:10.1080/07350015.2000.10524857
  3. ^ A b C d Dacorogna, M. M. (2001). Úvod do vysokofrekvenčního financování. San Diego: Academic Press.
  4. ^ A b C d E F G h i j Hautsch, N., & SpringerLink (služba online). (2012; 2011;). Ekonometrie finančních vysokofrekvenčních dat (2012. ed.). Heidelberg; Berlín ;: Springer. doi:10.1007/978-3-642-21925-2
  5. ^ A b C d Engle, R. F. (2000). Ekonometrie ultravysokofrekvenčních dat. Econometrica, 68(1), 1-22. doi:10.1111/1468-0262.00091
  6. ^ A b C d E F Brownlees, C. T., a Gallo, G. M. (2006). Finanční ekonometrická analýza na velmi vysoké frekvenci: obavy ohledně zpracování dat. Výpočetní statistika a analýza dat, 51 (4), 2232-2245. doi:10.1016 / j.csda.2006.09.030
  7. ^ A b C d E F R. Russell, Jeffrey & F. Engle, Robert. (2010). Analýza vysokofrekvenčních dat. Příručka finanční ekonometrie, svazek 1. 383-426. 10.1016 / B978-0-444-50897-3.50010-9.
  8. ^ Verousis, T. a Ap Gwilym, O. (2010). Vylepšený algoritmus pro čištění ultravysokofrekvenčních dat. Journal of Derivatives & Hedge Funds, 15(4), 323-340. doi:10.1057 / jdhf.2009.16
  9. ^ A b JENNINGS, E., JONES, S., ARVOLA, L., STAEHR, P. A., GAISER, E., JONES, I. D., Teknisk-naturvetenskapliga vetenskapsområdet. (2012). Účinky epizodických událostí souvisejících s počasím v jezerech: Analýza založená na vysokofrekvenčních datech. Sladkovodní biologie, 57(3), 589-601. doi:10.1111 / j.1365-2427.2011.02729.x
  10. ^ A b Modugno, M. (2013). Nyní vyvolává inflaci pomocí vysokofrekvenčních dat. International Journal of Forecasting, 29(4), 664-675. doi:10.1016 / j.ijforecast.2012.12.003
  11. ^ A b Huang, M., Liao, S., & Lin, K. (2015). Rozšířený odhad poločasu na základě vysokofrekvenčních dat. Journal of Forecasting, 34(7), 523-532. doi:10,1002 / za 2342