Počítačový experiment - Computer experiment
A počítačový experiment nebo simulační experiment je experiment používaný ke studiu počítačové simulace, označovaný také jako in silico Systém. Tato oblast zahrnuje výpočetní fyzika, výpočetní chemie, výpočetní biologie a další podobné disciplíny.
Pozadí
Počítačové simulace jsou konstruovány tak, aby napodobovaly fyzický systém. Protože jsou určeny k podrobnému replikování některých aspektů systému, často nepřinášejí analytické řešení. Proto metody jako diskrétní simulace událostí nebo konečný element používají se řešitelé. A počítačový model se používá k vyvození závěrů o systému, který replikuje. Například, klimatické modely jsou často používány, protože experimentování na objektu velikosti Země je nemožné.
Cíle
Počítačové experimenty byly použity s ohledem na mnoho účelů. Mezi ně patří:
- Kvantifikace nejistoty: Charakterizujte nejistotu přítomnou v počítačové simulaci vyplývající z neznámých během konstrukce počítačové simulace.
- Inverzní problémy: Objevte základní vlastnosti systému z fyzických dat.
- Oprava zkreslení: Pomocí fyzických dat opravte odchylku v simulaci.
- Asimilace dat: Zkombinujte více simulací a zdrojů fyzických dat do kompletního prediktivního modelu.
- Návrh systémů: Najděte vstupy, které vedou k optimálnímu měření výkonu systému.
Počítačové simulační modelování
Modelování počítačových experimentů obvykle používá Bayesiánský rámec. Bayesovské statistiky je interpretací oboru statistika kde jsou všechny důkazy o skutečném stavu světa výslovně vyjádřeny ve formě pravděpodobnosti. V oblasti počítačových experimentů by bayesovská interpretace znamenala, že musíme vytvořit a předchozí distribuce což představuje naši předchozí víru ve strukturu počítačového modelu. Použití této filozofie pro počítačové experimenty začalo v 80. letech a je pěkně shrnuto v Sacks et al. (1989) [1]. Zatímco Bayesovský přístup je široce používán, častý přístupy byly nedávno diskutovány [2].
Základní myšlenkou tohoto rámce je modelovat počítačovou simulaci jako neznámou funkci sady vstupů. Počítačová simulace je implementována jako část počítačového kódu, který lze vyhodnotit a vytvořit kolekci výstupů. Příkladem vstupů do těchto simulací jsou koeficienty v základním modelu, počáteční podmínky a vynucující funkce. Je přirozené vidět simulaci jako deterministickou funkci, která je mapuje vstupy do sbírky výstupy. Na základě tohoto pohledu na náš simulátor je běžné označovat shromažďování vstupů jako , samotná počítačová simulace jako a výsledný výstup jako . Oba a jsou vektorové veličiny a mohou to být velmi velké sbírky hodnot, často indexované prostorem nebo časem nebo prostorem i časem.
Ačkoli je v zásadě známo, v praxi tomu tak není. Mnoho simulátorů obsahuje desítky tisíc řádků počítačového kódu na vysoké úrovni, který není přístupný intuici. U některých simulací, jako jsou klimatické modely, může vyhodnocení výstupu pro jednu sadu vstupů vyžadovat miliony počítačových hodin [3].
Gaussův proces před
Typickým modelem pro výstup počítačového kódu je Gaussův proces. Pro jednoduchost zápisu předpokládejme je skalární. Vzhledem k Bayesovskému rámci opravujeme naše přesvědčení, že funkce následuje a Gaussův proces,kde je střední funkce a je kovarianční funkce. Populární střední funkce jsou polynomy nízkého řádu a populární kovarianční funkce je Mateřská kovariance, který zahrnuje jak exponenciální () a gaussovské kovariance (jako ).
Návrh počítačových experimentů
Návrh počítačových experimentů má značné rozdíly od návrh experimentů pro parametrické modely. Vzhledem k tomu, že Gaussův proces předchozí má nekonečné dimenzionální zastoupení, koncepty kritérií A a D (viz Optimální design ), které se zaměřují na snížení chyby v parametrech, nelze použít. Replikace by byly také zbytečné v případech, kdy počítačová simulace nemá žádnou chybu. Kritéria, která se používají k určení dobrého experimentálního designu, zahrnují integrovanou střední predikční chybu [4] a na základě vzdálenosti [5].
Mezi oblíbené strategie designu patří latinské hyperkrychle vzorkování a sekvence s nízkou odchylkou.
Problémy s obrovskými velikostmi vzorků
Na rozdíl od fyzikálních experimentů je běžné, že počítačové experimenty obsahují tisíce různých vstupních kombinací. Protože standardní odvození vyžaduje inverze matice čtvercové matice o velikosti počtu vzorků (), náklady rostou na . Maticová inverze velkých a hustých matic může také způsobit numerické nepřesnosti. V současné době je tento problém řešen chamtivými technikami rozhodovacího stromu, které umožňují efektivní výpočty pro neomezenou dimenzi a velikost vzorku patent WO2013055257A1, nebo se jim vyhnout použitím aproximačních metod, např. [6].
Viz také
- Simulace
- Kvantifikace nejistoty
- Bayesovské statistiky
- Emulátor Gaussova procesu
- Návrh experimentů
- Molekulární dynamika
- Metoda Monte Carlo
- Náhradní model
- Vyplnění a ověření šedého pole
Další čtení
- Santner, Thomas (2003). Návrh a analýza počítačových experimentů. Berlín: Springer. ISBN 0-387-95420-1.
- Fehr, Jörg; Heiland, Jan; Himpe, Christian; Saak, Jens (2016). „Osvědčené postupy pro replikovatelnost, reprodukovatelnost a opakovanou použitelnost počítačových experimentů ilustrované softwarem pro redukci modelu“. CÍLE Matematika. 1 (3): 261–281. arXiv:1607.01191. doi:10.3934 / Math.2016.3.261.