Savitzky – Golayův filtr - Savitzky–Golay filter - Wikipedia

A Savitzky – Golayův filtr je digitální filtr které lze použít na sadu digitální data body za účelem vyhlazení data, to znamená zvýšit přesnost dat bez narušení tendence signálu. Toho je dosaženo v procesu známém jako konvoluce, přizpůsobením postupných dílčích sad sousedních datových bodů s nízkým stupněm polynomiální metodou lineární nejmenší čtverce. Když jsou datové body rovnoměrně rozmístěny, an analytické řešení rovnice nejmenších čtverců lze nalézt ve formě jediné sady „konvolučních koeficientů“, které lze použít na všechny datové podskupiny, a poskytnout odhady vyhlazeného signálu (nebo derivátů vyhlazeného signálu) na centrální bod každé podskupiny. Metoda založená na zavedených matematických postupech[1][2] byl popularizován Abraham Savitzky a Marcel J. E. Golay, který v roce 1964 publikoval tabulky konvolučních koeficientů pro různé polynomy a velikosti podmnožiny.[3][4] Některé chyby v tabulkách byly opraveny.[5] Metoda byla rozšířena pro zpracování 2 a 3-dimenzionálních dat.
Savitzky and Golay's paper je jedním z nejčastěji citovaných článků v časopise Analytická chemie[6] a je tímto deníkem klasifikován jako jeden ze svých „10 klíčových článků“, který říká „lze tvrdit, že úsvit počítačově řízeného analytického nástroje lze vysledovat až k tomuto článku“.[7]
Aplikace
Data se skládají ze sady bodů {Xj, yj}, j = 1, ..., n, kde X je nezávislá proměnná a yj je pozorovaná hodnota. Jsou ošetřeni sadou m konvoluční koeficienty, Ci, podle výrazu
Vybrané konvoluční koeficienty jsou uvedeny v tabulky níže. Například pro vyhlazení 5bodovým kvadratickým polynomem, m = 5, i = -2, -1, 0, 1, 2 a jth vyhlazený datový bod, Yj, je dána
- ,
kde, C−2 = −3/35, C−1 = 12/35 atd. Existuje mnoho aplikací vyhlazování, které se provádí především proto, aby se data zdala být méně hlučná, než ve skutečnosti jsou. Následují aplikace numerické diferenciace dat.[8] Poznámka Při výpočtu nth derivát, další měřítko faktor lze použít na všechny vypočítané datové body k získání absolutních hodnot (viz výrazy pro (níže, podrobnosti).





- Umístění maxima a minima v experimentálních datových křivkách. To byla aplikace, která Savitzkyho nejprve motivovala.[4] První derivace funkce je nula na maximu nebo minimu. Diagram ukazuje datové body patřící k syntetickému Lorentzian křivka s přidaným šumem (modré diamanty). Data jsou vynesena na stupnici poloviční šířky vzhledem k maximu píku při nule. Vyhlazená křivka (červená čára) a 1. derivace (zelená) byly vypočítány pomocí 7bodových kubických filtrů Savitzky – Golay. Lineární interpolace prvních hodnot derivace v pozicích na obou stranách nulového přechodu udává polohu maxima špičky. K tomuto účelu lze také použít třetí deriváty.
- Umístění koncového bodu v a titrační křivka. Koncový bod je inflexní bod kde druhá derivace funkce je nula.[9] Titrační křivka pro kyselina mallonová ilustruje sílu metody. První koncový bod při 4 ml je sotva viditelný, ale druhý derivát umožňuje jeho hodnotu snadno určit lineární interpolací k nalezení přechodu nuly.
- Zploštění základní linie. v analytická chemie někdy je nutné změřit výšku absorpční pásmo proti zakřivené základní linii.[10] Protože zakřivení základní linie je mnohem menší než zakřivení absorpčního pásma, druhá derivace účinně zplošťuje základní linii. Tři měřítka výšky derivace, která je úměrná výšce absorpčního pásma, jsou vzdálenosti „peak-to-valley“ h1 a h2 a výška od základní linie, h3.[11]
- Vylepšení rozlišení ve spektroskopii. Pásma ve druhé derivaci spektroskopické křivky jsou užší než pásma ve spektru: zmenšila se poloviční šířka. To umožňuje, aby byly částečně překrývající se pásma „vyřešeny“ na samostatné (negativní) vrcholy.[12] Diagram ilustruje, jak to lze použít také pro chemický rozbor pomocí měření vzdáleností „peak-to-valley“. V tomto případě jsou údolí majetkem 2. derivace Lorentzian. (X-osová poloha je relativní k poloze maxima špičky na stupnici od poloviční šířka v poloviční výšce ).
- Vylepšení rozlišení pomocí 4. derivace (pozitivní vrcholy). Minima jsou vlastností 4. derivace Lorentziana.
Klouzavý průměr
Filtr klouzavého průměru se běžně používá s daty časových řad k vyhlazení krátkodobých výkyvů a zvýraznění dlouhodobějších trendů nebo cyklů. Často se používá v technické analýze finančních údajů, jako jsou ceny akcií, výnosy nebo objemy obchodování. Používá se také v ekonomii ke zkoumání hrubého domácího produktu, zaměstnanosti nebo jiných makroekonomických časových řad.
Filtr neváženého klouzavého průměru je nejjednodušší filtr konvoluce. Každá podmnožina datové sady je opatřena přímou vodorovnou čarou. Nebylo zahrnuto do Savitzsky-Golayových tabulek konvolučních koeficientů, protože všechny hodnoty koeficientů se jednoduše rovnou 1/m.
Odvození konvolučních koeficientů
Když jsou datové body rovnoměrně rozmístěny, an analytické řešení lze najít rovnice nejmenších čtverců.[2] Toto řešení tvoří základ konvoluce metoda numerického vyhlazení a diferenciace. Předpokládejme, že data se skládají ze sady n body (Xj, yj) (j = 1, ..., n), kde X je nezávislá proměnná a yj je vztažná hodnota. Polynom bude doplněn o lineární nejmenší čtverce na sadu m (liché číslo) sousední datové body, každý oddělen intervalem h. Nejprve se provede změna proměnné
kde je hodnota centrálního bodu. z bere hodnoty (např. m = 5 → z = −2, −1, 0, 1, 2).[poznámka 1] Polynom, stupně k je definován jako
Koeficienty A0, A1 atd. jsou získány řešením normální rovnice (tučně A představuje a vektor, tučně J představuje a matice ).
kde je Vandermondeova matice, to je -tá řada má hodnoty .
Například pro kubický polynom přizpůsobený 5 bodům, z= −2, −1, 0, 1, 2 jsou normální rovnice řešeny následovně.