Křivka - Curve fitting

Nahoře: nezpracovaná data a model.
Dno: vývoj normalizovaného součtu čtverců chyb.
![]() |
Přizpůsobit aproximaci |
Koncepty |
---|
Objednávky přibližování Měřítková analýza · Velká O notace Křivka · Falešná přesnost Významné údaje |
Další základy |
Přiblížení · Chyba generalizace Taylorův polynom Vědecké modelování |
Křivka[1][2] je proces konstrukce a křivka nebo matematická funkce, který nejlépe vyhovuje řadě datové body,[3] možná podléhá omezením.[4][5] Křivka může zahrnovat buď interpolace,[6][7] - kde se vyžaduje přesné přizpůsobení údajům, nebo - vyhlazení,[8][9] ve kterém je vytvořena "hladká" funkce, která přibližně odpovídá datům. Související téma je regresní analýza,[10][11] který se více zaměřuje na otázky statistická inference například kolik nejistoty je v křivce, která odpovídá údajům pozorovaným s náhodnými chybami. Přizpůsobené křivky lze použít jako pomůcku pro vizualizaci dat,[12][13] odvodit hodnoty funkce, kde nejsou k dispozici žádná data,[14] a shrnout vztahy mezi dvěma nebo více proměnnými.[15] Extrapolace odkazuje na použití přizpůsobené křivky za rozsah ze sledovaných údajů,[16] a podléhá a stupeň nejistoty[17] protože to může odrážet metodu použitou ke konstrukci křivky stejně, jako odráží pozorovaná data.
Typy
Přizpůsobení funkcí datovým bodům
Nejčastěji se jedna hodí k funkci formuláře y=F(X).
Přizpůsobení čar a polynomiálních funkcí datovým bodům

První stupeň polynomiální rovnice
je řádek s sklon A. Přímka spojí libovolné dva body, takže polynomiální rovnice prvního stupně je přesné přizpůsobení jakýmkoli dvěma bodům se zřetelnými souřadnicemi x.
Pokud se pořadí rovnice zvýší na polynom druhého stupně, dojde k následujícím výsledkům:
Tím se přesně vejde jednoduchá křivka do tří bodů.
Pokud se pořadí rovnice zvýší na polynom třetího stupně, získá se toto:
To přesně zapadne do čtyř bodů.
Obecnějším tvrzením by bylo říci, že se přesně vejde na čtyři omezení. Každé omezení může být bod, úhel nebo zakřivení (což je převrácená hodnota poloměru an oscilační kruh ). Omezení úhlu a zakřivení se nejčastěji přidávají na konce křivky a v takových případech se nazývají konečné podmínky. Identické koncové podmínky se často používají k zajištění plynulého přechodu mezi polynomiálními křivkami obsaženými v jedné spline. Mohla by být také přidána omezení vyššího řádu, například „změna rychlosti zakřivení“. To by bylo užitečné například na dálnici čtyřlístek konstrukce k pochopení rychlosti změny sil působících na auto (viz blbec ), jak následuje čtyřlístek, a podle toho stanovit přiměřené rychlostní limity.
Polynomiální rovnice prvního stupně by také mohla být přesným přizpůsobením pro jeden bod a úhel, zatímco polynomická rovnice třetího stupně by také mohla být přesným přizpůsobením pro dva body, omezení úhlu a omezení zakřivení. Pro tyto a pro polynomické rovnice vyššího řádu je možné mnoho dalších kombinací omezení.
Pokud jich je více než n + 1 omezení (n je stupeň polynomu), lze polynomiální křivku stále procházet těmito omezeními. Přesné přizpůsobení všem omezením není jisté (ale může se to stát například v případě polynomu prvního stupně, který přesně odpovídá třem kolineární body ). Obecně je však zapotřebí nějaká metoda k vyhodnocení každé aproximace. The nejmenší čtverce metoda je jedním ze způsobů, jak porovnat odchylky.
Existuje několik důvodů, proč získat přibližné přizpůsobení, když je možné jednoduše zvýšit stupeň polynomické rovnice a získat přesnou shodu .:
- I když existuje přesná shoda, nemusí to nutně znamenat, že ji lze snadno zjistit. V závislosti na použitém algoritmu může dojít k odlišnému případu, kdy nelze vypočítat přesnou shodu, nebo může trvat příliš mnoho času na nalezení řešení. Tato situace může vyžadovat přibližné řešení.
- Může být žádoucí účinek zprůměrování sporných datových bodů ve vzorku, spíše než zkreslení křivky tak, aby přesně odpovídaly.
- Rungeův fenomén: polynomy vysokého řádu mohou být vysoce oscilační. Pokud křivka prochází dvěma body A a B, dalo by se očekávat, že křivka poběží poněkud blízko středu A a B, také. To se nemusí stát u polynomiálních křivek vysokého řádu; mohou dokonce mít hodnoty, které jsou velmi velké v kladných nebo záporných hodnotách velikost. U polynomů nízkého řádu je pravděpodobné, že křivka spadne blízko středu (je dokonce zaručeno, že přesně prochází středem na polynomu prvního stupně).
- Polynomy nízkého řádu bývají hladké a polynomické křivky vysokého řádu bývají „hrudkovité“. Přesněji definovat maximální počet inflexní body možné v polynomické křivce je n-2, kde n je řád polynomiální rovnice. Inflexní bod je místo na křivce, kde se přepíná z kladného poloměru na záporný. Můžeme také říci, že to je místo, kde přechází z „zadržování vody“ na „vylučování vody“. Všimněte si, že je jen „možné“, že polynomy vysokého řádu budou hrudkovité; mohly by být také hladké, ale na rozdíl od polynomiálních křivek nízkého řádu to není zaručeno. Polynom patnáctého stupně může mít nanejvýš třináct inflexních bodů, ale může mít také dvanáct, jedenáct nebo jakékoli číslo až na nulu.
Stupeň polynomiální křivky, který je vyšší, než je nutné pro přesné přizpůsobení, je nežádoucí ze všech výše uvedených důvodů pro polynomy vysokého řádu, ale také vede k případu, kdy existuje nekonečné množství řešení. Například polynom prvního stupně (přímka) omezený pouze jedním bodem, místo obvyklých dvou, by poskytl nekonečné množství řešení. To přináší problém, jak porovnat a vybrat pouze jedno řešení, což může být problémem pro software i pro lidi. Z tohoto důvodu je obvykle nejlepší zvolit co nejnižší stupeň pro přesnou shodu se všemi omezeními a možná ještě nižší stupeň, pokud je přijatelné přibližné přizpůsobení.

Přizpůsobení dalších funkcí datovým bodům
Jiné typy křivek, jako např trigonometrické funkce (jako je sinus a kosinus), lze v určitých případech také použít.
Ve spektroskopii mohou být data vybavena Gaussian, Lorentzian, Voigt a související funkce.
v zemědělství obrácená logistika sigmoidní funkce (S-křivka) se používá k popisu vztahu mezi výnosem plodiny a růstovými faktory. Modrý údaj byl vytvořen sigmoidní regresí dat měřených na zemědělských pozemcích. Je vidět, že zpočátku, tj. Při nízké slanosti půdy, se výnos plodiny pomalu snižuje při zvyšování slanosti půdy, zatímco poté pokles postupuje rychleji.
Algebraické přizpůsobení versus geometrické přizpůsobení křivek
Pro algebraickou analýzu dat znamená „přizpůsobení“ obvykle pokus najít křivku, která minimalizuje svislou polohu (y-osa) posunutí bodu z křivky (např. obyčejné nejmenší čtverce ). Pro grafické a obrazové aplikace se však geometrické přizpůsobení snaží zajistit nejlepší vizuální přizpůsobení; což obvykle znamená snažit se minimalizovat ortogonální vzdálenost od křivky (např. celkem nejméně čtverců ), nebo jinak zahrnout obě osy posunutí bodu od křivky. Geometrické uložení nejsou populární, protože obvykle vyžadují nelineární a / nebo iterativní výpočty, i když mají výhodu estetičtějšího a geometricky přesnějšího výsledku.[19][20][21]
Přizpůsobení rovinných křivek datovým bodům
Pokud je funkce formuláře nelze postulovat, stále se můžete pokusit přizpůsobit a rovinná křivka.
Jiné typy křivek, jako např kuželovité úseky (kruhové, eliptické, parabolické a hyperbolické oblouky) nebo trigonometrické funkce (jako je sinus a kosinus), lze v určitých případech také použít. Například trajektorie předmětů pod vlivem gravitace sledují parabolickou cestu, když je ignorován odpor vzduchu. Přizpůsobení bodů trajektorie dat parabolické křivce by tedy dávalo smysl. Přílivy a odlivy se řídí sinusovými vzory, proto by měly být přílivové a datové body přizpůsobeny sinusové vlně nebo součtu dvou sinusových vln různých období, pokud jsou brány v úvahu účinky Měsíce a Slunce.
Pro parametrická křivka, je efektivní přizpůsobit každou z jeho souřadnic jako samostatnou funkci délka oblouku; za předpokladu, že lze objednat datové body, vzdálenost akordů může být použit.[22]
Přizpůsobení kruhu geometrickým uložením



Coope[23] přistupuje k problému pokusu najít nejlepší vizuální přizpůsobení kruhu k sadě datových bodů 2D. Metoda elegantně transformuje běžně nelineární problém na lineární problém, který lze vyřešit bez použití iteračních numerických metod, a je tedy mnohem rychlejší než předchozí techniky.
Přizpůsobení elipsy geometrickým uložením
Výše uvedená technika je rozšířena na obecné elipsy[24] přidáním nelineárního kroku, což má za následek rychlou metodu, ale najde vizuálně příjemné elipsy libovolné orientace a posunutí.
Aplikace na povrchy
Všimněte si, že zatímco se tato diskuse týkala 2D křivek, velká část této logiky se vztahuje i na 3D povrchy, jejichž každá záplata je definována sítí křivek ve dvou parametrických směrech, obvykle nazývaných u a proti. Povrch může být složen z jedné nebo více povrchových skvrn v každém směru.
Software
Mnoho statistické balíčky jako R a numerický software tak jako gnuplot, Vědecká knihovna GNU, MLAB, Javor, MATLAB, Mathematica, GNU oktáva, a SciPy zahrnout příkazy pro přizpůsobení křivky v různých scénářích. Existují také programy speciálně napsané pro přizpůsobení křivek; lze je najít v seznamy statistických a programy numerické analýzy stejně jako v Kategorie: Software pro regresi a přizpůsobení křivek.
Viz také
- Úprava pozorování
- Zhutnění přizpůsobené křivce
- Teorie odhadu
- Aproximace funkce
- Dobře padne
- Algoritmus Levenberg – Marquardt
- Montáž linky
- Nelineární regrese
- Overfitting
- Rovinná křivka
- Přizpůsobení rozdělení pravděpodobnosti
- Vyhlazení
- Spliny (interpolovat, vyhlazení )
- Časové řady
- Celkem nejméně čtverců
- Odhad trendu
Reference
- ^ Sandra Lach Arlinghaus, Praktická příručka pro tvarování křivek PHB. CRC Press, 1994.
- ^ William M. Kolb. Křivka pro programovatelné kalkulačky. Syntec, Incorporated, 1984.
- ^ S. S. Halli, K.V. Rao. 1992. Pokročilé techniky populační analýzy. ISBN 0306439972 Stránka 165 (srov. ... funkce jsou splněny, pokud máme pro pozorovaná data dobrou až středně silnou shodu.)
- ^ Signál a hluk: Proč tolik předpovědí selhává - ale některé ne. Autor: Nate Silver
- ^ Příprava dat pro dolování dat: Text. Dorian Pyle.
- ^ Numerické metody ve strojírenství s MATLAB®. Podle Jaan Kiusalaas. Strana 24.
- ^ Numerické metody ve strojírenství s Pythonem 3. Autor: Jaan Kiusalaas. Stránka 21.
- ^ Numerické metody tvarování křivek. Autor: P. G. Guest, Philip George Guest. Stránka 349.
- ^ Viz také: Mollifier
- ^ Přizpůsobení modelů biologickým datům pomocí lineární a nelineární regrese. Harvey Motulsky, Arthur Christopoulos.
- ^ Regresní analýza Rudolf J. Freund, William J. Wilson, Ping Sa. Stránka 269.
- ^ Vizuální informatika. Editoval Halimah Badioze Zaman, Peter Robinson, Maria Petrou, Patrick Olivier, Heiko Schröder. Stránka 689.
- ^ Numerické metody pro nelineární inženýrské modely. John R. Hauser. Stránka 227.
- ^ Metody experimentální fyziky: Spektroskopie, svazek 13, část 1. Claire Marton. Strana 150.
- ^ Encyclopedia of Research Design, Volume 1. Edited by Neil J. Salkind. Stránka 266.
- ^ Techniky komunitní analýzy a plánování. Autor: Richard E. Klosterman. Strana 1.
- ^ Úvod do rizika a nejistoty při hodnocení environmentálních investic. Nakladatelství DIANE. Str. 69
- ^ Kalkulačka pro sigmoidní regrese
- ^ Ahn, Sung-Joon (prosinec 2008), "Geometrické přizpůsobení parametrických křivek a povrchů" (PDF), Journal of Information Processing Systems, 4 (4): 153–158, doi:10.3745 / JIPS.2008.4.4.153, archivovány z originál (PDF) dne 13.03.2014
- ^ Černov, N .; Ma, H. (2011), „Nejméně čtvercové tvarování kvadratických křivek a ploch“, Yoshida, Sota R. (ed.), Počítačové vidění, Nova Science Publishers, s. 285–302, ISBN 9781612093994
- ^ Liu, Yang; Wang, Wenping (2008), „A Revisit to Least Squares Orthogonal Distance Fitting of Parametric Curves and Surfaces“, Chen, F .; Juttler, B. (eds.), Pokroky v geometrickém modelování a zpracování, Přednášky v informatice, 4975, str. 384–397, CiteSeerX 10.1.1.306.6085, doi:10.1007/978-3-540-79246-8_29, ISBN 978-3-540-79245-1
- ^ str.51 v Ahlberg & Nilson (1967) Teorie splajnů a jejich aplikace, Academic Press, 1967 [1]
- ^ Coope, I.D. (1993). "Přizpůsobení kruhu lineárními a nelineárními nejmenšími čtverci". Journal of Optimization Theory and Applications. 76 (2): 381–388. doi:10.1007 / BF00939613. hdl:10092/11104.
- ^ Paul Sheer, Softwarový asistent pro manuální stereofotometrologii, M.Sc. práce, 1997
Další čtení
- N. Černov (2010), Kruhová a lineární regrese: Přizpůsobení kruhů a čar nejméně čtverci, Chapman & Hall / CRC, Monografie o statistice a aplikované pravděpodobnosti, svazek 117 (256 stran). [2]