Fréchetova počáteční vzdálenost - Fréchet inception distance
The Počáteční vzdálenost Fréchet (FID) je metrický slouží k posouzení kvality obrazů vytvořených generátorem a generativní kontradiktorní síť (GAN).[1] Na rozdíl od dřívějších počáteční skóre (IS), který hodnotí pouze distribuci generovaných obrazů, FID porovnává distribuci generovaných obrazů s distribucí skutečných obrazů, které byly použity k trénování generátoru.[1][2]
Metrika FID je Fréchetova vzdálenost mezi dvěma vícerozměrné Gaussovy distribuce: , distribuce funkcí Inception v3 obrazů generovaných GAN a , distribuce funkcí Inception v3 ze „světa“ nebo skutečných obrazů používaných k trénování GAN. Ve výsledku jej lze vypočítat ze střední a střední hodnoty kovariance aktivací, když jsou syntetizované a skutečné obrazy přivedeny do sítě Inception jako:[1][2][3]
Spíše než přímé porovnávání obrázků pixel po pixelu (například pomocí Norma L2 ), FID porovnává střední a standardní odchylku jedné z hlubších vrstev v Inception v3, a Konvoluční neuronová síť. Tyto vrstvy jsou blíže k výstupním uzlům, které odpovídají objektům z reálného světa, jako je konkrétní plemeno psa nebo letadlo, a dále od mělkých vrstev poblíž vstupního obrazu. Ve výsledku mají tendenci napodobovat lidské vnímání podobnosti v obrazech[Citace je zapotřebí ].
Metrika FID je současná standardní metrika pro hodnocení kvality sítí GAN od roku 2020. Používá se k měření kvality mnoha nedávných sítí GAN.[2] včetně StyleGAN1 s vysokým rozlišením[4] a StyleGAN2[5] sítí
Dějiny
Metrika FID byla zavedena v roce 2017.[1] Je inspirován Fréchetova vzdálenost představil v roce 1957 M. Frechet.[6]
Reference
- ^ A b C d Heusel, Martin; Ramsauer, Hubert; Unterthiner, Thomas; Nessler, Bernhard; Hochreiter, Sepp (12. ledna 2018). "Sítě GAN vycvičené pravidlem aktualizace dvou časových měřítků konvergují k místní Nash rovnováze". arXiv:1706.08500 [cs.LG ].
- ^ A b C Jean, Neal (15. července 2018). „Počáteční vzdálenost Fréchet“. Neal Jean. Citováno 3. července 2020.
- ^ Dowson, D. C; Landau, B. V (1. září 1982). "Fréchetova vzdálenost mezi vícerozměrným normálním rozdělením". Journal of Multivariate Analysis. 12 (3): 450–455. doi:10.1016 / 0047-259X (82) 90077-X. ISSN 0047-259X.
- ^ Karras, Tero; Laine, Samuli; Aila, Timo (2020). "Architektura generátoru založeného na stylu pro generativní kontradiktorní sítě". Transakce IEEE na analýze vzorů a strojové inteligenci. PP: 1. arXiv:1812.04948. doi:10.1109 / TPAMI.2020.2970919. PMID 32012000.
- ^ Karras, Tero; Laine, Samuli; Aittala, Miika; Hellsten, Janne; Lehtinen, Jaakko; Aila, Timo (23. března 2020). "Analýza a zlepšení kvality obrazu StyleGAN". arXiv:1912.04958 [cs.CV ].
- ^ Fréchet., M (1957). „Sur la distance de deux lois de probabilité“. C. R. Acad. Sci. Paříž. 244: 689–692.
![]() | Tento počítačová věda článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |