Fréchetova počáteční vzdálenost - Fréchet inception distance

The Počáteční vzdálenost Fréchet (FID) je metrický slouží k posouzení kvality obrazů vytvořených generátorem a generativní kontradiktorní síť (GAN).[1] Na rozdíl od dřívějších počáteční skóre (IS), který hodnotí pouze distribuci generovaných obrazů, FID porovnává distribuci generovaných obrazů s distribucí skutečných obrazů, které byly použity k trénování generátoru.[1][2]

Metrika FID je Fréchetova vzdálenost mezi dvěma vícerozměrné Gaussovy distribuce: , distribuce funkcí Inception v3 obrazů generovaných GAN a , distribuce funkcí Inception v3 ze „světa“ nebo skutečných obrazů používaných k trénování GAN. Ve výsledku jej lze vypočítat ze střední a střední hodnoty kovariance aktivací, když jsou syntetizované a skutečné obrazy přivedeny do sítě Inception jako:[1][2][3]

Spíše než přímé porovnávání obrázků pixel po pixelu (například pomocí Norma L2 ), FID porovnává střední a standardní odchylku jedné z hlubších vrstev v Inception v3, a Konvoluční neuronová síť. Tyto vrstvy jsou blíže k výstupním uzlům, které odpovídají objektům z reálného světa, jako je konkrétní plemeno psa nebo letadlo, a dále od mělkých vrstev poblíž vstupního obrazu. Ve výsledku mají tendenci napodobovat lidské vnímání podobnosti v obrazech[Citace je zapotřebí ].

Metrika FID je současná standardní metrika pro hodnocení kvality sítí GAN od roku 2020. Používá se k měření kvality mnoha nedávných sítí GAN.[2] včetně StyleGAN1 s vysokým rozlišením[4] a StyleGAN2[5] sítí

Dějiny

Metrika FID byla zavedena v roce 2017.[1] Je inspirován Fréchetova vzdálenost představil v roce 1957 M. Frechet.[6]

Reference

  1. ^ A b C d Heusel, Martin; Ramsauer, Hubert; Unterthiner, Thomas; Nessler, Bernhard; Hochreiter, Sepp (12. ledna 2018). "Sítě GAN vycvičené pravidlem aktualizace dvou časových měřítků konvergují k místní Nash rovnováze". arXiv:1706.08500 [cs.LG ].
  2. ^ A b C Jean, Neal (15. července 2018). „Počáteční vzdálenost Fréchet“. Neal Jean. Citováno 3. července 2020.
  3. ^ Dowson, D. C; Landau, B. V (1. září 1982). "Fréchetova vzdálenost mezi vícerozměrným normálním rozdělením". Journal of Multivariate Analysis. 12 (3): 450–455. doi:10.1016 / 0047-259X (82) 90077-X. ISSN  0047-259X.
  4. ^ Karras, Tero; Laine, Samuli; Aila, Timo (2020). "Architektura generátoru založeného na stylu pro generativní kontradiktorní sítě". Transakce IEEE na analýze vzorů a strojové inteligenci. PP: 1. arXiv:1812.04948. doi:10.1109 / TPAMI.2020.2970919. PMID  32012000.
  5. ^ Karras, Tero; Laine, Samuli; Aittala, Miika; Hellsten, Janne; Lehtinen, Jaakko; Aila, Timo (23. března 2020). "Analýza a zlepšení kvality obrazu StyleGAN". arXiv:1912.04958 [cs.CV ].
  6. ^ Fréchet., M (1957). „Sur la distance de deux lois de probabilité“. C. R. Acad. Sci. Paříž. 244: 689–692.