Automatická anotace obrazu - Automatic image annotation

Automatická anotace obrazu (také známý jako automatické značkování obrázků nebo lingvistické indexování) je proces, kterým počítačový systém automaticky přiřazuje metadata ve formě titulky nebo klíčová slova do a digitální obraz. Tato aplikace počítačové vidění techniky se používají v načítání obrázků systémy pro organizaci a lokalizaci zajímavých obrázků z a databáze.

Tuto metodu lze považovat za typ více tříd klasifikace obrazu s velmi velkým počtem tříd - stejně velkým jako velikost slovníku. Typicky, analýza obrazu ve formě extrahované vektory funkcí a anotační slova pro trénink používá strojové učení techniky pokusu o automatické použití anotací na nové obrázky. První metody se naučily korelace mezi funkce obrazu a tréninkové anotace, pak byly techniky vyvinuty pomocí strojový překlad pokusit se přeložit textový slovník do „vizuálního slovníku“ nebo do seskupených oblastí známých jako kuličky. Práce sledující tyto snahy zahrnovaly klasifikační přístupy, modely relevance atd.

Výhody automatické anotace obrazu oproti načítání obrázků podle obsahu (CBIR) spočívají v tom, že dotazy může uživatel určit přirozeněji.[1] CBIR obecně (v současné době) vyžaduje, aby uživatelé vyhledávali podle obrazových konceptů, jako je barva a textura nebo hledání příkladů dotazů. Určité funkce obrázků v příkladech obrázků mohou přepsat koncept, na který se uživatel skutečně zaměřuje. Tradiční metody vyhledávání obrázků, jaké používají knihovny, se spoléhaly na ručně anotované obrázky, což je nákladné a časově náročné, zejména vzhledem k existujícím velkým a neustále rostoucím databázím obrázků.

Software pro automatickou anotaci obrazu

SuperAnnotate

SuperAnotovat je platforma typu end-to-end pro počítačové vidění inženýři a anotační týmy pro anotaci, správu, školení a nakonec automatizaci kanálů počítačového vidění.

Automatizace: Platforma umožňuje tři odlišné typy automatizace jak při označování, tak při zajištění kvality úrovně. Automatizaci lze provést prostřednictvím přenos učení, aktivní učení[2] a detekce nesprávného štítku.[3] Prostřednictvím navázaného spojení mezi projekty anotací dat a Nervová síť Prostředí má schopnost trénovat vlastní modely, provádět manuální opravy a iterovat, to vše na stejné platformě, což zvyšuje rychlost a přesnost každého nového úkolu anotace. Platforma také umožňuje vybrat nejrelevantnější snímky z velké sady obrázků, což pomůže dosáhnout nejvyšší přesnosti rozpoznávání s omezenou sadou dat. Kromě samotné automatizace anotací umožňuje SuperAnnotate eliminovat datový šum automatizací detekce nesprávně označených tréninkových vzorků. Platforma je speciálně postavena tak, aby sjednotila a automatizovala celý kanál anotací dat.

Integrace API: Platforma je dodávána s integrovanou sadou Python SDK, která automatizuje nastavení a distribuci projektů, správu týmů a škálování pro větší projekty. Sada SDK obsahuje řadu funkcí pro přenos dat, převaděče anotací, funkce pro manipulaci s daty obrázků, anotace atd.[4] Umožňuje také technikům CV provádět školení, porovnávat více výsledků školení, automaticky vyhledávat riskantní anotace atd.[5]

Viz také

Reference

  1. ^ [1]
  2. ^ SuperAnnotate (2020-09-30), AnnotationSoftware / active_learning, vyvoláno 2020-11-17
  3. ^ SuperAnnotate (2020-09-17), Software / qa-automation, vyvoláno 2020-11-17
  4. ^ SuperAnnotate (2020-09-17), Anotace Software / superannotate-python-sdk, vyvoláno 2020-11-17
  5. ^ „SuperAnnotate Desktop“. opencv.org. Citováno 2020-11-17.

Další čtení

  • Model společného výskytu slov
Y Mori; H Takahashi & R Oka (1999). "Transformace obrazu na slovo založená na dělení a vektorové kvantování obrázků slovy.". Sborník příspěvků z mezinárodního semináře o multimediálním inteligentním ukládání a řízení načítání. CiteSeerX  10.1.1.31.1704.
  • Anotace jako strojový překlad
P Duygulu; K Barnard; N de Fretias & D Forsyth (2002). „Rozpoznávání objektů jako strojový překlad: Naučit se lexikon pro slovní zásobu pevného obrazu“. Sborník příspěvků z Evropské konference o počítačovém vidění. 97–112. Archivovány od originál dne 2005-03-05.
  • Statistické modely
J Li & J Z Wang (2006). „Počítačová anotace obrázků v reálném čase“. Proc. ACM Multimedia. 911–920.
J Z Wang & J Li (2002). „Lingvistické indexování obrázků podle učení pomocí 2-D MHMM“. Proc. ACM Multimedia. 436–445.
  • Automatické jazykové indexování obrázků
J Li & J Z Wang (2008). „Počítačová anotace obrázků v reálném čase“. Transakce IEEE na analýze vzorů a strojové inteligenci.
J Li & J Z Wang (2003). „Automatické jazykové indexování obrázků pomocí přístupu statistického modelování“. Transakce IEEE na analýze vzorů a strojové inteligenci. str. 1075–1088.
  • Hierarchický model seskupení aspektů
K Barnard; D A Forsyth (2001). „Učení se sémantice slov a obrázků“. Sborník mezinárodní konference o počítačovém vidění. 408–415. Archivovány od originál dne 28. 9. 2007.
  • Latentní Dirichletův model alokace
D Blei; A Ng & M Jordan (2003). „Přidělení latentního dirichletu“ (PDF). Journal of Machine Learning Research. 3: 993–1022. Archivovány od originál (PDF) dne 2005-05-21.
G Carneiro; A B Chan; P Moreno & N Vasconcelos (2006). „Kontrolované učení sémantických tříd pro anotace a načítání obrázků“ (PDF). Transakce IEEE na analýze vzorů a strojové inteligenci. 394–410.
  • Podobnost textury
R W Picard & T P Minka (1995). „Vision Texture for Annotation“. Multimediální systémy.
  • Podporujte vektorové stroje
C Cusano; G Ciocca & R Scettini (2004). Msgstr "Anotace obrázku pomocí SVM". Sborník z internetového zobrazování IV. Internet Imaging V. 5304. p. 330. Bibcode:2003SPIE.5304..330C. doi:10.1117/12.526746.
  • Soubor rozhodovacích stromů a náhodných dílčích oken
R Maree; P Geurts; J Piater & L Wehenkel (2005). „Náhodná podokna pro robustní klasifikaci obrazu“. Sborník mezinárodní konference IEEE o počítačovém vidění a rozpoznávání vzorů. s. 1: 34–30.
  • Maximální entropie
J Jeon; R Manmatha (2004). "Použití maximální entropie pro automatickou anotaci obrazu" (PDF). Int'l Conf on Image and Video Retrieval (CIVR 2004). str. 24–32.
  • Relevantní modely
J Jeon; V Lavrenko & R Manmatha (2003). „Automatická anotace a načítání obrázků pomocí modelů relevantnosti napříč médii“ (PDF). Sborník konference ACM SIGIR o výzkumu a vývoji v oblasti získávání informací. str. 119–126.
  • Relevanční modely využívající funkce spojité hustoty pravděpodobnosti
V Lavrenko; R Manmatha & J Jeon (2003). „Model pro učení sémantiky obrázků“ (PDF). Sborník 16. konference o pokroku v systémech zpracování neurálních informací NIPS.
  • Koherentní jazykový model
R Jin; J Y Chai; L Si (2004). „Efektivní automatická anotace obrazu pomocí koherentního jazykového modelu a aktivního učení“ (PDF). Sborník MM'04.
  • Inferenční sítě
D Metzler & R Manmatha (2004). „Inferenční síťový přístup k načítání obrázků“ (PDF). Sborník z mezinárodní konference o vyhledávání obrázků a videa. str. 42–50.
  • Vícenásobná distribuce Bernoulli
S Feng; R Manmatha & V Lavrenko (2004). „Více modelů Bernoulliho relevance pro anotace obrázků a videí“ (PDF). Konference IEEE o počítačovém vidění a rozpoznávání vzorů. str. 1002–1009.
  • Více alternativ designu
J Y Pan; H-J Yang; P Duygulu; C Faloutsos (2004). "Automatické titulky" (PDF). Sborník mezinárodní konference IEEE z roku 2004 o multimédiích a výstavách (ICME'04). Archivovány od originál (PDF) dne 09.12.2004.
  • Anotace přirozené scény
J Fan; Y Gao; H Luo; G Xu (2004). „Automatická anotace obrazu pomocí konceptuálních citlivých výběžků pro reprezentaci obrazového obsahu“. Sborník 27. mezinárodní konference o výzkumu a vývoji v oblasti vyhledávání informací. 361–368.
  • Relevantní globální filtry na nízké úrovni
Oliva & A Torralba (2001). „Modelování tvaru scény: holistické znázornění prostorové obálky“ (PDF). International Journal of Computer Vision. 42: 145–175.
  • Globální funkce obrazu a neparametrický odhad hustoty
A Yavlinsky, E Schofield & S Rüger (2005). „Automatická anotace obrazu využívající globální funkce a robustní neparametrický odhad hustoty“ (PDF). Int'l Conf on Image and Video Retrieval (CIVR, Singapur, červenec 2005). Archivovány od originál (PDF) dne 2005-12-20.
  • Sémantika videa
N Vasconcelos & A Lippman (2001). „Statistické modely struktury videa pro analýzu a charakterizaci obsahu“ (PDF). Transakce IEEE na zpracování obrazu. s. 1–17.
Ilaria Bartolini; Marco Patella a Corrado Romani (2010). „Shiatsu: Sémantické hierarchické automatické označování videí podle segmentace pomocí řezů“. 3. mezinárodní multimediální workshop ACM o automatizované extrakci informací v mediální produkci (AIEMPro10).
  • Upřesnění anotace obrázku
Yohan Jin; Latifur Khan; Lei Wang & Mamoun Awad (2005). „Obrázkové anotace kombinací více důkazů a wordNet“. 13. výroční mezinárodní konference ACM o multimédiích (MM 05). 706–715.
Changhu Wang; Feng Jing; Lei Zhang a Hong-Jiang Zhang (2006). „Upřesnění anotace obrázku pomocí náhodného procházení s restartováním“. 14. výroční mezinárodní konference ACM o multimédiích (MM 06).
Changhu Wang; Feng Jing; Lei Zhang a Hong-Jiang Zhang (2007). msgstr "upřesnění anotace obrazu podle obsahu". Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR 07). doi:10.1109 / CVPR.2007.383221.
Ilaria Bartolini a Paolo Ciaccia (2007). "Imagination: Exploiting Link Analysis for Accurate Image Annotation". Springer Adaptive Multimedia Retrieval. doi:10.1007/978-3-540-79860-6_3.
Ilaria Bartolini a Paolo Ciaccia (2010). „Vícedimenzionální anotace a vyhledávání obrázků podle klíčových slov“. 2. mezinárodní seminář ACM o vyhledávání klíčových slov na strukturovaných datech (KEYS 2010).
  • Automatická anotace obrazu souborem vizuálních deskriptorů
Emre Akbas a Fatos Y. Vural (2007). "Automatická anotace obrazu souborem vizuálních deskriptorů". Mezinárodní Konf. o počítačovém vidění (CVPR) 2007, Workshop o aplikacích sémantického učení v multimédiích. doi:10.1109 / CVPR.2007.383484.
  • Nový základní směr pro anotaci obrázku
Ameesh Makadia a Vladimir Pavlovic a Sanjiv Kumar (2008). „Nová základní linie pro anotaci obrázků“ (PDF). Evropská konference o počítačovém vidění (ECCV).

Simultánní klasifikace a anotace obrazu

Chong Wang a David Blei a Li Fei-Fei (2009). "Simultánní klasifikace obrazu a poznámky" (PDF). Konf. o počítačovém vidění a rozpoznávání vzorů (CVPR).
  • TagProp: Diskriminační metrické učení v modelech nejbližších sousedů pro automatickou anotaci obrázků
Matthieu Guillaumin a Thomas Mensink a Jakob Verbeek a Cordelia Schmid (2009). „TagProp: Diskriminační metrické učení v modelech nejbližších sousedů pro automatickou anotaci obrázků“ (PDF). Mezinárodní Konf. na počítačovém vidění (ICCV).
  • Anotace obrázku pomocí metrického učení v sémantických čtvrtích
Yashaswi Verma & C. V. Jawahar (2012). „Image Annotation Using Metric Learning in Semantic Neighborhoods“ (PDF). Evropská konference o počítačovém vidění (ECCV). Archivovány od originál (PDF) dne 2013-05-14. Citováno 2014-02-26.
  • Automatická anotace obrazu pomocí reprezentací Deep Learning
Venkatesh N. Murthy & Subhransu Maji a R. Manmatha (2015). „Automatická anotace obrazu pomocí reprezentací Deep Learning“ (PDF). Mezinárodní konference o multimédiích (ICMR).
  • Anotace medicínského obrazu pomocí bayesiánských sítí a aktivního učení
N. B. Marvasti & E. Yörük a B. Acar (2018). „Anotace medicínského obrazu pomocí počítače: Předběžné výsledky s jaterními lézemi v CT“. IEEE Journal of Biomedical and Health Informatics.