Rozsáhlá koncepce ontologie pro multimédia - Large Scale Concept Ontology for Multimedia

The Rozsáhlá koncepce ontologie pro multimédia projekt byl sérií workshopů konaných od dubna 2004 do září 2006^[1] za účelem definování standardního formálního slovníku pro anotaci a vyhledávání videa.

Mandát

Projekt Large-Scale Concept Ontology for Multimedia sponzorovala Kancelář rušivé technologie a spojilo zástupce zástupců různých výzkumných komunit, jako je multimediální učení, vyhledávání informací, výpočetní lingvistika, knihovnictví a reprezentace znalostí, jakož i „uživatelské“ komunity, jako jsou zpravodajské agentury a vysílací společnosti, aby společně pracovali na definování souboru 1 000 konceptů.^[2] Každý koncept měl jednotlivě splňovat následující kritéria:^[3]

Utility: koncepty musí podporovat realistické problémy s načítáním videa
Proveditelnost: koncepty jsou nebo budou schopné detekce vzhledem k krátkodobému (5 let předpokládanému) stavu technologie
Pozorovatelnost: koncepty se ve skutečných souborech video dat vyskytují s relativně vysokou frekvencí

Společně tyto koncepty měly splňovat další kritérium poskytování širokého (na doméně nezávislém) pokrytí.^[3] Cílové oblasti pokrytí na vysoké úrovni zahrnovaly fyzické objekty, včetně animovaných objektů (jako jsou lidé, mobové a zvířata), a neživé objekty, od velkých (jako jsou budovy a dálnice) až po malé (jako jsou telefony a spotřebiče); akce a události; umístění a nastavení; a grafika. Snahu vedl Dr. Milind Naphade, který byl hlavním vyšetřovatelem spolu s výzkumníky z Univerzita Carnegie Mellon, Columbia University, a IBM.^[1]

Vývojové stopy

Projekt měl dvě hlavní „stopy“: vývoj a nasazení nástrojů pro anotaci klíčových snímků (prováděné CMU a Columbia) a vývoj samotné hierarchie konceptu Ontology pro multimédia ve velkém měřítku. Druhá stopa byla provedena ve dvou fázích: První spočívala v manuální konstrukci hierarchie konceptu 884, byla provedena společně mezi zástupci výzkumu a uživatelské komunity.

Druhá stopa, kterou provádějí odborníci na reprezentaci znalostí v Cycorp, Inc., zahrnovalo mapování konceptů do Cyc znalostní základna a použití odvozovacího stroje Cyc k poloautomatickému upřesnění, opravě a rozšíření hierarchie konceptů. Fáze mapování / rozšiřování projektu byla motivována touhou po rozšíření šířky - mapování mělo za následek přechod z 884 koncepty tak, aby překonaly počáteční cíl 1 000 - a posunout rozsáhlou koncepční ontologii pro multimédia z jednorozměrné hierarchie konceptů do plnohodnotné ontologie bohatých sémantických spojení.^[3]

Výsledky projektu

Výstupy úsilí zahrnovaly:^[1]

„Lite“ verze hierarchie konceptů Ontology pro multimédia ve velkém měřítku sestávající z podmnožiny 449 konceptů.
Korpus 61 901 klíčových klíčových slov videa, převzatý z datové sady TRECVID z roku 2006, anotovaný pomocí Large-Scale Concept Ontology for Multimedia „lite“.
Plná taxonomie 2 638 konceptů, která byla vytvořena poloautomaticky mapováním 884 konceptů, ručně identifikovaných spolupracovníky, do znalostní základny Cyc a dotazováním na odvozovací stroj Cyc pro užitečné doplňky.
Plná ontologie v podobě vydání ResearchCyc z roku 2006, které obsahovalo koncepci rozsáhlého konceptu ontologie pro multimediální mapování do cyc ontologie.

Veřejné detektory

Bylo vyvinuto a vydáno několik sad koncepčních detektorů pro veřejné použití:

VIREO-374, 374 detektorů vyvinutých společností City University of Hong Kong.
Columbia 374, 374 detektorů vyvinutých společností Columbia University.
101, 101 detektorů vyvinutých společností University of Amsterdam.

Použití ve větší výzkumné komunitě

Od svého vydání se ve výzkumu vizuálního rozpoznávání začala úspěšně používat velká koncepce ontologie pro multimédia: Kromě výzkumu prováděného účastníky projektu byla použita nezávislým výzkumem při extrakci konceptů ze obrázků,^[4]^[5] a sloužil jako základ pro nástroj pro anotaci videa.^[6]

Viz také

Jazyk multimediální webové ontologie (MOWL )

Reference

^ ^A ^b ^C Naphade, et al.„„ Ontology Large Scale Concept Ontology for Multimedia: VACE Workshop Report “,
^ Naphade, et al.„Koncept rozsáhlého konceptu ontologie pro porozumění multimédii,“ ppt prezentaci publikoval MITER Archivováno 2006-05-06 na Wayback Machine
^ ^A ^b ^C Naphade, et al.„Large-Scale Concept Ontology for Multimedia,“ IEEE MultiMedia, sv. 13, č. 3, s. 86-91, červenec-září 2006.
^ Snoek, et al.„Přidání sémantiky k detektorům pro načítání videa,“ připravovaný v Transakce IEEE na multimédiích, 2007
^ Znepokojující, et al., „MediaMill Large-lexicon Concept Suggestion Engine,“ připravovaný, v Sborník mezinárodní konference IEEE o akustice, řeči a zpracování signálu, Honolulu, Havaj, USA, duben 2007.
^ Emilie Garanaud, Smeaton, A. a Koskela, M., „Hodnocení nástroje pro anotaci videa založeného na ontologii LSCOM“ v Sborník z první mezinárodní konference o sémantice a technologii digitálních médií, Atény, Řecko, 6. – 8. Prosince 2006. Archivováno 20. července 2011 v Wayback Machine

externí odkazy

Rozsáhlá koncepce ontologie pro multimediální domovskou stránku

[ReferenceA-1] A ^b ^C Naphade, et al.„„ Ontology Large Scale Concept Ontology for Multimedia: VACE Workshop Report “,

[2] Naphade, et al.„Koncept rozsáhlého konceptu ontologie pro porozumění multimédii,“ ppt prezentaci publikoval MITER Archivováno 2006-05-06 na Wayback Machine

[ee.columbia.edu-3] A ^b ^C Naphade, et al.„Large-Scale Concept Ontology for Multimedia,“ IEEE MultiMedia, sv. 13, č. 3, s. 86-91, červenec-září 2006.

[4] Snoek, et al.„Přidání sémantiky k detektorům pro načítání videa,“ připravovaný v Transakce IEEE na multimédiích, 2007

[5] Znepokojující, et al., „MediaMill Large-lexicon Concept Suggestion Engine,“ připravovaný, v Sborník mezinárodní konference IEEE o akustice, řeči a zpracování signálu, Honolulu, Havaj, USA, duben 2007.

[6] Emilie Garanaud, Smeaton, A. a Koskela, M., „Hodnocení nástroje pro anotaci videa založeného na ontologii LSCOM“ v Sborník z první mezinárodní konference o sémantice a technologii digitálních médií, Atény, Řecko, 6. – 8. Prosince 2006. Archivováno 20. července 2011 v Wayback Machine

[1]

[2]

[3]

[4]

[5]

[6]