Rozsáhlá koncepce ontologie pro multimédia - Large Scale Concept Ontology for Multimedia
The Rozsáhlá koncepce ontologie pro multimédia projekt byl sérií workshopů konaných od dubna 2004 do září 2006[1] za účelem definování standardního formálního slovníku pro anotaci a vyhledávání videa.
Mandát
Projekt Large-Scale Concept Ontology for Multimedia sponzorovala Kancelář rušivé technologie a spojilo zástupce zástupců různých výzkumných komunit, jako je multimediální učení, vyhledávání informací, výpočetní lingvistika, knihovnictví a reprezentace znalostí, jakož i „uživatelské“ komunity, jako jsou zpravodajské agentury a vysílací společnosti, aby společně pracovali na definování souboru 1 000 konceptů.[2] Každý koncept měl jednotlivě splňovat následující kritéria:[3]
- Utility: koncepty musí podporovat realistické problémy s načítáním videa
- Proveditelnost: koncepty jsou nebo budou schopné detekce vzhledem k krátkodobému (5 let předpokládanému) stavu technologie
- Pozorovatelnost: koncepty se ve skutečných souborech video dat vyskytují s relativně vysokou frekvencí
Společně tyto koncepty měly splňovat další kritérium poskytování širokého (na doméně nezávislém) pokrytí.[3] Cílové oblasti pokrytí na vysoké úrovni zahrnovaly fyzické objekty, včetně animovaných objektů (jako jsou lidé, mobové a zvířata), a neživé objekty, od velkých (jako jsou budovy a dálnice) až po malé (jako jsou telefony a spotřebiče); akce a události; umístění a nastavení; a grafika. Snahu vedl Dr. Milind Naphade, který byl hlavním vyšetřovatelem spolu s výzkumníky z Univerzita Carnegie Mellon, Columbia University, a IBM.[1]
Vývojové stopy
Projekt měl dvě hlavní „stopy“: vývoj a nasazení nástrojů pro anotaci klíčových snímků (prováděné CMU a Columbia) a vývoj samotné hierarchie konceptu Ontology pro multimédia ve velkém měřítku. Druhá stopa byla provedena ve dvou fázích: První spočívala v manuální konstrukci hierarchie konceptu 884, byla provedena společně mezi zástupci výzkumu a uživatelské komunity.
Druhá stopa, kterou provádějí odborníci na reprezentaci znalostí v Cycorp, Inc., zahrnovalo mapování konceptů do Cyc znalostní základna a použití odvozovacího stroje Cyc k poloautomatickému upřesnění, opravě a rozšíření hierarchie konceptů. Fáze mapování / rozšiřování projektu byla motivována touhou po rozšíření šířky - mapování mělo za následek přechod z 884 koncepty tak, aby překonaly počáteční cíl 1 000 - a posunout rozsáhlou koncepční ontologii pro multimédia z jednorozměrné hierarchie konceptů do plnohodnotné ontologie bohatých sémantických spojení.[3]
Výsledky projektu
Výstupy úsilí zahrnovaly:[1]
- „Lite“ verze hierarchie konceptů Ontology pro multimédia ve velkém měřítku sestávající z podmnožiny 449 konceptů.
- Korpus 61 901 klíčových klíčových slov videa, převzatý z datové sady TRECVID z roku 2006, anotovaný pomocí Large-Scale Concept Ontology for Multimedia „lite“.
- Plná taxonomie 2 638 konceptů, která byla vytvořena poloautomaticky mapováním 884 konceptů, ručně identifikovaných spolupracovníky, do znalostní základny Cyc a dotazováním na odvozovací stroj Cyc pro užitečné doplňky.
- Plná ontologie v podobě vydání ResearchCyc z roku 2006, které obsahovalo koncepci rozsáhlého konceptu ontologie pro multimediální mapování do cyc ontologie.
Veřejné detektory
Bylo vyvinuto a vydáno několik sad koncepčních detektorů pro veřejné použití:
- VIREO-374, 374 detektorů vyvinutých společností City University of Hong Kong.
- Columbia 374, 374 detektorů vyvinutých společností Columbia University.
- 101, 101 detektorů vyvinutých společností University of Amsterdam.
Použití ve větší výzkumné komunitě
Od svého vydání se ve výzkumu vizuálního rozpoznávání začala úspěšně používat velká koncepce ontologie pro multimédia: Kromě výzkumu prováděného účastníky projektu byla použita nezávislým výzkumem při extrakci konceptů ze obrázků,[4][5] a sloužil jako základ pro nástroj pro anotaci videa.[6]
Viz také
Reference
- ^ A b C Naphade, et al.„„ Ontology Large Scale Concept Ontology for Multimedia: VACE Workshop Report “,
- ^ Naphade, et al.„Koncept rozsáhlého konceptu ontologie pro porozumění multimédii,“ ppt prezentaci publikoval MITER Archivováno 2006-05-06 na Wayback Machine
- ^ A b C Naphade, et al.„Large-Scale Concept Ontology for Multimedia,“ IEEE MultiMedia, sv. 13, č. 3, s. 86-91, červenec-září 2006.
- ^ Snoek, et al.„Přidání sémantiky k detektorům pro načítání videa,“ připravovaný v Transakce IEEE na multimédiích, 2007
- ^ Znepokojující, et al., „MediaMill Large-lexicon Concept Suggestion Engine,“ připravovaný, v Sborník mezinárodní konference IEEE o akustice, řeči a zpracování signálu, Honolulu, Havaj, USA, duben 2007.
- ^ Emilie Garanaud, Smeaton, A. a Koskela, M., „Hodnocení nástroje pro anotaci videa založeného na ontologii LSCOM“ v Sborník z první mezinárodní konference o sémantice a technologii digitálních médií, Atény, Řecko, 6. – 8. Prosince 2006. Archivováno 20. července 2011 v Wayback Machine