Anotace k dramatu - Drama annotation

Anotace k dramatu je proces anotování metadata a drama. Vzhledem k dramatu vyjádřenému v nějakém médiu (text, video, zvuk atd.) Proces anotace metadat identifikuje, jaké jsou prvky, které charakterizují drama, a anotuje tyto prvky v nějakém formátu metadat. Například ve větě „Laertes a Polonius varují Ophelii, aby se držela daleko od Hamleta.“ z textu Osada, slovo „Laertes“, které odkazuje na dramatický prvek, konkrétně na postavu, bude komentováno jako „Char“, převzato z nějaké sady metadat. Tento článek se věnuje dramatickým anotačním projektům se sadami metadat a anotací navržených ve vědecké literatuře založených na značkovacích jazycích a ontologie.

Drama napříč médii a žánry

Drama zahrnuje různá média a jazyky, od Řecká tragédie a hudební drama akční filmy a videohry: navzdory jejich obrovským rozdílům tyto příklady sdílejí rysy kulturního konstruktu, který známe jako drama. drama lze považovat za formu nehmotné kulturní dědictví, protože se vyznačuje vyvíjející se povahou, s formou a funkcí, které se mění v čase:[1] například zvažte rozdíl mezi řeckou tragédií Oidipus a modernistická hra Šest znaků při hledání autora. Exponenciální šíření dramatu v současné kultuře vedlo Martin Esslin vytvořit definici „dramatických médií“, tj. médií, která zobrazují postavy provádějící živé akce, jako je divadlo, kino a videohry.

Diskrétní projevy dramatu jsou dokumentovány v různých médiích, včetně textu, partitury, videa, zvuku atd. Dramatický obsah, který je základem těchto projevů, však nezávisí na konkrétním médiu: vezměte si například Ardenovo vydání drama o Osada [2] a Film Laurence Oliviera Hamlet, dva příklady dramatického dědictví, které sdílejí stejný dramatický obsah navzdory rozdílům v mediální podpoře. Anotace obsahu médií, která zprostředkovávají dramatický obsah, vyžaduje použití anotačního schématu vyjádřeného ve formálním jazyce, díky čemuž je anotace srovnatelná a případně strojově čitelné.

První pokusy o připojení metadat obsahu k médiím se týkaly textových dokumentů a byly prováděny pomocí značkovací jazyky, jako XML, které umožňují vložit značky obsahu do textu dokumentu. S příchodem Sémantický web projekt,[3] popisné nástroje se vyvinuly směrem k používání ontologií, a to díky jazykům a zdrojům poskytovaným projektem Semantic Web. Zejména sémantická anotace se opírá o použití Rámec popisu zdrojů jazyk, speciálně navržený pro popsaný webový obsah jakéhokoli typu.

Sémantická anotace dramatu spočívá v reprezentaci poznatků o dramatu ve strojově čitelném formátu, aby posloužila úkolu anotovat dramatický obsah koherentně napříč různými médii a jazyky a současně abstrahovat od technických aspektů signálů a kódování textu. Anotace dramatického obsahu napříč médii a žánry je způsob, jak uchovat, porovnat a studovat podstatu dramatu a jeho projevů. Dostupnost metadat obsahu o dramatu je navíc předpokladem pro řadu generativních úkolů, od automatizace generování dramatu až po podporu lidské kreativity v tomto úkolu.

Anotace příběhu a dramatu prostřednictvím značkovacích jazyků a jazykových schémat

Anotace příběhu spočívá v anotaci obsahu příběhy. Ve většině případů je toto úsilí prováděno s cílem konstruovat korpusy komentovaných příběhů nebo korpusy příběhu, dokončené při studiu vztahu mezi jazykovým vyjádřením příběhu v příběhu a jeho obsahem. V posledním desetiletí došlo k řadě výzkumných iniciativ zaměřených zejména na popis příběhu a postav. Zvažte například jazyk Narrative Knowledge Representation Language (NKRL)[4] a projekt DramaBank,[5] speciálně zaměřené na reprezentaci obsahu příběhu v textech v přirozeném jazyce.

Anotace narativních textů byla podněcována a ovlivňována dvěma hlavními směry výzkumu. Na jedné straně tradice reprezentace znalostí v AI přispěla koncepčními nástroji pro popis obsahu příběhů s jazyky, které sahají od skriptů[6] [Schank 1975] až rámy.[7] Jazykový protějšek této linie výzkumu vyústil ve zdroje umístěné na lexikálně-sémantické úrovni (jako např. FrameNet[8] a na rozhraní mezi syntaxí a sémantikou (např PropBank, které nabízejí nástroje pro znázornění souvislosti mezi vyjádřením příběhu prostřednictvím textu a samotným obsahem příběhu). Například nástroj Story Workbench[9] zahrnuje vrstvené anotační schéma, které využívá tyto zdroje pro vícevrstvou anotaci narativů. Na druhé straně anotace narativů těží z trendu zavedeného během posledních tří desetiletí,[10] reprezentace obsahu dokumentů ve strojově čitelné formě. S příchodem značkovacích jazyků, jako je Iniciativa pro kódování textu (TEI) pro kódování textu v digitální podobě a anotování jejich struktury se používání značek brzy stalo standardem v projektech textových anotací.

Zejména projekty jako Narrative Knowledge Representation Language (NKRL)[11] využil použití značkovacích jazyků pro reprezentaci narativního obsahu textu a přepracoval použití rámců do nově vznikajícího scénáře indexování a vyhledávání médií. V poslední době Elson v rámci obecnějšího úsilí o konstrukci prostředků pro automatizaci zpracování a generování jazyků navrhl jazyk založený na šabloně pro popis narativního obsahu textových dokumentů s cílem vytvořit korpus komentovaných narativních textů, s názvem DramaBank project.[12] V posledních letech se anotace narativního textu vyvinula směrem k minimálním schématům zaměřeným na uchopení pravidelností písemných a ústních narativů na úrovni diskurzu.[13] Tyto iniciativy, zakořeněné v narativních teoriích, se však zaměřují na realizaci narativů prostřednictvím konkrétního média, tj. Textu, zanechávajícího univerzální prvky dramatického vyprávění, které jdou za expresivními charakteristikami každého média.

Anotace příběhu a dramatu prostřednictvím výpočetní ontologie

Většinou se zaměřují na indexování a vyhledávání médií, objevily se ontologie a slovníky, které podporují reprezentaci obsahu médií podle sdílené sémantiky dostupné na webu. Zejména sémantické zdroje, jako je VERL (Video Event Reprezentation Language[14] a LODE (propojený otevřený popis událostí)[15] poskytnout strukturovaný popis událostí, který lze použít k popisu událostí v příbězích. V paradigmatu Propojená data, se tyto zdroje stávají infrastrukturou pro aplikace založené na obsahu v oblasti médií: například zvažte projekt EventMedia,[16] kde byly různé slovníky sladěny s automatickými metodami k vytvoření ilustrovaného katalogu médií představujících události.

Mediální nezávislý model příběhu poskytuje ontologie OntoMedia, využívaná napříč různými projekty (například projekt Contextus[17] anotovat narativní obsah různých mediálních objektů, od psané literatury po komiksy a televizní beletrii. Tento projekt zahrnuje některé koncepty, jako je pojem charakter, které jsou relevantní pro popis dramatu, ale je zaměřen hlavně na reprezentaci událostí a pořadí, v jakém jsou vystaveny v médiích pro srovnání mezi médii, postrádá schopnost reprezentovat základní pojmy dramatu. V oblasti šíření kulturního dědictví ontologie StorySpace,[18] ontologie příběhu, podporuje kurátory muzeí při propojování obsahu uměleckých děl prostřednictvím příběhů, přičemž konečným cílem je umožnit generování vyhledávání obsahu přizpůsobeného uživateli.[19]

Řada výzkumů řešila použití logických reprezentací k popisu příběhů s cílem vytvořit generativní systémy, které využívají axiomatizace narativních struktur.[20] Nakonec někteří vědci vytvořili reprezentační nástroje pro konkrétní narativní teorie, od literárního strukturalismu[21] k postupům psaní scénářů[22]

Drammar[23] je ontologie dramatu, koncipovaná speciálně pro anotaci dramatických médií.[24] Drammar si klade za cíl rozšířit používání ontologií k popisu obsahových metadat dramatických médií teoreticky neutrálním způsobem nezávislým na médiích. Použití formátu ontologie umožňuje nejen specifikovat koncepční model dramatu formálním a jednoznačným způsobem, ale také zpřístupňuje znalosti o dramatu jako slovník pro výměnu anotací napříč různými projekty a snadno použitelné pro aplikace, které zahrnují manipulaci anotace automatickými uvažovači a jinými typy softwaru[25]

Reference

  1. ^ Lombardo, Vincenzo; Pizzo, Antonio; Damiano, Rossana (1. února 2016). „Ochrana a přístup k dramatu jako nehmotnému kulturnímu dědictví“ (PDF). J. Comput. Kult. Dědit. 9 (1): 5:1–5:26. doi:10.1145/2812814. hdl:2318/1556751. ISSN  1556-4673.
  2. ^ Shakespeare, William; editoval Harold Jenkins (1997). Osada (Repr. Nelson. Ed.). Walton-on-Thames: Thomas Nelson. ISBN  978-0174434696.
  3. ^ Berners-Lee, Tim; Hendler, James; Lassila, Ora (1. ledna 2001). „Sémantický web“. Scientific American. 284 (5): 34–43. doi:10.1038 / scientificamerican0501-34. Archivovány od originál dne 6. září 2018. Citováno 12. října 2016.
  4. ^ ZARRI, GIAN PIERO (září 1997). „NKRL, nástroj reprezentace znalostí pro kódování„ smyslu “složitých narativních textů“. Přirozené jazykové inženýrství. 3 (2): 231–253. CiteSeerX  10.1.1.519.7577. doi:10.1017 / S1351324997001794.
  5. ^ Elson, David K. „DramaBank: Annotating Agency in Narrative Discourse“ (PDF): 2813–2819. Citovat deník vyžaduje | deník = (Pomoc)
  6. ^ Schank, Roger C .; Abelson, Robert P. (1. ledna 1975). „Skripty, plány a znalosti“. Sborník ze 4. mezinárodní společné konference o umělé inteligenci - svazek 1. Ijcai'75: 151–157.
  7. ^ Minsky, Marvin (1. ledna 1975). "Minsky's Frame System Theory". Proceedings of the 1975 Workshop on Theoretical Issues in Natural Language Processing. Tinlap '75: 104–116. doi:10.3115/980190.980222.
  8. ^ Baker, Collin F .; Fillmore, Charles J .; Lowe, John B. (1. ledna 1998). „Projekt Berkeley FrameNet“. Sborník z 36. výročního zasedání Asociace pro počítačovou lingvistiku a ze 17. mezinárodní konference o počítačové lingvistice - svazek 1. 1: 86–90. doi:10.3115/980845.980860.
  9. ^ Finlayson, Mark Alan. „The Story Workbench: Extensible Semi-Automatic Text Annotation Tool“: 21–24. Citovat deník vyžaduje | deník = (Pomoc)
  10. ^ Coombs, James H .; Renear, Allen H .; DeRose, Steven J. (1. listopadu 1987). "Značkovací systémy a budoucnost vědeckého zpracování textu". Commun. ACM. 30 (11): 933–947. CiteSeerX  10.1.1.515.5618. doi:10.1145/32206.32209. ISSN  0001-0782.
  11. ^ ZARRI, GIAN PIERO (září 1997). „NKRL, nástroj reprezentace znalostí pro kódování„ smyslu “složitých narativních textů“. Přirozené jazykové inženýrství. 3 (2): 231–253. CiteSeerX  10.1.1.519.7577. doi:10.1017 / S1351324997001794.
  12. ^ http://lrec.elra.info/proceedings/lrec2012/pdf/866_Paper.pdf
  13. ^ Rahimtoroghi, Elahe; Corcoran, Thomas; Swanson, Reid; Walker, Marilyn A .; Sagae, Kenji; Gordon, Andrew (23. října 2014). „Minimální schémata narativních anotací a jejich aplikace“. Citovat deník vyžaduje | deník = (Pomoc)
  14. ^ Francois, A.R.J .; Nevatia, R .; Hobbs, J .; Bolles, R.C. (Říjen 2005). "VERL: Rámec ontologie pro reprezentaci a anotování video událostí". IEEE Multimedia. 12 (4): 76–86. doi:10.1109 / MMUL.2005,87. S2CID  8772560.
  15. ^ Shaw, Ryan; Troncy, Raphaël; Hardman, Lynda (6. prosince 2009). "LODE: Propojení otevřených popisů událostí". Sémantický web. Přednášky z informatiky. 5926. str. 153–167. CiteSeerX  10.1.1.154.5031. doi:10.1007/978-3-642-10871-6_11. ISBN  978-3-642-10870-9.
  16. ^ Khrouf, Houda; Troncy, Raphael (2016). „EventMedia: datový soubor událostí LOD ilustrovaný médii“. Sémantický web. 7 (2): 193–199. doi:10,3233 / SW-150184.
  17. ^ „Jey Biddulph“.
  18. ^ Wolff, Annika; Mulholland, Paul; Collins, Trevor (1. ledna 2012). Storyspace: Příběh založený na vytváření příběhů muzea. Sborník 23. konference ACM o hypertextu a sociálních médiích. str. 89–98. doi:10.1145/2309996.2310012. ISBN  9781450313353.
  19. ^ Mulholland, P .; Collins, T. (1. září 2002). Používání digitálních příběhů k podpoře společného učení a zkoumání kulturního dědictví. 13. mezinárodní workshop o databázových a expertních systémových aplikacích, 2002. Sborník. 527–531. CiteSeerX  10.1.1.8.7977. doi:10.1109 / DEXA.2002.1045951. ISBN  978-0-7695-1668-4.
  20. ^ Martens, Chris; Bosser, Anne-Gwenn; Ferreira, João F .; Cavazza, Marc (15. září 2013). Lineární logické programování pro generaci narativu. Logické programování a nonmonotonic uvažování. Přednášky z informatiky. 8148. 427–432. doi:10.1007/978-3-642-40564-8_42. hdl:10149/312346. ISBN  978-3-642-40563-1.
  21. ^ Peinado, Federico; Gervás, Pablo; Díaz-Agudo, Belén (2004). Msgstr "Popis logické ontologie pro generování pohádek". Workshop LREC o jazykových zdrojích pro jazykovou kreativitu. 4: 56–61.
  22. ^ Szilas, Nicolas (11. února 2016). "Modelování a reprezentace dramatických situací jako paradoxních struktur". Digitální stipendium v ​​humanitních oborech. 32 (2): 403–422. doi:10.1093 / llc / fqv071. ISSN  2055-7671.
  23. ^ https://www.di.unito.it/wikidrammar wiki
  24. ^ Lombardo, Vincenzo; Pizzo, Antonio (27. června 2014). "Sada multimediálních nástrojů pro vizualizaci metadat dědictví dramatu". Multimediální nástroje a aplikace. 75 (7): 3901–3932. doi:10.1007 / s11042-014-2066-3. hdl:2318/148462.
  25. ^ Lombardo, Vincenzo; Battaglino, Cristina; Pizzo, Antonio; Damiano, Rossana; Lieto, Antonio (2015). „Spojení koncepčního modelování a pravidel pro anotaci dramatických médií“. Sémantický web. 6 (5): 503–534. doi:10,3233 / SW-140156. hdl:2318/155427.

externí odkazy