Infobox - Infobox - Wikipedia
Na wiki, an infobox je stůl slouží ke shromažďování a prezentaci podmnožiny informací o předmětu, jako je a dokument. Je to strukturovaný dokument obsahující sadu páry atribut – hodnota,[1] a v Wikipedia představuje souhrn informací o předmětu an článek.[2] Tímto způsobem jsou srovnatelné s údaji tabulky v některých aspektech. Když je prezentován v rámci většího dokumentu, který shrnuje, je infobox často prezentován v postranní panel formát.
Infobox může být implementován v jiném dokumentu do zatracující do tohoto dokumentu a specifikovat některé nebo všechny páry atribut-hodnota spojené s tímto infoboxem, známým jako parametrizace.
Wikipedia
K shrnutí informací o článku lze použít infobox Wikipedia.[3] Používají se v podobných článcích k zajištění konzistence prezentace pomocí společného formátu.[4][2] Původně se používaly infoboxy (a šablony obecně) rozvržení stránky účely.[2] Infobox lze převést do článku zadáním hodnota pro některé nebo všechny jeho parametry.[5] Použitý název parametru musí být stejný jako název uvedený v šabloně infoboxu, ale k ní může být přidružena jakákoli hodnota.[5] Jméno je oddělený z hodnoty o znaménko rovná se.[5] Název parametru lze považovat za atribut předmětu článku.[6]
{{Infobox připravené jídlo | jméno = | obrázek = | imagesize = | titulek = | alternate_name = | country = | region = | tvůrce = | kurz = | typ = | sloužil = | main_ingredient = | variace = | kalorie = | other =}} | {{Infobox připravené jídlo | jméno = Crostata | obrázek = Crostata limone e zenzero 3.jpg | imagesize = | titulek = Crostata s citronovou zázvorovou náplní | alternate_name = | země = [[Itálie]]| region = [[Lombardia]]| tvůrce = | samozřejmě = [[Dezert]]| zadejte = [[Dortík]]| sloužil = | main_ingredient = Pečivá kůra, [[džem]] nebo [[ricotta]], ovoce | variace = ''Crostata di frutta'', ''crostata di ricotta'', mnoho dalších sladkých nebo slaných variací kalorie = | other =}} |
Infobox Infobox připravené jídlo použitý na článcích souvisejících s potravinami na Wikipedii, bez č hodnoty určené pro jeho parametry (atributy). | Stejný infobox jako implementovaný v článku crostata. Všimněte si, že hodnoty jsou napravo od znaménko rovná se (=) a že názvy parametrů jsou stejné jako ve specifikaci šablony infoboxu. Hodnoty jsou v označení wiki: položky uzavřené v hranatých závorkách (např. [[Tart]]) budou vykresleny jako odkaz na příslušný článek Wikipedie (např. Dortík ) a propojený soubor bude převeden do článku namísto jeho označení. |
Na Wikipedii je infobox zahrnut do článku uzavřením dvojic název a atribut – hodnota do dvojité sady rovnátka. The MediaWiki software, na kterém pak Wikipedia funguje analyzuje dokument, pro který infobox a další šablony zpracovává a procesor šablony. Tohle je stroj šablony který vyrábí a webový dokument a a styl slouží k prezentaci dokumentu. To umožňuje, aby byl design infoboxu oddělen od obsahu, s nímž manipuluje;[2] to znamená, že design šablony může být aktualizován, aniž by to ovlivnilo informace v ní, a nový design se automaticky rozšíří na všechny články, které infobox vylučují.[4] Infoboxy obvykle jsou formátovaný se zobrazí v pravém horním rohu článku Wikipedie v zobrazení plochy,[3] nebo nahoře v mobilním zobrazení.
Umístění infoboxu v rámci wikitext článku je důležité pro přístupnost.[7] A nejlepší praxe je umístit je následovně rozcestník šablony (ty, které nasměrují čtenáře na články o tématech s podobnými názvy) a šablony údržby (například označení článku jako neodkázaného), ale před všemi ostatními obsah.[8][9]
Baeza-Yates a King tvrdí, že některým editorům připadají šablony jako infoboxy komplikované,[10] protože šablona může skrýt text o vlastnosti nebo zdroji, který si editor přeje změnit; to je umocněno zřetězenými šablonami, tj. šablonami zahrnutými do jiných šablon.[10]
V srpnu 2009 anglická Wikipedia používala přibližně 3 000 šablon infoboxů, které společně používaly více než 20 000 atributů.[11] Od té doby bylo mnoho sloučeno, aby se snížila nadbytečnost. K červnu 2013 došlo k nejméně 1345 446 vyloučením rodiče Šablona Infobox ,[12] používaný některými, ale ne všemi, informačními kanály na 4 251 127 článcích.
Název Infoboxu je obvykle „Infobox [žánr]“; široce používaným informačním boxům však lze přiřadit kratší názvy, například „taxobox“ pro taxonomii.[8]
Strojové učení
Asi 44,2% článků na Wikipedii obsahovalo infobox v roce 2008,[13] a asi 33% v roce 2010.[14] Automatizovaný extrakce sémantických znalostí použitím strojové učení algoritmy se používají k „extrakci strojově zpracovatelných informací při relativně nízkých nákladech na složitost“.[1] Nízké pokrytí to však ztěžuje, i když to lze částečně překonat doplněním údajů o článku o údaje v Kategorie ve kterém je článek obsažen.[13] The Francouzská Wikipedia zahájila projekt Infobox verze 2 v květnu 2011.[15][16]
Znalosti získané strojovým učením lze využít ke zdokonalení článku, například pomocí automatických návrhů softwaru pro editory pro přidání dat infoboxu.[13] Projekt iPopulator vytvořil systém, který přidal hodnotu parametru infoboxu článku pomocí automatické analýzy textu tohoto článku.[11]
DBpedia používá strukturovaný obsah extrahované z infoboxů[2] algoritmy strojového učení k vytvoření zdroje propojené údaje v Sémantický web; popsal to Tim Berners-Lee jako „jedna z nejznámějších“ součástí propojeného datového projektu.[17]
Strojová extrakce vytváří trojnásobek skládající se z subjektu, predikátu nebo relace a objektu.[1] Každý pár atribut-hodnota infoboxu se používá k vytvoření RDF prohlášení pomocí ontologie.[18] To usnadňuje užší propast mezi Wikipedií a ontologií, než jaká existuje mezi nestrukturovaným nebo volným textem a ontologií.[19]
Sémantický vztah mezi subjektem a objektem je stanoven predikátem.[1] V příkladu infoboxu trojice („crostata“, typ, „tart“) označuje, že a crostata je typ dortík. Téma článku se používá jako předmět, název parametru se používá jako predikát a hodnota parametru jako objekt.[18][1] Každý typ infoboxu je mapován na třídu ontologie a každá vlastnost (parametr) v infoboxu je mapována na vlastnost ontologie.[20] Tato mapování se používají při analýze článku na Wikipedii k extrakci dat.
Poznámky
- ^ A b C d E Baeza-Yates & King 2009, str. 31.
- ^ A b C d E Liyang 2011, str. 385.
- ^ A b Broughton 2008, str. 357.
- ^ A b Broughton 2008, str. 17.
- ^ A b C Broughton 2008, str. 18.
- ^ Baeza-Yates & King 2009, str. 30.
- ^ Broughton 2008, str. 234.
- ^ A b Broughton 2008, str. 235.
- ^ The Anglická Wikipedia politika týkající se přístupnosti je uvedena v Wikipedia: Manual of Style / Accessibility. Politika o wikitext rozvržení je uvedeno na Wikipedia: Manual of Style / Layout a Wikipedia: Manuál stylu / hlavní sekce.
- ^ A b Baeza-Yates & King 2009, str. 345.
- ^ A b Lange, Böhm & Naumann 2010, str. 7.
- ^ „Nástroje nástroje Jarry1250 Toolserver - počet vyloučení šablon“. Seznam projektů Wikimedia. 7. června 2013. Citováno 7. června 2013.
- ^ A b C Baeza-Yates & King 2009, str. 28.
- ^ Lange, Böhm & Naumann 2010, str. 5.
- ^ Geertman, Reinhardt & Toppen 2011, str. 493.
- ^ Projekt je hostován na serveru Francouzská Wikipedia strana Infobox / V2.
- ^ Miller 2008.
- ^ A b Liyang 2011, str. 387.
- ^ Virvou a Matsuura 2012, str. 315.
- ^ Liyang 2011, str. 395.
Reference
- Baeza-Yates, Ricardo; King, Irwin, eds. (2009). Tkalcovské služby a lidé v síti WWW. Springer. ISBN 9783642005695. LCCN 2009926100.
- Broughton, John (2008-07-14). Barber, Nan; Meyers, Peter (eds.). Wikipedia - Chybějící příručka. O'Reilly Media. ISBN 9780596553777.
- Geertman, Stan; Reinhardt, Wolfgang; Toppen, Fred, eds. (2011). Pokrok v oblasti geoinformačních věd pro měnící se svět. Poznámky k přednášce v geoinformacích a kartografii. 1. Springer. doi:10.1007/978-3-642-19789-5. ISBN 9783642197888. ISSN 1863-2246. LCCN 2011925152.
- Lange, Dustin; Böhm, Christoph; Naumann, Felix (2010). Extrakce strukturovaných informací z článků na Wikipedii za účelem naplnění infoboxů. Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam, Hasso-Plattner-Institut für Softwaresystemtechnik Potsdam. Universitätsverlag Potsdam. ISBN 9783869560816.
- Yu, Liyang (2011). Průvodce pro vývojáře po sémantickém webu. Springer. doi:10.1007/978-3-642-15970-1. ISBN 9783642159695.
- Miller, Paul (07.02.2008). „Sir Tim Berners-Lee hovoří s Talisem o sémantickém webu“. Přepis CastingWords. Talis Group. Archivovány od originál dne 10.05.2013. Citováno 2013-06-02.
- Virvou, Maria; Matsuura, Saeko, eds. (2012). Znalostní softwarové inženýrství: Sborník z desáté společné konference o znalostním softwarovém inženýrství. Hranice a umělá inteligence a aplikace. 240. IOS Press. ISBN 9781614990932. LCCN 2012943674.
Další čtení
- Kiran, Kumar N .; Santosh, G.S.K .; Varma, Vasudeva (červen 2011). „Multilingual document clustering using Wikipedia as external knowledge“. Multidisciplinární získávání informací. Přednášky z informatiky. Springer Berlin Heidelberg. 6653. doi:10.1007/978-3-642-21353-3. ISBN 9783642213533. ISSN 0302-9743.
- Chutiporn, Anutariya; Domingue, John, eds. (2008). Sémantický web: 3. asijská konference o sémantickém webu, ASWC 2008, Bangkok, Thajsko, 8. – 11. Prosince 2008. Sborník. Přednášky z informatiky. 5367. Springer. ISBN 9783540897033. ISSN 0302-9743.
- Wu, Fei; Hoffmann, Ralph; Weld, Daniel s. (2008). "Extrakce informací z Wikipedie: pohyb dolů dlouhým ocasem". Sborník příspěvků ze 14. mezinárodní konference ACM SIGKDD o získávání znalostí a dolování dat. Sdružení pro výpočetní techniku: 731–739. doi:10.1145/1401890.1401978. ISBN 9781605581934.