Infobox - Infobox - Wikipedia

Infobox ze skutečného života Britská železniční třída 43 auto 43185 provozované společností První Great Western

Na wiki, an infobox je stůl slouží ke shromažďování a prezentaci podmnožiny informací o předmětu, jako je a dokument. Je to strukturovaný dokument obsahující sadu páry atribut – hodnota,^[1] a v Wikipedia představuje souhrn informací o předmětu an článek.^[2] Tímto způsobem jsou srovnatelné s údaji tabulky v některých aspektech. Když je prezentován v rámci většího dokumentu, který shrnuje, je infobox často prezentován v postranní panel formát.

Infobox může být implementován v jiném dokumentu do zatracující do tohoto dokumentu a specifikovat některé nebo všechny páry atribut-hodnota spojené s tímto infoboxem, známým jako parametrizace.

Wikipedia

K shrnutí informací o článku lze použít infobox Wikipedia.^[3] Používají se v podobných článcích k zajištění konzistence prezentace pomocí společného formátu.^[4]^[2] Původně se používaly infoboxy (a šablony obecně) rozvržení stránky účely.^[2] Infobox lze převést do článku zadáním hodnota pro některé nebo všechny jeho parametry.^[5] Použitý název parametru musí být stejný jako název uvedený v šabloně infoboxu, ale k ní může být přidružena jakákoli hodnota.^[5] Jméno je oddělený z hodnoty o znaménko rovná se.^[5] Název parametru lze považovat za atribut předmětu článku.^[6]

{{Infobox připravené jídlo | jméno = | obrázek = | imagesize = | titulek = | alternate_name = | country = | region = | tvůrce = | kurz = | typ = | sloužil = | main_ingredient = | variace = | kalorie = | other =}}

{{Infobox připravené jídlo | jméno = Crostata | obrázek = Crostata limone e zenzero 3.jpg | imagesize = | titulek = Crostata s citronovou zázvorovou náplní | alternate_name = | země = [[Itálie]]| region = [[Lombardia]]| tvůrce = | samozřejmě = [[Dezert]]| zadejte = [[Dortík]]| sloužil = | main_ingredient = Pečivá kůra, [[džem]] nebo [[ricotta]], ovoce | variace = ''Crostata di frutta'', ''crostata di ricotta'', mnoho dalších sladkých nebo slaných variací kalorie = | other =}}

Infobox Infobox připravené jídlo použitý na článcích souvisejících s potravinami na Wikipedii, bez č hodnoty určené pro jeho parametry (atributy).

Stejný infobox jako implementovaný v článku crostata. Všimněte si, že hodnoty jsou napravo od znaménko rovná se (=) a že názvy parametrů jsou stejné jako ve specifikaci šablony infoboxu. Hodnoty jsou v označení wiki: položky uzavřené v hranatých závorkách (např. [[Tart]]) budou vykresleny jako odkaz na příslušný článek Wikipedie (např. Dortík ) a propojený soubor bude převeden do článku namísto jeho označení.

Infobox k článku na Wikipedii Crostata vykreslen a modul webového prohlížeče na stolní počítač

Taxobox (zkratka pro taxonomie infobox) pro článek na Wikipedii Xuanhanosaurus vykreslen a modul webového prohlížeče na stolní počítač. Taxobox je typ infoboxu, který podrobně popisuje taxonomii konkrétního forma života nebo zvíře

Na Wikipedii je infobox zahrnut do článku uzavřením dvojic název a atribut – hodnota do dvojité sady rovnátka. The MediaWiki software, na kterém pak Wikipedia funguje analyzuje dokument, pro který infobox a další šablony zpracovává a procesor šablony. Tohle je stroj šablony který vyrábí a webový dokument a a styl slouží k prezentaci dokumentu. To umožňuje, aby byl design infoboxu oddělen od obsahu, s nímž manipuluje;^[2] to znamená, že design šablony může být aktualizován, aniž by to ovlivnilo informace v ní, a nový design se automaticky rozšíří na všechny články, které infobox vylučují.^[4] Infoboxy obvykle jsou formátovaný se zobrazí v pravém horním rohu článku Wikipedie v zobrazení plochy,^[3] nebo nahoře v mobilním zobrazení.

Umístění infoboxu v rámci wikitext článku je důležité pro přístupnost.^[7] A nejlepší praxe je umístit je následovně rozcestník šablony (ty, které nasměrují čtenáře na články o tématech s podobnými názvy) a šablony údržby (například označení článku jako neodkázaného), ale před všemi ostatními obsah.^[8]^[9]

Baeza-Yates a King tvrdí, že některým editorům připadají šablony jako infoboxy komplikované,^[10] protože šablona může skrýt text o vlastnosti nebo zdroji, který si editor přeje změnit; to je umocněno zřetězenými šablonami, tj. šablonami zahrnutými do jiných šablon.^[10]

V srpnu 2009 anglická Wikipedia používala přibližně 3 000 šablon infoboxů, které společně používaly více než 20 000 atributů.^[11] Od té doby bylo mnoho sloučeno, aby se snížila nadbytečnost. K červnu 2013 došlo k nejméně 1345 446 vyloučením rodiče Šablona Infobox ,^[12] používaný některými, ale ne všemi, informačními kanály na 4 251 127 článcích.

Název Infoboxu je obvykle „Infobox [žánr]“; široce používaným informačním boxům však lze přiřadit kratší názvy, například „taxobox“ pro taxonomii.^[8]

Strojové učení

Asi 44,2% článků na Wikipedii obsahovalo infobox v roce 2008,^[13] a asi 33% v roce 2010.^[14] Automatizovaný extrakce sémantických znalostí použitím strojové učení algoritmy se používají k „extrakci strojově zpracovatelných informací při relativně nízkých nákladech na složitost“.^[1] Nízké pokrytí to však ztěžuje, i když to lze částečně překonat doplněním údajů o článku o údaje v Kategorie ve kterém je článek obsažen.^[13] The Francouzská Wikipedia zahájila projekt Infobox verze 2 v květnu 2011.^[15]^[16]

Znalosti získané strojovým učením lze využít ke zdokonalení článku, například pomocí automatických návrhů softwaru pro editory pro přidání dat infoboxu.^[13] Projekt iPopulator vytvořil systém, který přidal hodnotu parametru infoboxu článku pomocí automatické analýzy textu tohoto článku.^[11]

DBpedia používá strukturovaný obsah extrahované z infoboxů^[2] algoritmy strojového učení k vytvoření zdroje propojené údaje v Sémantický web; popsal to Tim Berners-Lee jako „jedna z nejznámějších“ součástí propojeného datového projektu.^[17]

Strojová extrakce vytváří trojnásobek skládající se z subjektu, predikátu nebo relace a objektu.^[1] Každý pár atribut-hodnota infoboxu se používá k vytvoření RDF prohlášení pomocí ontologie.^[18] To usnadňuje užší propast mezi Wikipedií a ontologií, než jaká existuje mezi nestrukturovaným nebo volným textem a ontologií.^[19]

Sémantický vztah mezi subjektem a objektem je stanoven predikátem.^[1] V příkladu infoboxu trojice („crostata“, typ, „tart“) označuje, že a crostata je typ dortík. Téma článku se používá jako předmět, název parametru se používá jako predikát a hodnota parametru jako objekt.^[18]^[1] Každý typ infoboxu je mapován na třídu ontologie a každá vlastnost (parametr) v infoboxu je mapována na vlastnost ontologie.^[20] Tato mapování se používají při analýze článku na Wikipedii k extrakci dat.

Poznámky

^ ^A ^b ^C ^d ^E Baeza-Yates & King 2009, str. 31.
^ ^A ^b ^C ^d ^E Liyang 2011, str. 385.
^ ^A ^b Broughton 2008, str. 357.
^ ^A ^b Broughton 2008, str. 17.
^ ^A ^b ^C Broughton 2008, str. 18.
^ Baeza-Yates & King 2009, str. 30.
^ Broughton 2008, str. 234.
^ ^A ^b Broughton 2008, str. 235.
^ The Anglická Wikipedia politika týkající se přístupnosti je uvedena v Wikipedia: Manual of Style / Accessibility. Politika o wikitext rozvržení je uvedeno na Wikipedia: Manual of Style / Layout a Wikipedia: Manuál stylu / hlavní sekce.
^ ^A ^b Baeza-Yates & King 2009, str. 345.
^ ^A ^b Lange, Böhm & Naumann 2010, str. 7.
^ „Nástroje nástroje Jarry1250 Toolserver - počet vyloučení šablon“. Seznam projektů Wikimedia. 7. června 2013. Citováno 7. června 2013.
^ ^A ^b ^C Baeza-Yates & King 2009, str. 28.
^ Lange, Böhm & Naumann 2010, str. 5.
^ Geertman, Reinhardt & Toppen 2011, str. 493.
^ Projekt je hostován na serveru Francouzská Wikipedia strana Infobox / V2.
^ Miller 2008.
^ ^A ^b Liyang 2011, str. 387.
^ Virvou a Matsuura 2012, str. 315.
^ Liyang 2011, str. 395.

Reference

Baeza-Yates, Ricardo; King, Irwin, eds. (2009). Tkalcovské služby a lidé v síti WWW. Springer. ISBN 9783642005695. LCCN 2009926100.
Broughton, John (2008-07-14). Barber, Nan; Meyers, Peter (eds.). Wikipedia - Chybějící příručka. O'Reilly Media. ISBN 9780596553777.
Geertman, Stan; Reinhardt, Wolfgang; Toppen, Fred, eds. (2011). Pokrok v oblasti geoinformačních věd pro měnící se svět. Poznámky k přednášce v geoinformacích a kartografii. 1. Springer. doi:10.1007/978-3-642-19789-5. ISBN 9783642197888. ISSN 1863-2246. LCCN 2011925152.
Lange, Dustin; Böhm, Christoph; Naumann, Felix (2010). Extrakce strukturovaných informací z článků na Wikipedii za účelem naplnění infoboxů. Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam, Hasso-Plattner-Institut für Softwaresystemtechnik Potsdam. Universitätsverlag Potsdam. ISBN 9783869560816.
Yu, Liyang (2011). Průvodce pro vývojáře po sémantickém webu. Springer. doi:10.1007/978-3-642-15970-1. ISBN 9783642159695.
Miller, Paul (07.02.2008). „Sir Tim Berners-Lee hovoří s Talisem o sémantickém webu“. Přepis CastingWords. Talis Group. Archivovány od originál dne 10.05.2013. Citováno 2013-06-02.
Virvou, Maria; Matsuura, Saeko, eds. (2012). Znalostní softwarové inženýrství: Sborník z desáté společné konference o znalostním softwarovém inženýrství. Hranice a umělá inteligence a aplikace. 240. IOS Press. ISBN 9781614990932. LCCN 2012943674.

Další čtení

Kiran, Kumar N .; Santosh, G.S.K .; Varma, Vasudeva (červen 2011). „Multilingual document clustering using Wikipedia as external knowledge“. Multidisciplinární získávání informací. Přednášky z informatiky. Springer Berlin Heidelberg. 6653. doi:10.1007/978-3-642-21353-3. ISBN 9783642213533. ISSN 0302-9743.
Chutiporn, Anutariya; Domingue, John, eds. (2008). Sémantický web: 3. asijská konference o sémantickém webu, ASWC 2008, Bangkok, Thajsko, 8. – 11. Prosince 2008. Sborník. Přednášky z informatiky. 5367. Springer. ISBN 9783540897033. ISSN 0302-9743.
Wu, Fei; Hoffmann, Ralph; Weld, Daniel s. (2008). "Extrakce informací z Wikipedie: pohyb dolů dlouhým ocasem". Sborník příspěvků ze 14. mezinárodní konference ACM SIGKDD o získávání znalostí a dolování dat. Sdružení pro výpočetní techniku: 731–739. doi:10.1145/1401890.1401978. ISBN 9781605581934.

[FOOTNOTEBaeza-YatesKing200931-1] A ^b ^C ^d ^E Baeza-Yates & King 2009, str. 31.

[FOOTNOTELiyang2011385-2] A ^b ^C ^d ^E Liyang 2011, str. 385.

[FOOTNOTEBroughton2008357-3] A ^b Broughton 2008, str. 357.

[FOOTNOTEBroughton200817-4] A ^b Broughton 2008, str. 17.

[FOOTNOTEBroughton200818-5] A ^b ^C Broughton 2008, str. 18.

[FOOTNOTEBaeza-YatesKing200930-6] Baeza-Yates & King 2009, str. 30.

[FOOTNOTEBroughton2008234-7] Broughton 2008, str. 234.

[FOOTNOTEBroughton2008235-8] A ^b Broughton 2008, str. 235.

[9] The Anglická Wikipedia politika týkající se přístupnosti je uvedena v Wikipedia: Manual of Style / Accessibility. Politika o wikitext rozvržení je uvedeno na Wikipedia: Manual of Style / Layout a Wikipedia: Manuál stylu / hlavní sekce.

[FOOTNOTEBaeza-YatesKing2009345-10] A ^b Baeza-Yates & King 2009, str. 345.

[FOOTNOTELangeBöhmNaumann20107-11] A ^b Lange, Böhm & Naumann 2010, str. 7.

[Jarry-12] „Nástroje nástroje Jarry1250 Toolserver - počet vyloučení šablon“. Seznam projektů Wikimedia. 7. června 2013. Citováno 7. června 2013.

[FOOTNOTEBaeza-YatesKing200928-13] A ^b ^C Baeza-Yates & King 2009, str. 28.

[FOOTNOTELangeBöhmNaumann20105-14] Lange, Böhm & Naumann 2010, str. 5.

[FOOTNOTEGeertmanReinhardtToppen2011493-15] Geertman, Reinhardt & Toppen 2011, str. 493.

[16] Projekt je hostován na serveru Francouzská Wikipedia strana Infobox / V2.

[FOOTNOTEMiller2008-17] Miller 2008.

[FOOTNOTELiyang2011387-18] A ^b Liyang 2011, str. 387.

[FOOTNOTEVirvouMatsuura2012315-19] Virvou a Matsuura 2012, str. 315.

[FOOTNOTELiyang2011395-20] Liyang 2011, str. 395.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]