Klíčové slovo v kontextu - Key Word in Context
Klíčové slovo v kontextu (KWIC) je nejběžnější formát pro shoda řádky. Termín KWIC poprvé vytvořil Hans Peter Luhn.[1] Systém byl založen na konceptu zvaném klíčové slovo v titulech který pro manchesterské knihovny poprvé navrhl v roce 1864 Andrea Crestadoro.[2]
Index KWIC je tvořen seřazením a zarovnáním slov v názvu článku, aby bylo možné každé slovo (kromě přestaň slova ) v názvech, které lze prohledávat abecedně v rejstříku.[3] Byla to užitečná metoda indexování technických příruček před počítačovým zpracováním fulltextové vyhledávání stal se obyčejný.[4]
Například vyhledávací dotaz zahrnující všechna slova v definici příkladu („KWIC je zkratka pro Key Word In Context, nejběžnější formát pro shodné řádky“) a slogan Wikipedie v angličtině („encyklopedie zdarma“), prohledáno na stránce Wikipedie, může poskytnout index KWIC následujícím způsobem. Index KWIC obvykle používá široké rozložení, které umožňuje zobrazení maximálních „kontextových“ informací (v následujícím příkladu není zobrazeno).
KWIC je | akronym pro klíčové slovo v kontextu, ... | Strana 1 |
... Klíčové slovo v kontextu, nejvíce | běžný formát pro shodné řádky. | Strana 1 |
... nejběžnější formát pro | shoda řádky. | Strana 1 |
... je zkratka pro Key Word In | Kontext, nejběžnější formát ... | Strana 1 |
Wikipedia, The Free | Encyklopedie | strana 0 |
... V kontextu, nejběžnější | formát pro shodné linky. | Strana 1 |
Wikipedia, The | Volný, uvolnit Encyklopedie | strana 0 |
KWIC je zkratka pro | Klíč Slovo v kontextu, nejvíce ... | Strana 1 |
KWIC je zkratka pro Key Word ... | Strana 1 | |
... společný formát pro shodu | řádky. | Strana 1 |
... pro klíčové slovo v kontextu | většina společný formát pro shodu ... | Strana 1 |
Wikipedia, Otevřená encyklopedie | strana 0 | |
KWIC je zkratka pro Key | Slovo V kontextu je nejčastější ... | Strana 1 |
Index KWIC je zvláštní případ a permutovaný index.[5] Tento termín odkazuje na skutečnost, že indexuje vše cyklické permutace nadpisů. Knihy složené z mnoha krátkých sekcí s vlastními popisnými nadpisy, zejména sbírek manuální stránky, často končily a permutovaný index sekce, která umožňuje čtenáři snadno najít sekci jakýmkoli slovem z jejího záhlaví. Tato praxe, známá také jako Klíčové slovo mimo kontext (KWOC), již není běžný.
Klíčové slovo vedle kontextu (KWAC)
Klíčové slovo v kontextu (KWIC)
Klíčové slovo mimo kontext (KWOC)
Odkazy v literatuře
Poznámka: První reference nezobrazuje index KWIC, pokud nezaplatíte za prohlížení příspěvku. Druhý odkaz vůbec neuvádí ani papír.
- David L. Parnas používá ve své práci index KWIC jako příklad toho, jak provádět modulární design Kritéria, která se mají použít při rozkladu systémů na moduly, k dispozici jako ACM Classic Paper
- Christopher D. Manning a Hinrich Schütze popisují index KWIC a počítačové shody v oddíle 1.4.5 jejich knihy Základy statistického zpracování přirozeného jazyka. Cambridge, Mass: MIT Press, 1999. ISBN 9780262133609. Citují článek od H.P. Luhn z roku 1960, „Klíčový index v kontextu pro technickou literaturu (kwic index)“.
- Podle reverenda Gerarda O'Connora Concordantia et Indices Missalium Romanorum „Většina shod vytvořených v nedávné době as pomocí počítačového softwaru používá jak formáty KWIC (klíčové slovo v kontextu), tak KWICn (klíčové slovo ve středu), které uvádí klíčové slovo, obvykle zvýrazněné tučným textem v konzistentní pozici, v omezeném množství kontextového textu, tj. tři [nebo] čtyři slova textu před klíčovým slovem a stejné množství následujícího textu. Tento formát je nesmírně užitečný v tom, že klíčové slovo je snadno identifikovatelné společně s jeho kontextem ... Shoda římského misálu se vyrábí ve formátech KWIC i KWICn a je pozoruhodná tím, že každá slovní forma je uvedena tak, jak je uvedena v textu, to znamená, že není lemmatizována. “
Viz také
- ptx, nástroj příkazového řádku Unix produkující a permutovaný index
- Harmonikář
- Shoda (vydavatelství)
- Burrows – Wheelerova transformace
- Hans Peter Luhn
- Příponový strom
Reference
- ^ Manning, C. D., Schütze, H .: "Základy statistického zpracování přirozeného jazyka", s. 35. MIT Press, 1999
- ^ „Pokročilé postupy indexování a abstrahování“. Atlantic Publishers & Distri. Citováno 26. března 2019 - prostřednictvím Knih Google.
- ^ „Archivovaná kopie“. Archivovány od originál dne 06.06.2016. Citováno 2016-06-17.CS1 maint: archivovaná kopie jako titul (odkaz)
- ^ „Terénní průvodce“. Pátek 8. května 2020
- ^ "3. Teorie indexování KWIC". Infohost.nmt.edu. Citováno 26. března 2019.