Akademické studie o Wikipedii - Academic studies about Wikipedia
Od doby, kdy byla Wikipedie stará několik let, jich bylo mnoho akademické studie o Wikipedii v recenzováno publikace. Tento výzkum lze rozdělit do dvou kategorií. První analyzoval produkci a spolehlivost obsahu encyklopedie, zatímco druhý zkoumal sociální aspekty, jako je použití a správa. Tyto studie velmi usnadňuje skutečnost, že Wikipedia Databázi lze stáhnout bez pomoci vlastníka webu.[1]
Obsah
Výroba
Menšina editorů produkuje většinu trvalého obsahu
V mezník recenzovaný papír,[2] uvedeno také v Opatrovník,[3] tým šesti výzkumníků z University of Minnesota měřil vztah mezi počtem úprav editorů a schopností editorů přenášet své spisy čtenářům Wikipedie, měřeno pomocí trvalých zobrazení slov (PWV) - kolikrát je zobrazeno slovo vložené úpravou. Účetní metodu lze nejlépe popsat pomocí autorových vlastních slov: "pokaždé, když je článek zobrazen, je zobrazeno také každé z jeho slov. Když je zobrazeno slovo napsané editorem X, je mu připsán jeden PWV." Počet zobrazení článku byl odhadnut z protokolů webového serveru.
Vědci analyzovali 25 bilion PWV lze připsat registrovaným uživatelům v intervalu 1. září 2002 - 31. října 2006. Na konci tohoto období bylo 10% editorů (podle počtu úprav) připsáno 86% PWV, horní 1% přibližně 70 % a nejvyšších 0,1% (4200 uživatelů) bylo připsáno 44% PWV, tj. téměř polovina „hodnoty“ Wikipedie měřené v této studii. Prvních 10 editorů (podle PWV) přispělo pouze 2,6% PWV a pouze tři z nich byli v top 50 podle počtu úprav. Z údajů autoři studie odvodili následující vztah:
Růst podílu PWV se zvyšuje superexponenciálně podle pořadí počet pořadí; jinými slovy, elitní redaktoři (ti, kteří upravují nejčastěji) více hodnotu, než jakou by jim [bylo přiděleno] vzhledem k a mocenský zákon vztah.
Studie také analyzovala dopad roboti na obsah. Podle počtu úprav dominují na Wikipedii roboti; 9 z 10 nejlepších a 20 z 50 nejlepších jsou roboti. Naproti tomu v žebříčku PWV se v top 50 objevují pouze dva roboti a v top 10 žádný.
Na základě stálého růstu vlivu na ty nejlepší 0,1% editory PWV studie dospěla k jednoznačnému závěru:
... Častí redaktoři ovládají to, co lidé vidí při návštěvě Wikipedie a ... tato nadvláda se zvyšuje.
Rozložení práce a sociální vrstvy
Recenzovaný příspěvek zaznamenal „sociální stratifikace ve společnosti Wikipedia „kvůli„ třídě administrátorů “. Příspěvek navrhl, že taková stratifikace může být v některých ohledech prospěšná, ale uznal„ jasný následný posun moci mezi úrovněmi stratifikace “kvůli„ rozdílům mezi statusem a mocí “mezi administrátory a další editory.[4]
Analyzuje se celá historie úprav Anglická Wikipedia do července 2006 stejná studie zjistila, že vliv úprav administrátorů na obsah se od roku 2003, kdy administrátoři prováděli zhruba 50% z celkových úprav, neustále snižoval, do roku 2006, kdy administrátoři prováděli pouze 10% úprav. To se stalo i přes skutečnost, že průměrný počet úprav na správce se během stejného období zvýšil více než pětinásobně. Tento fenomén byl autory článku označen jako „vzestup davu“. Analýza, která jako metriku použila počet slov upravených místo počtu akcí úprav, ukázala podobný vzor. Protože třída administrátorů je vzhledem k počtu úprav poněkud libovolná, studie také zvažovala rozdělení uživatelů do kategorií na základě počtu provedených úprav. Výsledky pro „elitní uživatele“, tj. Uživatele s více než 10 000 úpravami, byly poněkud v souladu s výsledky získanými pro administrátory, až na to, že „počet slov změněných elitními uživateli držel krok se změnami provedenými začínajícími uživateli, i když počet úprav provedených začínajícími uživateli rostl proporcionálně rychleji “. Elitním uživatelům bylo přiděleno přibližně 30% změn pro rok 2006. Studie uzavírá:
I když se tedy jejich vliv v posledních letech slábne, zdá se, že elitní uživatelé nadále přispívají značnou částí práce odvedené na Wikipedii. Kromě toho ... úpravy provedené elitními uživateli se zdají být podstatného rázu. To znamená, že se zdá, že dělají víc než jen opravu pravopisných chyb nebo přeformátování citací ...
Spolehlivost
An Argumentace konference (2010) hodnotila, zda je důvěra ve Wikipedii založena na epistemický nebo pragmatické zásluhy. I když čtenáři nemusí posoudit skutečné znalosti a odbornost autorů daného článku, mohou posoudit vášeň přispěvatelů pro projekt a komunikační design, jehož prostřednictvím se tato vášeň projevuje, a poskytnout důvod důvěry.[5]
Autor podrobně tvrdil, že Wikipedii nelze důvěřovat na základě individuálních odborných znalostí, kolektivních znalostí nebo minulých zkušeností se spolehlivostí. To je proto, že anonymita a pseudonymita zabránit hodnocení znalostí a "anti-expertní kultura„je nepravděpodobné, že by se to změnilo. Úpravy Wikipedie mohou být do značné míry omezeny na elitní skupinu editorů, aniž by se agregovaly“moudrost davu "což v některých případech stejně snižuje kvalitu článku. Osobní zkušenosti a empirické studie, potvrzené incidenty včetně." Seigenthaler biografie kontroverze, poukazují na závěr, že Wikipedia není obecně spolehlivá. Tyto epistemické faktory proto neospravedlňují konzultace s Wikipedií.
Autor poté navrhl důvody důvěřovat Wikipedii na základě pragmatických hodnot, které lze zhruba shrnout do dvou faktorů. Za prvé, velikost a aktivita kolem wikipedie naznačuje, že redaktoři jsou hluboce odhodláni poskytovat světu znalosti. Zadruhé, transparentní vývoj politik, postupů, institucí a technologií vedle konspikovaného masivního úsilí řeší možné obavy, které by člověk mohl mít při důvěryhodnosti Wikipedie. Mezi vyjádřené obavy patří definice poskytovaných znalostí, zabránění zkresleným příspěvkům lidí, kteří nesdílejí stejný závazek, oprava poškození úprav a kontrola a zlepšování kvality článku.
Zeměpis
Výzkum provedený Oxford Internet Institute ukázal, že od roku 2009 Wikipedia „označeno zeměpisnou značkou„Články ve všech jazykových vydáních pokrývaly asi půl milionu míst na Zemi. Geografické rozložení článků však bylo velmi nerovnoměrné. Většina článků je psána o Severní Americe, Evropě a východní Asii, s velmi malým pokrytím velkých částí rozvojových zemí. svět, včetně většiny z Afriky.[6]
Zpracování přirozeného jazyka
Textový obsah a strukturovaná hierarchie Wikipedie se staly důležitým zdrojem znalostí pro výzkumníky v zpracování přirozeného jazyka a umělá inteligence. V roce 2007 vědci v Technion - Izraelský technologický institut vyvinuli techniku nazvanou Explicit Semantic Analysis[7] který využívá světové znalosti obsažené v anglických článcích na Wikipedii. Koncepční reprezentace slov a textů se vytvářejí automaticky a používají se k výpočtu podobnosti mezi slovy a mezi texty.
Výzkumní pracovníci v Všudypřítomná laboratoř zpracování znalostí používat jazykové a světové znalosti zakódované ve Wikipedii a Wikislovníku k automatickému vytváření jazykových znalostních základen, které jsou podobné odborníkům vytvořeným zdrojům, jako jsou WordNet.[8] Strube a Ponzetto vytvořili algoritmus k identifikaci vztahů mezi slovy procházením anglické Wikipedie prostřednictvím svého kategorizačního schématu a dospěli k závěru, že Wikipedia vytvořila „taxonomii schopnou konkurovat WordNetu v lingvistických úlohách zpracování“.[9]
Kritiky polí obsahu
Zdravotní informace
Informace o zdraví na anglické Wikipedii jsou populárně přístupné jako výsledky z vyhledávače a Stránka s výsledky vyhledávání, které často dodávají odkazy na články na Wikipedii.[10] Byla provedena nezávislá hodnocení kvality zdravotních informací poskytovaných na Wikipedii a toho, kdo k informacím přistupuje. Byl studován počet a demografické údaje lidí, kteří hledají informace o zdraví na Wikipedii, rozsah zdravotních informací na Wikipedii a kvalita informací na Wikipedii.[11] Existují nevýhody používání Wikipedie jako zdroje zdravotních informací.
Sociální aspekty
Demografie
Studie z roku 2007 Hitwise, reprodukováno v Čas časopis,[12] zjistili, že návštěvníci Wikipedie jsou téměř stejně rozděleni na 50/50 mužů / žen, ale 60% úprav provádějí redaktoři mužského pohlaví.
WikiWarMonitor který je součástí Evropská komise, CORDIS FP7 FET-Open podporovaný projekt s názvem ICTeCollective, publikovali:
V roce 2011 v IEEE Xplore s názvem „Upravit války na Wikipedii“ pro Třetí mezinárodní konferenci IEEE o sociálních výpočtech (SocialCom) uvádí nový způsob měření toho, jak sporný článek na Wikipedii je a ověřen proti 6 indoevropský jazyk edice včetně Angličtina.[13]
V roce 2012 v PLOS ONE která použila kumulativní data z 32 jazykových vydání wikipedie, uvedla, že na základě analýzy cirkadiánních vzorců aktivity jsou podíly příspěvků na anglickou Wikipedii ze Severní Ameriky a Evropy-Dálného východu-Austrálie téměř stejné, zatímco se zvyšuje na 75% Příspěvky mezi Evropou, Dálným východem a Austrálií pro Jednoduchá anglická Wikipedia. Výzkum zahrnuje také některé další demografické analýzy ostatních vydání v různých jazycích.[14]
V roce 2013 v Dopisy o fyzické kontrole „Dopis uvádí obecný model sociální dynamiky v prostředí spolupráce zahrnujícím názory, konflikty a konsenzus se specifickou analogií k wikipedii:„ mírumilovný článek může být najednou kontroverzní, když se do jeho editace zapojí více lidí. “[15]
V roce 2014 vyšla jako kniha kapitola s názvem „Nejkontroverznější témata ve Wikipedii: Vícejazyčná a geografická analýza“: analyzovala objem úprav článků v různých jazykových verzích Wikipedie s cílem stanovit nejkontroverznější témata v různých jazycích a skupinách jazyky. U anglické verze byly první tři nejkontroverznější články George W. Bush, Anarchismus a Muhammad. Tématy v jiných jazycích, které způsobují největší polemiku, byly Chorvatsko (německé), Ségolène Royal (francouzské), Chile (španělské) a homosexualita (české).[16]
Zásady a pokyny
Popisná studie[17] který do září 2007 analyzoval zásady a pokyny Wikipedie v anglickém jazyce, identifikoval řadu klíčových statistik:
- 44 oficiálních politik
- 248 pokynů
Bylo zjištěno, že i krátká politika typu „ignorovat všechna pravidla“ přinesla mnoho diskusí a vysvětlení:
Zatímco samotná zásada „Ignorovat všechna pravidla“ má pouze šestnáct slov, stránka s vysvětlením, co tato zásada znamená, obsahuje více než 500 slov, odkazuje čtenáře na dalších sedm dokumentů, vygenerovala více než 8 000 slov diskuse a byla změněna více než stokrát méně než rok.
Studie zkoumala expanzi některých klíčových politik od jejich vzniku:
- Wikipedia: Ignorovat všechna pravidla: 3600% (včetně dalšího dokumentu s jeho vysvětlením)
- Wikipedia: Konsenzus: 1557%
- Wikipedia: Autorská práva: 938%
- Wikipedia: Co Wikipedia není: 929%
- Wikipedia: Zásady mazání: 580%
- Wikipedia: Občanství: 124%
Číslo pro „odstranění“ však bylo považováno za neprůkazné, protože zásada byla rozdělena do několika dílčích zásad.
Přesilovky
Společná recenzovaná studie z roku 2007[18] prováděné výzkumníky z University of Washington a Laboratoře HP zkoumali, jak se politiky uplatňují a jak přispěvatelé pracují na dosažení shody kvantitativní analýzou vzorku aktivních diskusních stránek. Používání listopadu 2006 Anglická Wikipedia skládka databáze, studie se zaměřila na 250 diskusních stránek na konci distribuce: 0,3% všech diskusních stránek, ale obsahujících 28,4% všech revizí diskusních stránek, a ještě významněji, obsahujících 51,1% všech odkazů na zásady. Z historie vzorkovaných stránek studie zkoumala pouze měsíce s vysokou aktivitou, nazývané kritické sekce - sady po sobě jdoucích měsíců, kdy počet revizí článků i diskusních stránek byl významný.
Studie definovala a vypočítala míru prevalence politiky. Byl zvažován kritický úsek nabitý politikou pokud by její politický faktor byl alespoň dvojnásobkem průměru. Články byly označeny 3 proměnné ukazatele:
- kontroverzní
- představoval
- nabitý politikou
Všechny možné úrovně těchto tří faktorů přinesly 8 kategorií vzorkování. Cílem studie bylo analyzovat 9 kritických sekcí z každé kategorie vzorkování, ale bylo možné vybrat pouze 69 kritických sekcí, protože pouze 6 článků (historií) bylo současně uváděno, kontroverzních a politicky náročných.
Studie zjistila, že politiky nebyly v žádném případě důsledně uplatňovány. Pro ilustraci svých širších zjištění představila zpráva ve zřejmém kontrastu následující dva výňatky z diskusních stránek Wikipedie:
- diskuse, kde se účastníci rozhodli, že výpočet průměru z údajů poskytnutých vládní agenturou představuje původní výzkum:
je průměr ... nepovažuje se za původní výzkum? [U3]
Mně to nevypadá, vypadá to, že původní výzkum provedla [Gov't agency], nebo mi něco chybí? [U4]
Pokud [agentura Gov't] nezveřejnila skutečný průměr, my „počítáme“ by to NEBO, ne? Nejsem si jistý. [U3]
Ne, proč by to mělo být? Extrapolace dat z již dostupných informací není NEBO. [U5]
Od WP: NOR „články nemusí obsahovat žádnou novou analýzu nebo syntézu publikovaných argumentů, konceptů, dat, nápadů nebo tvrzení, které slouží k prosazení pozice.“ Za co stojí ... [U4]
- diskuse, kde byla jako argument pro původní politiku výzkumu použita logická dedukce:
Vaše představa je WP: NEBO. Mohu snadno poskytnout. . . vědecký článek, který říká, že antiautoritářství není ústředním bodem panismu. Syntetizujete zde všechny druhy nápadů, založené na vašem POV. [U6]
Jednoduché deduktivní uvažování není původním výzkumem. Panismus je ze své podstaty antiautoritářský; autoritářský ekonomický systém proto nemůže být Panist. S čím nesouhlasíte: předpoklad nebo závěr? [U7]
Studie prohlásila, že tyto nejasnosti snadno vedou k mocenským hrám, a identifikovala pomocí metod z zakotvená teorie (Strauss), 7 typů přesilovek:
- rozsah článku (co je v článku mimo téma)
- předchozí shoda (minulá rozhodnutí prezentována jako absolutní a nesporná)
- interpretační síla (subkomunita požadující větší interpretační autoritu než jiná)
- legitimita přispěvatele (jeho odbornost atd.)
- hrozba sankce (blokování atd.)
- procvičování na jiných stránkách (další stránky jsou považovány za modely, které mají následovat)
- legitimita zdroje (citovaný odkaz je sporný)
Kvůli nedostatku místa studie podrobně popsala pouze první 4 typy přesilovek, které byly prováděny pouze interpretací politiky. Byla analyzována pátá kategorie power play; spočívalo v do očí bijících porušeních zásad, které byly odpuštěny, protože přispěvatel byl za své příspěvky oceňován navzdory tomu, že nerespektoval pravidla.
Rozsah článku
Studie se domnívá, že politika Wikipedie je nejednoznačná v otázkách rozsahu. Následující viněta slouží k ilustraci nároku:
... shoda je kecy, protože mám fakta na své straně. Rovněž musím vyzvat Wikipedii, abych byla odvážná ... vypuštění diskuse o katolické církvi ... pohled na paleocentrismus je nejen nepřesný, ale porušuje WP: NPOV .... Jeho odstranění / emaskulace by porušila několik zásad Wikipedie: NPOV, buďte odvážní ... Pokud všichni chcete článek, který se týká pouze vědecké teorie paleocentrismu, napište si jej sami. [U12]
Předtím, než jste se objevili, napsali jsme článek o vědecké teorii paleocentrismu ... Jste zde zjevně noví, [U12] ... argumentovat na základě vašeho čtení NPOV a Be bold je trochu směšné, jako dítě právě ze střední školy argumentuje body ústavního práva. Tyto věci jsou principy, které mají ustálený význam. Lidé, kteří tu jsou už léta, jim rozumějí mnohem lépe než vy. V tomto argumentu se vám neprojeví jako efektivní zbraň, kterou můžete ovládat ... [U13]
Sociální dopad „paleocentrizmu“ není „paleocentrismus“ ... Wikipedia: wiki není papír, nemusíme do každého článku vtesnávat každý terciární aspekt tématu a nemusíme jej považovat za neúplný když nebudeme ... [U14]
... první věc, kterou odkaz Wikipedia: wiki není papír říká, je: „„ Wikipedia “je„ encyklopedie. “„ Skutečná encyklopedie jako Encyclopædia Britannica má fantastickou část o paleocentrizmu, včetně všech sociálních, politických a filozofických Dopady. [U12]
Jak je diskutováno na Wikipedii: wiki není papír, články na Wikipedii by měly poskytnout krátký přehled o centrálně důležitých aspektech předmětu. Pro biologa, jako jste vy, není centrálním aspektem paleocentrismu rozhodně jeho sociální dopad, ale pro zbytek společnosti ano. ... [U12]
... o čem mluvíte, není „paleocentrismus“. Ústředními problémy paleocentrizmu jsou periodická rovnováha, geomorfní zvlnění, provzdušňování. To jsou problémy, které mají vlastně co do činění s procesem samotného paleocentrismu. Tyto „sociální aspekty“, o kterých mluvíte, jsou „periferní“, „nikoli ústřední“. Jsou „o“ paleocentrizmu, „obklopují“ paleocentrismus, ale „nejsou paleocentrismem“ ... [U15]
Studie poskytuje následující výklad pro vášnivou debatu:
Takové boje o rozsah článku se odehrávají i v hypertextovém prostředí, protože na názvu článku záleží. Článek o „paleocentrizmu“ je prestižnější a je pravděpodobnější, že se s ním čtenář setká, než článek s názvem „sociální účinek paleocentrizmu“.
Předchozí shoda
Studie poznamenává, že na Wikipedii není konsenzus nikdy konečný a to, co tvoří konsenzus, se může kdykoli změnit. Studie zjistila, že tato časová nejednoznačnost je úrodnou půdou pro mocenské hry, a generační boj o konsenzus staví do širšího obrazu boje za vlastnictví článku:
V praxi ... často existují de facto vlastníci stránek nebo koalice přispěvatelů, kteří určují obsah článku. Předchozí shoda v této skupině může být prezentována jako nezpochybnitelná, maskující mocenské hry, které mohly vést k dosažení konsensu. ... Jde o legitimitu předchozího konsensu. Dlouhodobí přispěvatelé nechtějí ztrácet čas argumenty o problémech, které považují za vyřešené. Poukaz na předchozí shodu, stejně jako odkaz na zásady, poskytuje metodu pro řešení trolského chování. Na druhou stranu, nově příchozí nebo okrajoví přispěvatelé mají často pocit, že jejich perspektivy nebyly zastoupeny v dřívějších argumentech a chtějí problém znovu nastolit.
Studie k ilustraci tohoto nepřetržitého boje používá následující úryvek z diskuse:
Většina věcí, které níže popisuje [U17], již byla hashována. . . Je to jako ta hra na ránu: zkoušejí jeden úhel, je vyvrácen; zkusí druhý úhel, je vyvrácen; zkouší třetí úhel, je vyvrácen; a pak zkusí první anglangain. [U18]
Bylo by zajímavé vidět, kolik různých uživatelů se snaží přispět do tohoto článku a rozšířit alternativní náhledy, aby je šikanovali ti, kdo věří v [Kosmická polarita] nábožensky ... proč neuvažujete o tom, že možná mají smysl a že [U19], [U20] a vy ostatní řídíte redaktory od tohoto článku svým těžkopádným, administrátorsky privilegovaným pushem POV? [U21]
Síla tlumočení
Viněta ilustrovala, jak administrátoři přehlasovali konsenzus a vymazali osobní účty uživatelů / pacientů trpících anonymizovanou nemocí (ve studii pojmenovanou Frupismus). K zásahu správce došlo, když byl článek nominován, aby se stal doporučeným článkem.
Oprávněnost přispěvatele
Tento typ mocenské hry ilustruje přispěvatel (U24), který na základě svých minulých příspěvků argumentuje proti jinému přispěvateli, který obviňuje U24, že je neproduktivní a ničivý:
Máte na mysli „já“, abych se zmínil o nedostatečné kvalitě na Wikipedii? Prosím, podívej se znovu na můj počet úprav !! LOL. Mám přes 7 000 úprav ... Jak víte, můžu si vzít zásluhu na téměř úplném psaní od začátku 2 ze 6 nebo 7 FA ve filozofii ... [U24]
Výslovné soupeření o vlastnictví
Studie zjistila, že existují přispěvatelé, kteří důsledně a úspěšně porušují zásady bez sankcí:
U24 dělá několik do očí bijících „my nebo oni“ soupeří o moc: pokud akce U25 budou přetrvávat, odejde. ... Takové akce jasně porušují zásady týkající se vlastnictví článků, zdvořilosti vůči jiným přispěvatelům a zacházení s nováčky. Jako nováček možná U25 o těchto zásadách neví, ale U26 určitě ano. Ochotná slepota [U26] vychází ze skutečnosti, že U24 je cenným přispěvatelem do článků o filozofii a není ostýchavý, když na to poukazuje. Přispěvatelů s odhodláním důsledně produkovat vysoce kvalitní obsah je nedostatek; komunita Wikipedie je ochotna tolerovat zneužívání a porušování zásad, pokud se provádí hodnotná práce ....
Při vší úctě to neodpovědělo na otázku ... Chtěl jsem vědět, co je v návrhu U25 nepřijatelné. . . Jeho nedostatek odkazu atd. Je jistá chyba, ale proto jsem jeden poskytl (Dotaz, část 8). [U26]
... tomuto bodu se již v článku věnujeme ... Možná bude nutné ho trochu rozšířit. Můžu to snadno udělat sám, když mám čas ... Existuje ještě něco jiného? Podporujete také názor U25, že článek je „špatný“, že je třeba jej opravit shora dolů, bezvýznamné nesmysly, které se ve skutečnosti pokusil vložit výše, nebo jiné NE, které uvedl na této stránce? V zásadě existují v této věci dvě strany, tento článek může být převzat klikami, jako je jeho jméno, nebo ne? Pokud ano, jdu. Můžete mě podporovat nebo ne. Kde stojíte? ... [U24]
V žádném případě nepodporuji představu, že článek je špatný. Ve skutečnosti nesouhlasím s mnoha věcmi, které U25 řekla jinde na této stránce ... Je mi opravdu líto, pokud vás to rozrušilo. [U26]
Získání správy
V roce 2008 vědci z Univerzita Carnegie Mellon vymyslel a probit model z Anglická Wikipedia redaktoři, kteří úspěšně prošli proces vzájemného hodnocení, aby se stali administrátory.[19] Použitím pouze metadat z Wikipedie, včetně textu souhrnů úprav, byl jejich model při předpovídání úspěšných kandidátů přesný o 74,8%.
Dokument zaznamenal, že navzdory opačným protestům „v mnoha ohledech jsou volby do správy propagací, která odlišuje elitní základní skupinu od velké masy redaktorů“. V důsledku toho byl použit papír zachycení politiky[20]— Metoda, která srovnává nominálně důležité atributy s těmi, které skutečně vedou k povýšení v pracovním prostředí.
Celková míra úspěšnosti propagace se snížila ze 75% v roce 2005 na 53% v roce 2006 a na 42% v roce 2007. Tento náhlý nárůst míry selhání byl přičítán vyššímu standardu, který museli nedávno povýšení administrátoři splnit, a podporován anekdoticky důkazy z jiné nedávné studie[21] cituji některé časné administrátory, kteří vyjádřili pochybnosti, že by obstáli, kdyby se jejich volby (RfA) konaly nedávno. S ohledem na tento vývoj studie tvrdila, že:
Proces, který zakladatel Wikipedie jednou nazval „žádný velký problém“, se stal docela velkým problémem.
Faktor | 2006–2007 | před – 2006 |
---|---|---|
každý předchozí pokus o RfA | -14.7% | -11.1% |
každý měsíc od první úpravy | 0.4% | (0.2%) |
každých 1000 úprav článku | 1.8% | (1.1%) |
každých 1000 úprav zásad Wikipedie | 19.6% | (0.4%) |
každých 1000 WikiProject úpravy | 17.1% | (7.2%) |
každých 1000 úprav článku o článku | 6.3% | 15.4% |
každá úprava Arb / mediace / wikiquette | -0.1% | -0.2% |
každé skóre rozmanitosti (viz text) | 2.8% | 3.7% |
každé procento z Indikace „drobné úpravy“ v editačních souhrnech | 0.2% | 0.2% |
každé procento lidských souhrnů písemných úprav | 0.5% | 0.4% |
každé „poděkování“ v souhrnech úprav | 0.3% | (0.0%) |
každá indikace „POV“ v souhrnech úprav | 0.1% | (0.0%) |
každá úprava v pozornosti / nástěnce správce | -0.1% | (0.2%) |
Navzdory očekáváním možná „běh“ administrátora vícekrát škodí šanci kandidáta na úspěch. Každý následující pokus má o 14,8% nižší šanci na úspěch než ten předchozí. Délka účasti na projektu přispívá jen malou měrou k šanci na úspěšnou RfA.
Dalším významným zjištěním článku je, že jedna úprava zásad Wikipedie nebo úprava WikiProject má hodnotu deseti úprav článků. Související zjištění je, že kandidáti se zkušenostmi v různých oblastech webu měli větší šanci na zvolení. To bylo měřeno skóre rozmanitosti, jednoduchý počet počtu oblastí, kterých se editor účastnil. Příspěvek rozdělil Wikipedii na 16 oblastí: článek, přednáška o článku, články / kategorie / šablony pro odstranění (XfD), (ne) kontrola odstranění atd. (viz celý seznam). Například uživatel, který upravil články, vlastní uživatelskou stránku a zveřejnil je jednou při (ne) vymazání, by měl skóre rozmanitosti 3. Provedení jediné úpravy v jakékoli další oblasti Wikipedie korelovalo s 2,8% zvýšenou pravděpodobností úspěch v získávání administrátorství.
Pomohlo také provedení menších úprav, ačkoli autoři studie se domnívají, že tomu tak může být, protože drobné úpravy korelují se zkušenostmi. Naproti tomu každá úprava stránky arbitrážního nebo mediačního výboru, nebo Upozornění na wikiquette, což jsou všechna místa pro řešení sporů, snižuje pravděpodobnost úspěchu o 0,1%. Podobně škodlivý účinek mělo zveřejňování zpráv na nástěnkách správce. Studie to interpretovala jako důkaz, že redaktoři zapojení do eskalace nebo zdlouhavých konfliktů snižují jejich šance stát se administrátory.
„Poděkování“ nebo jeho variace v souhrnech úprav a poukázání na problémy s hlediskem („POV“) (také pouze v souhrnech úprav, protože studie analyzovala pouze metadata) měly malý přínos, což přispělo k 0,3% a 0,1% ke kandidátům šance v letech 2006–2007, ale dříve nedosáhly statistické významnosti.
Několik faktorů, které byly shledány přinejlepším irelevantní nebo marginální:
- Úpravy uživatelských stránek (včetně vlastních) nepomáhají. Úpravy diskusních stránek uživatelů poněkud překvapivě neovlivňují pravděpodobnost správy.
- Přivítání nováčků nebo vyslovení „prosím“ v souhrnech úprav nemělo žádný účinek.
- Účast na budování konsensu, jako jsou hlasy RfA nebo vesnická pumpa, nezvyšuje pravděpodobnost, že se stanete administrátorem. Studie připouští, že účast na konsensu byla měřena kvantitativně, ale ne kvalitativně.
- Boj proti vandalům měřený počtem úprav tabulek vandalismu neměl žádný účinek. Každých tisíc úprav obsahujících varianty „návratu“ pozitivně korelovalo (7%) se správou na období 2006–2007, ale nedosáhlo statistické významnosti, pokud není ochoten snížit prahovou hodnotu na p <0,1). Matoucí je, že před rokem 2006 byl počet reverzí negativně korelován (-6,8%) s úspěšností správy, proti bez dosažení statistické významnosti ani při p <0,1. Může to být způsobeno zavedením politiky známé jako „3RR“ v roce 2006, jejímž cílem je snížení návratnosti.[22]
Studie naznačuje, že některá z 25% nevysvětlitelné variability výsledků může být způsobena faktory, které nebyly měřeny, jako je kvalita úprav nebo účast na koordinaci mimo pracoviště, například (výslovně citovaný) tajný seznam adres uvedený v Registrace.[23] Článek uzavírá:
Pouhé provedení velkého množství produkčních prací je pro „propagaci“ ve Wikipedii nedostatečné. Úpravy článků kandidátů byly slabými prediktory úspěchu. Musí také prokázat více manažerského chování. Různorodé zkušenosti a příspěvky k vývoji politik a WikiProjects byly silnějšími prediktory úspěchu RfA. To je v souladu se zjištěními, že Wikipedia je byrokracie[17] a tato koordinační práce se podstatně zvýšila.[24][25] ... Účast na politice Wikipedie a WikiProjects nebyla předpovědní pro správu před rokem 2006, což naznačuje, že komunita jako celek začíná upřednostňovat tvorbu politiky a organizační zkušenosti před jednoduchou koordinací na úrovni článku.
Následný průzkum jinou skupinou[26] zkoumali činnosti smyslů jednotlivců během jejich příspěvků k rozhodnutím RfA. Tato práce stanoví, že rozhodnutí o kandidátech na RfA je založena na sdílené interpretaci důkazů ve wiki a historii předchozích interakcí.
Wikipedia ve vzdělávání
I přes neochotu učitelů používat Wikipedii jako základnu pro práci ve třídě bylo zjištěno, že psaní Wikipedie studenty (Hebrejská Wikipedia pro tento článek) zvyšuje jejich zájem o proces učení, investice do jejich pracovních výstupů, jejich pokrok v učení a osobním rozvoji a možnost studentů pro místní a mezinárodní spolupráci.[27]
Strojové učení
Automatizovaný extrakce sémantických znalostí použitím strojové učení algoritmy se používají k „extrakci strojově zpracovatelných informací při relativně nízkých nákladech na složitost“.[28] DBpedia používá strukturovaný obsah extrahováno z infoboxy článků Wikipedie v různých jazycích pomocí algoritmů strojového učení k vytvoření zdroje propojené údaje v Sémantický web.[29]
Statistiky pohledu na Wikipedii a lidské chování
Ve studii publikované v PLOS ONE[30] Taha Yasseri z Oxford Internet Institute a jeho kolegové z Středoevropská univerzita prokázali, že statistiky zobrazení článků o filmech dobře souvisejí s tržbami z nich. Vyvinuli matematický model pro predikci tržby analyzováním počtu zobrazení stránky, počtu úprav a jedinečných editorů stránek Wikipedie ve filmech. Ačkoli byl tento model vyvinut pro anglickou Wikipedii pro filmy, lze jazykově nezávislé metody zobecnit na jiné jazyky a na jiné druhy produktů mimo filmy.[31]
V díle publikovaném v Vědecké zprávy v roce 2013,[32] Helen Susannah Moat, Tobias Preis a kolegové prokázali souvislost mezi změnami v počtu zhlédnutí článků anglické Wikipedie týkajících se finančních témat a následnými velkými pohyby na akciových trzích v USA.[33][34]
Reference
- ^ S - tuckman, Jeff; Purtilo, James (2009). Měření wikisféry. Sborník z 5. mezinárodního sympozia o Wikis a otevřené spolupráci. p. 1. doi:10.1145/1641309.1641326. ISBN 978-1-60558-730-1. S2CID 17770818.
- ^ Priedhorsky, Reid; Chen, Jilin; Lam, Snider (Tony); Panciera, Katherine; Terveen, Loren; Austin, Shane (2007). "Vytváření, ničení a obnovování hodnoty na Wikipedii". Sborník příspěvků z mezinárodní konference ACM 2007 o podpoře skupinové práce. Konference o podpoře skupinové práce. Stiskněte ACM. 259–268. doi:10.1145/1316624.1316663. ISBN 978-1-59593-845-9.
- ^ Baker, Nicholson (10.04.2008). „Jak jsem se zamiloval do Wikipedie“. Opatrovník. Citováno 2010-11-29.
- ^ Chi, Ed; Kittur, Aniket; Pendleton, Bryan A .; Suh, Bongwon & Mytkowicz, Todd (31. ledna 2007). „Síla několika vs. moudrost davu: Wikipedia a vzestup buržoazie“ (PDF). Konference Interakce počítač / člověk 2007. Sdružení pro výpočetní techniku. S2CID 14770727. Citováno 2017-04-23.
- ^ Goodwin, Jean. (2010). Autorita Wikipedie. In Juho Ritola (Ed.), Argument cultures: Proceedings of the Ontario Society for the Study of Argumentation Conference. Windsor, ON, Kanada: Ontario Society for the Study of Argumentation.CD-ROM.24 pp.
- ^ Graham, Mark (11. 11. 2009). „Mapování zeměpisných oblastí obsahu Wikipedie“. Mark Graham: Blog. Nulová geografie. Archivovány od originál dne 8. 12. 2009. Citováno 2009-11-16.
- ^ Gabrilovich, Evgeniy; Markovitch, Shaul (2007). „Výpočet sémantické souvislosti pomocí explicitní sémantické analýzy založené na Wikipedii“. Sborník IJCAI. Morgan Kaufmann Publishers Inc. str. 1606–1611. CiteSeerX 10.1.1.76.9790.
- ^ Zesch, Torsten; Müller, Christoph; Gurevych, Iryna (2008). „Extrahování lexikálních sémantických znalostí z Wikipedie a Wikislovníku“ (PDF). Sborník z konference o jazykových zdrojích a hodnocení (LREC).
- ^ M Strube; SP Ponzetto (2006). "WikiRelate! Computing semantic relatedness using Wikipedia psu.edu" (PDF). Proceedings of the National Conference. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Laurent, M. R.; Vickers, T. J. (2009). "Seeking Health Information Online: Does Wikipedia Matter?". Journal of the American Medical Informatics Association. 16 (4): 471–479. doi:10.1197/jamia.M3059. PMC 2705249. PMID 19390105.
- ^ Heilman, JM; Kemmann, E; Bonert, M; Chatterjee, A; Ragar, B; Beards, GM; Iberri, DJ; Harvey, M; Thomas, B; Stomp, W; Martone, MF; Lodge, DJ; Vondracek, A; de Wolff, JF; Liber, C; Grover, SC; Vickers, TJ; Meskó, B; Laurent, MR (Jan 31, 2011). "Wikipedia: a key tool for global public health promotion". Journal of Medical Internet Research. 13 (1): e14. doi:10.2196/jmir.1589. PMC 3221335. PMID 21282098.
- ^ Bill Tancer (2007-04-25). "Who's Really Participating in Web 2.0". Časopis Time. Archivováno from the original on 30 April 2007. Citováno 2007-04-30.
- ^ Sumi, R.; Yasseri, T.; Rung, A.; Kornai, A.; Kertesz, J. (1 October 2011). "Edit Wars in Wikipedia". 2011 IEEE Third Int'l Conference on Privacy, Security, Risk and Trust and 2011 IEEE Third Int'l Conference on Social Computing. pp. 724–727. arXiv:1107.3689. doi:10.1109/PASSAT/SocialCom.2011.47. ISBN 978-1-4577-1931-8. S2CID 14151613 – via IEEE Xplore.
- ^ Szolnoki, Attila; Yasseri, Taha; Sumi, Robert; Kertész, János (2012). "Circadian Patterns of Wikipedia Editorial Activity: A Demographic Analysis". PLOS ONE. 7 (1): e30091. doi:10.1371/journal.pone.0030091. ISSN 1932-6203. PMC 3260192. PMID 22272279.
- ^ Török, J; Iñiguez, G; Yasseri, T; San Miguel, M; Kaski, K; Kertész, J (2013). "Opinions, Conflicts, and Consensus: Modeling Social Dynamics in a Collaborative Environment". Dopisy o fyzické kontrole. 110 (8): 088701. arXiv:1207.4914. Bibcode:2013PhRvL.110h8701T. doi:10.1103/PhysRevLett.110.088701. PMID 23473207. S2CID 2496524. cited
- Ratkiewicz, Jacob; Fortunato, Santo; Flammini, Alessandro; Menczer, Filippo; Vespignani, Alessandro (2010). "Characterizing and Modeling the Dynamics of Online Popularity". Dopisy o fyzické kontrole. 105 (15): 158701. doi:10.1103/PhysRevLett.105.158701. ISSN 0031-9007. PMID 21230945.
- Szolnoki, Attila; Yasseri, Taha; Sumi, Robert; Rung, András; Kornai, András; Kertész, János (2012). "Dynamics of Conflicts in Wikipedia". PLOS ONE. 7 (6): e38869. doi:10.1371/journal.pone.0038869. ISSN 1932-6203. PMC 3380063. PMID 22745683.
- ^ Yasseri T.; Spoerri A.; Graham M.; Kertész J (2014). "The most controversial topics in Wikipedia: A multilingual and geographical analysis". In Fichman P.; Hara N. (eds.). Global Wikipedia:International and cross-cultural issues in online collaboration. Lanham, Maryland: Rowman and Littlefield Press. arXiv:1305.5566. ISBN 978-0-8108-9101-2. OCLC 1026054095.
- ^ A b Butler, Brian; Joyce, Elisabeth; Pike, Jacqueline (2008). Don't look now, but we've created a bureaucracy. Proceedings of the Twenty-sixth Annual CHI Conference on Human Factors in Computing Systems - CHI '08. p. 1101. doi:10.1145/1357054.1357227. ISBN 978-1-60558-011-1. S2CID 15211227.
- ^ Kriplean, Travis; Beschastnikh, Ivan; McDonald, David W.; Golder, Scott A. (2007). Community, consensus, coercion, control. Proceedings of the 2007 International ACM Conference on Conference on Supporting Group Work - GROUP '07. p. 167. doi:10.1145/1316624.1316648. ISBN 978-1-59593-845-9. S2CID 14491248.
- ^ Burke, Moira; Kraut, Robert (2008). Taking up the mop. Proceedings of the Twenty-sixth Annual CHI Conference Extended Abstracts on Human Factors in Computing Systems - CHI '08. p. 3441. doi:10.1145/1358628.1358871. ISBN 978-1-60558-012-8.
- ^ Stumpf, S. A.; London, M. (1981). "Capturing rater policies in evaluating candidates for promotion". The Academy of Management Journal. 24 (4): 752–766. doi:10.2307/256174. JSTOR 256174.
- ^ Forte, A., and Bruckman, A. Scaling consensus: Increasing decentralization in Wikipedia governance. Proc. HICSS 2008.
- ^ WP:3RR a WP:EW, policies which prevent repetitive reverting.
- ^ Metz, Cade. "Secret mailing list rocks Wikipedia". Registrace.
- ^ Kittur, Aniket; Suh, Bongwon; Pendleton, Bryan A.; Chi, Ed H. (2007). He says, she says: conflict and coordination in Wikipedia. Proceedings of the SIGCHI Conference on Human Factors in Computing. pp. 453–462. doi:10.1145/1240624.1240698. ISBN 978-1-59593-593-9. S2CID 17493296.
- ^ Viegas, Fernanda B.; Wattenberg, Martin; Kriss, Jesse; van Ham, Frank (2007). "Talk Before You Type: Coordination in Wikipedia". 40th Annual Hawaii International Conference on System Sciences: 575–582. CiteSeerX 10.1.1.210.1057. doi:10.1109/HICSS.2007.511. ISBN 978-0-7695-2755-0. S2CID 5293547.
- ^ Derthick, K., P. Tsao, T. Kriplean, A. Borning, M. Zachry, and D. W. McDonald (2011). Collaborative Sensemaking during Admin Permission Granting in Wikipedia. In A.A. Ozok and P. Zaphiris (Eds.): Online Communities, HCII 2011, LNCS 6778, pp. 100–109.
- ^ Hertz, Tehila (2018). "Wikishtetl: Commemorating Jewish Communities that Perished in the Holocaust through the Wikipedia Platform". Hledání. 13.
- ^ Baeza-Yates, Ricardo; King, Irwin, eds. (2009). Weaving services and people on the World Wide Web. Springer. ISBN 978-3-642-00569-5. LCCN 2009926100.
- ^ Yu, Liyang (2011). A Developer's Guide to the Semantic Web. Springer. doi:10.1007/978-3-642-15970-1. ISBN 978-3-642-15969-5.
- ^ Márton Mestyán; Taha Yasseri; János Kertész (2013). "Early Prediction of Movie Box Office Success Based on Wikipedia Activity Big Data". PLOS ONE. 8 (8): e71226. arXiv:1211.0970. Bibcode:2013PLoSO...871226M. doi:10.1371/journal.pone.0071226. PMC 3749192. PMID 23990938.
- ^ "Wikipedia buzz predicts blockbuster movies' takings weeks before release". Opatrovník. Nov 8, 2012. Citováno 2. září 2013.
- ^ Helen Susannah Moat; Chester Curme; Adam Avakian; Dror Y. Kenett; H. Eugene Stanley; Tobias Preis (2013). "Quantifying Wikipedia Usage Patterns Before Stock Market Moves". Vědecké zprávy. 3: 1801. Bibcode:2013NatSR...3E1801M. doi:10.1038/srep01801. PMC 3647164.
- ^ "Wikipedia's crystal ball". Financial Times. 10. května 2013. Citováno 10. srpna 2013.
- ^ Kadhim Shubber (May 8, 2013). "Wikipedia page views could predict stock market changes". Wired.com. Citováno 10. srpna 2013.
Další čtení
- Adler, B.T.; de Alfaro, L. (2007). "A content-driven reputation system for the Wikipedia". Proceedings of the 16th international conference on World Wide Web. New York: ACM. pp. 261–270. CiteSeerX 10.1.1.728.9724. doi:10.1145/1242572.1242608. ISBN 978-1-59593-654-7. S2CID 405135.
- Amichai-Hamburger, Y.; Lamdan, N.; Madiel, R.; Hayat, T. (2008). "Personality characteristics of Wikipedia members". Cyberpsychology & Behavior. 11 (6): 679–681. doi:10.1089/cpb.2007.0225. PMID 18954273.
- Blumenstock, J. E. (2008). "Size matters: word count as a measure of quality on Wikipedia". Proceedings of the 17th international conference on World Wide Web. New York: ACM. pp. 1095–1096. doi:10.1145/1367497.1367673. ISBN 978-1-60558-085-2. S2CID 8896540.
- Bryant, S. L.; Forte, A.; Bruckman, A. (2005). "Becoming Wikipedian: transformation of participation in a collaborative online encyclopedia". GROUP '05 Proceedings of the 2005 international ACM SIGGROUP conference on Supporting group work. New York: ACM. doi:10.1145/1099203.1099205. ISBN 978-1-59593-223-5. S2CID 221349.
- Farrell, H.; Schwartzberg, M. (2008). "Norms, Minorities, and Collective Choice Online". Ethics & International Affairs. 22 (4): 357–367. doi:10.1111/j.1747-7093.2008.00171.x. Archivovány od originál on 20 January 2009. Citováno 2009-02-03.
- Hu, M.; Lim, E.-P.; Sun, A.; Lauw, H. W.; Vuong, B.-Q. (2007). "Measuring article quality in Wikipedia: models and evaluation". Proceedings of the sixteenth ACM conference on Conference on information and knowledge management. New York: ACM. doi:10.1145/1321440.1321476. ISBN 978-1-59593-803-9. S2CID 654234.
- Jensen, Richard (2012). "Military History on the Electronic Frontier: Wikipedia Fights the War of 1812" (PDF). Journal of Military History. 76 (4): 523–556.
- Kopf, Susanne. "Debating the European Union transnationally: Wikipedians’ construction of the EU on a Wikipedia talk page (2001-2015)." (PhD dissertation Lancaster University, 2018) online Archivováno 2019-05-16 at the Wayback Machine.
- Kuznetsov, S. (2006). "Motivations of contributors to Wikipedia". ACM SIGCAS Computers and Society. 36 (2): 1–es. doi:10.1145/1215942.1215943. S2CID 1115614.
- Luyt, B.; Aaron, T. C. H.; Thian, L. H.; Hong, C. K. (2008). "Improving Wikipedia's accuracy: Is edit age a solution?". Journal of the American Society for Information Science and Technology. 59 (2): 318–330. doi:10.1002/asi.20755.
- Medelyan, O.; Milne, D.; Legg, C.; Witten, I. H. (2008). "Mining Meaning from Wikipedia". arXiv:0809.4530 [cs.AI ].
- Park, T. K. (2011). "The visibility of Wikipedia in scholarly publications". První pondělí. 16 (8). doi:10.5210/fm.v16i8.3492. hdl:2022/21757. Archivovány od originál on 2012-04-04. Citováno 2011-08-09.
- van Pinxteren, B. (2017). "African Languages in Wikipedia – A Glass Half Full or Half Empty?". Political Economy - Development: Comparative Regional Economies eJournal. 5 (12). SSRN 2939146.
- Rijshouwer, Emiel (2019). Organizing Democracy. Power concentration and self-organization in the evolution of Wikipedia (dissertation ed.). Rotterdam: Erasmus University Rotterdam. hdl:1765/113937. OCLC 1081174169.
- Shachaf, P. (2009). "The paradox of expertise: Is the Wikipedia reference desk as good as your library?". Journal of Documentation. 65 (6): 977–996. doi:10.1108/00220410910998951.
- Shachaf, P.; Hara, N. (2010). "Beyond vandalism: Wikipedia trolls" (PDF). Journal of Information Science. 36 (3): 357–370. doi:10.1177/0165551510365390. S2CID 21846015.
- Stein, K.; Hess, C. (2007). "Does it matter who contributes: a study on featured articles in the German Wikipedia". Proceedings of the eighteenth conference on Hypertext and hypermedia. New York: ACM. doi:10.1145/1286240.1286290. ISBN 978-1-59593-820-6. S2CID 16649948.
- Suh, B.; Chi, E. H.; Kittur, A.; Pendleton, B. A. (2008). Lifting the veil: improving accountability and social transparency in Wikipedia with wikidashboard. Proceedings of the Twenty-sixth Annual SIGCHI Conference on Human Factors in Computing Systems. p. 1037. doi:10.1145/1357054.1357214. ISBN 978-1-60558-011-1. S2CID 17070584.
- Urdaneta, G.; Pierre, G.; van Steen, M. (2009). "Wikipedia Workload Analysis for Decentralized Hosting". Computer Networks. 53 (11): 1830–1845. CiteSeerX 10.1.1.148.6299. doi:10.1016/j.comnet.2009.02.019.
- Vuong, B.-Q.; Lim, E.-P.; Sun, A.; Le, M.-T.; Lauw, H. W.; Chang, K. (2008). "On ranking controversies in Wikipedia: models and evaluation". Proceedings of the 2008 International Conference on Web Search and Data Mining. New York: ACM. doi:10.1145/1341531.1341556. ISBN 978-1-59593-927-2. S2CID 12504471.
- Wilson, J. (2014). "Proceed with extreme caution: Citation to Wikipedia in light of contributor demographics and content policies." Vanderbilt Journal of entertainment and Technology Law, 16(4). Citováno z https://ssrn.com/abstract=2474110
- Zickuhr, K., & Rainie, L. (2011). "Wikipedia, past and present: A snapshot of current Wikipedia users." Retrieved from Pew Research Center website: http://www.pewinternet.org/2011/01/13/wikipedia-pastand-present/[trvalý mrtvý odkaz ]
externí odkazy
- WikiPapers – a compilation of resources (conference papers, journal articles, theses, books, datasets and tools) focused on the research of wikis and Wikipedia