Scholar indexy a dopad - Scholar Indices and Impact

Scholar indexy se používají k měření příspěvků vědců do jejich oblastí výzkumu. Od roku 2005 ze dne Jorge E. Hirsch,[1] používání vědeckých indexů se zvýšilo.

Definice

Někdy se nazývá bibliometrie, vědecké indexy jsou matematické a statistické nástroje, které měří význam příspěvků akademika do jeho oblasti výzkumu. Scholar indexy mohou zahrnovat další hodnocení, jako je sledování citací a hodnocení deníku.

Stvoření

Libovolný agregátor citace a reference, mohly by, vzhledem k času, penězům a sklonu, vytvářet vlastní sadu vědeckých indexů. Mezi vydavatele, kteří jsou v této oblasti prominentní, patří Elsevier a Thomson Reuters.

Komerční software které používají analyzátory a web vyhledávače pro generování sad vědeckých indexů nebo jednotlivých výsledků jsou nyní k dispozici. Příklady: Publikovat nebo zahynout;[2] 'ScholarIndex ';[3] 'Scopus '[4] a 'Google Scholar '.[5]

Každý prodejce softwaru používá k vytváření sad vědeckých indexů primárně svá vlastní data a také deníky, publikace, soubory autorit, rejstříky a kategorie předmětů.

Zatímco některé společnosti poskytují data a vyhodnocené metriky jako soubory ke stažení zdarma, jiné vyžadují předplatné k pokrytí nákladů na výrobu a údržbu efektivního analyzátoru, vyhledávače a databáze dokumentů.

Použití

Scholar indexy umožňují výběr sbírek časopisů, použití výzkumných fondů, hodnocení časopisů a určení významných přispěvatelů v dané oblasti.[6][7]

Zastánci vědeckých indexů doporučují jejich použití v oblastech, jako jsou styčné služby, reference, instrukce a správa sbírek.[8]

Kritici používání vědeckých indexů uvádějí svá omezení kvůli otázkám přesnosti, platnosti a použitelnosti a diskutují o jejich aplikaci při přijímání, držbě, financování, udělování cen a rozhodování o členství.

Ačkoli vědecké indexy nemusí zcela popsat dopad práce jednotlivého výzkumného pracovníka, někteří akademici určí své vlastní vědecké indexy, které například zahrnou do propagačních materiálů a životopisů. Jiní mohou studovat své vědecké indexy jednoduše pro sebe.

Zájemce o oblast vědeckých indexů mohou výsledky, například projekty vizualizace dat, považovat za vzrušující.

Typy

K dnešnímu dni byla vyvinuta řada vědeckých indexů. Jedním z nich je 'h-index' zavedený Jorge E. Hirsch v srpnu 2005. Hirsch popsal h-index jako nezaujatý, protože zahrnoval vztah mezi objemem publikovaných prací akademika a počtem citací u těchto článků, které vytvářely menší zkreslení než kterékoli z těchto opatření samostatně.

Dalším vědeckým indexem je „g-index“, který měří počty citací všech dobře citovaných děl za určité časové období. „M-kvocient“ byl vyvinut k zavedení časového limitu pro h-index, který byl jinak, stále rostoucí množství.

Další varianty h-indexu, jako je hI-index, e-index [9] a další jsou vyvíjeny a revidovány.

The Erdőovo číslo [10] byl vyvinut k měření publikačního řetězce zahájeného Paulem Erdősem.

Všechny tyto vědecké indexy kvantifikují příspěvek výzkumného pracovníka pouze na základě citací jejich práce. V ideálním případě by hodnocení příspěvku výzkumného pracovníka do jejich oboru zahrnovalo jak vědecké indexy, tak analýzu kvality samotné práce.

h-index

The h-index index navrhl Jorge E. Hirsch, a fyzik v UCSD v roce 2005.[1]

Henry Schaefer z University of Georgia USA vytvořily společně s kolegyní Amy Petersonovou žebříček podle h-indexu z ISI Web of Science. Ačkoli webové aplikace mohou vypočítat h-indexy, Peterson musel zkontrolovat chybně napsaná nebo duplicitní jména.

H-index je definován takto:

Vědec má index h -li h jeho N papíry mají alespoň h citace každý a druhý (N-h) papíry nemají více než h každý citace.

Pro výpočet h-indexu jsou práce napsané akademikem seřazeny v sestupném pořadí podle počtu citací. H-index je místo, kde se počet příspěvků rovná počtu citací (počínaje příspěvkem s nejvyšším počtem citací).

H-index, i když je široce používán, nebere v úvahu kvalitu článků; další příspěvky, které citují publikace akademiků; počet spoluautorů a pozice autora v seznamu autorů. Všechna pole mají také stejnou hodnotu.

Dalším omezením je, že se h-index v průběhu času nemění[Citace je zapotřebí ]. Například, Évariste Galois měl h-index 2 while Claude Shannon měl h-index 7,[11] v roce 2020 vzrostl na 62.[12]

m-kvocient

Zatímco h-index je nezávislý na datu akademické kariéry, m-kvocient má za cíl zvážit období akademického úsilí tak, aby i mladí vědci dosáhli významu, který si zaslouží.

Pokud tedy n= počet let od prvního publikovaného článku vědce, m-kvocient = h-index /n.

M-kvocient se však může stabilizovat až později v kariéře vědce. pro výzkumné pracovníky na počátku jejich kariéry, kteří mají nízké indexy h, mohou malé změny v h-indexu vést k velkým změnám m-kvocientu. Hirsch navrhuje, že první publikovaný článek výzkumníka nemusí být vždy vhodným výchozím bodem, zvláště pokud se jednalo o malý příspěvek, který byl publikován dlouho před akademickým obdobím udržitelné produktivity.

Ačkoliv m-kvocient přidává čas jako váhový faktor, neřeší hlavní nevýhody h-indexu, včetně kvality publikace a kvality citace.

g-index

g-index je varianta h-index, který bere v úvahu vývoj citací nejcitovanějších článků v průběhu času.

Sada papírů má g-index g pokud G je nejvyšší hodnost taková, že nejlepší g papíry mají alespoň dohromady G^ 2 citace.

Jinými slovy g-index g je největší hodnost (kde jsou příspěvky seřazeny v sestupném pořadí podle počtu citací, které obdržely) taková, že první G papíry mají alespoň (společně) G^ 2 citace.

Lze prokázat, že pro jakoukoli sadu papírů g-index vždy existuje a je jedinečný.[13]

Kde Lotkaian exponent a kde T označuje celkový počet zdrojů.

Od té doby ,

Například pokud mají 2 vědci h-index 4, může se stát, že jeden z nich publikoval 4 příspěvky, které mají 4 nebo více citací, zatímco jiný vědec může publikovat 10 článků, z nichž 3 mají více než 100 citací a 4. příspěvek má 4 citace a zbývající mají méně než 4 citace.

Ve snaze nabídnout vyšší váhu druhému vědci, který v souhrnu obdržel více než 304 citací za 10 článků, g-index bylo navrženo. V našem příkladu tedy má první vědec g-index = 4, zatímco druhý vědec ano g-index výrazně vyšší.

Erdőovo číslo

Erdősovo číslo měří vzdálenost mezi člověkem a matematikem Paulem Erdősem, měřenou autorstvím matematických prací.

Když vezmeme v úvahu, že Paul Erdős má index = 0, lidé, kteří s ním spoluautorem mají index = 1, spoluautoři těchto spoluautorů mají index = 2 atd. Chcete-li tedy vypočítat číslo Erdős, přidejte 1 k číslu Erdős libovolného spoluautora s nejnižším číslem Erdős. Projekt Erdősovo číslo na Oakland University udržuje web sledující Erdőův počet vědců po celém světě.

Jednou výhradou je, že většina dosud zaznamenaných Erdőových čísel se pohybuje až do 13, ale průměr je méně než 5 a téměř každý s konečným Erdősovým číslem má číslo menší než 8.

Rozbočovače a indexy autorit

Vyhodnocení úplného přínosu vědce do oblasti výzkumu lze hodnotit dvěma způsoby. Jedním z nich je zohlednění počtu citací přijatých učencem. Druhým důvodem je zohlednění kvality referencí, na které vědec odkazuje.

I když je silně citován, dělá z učence silnou autoritu ve svém oboru, díky silným referencím je vědec silným centrem, který zná veškerou významnou práci v této oblasti. Výpočet indexů hubu a autority vyžaduje znalost vztahů mezi vědci, kteří jsou citováni nebo na něž je odkazováno.

K výpočtu těchto indexů lze použít algoritmus Hubs and Authorities. Algoritmus provádí a analýza odkazu v dané síti a každému uzlu přiřadí dvě skóre: hub a autoritu .;[14][15]

Na hodnotný a informativní uzel v síti obvykle odkazuje velký počet odkazů, to znamená, že má velký indegree (viz obr. 1). Takový uzel se nazývá autorita.[16]

Uzel, který ukazuje na mnoho uzlů autorit, je sám o sobě užitečným prostředkem a nazývá se rozbočovač. Rozbočovač má obvykle velký outgree. V souvislosti s citací literatury je centrem recenzní práce, která cituje mnoho původních prací, zatímco autoritou je původní seminární práce, která je citována mnoha články.[17]

Obr. 1. Při zvažování konektivity zeleného uzlu S, uzly y uveďte stupeň a uzly v X označte vnější stupeň uzlu S.

Síť může být vytvořena z uzlů představujících autory a odkazů označujících odkazy na publikované práce. Odchozí odkazy označují, koho autor citoval, a příchozí odkazy označují, kdo citoval autora.

Skóre výzkumného pracovníka je součet skóre autorů, jejichž práce je citována. Skóre autority výzkumníka je součet skóre autorů, kteří odkazovali na práci výzkumníka.

Skóre náboje se zvyšuje, pokud autor cituje příspěvky publikované autory s vysokým skóre autority. Skóre autority se zvyšuje, když jsou publikované práce citovány autory s vysokým skóre hubů.

Rovnice lze přepsat ve formě matice-vektor. Nechť A je matice sousedství sítě a vektorů h a a, které obsahují všechny rozbočovače a skóre autorit. Poté lze skóre vypočítat podle následujících vzorců.[18]

Implementace algoritmu rozbočovače a autority

Rozbočovače a indexy úřadů vyžadují znalost propojení mezi vědci, kteří vzájemně odkazují a citují své práce. Vzhledem k tomu, že není vždy možné přesně získat tyto vzorce připojení, lze odhadnout matici sousedství (A) týkající se spojení učence.

Například vědec má odhadovanou lokální matici konektivity. Jedná se o kombinaci práce, kterou cituje, a děl, která cituje. Jakmile je odhadnuta sousední síť, jsou rozbočovač a indexy autorit určeny podle vlastní rozklad z (A.A) a (A'.A) resp. Kroky pro tuto konkrétní implementaci jsou následující:

  • Krok 1: Nechte učence, který má být hodnocen, S. Tento vědec je prohledán Scopus a celkový počet citací, které obdržel Ca celkový počet referencí, které použilr.
  • Krok 2: Seznam vědců, kteří citovali díla autora S jsou zaznamenány jako sada Y. Seznam vědců, kteří byli odkázáni S jsou zaznamenány jako X. Volba členů X a Y jsou vytvářeny v pořadí klesajících citací v Scopus. Protože odhad matice sousedství A bylo dostačující, proto jsme zaznamenali členy X, a Y s citacemi většími než 100 v Scopus. Nechť počet významných citací = Csa počet významných odkazů rs. Pro každého významného člena X a Y, jeden vyhodnotí poměr (počet citací / počet odkazů) jako váhy matice A.
  • Krok 3: Jakmile váhy odpovídající významným členům X a Y vypočítají se váhy ne-tak významných členů náhodně. Náhodné váhy jsou tedy generovány pro CCs citace členů Y a rrs reference pro členy X. Matice A je tedy generován jako:
ASloupecSXY
Index řádkůS010
X000
Y100

Kde bloky X a bloky Y nahrazují „1“. Připojení odpovídá obr. 2.

Obr. 2. Tento obrázek zobrazuje spojení mezi S, X, Y pro generování matice sousedství A. Pouze S je připojen k X a Y je připojen k S, všechna ostatní připojení jsou 0. A je jednosměrná matice sousedství.
  • Krok 4: Počáteční vektor rozbočovače se počítá jako primární vlastní vektor (s nejvyšší vlastní hodnotou) z A.A ' a normalizováno mezi [0,1]. Počáteční autoritní vektor je primární vlastní vektor z A'.A a také normalizováno. Vzhledem k tomu, že tyto indexy spolu souvisejí, stane se z vektoru rozbočovače A * počáteční autorizační vektor a z autoritního vektoru se stane počáteční vektor A'*. Vzhledem k tomu, že vědec „S“ byl prvním vstupem do matice A, první hodnota vektoru rozbočovače a autority jsou tedy indexy rozbočovače pro vědce S. Pseudokód pro stejný je následující je S je vědec, jehož index hubu je h a index oprávnění je A.

Pseudo kód

1

2

3

4

Příklad 1: Scholarové indexy známých vědců

Vědech-index (pomocí Publish nebo Perish) [2]g-index (pomocí Publish nebo Perish)[2]h-index (pomocí Scopus )[4]Index náboje (na 10 ^ 2)[4]Index autorit [4]
Newman, MEJ6521051210.54129.3687
Einstein, Albert92231N / A (nic předloženo po roce 1995)099.9586
Shannon, CE44228N / A (nic předloženo po roce 1995)015.9117
Erdős, Paul7614280.40649077.8040
Shenker, Scott1052533629.173171.1167
Hirsch, Jorge E.31702178.938151.5361
Pople, Johne8729329123.7993355.6553

Tabulka využívá Scopus pouze jako vyhledávač a matice sousedství je odhad, takže výsledky uvedené v tabulce jsou extrémně agregované verze a nesmí být zaměňovány s absolutními indexy. Lepší odhad matice sousedství může způsobit odchylky v indexech. Scopus také sleduje články až po roce 1995, což je další omezení. (Všechny indexy byly vyhodnoceny k 12. prosinci 2011.)

V této tabulce je zřejmé, že různé vyhledávače poskytují různé h-indexy. Je možné, že vědec s vysokým indexem h může být silnou autoritou, ale ne nutně silným centrem. Platnost webových vyhledávačů se hodnotí jako nepřístupné dokumenty před rokem 1995. Počet publikací konkrétního autora v konkrétní databázi je odpovědný za ovlivnění indexů autoritních center. Interdisciplinární práce může být dobře hodnocena indexem autoritního centra na rozdíl od jiných indexů.

Příklad 2: Předpokládané indexy autorit hub s časem (příklad hračky)

Toto je příklad k pochopení souhry různých vědeckých indexů.

Nová vědecká pracovnice, která zahájila akademickou kariéru v roce 2009, vydala 3 příspěvky. Dva příspěvky mají každý 2 citace, zatímco třetí příspěvek nemá žádné citace. Odkázala na 60 článků se 17 silnými odkazy mezi 60. Jeden z jejích spoluautorů má nejnižší Erdősovo číslo 3. Její vědecké indexy k prosinci 2011 jsou:

  • h-index = 2
  • g-index = 2
  • m-kvocient = 2/2 = 1
  • Erdőovo číslo = 3 + 1 = 4
  • HUB index (na 10 ^ 2) = 11,702
  • AUTHORITY index = 0,1061

V jiném roce zveřejní další příspěvek s 20 novými referencemi, takže nyní má kumulativní počet 31 silných referencí, 4 příspěvky se 2 citacemi pro 2 příspěvky a 0 citací pro další 2 příspěvky. Změní se její indexy autoritních uzlů:

HUB index = 12,668

AUTHORITY index = 0,1061

V dalším roce se její citace na 3 příspěvky zvýší na 10 a nadále má 60 referencí se 17 silnými referencemi:

HUB index = 11,568

AUTHORITY index = 0,3241

V dalším roce se její citace zvýší na 10 a ona píše další referát tak, že počet odkazů stoupne na 80 (s 31 silnými):

HUB index = 12 694

AUTHORITY index = 0,3284

Abychom to shrnuli, jsou pro tento příklad hračky pozorovány následující indexy autoritních center.

InstancePočet citacíPočet referencíHUB (za 10 ^ 2)ÚŘAD
V současné době46011.7020.1061
Pokud se reference zvýší48012.6680.1061
Pokud se citace zvýší106011.5680.3241
Pokud se citace a reference zvýší108012.6940.3284

Kód matlabu pro instance příkladu 1 a příkladu hračky v příkladu 2 je připojen jako soubor 1.

Soubor 1. Ukázkový kód MATLAB pro indexy autorit hub pro slavné vědce a příklad hračky v příkladech 1 a 2.

Tyto příklady ukazují význam indexů autoritních center při kvantitativním hodnocení příspěvků vědce v úplné akademické kariéře.

Kritika

Scholar indexy mají omezení včetně nedostatečné přesnosti, platnosti a použitelnosti. Zatímco přesnost vědeckých indexů je sporná kvůli rozdílu v pravopisu, rozdílu v analyzátoru, vyhledávačích a databázích dokumentů udržovaných různými online zdroji, je možné vyřešit problémy s přesností, pokud lze každému autorovi přiřadit jedinečné ID místo spoléhání se na jména pro vyhledávání. Také pokaždé, když jsou tyto indexy hlášeny, musí být uvedena metoda a použité vyhledávače, aby se co nejvíce zabránilo nejednoznačnosti.

Platnost vědeckých indexů je omezením, protože neváží pole různého významu. Například, John Pople, teoretický chemik, který obdržel Nobelovu cenu, se špatně daří v sadách h-indexů.

Použitelnost vědeckých indexů má svá omezení, když vědci zdůrazňují spíše praktický pokrok v oblasti úsilí než publikování článků. Je také obtížné dokumentovat díla dřívějšího desetiletí jako online dokumenty, čímž se snižuje jejich online nárazový faktor. Například Scopus je online databáze, která počítá vědecké indexy pouze pro dokumenty nalezené po roce 1995. Žádné starší práce nejsou dokumentovány ani hodnoceny.

Jorge E. Hirsch navrhl h-index by měl informovat najímání, povýšení, financování, funkční období, ceny a společenské výbory, aby činil uvážlivá rozhodnutí. Kvůli jejich omezením je však na ně nejlépe pohlížet vyváženě.

Reference

  1. ^ A b McDonald, Kim (8. listopadu 2005). „Fyzik navrhuje nový způsob hodnocení vědeckých výstupů“. PhysOrg. Citováno 13. května 2010.
  2. ^ A b C Perish Software Harzing, A.W. (2007) Publish or Perish, dostupné z http://www.harzing.com/pop.htm
  3. ^ http://www.cs.odu.edu/~mln/pubs/2007-10-09-h-index.html
  4. ^ A b C d https://www.scopus.com/home.url
  5. ^ https://scholar.google.com/
  6. ^ Mohammad Hamdaqa a A. Hamou-Lhadj, „Citační analýza: přístup k usnadnění porozumění a analýza dokumentů o souladu s předpisy“, Proc. 6. mezinárodní konference o informačních technologiích, Las Vegas, USA
  7. ^ Kear, Robin & Colbert-Lewis, Danielle (2011). „Hledání citací a bibliometrická měřítka“. Zprávy o univerzitách a výzkumných knihovnách. 72 (8): 470–474. doi:10,5860 / crln.72,8.8620.
  8. ^ Amanda L. Werhane, UW-Madison. „Hirschův index vědecké produkce: nová míra, probíhající debata“ (PDF). Citováno 22. dubna 2014.
  9. ^ Zhang, C-T (2009). „E-index doplňující h-index pro nadměrné citace“. PLOS ONE. 4 (5): e5429. doi:10.1371 / journal.pone.0005429. PMC  2673580. PMID  19415119.
  10. ^ Erdőův číselný projekt. http://www.oakland.edu/enp/
  11. ^ http://arnetminer.org/viewperson.do?aid=833230&name=C.%20E.%20Shannon (Shannonův h-index)
  12. ^ https://scholar.google.it/citations?hl=it&user=2M6S-aAAAAAJ
  13. ^ LEO EGGHE (2006). "Teorie a praxe g-indexu". Scientometrie. 69 (1): 131–152. doi:10.1007 / s11192-006-0144-7. hdl:1942/981.
  14. ^ Centra a úřady.http://nlp.stanford.edu/IR-book/html/htmledition/hubs-and-authorities-1.html
  15. ^ Centra a úřady.http://www.cs.ucr.edu/~vagelis/classes/CS172/publications/kleinberg98authoritative.pdf
  16. ^ Základní terminologie
  17. ^ Hierarchická analýza odkazů pro hodnocení webových dat. http://renaud.delbru.fr/doc/pub/eswc2010-ding-slides.pdf
  18. ^ Algoritmus HITS - rozbočovače a autority na internetu. http://www.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture4/lecture4.html