Arnetminer - Arnetminer
ArnetMiner (také AMiner) je bezplatná online služba používaná k indexování, vyhledávání a těžbě velkých vědeckých dat.
Přehled
ArnetMiner (AMiner) je navržen k vyhledávání a hraní dolování dat operace proti akademickým publikacím na internetu pomocí analýzy sociálních sítí k identifikaci spojení mezi výzkumnými pracovníky, konferencemi a publikacemi.[1] To mu umožňuje poskytovat služby, jako je expertní vyhledávání, geografické vyhledávání, analýza trendů, doporučení recenzentů, vyhledávání asociací, vyhledávání kurzů, hodnocení akademického výkonu a modelování témat.
ArnetMiner byl vytvořen jako výzkumný projekt v oblasti analýzy sociálních vlivů, hodnocení sociálních sítí a extrakce sociálních sítí. Byla vydána řada recenzovaných článků vyplývajících z vývoje systému. Je v provozu více než tři roky a indexoval 130 000 000 výzkumných pracovníků a více než 200 milionů publikací.[2] Výzkum byl financován čínským národním programem špičkových technologií pro výzkum a vývoj a Národní vědecká nadace Číny.
ArnetMiner se běžně používá v akademické sféře k identifikaci vztahů mezi a kreslení statistických korelací o výzkumu a vědcích. Přitáhlo více než 10 milionů nezávislých IP přístupů z 220 zemí a regionů. Produkt byl použit v Elsevier platforma SciVerse,[3] a akademické konference jako SIGKDD, ICDM, PKDD, WSDM.
Úkon
ArnetMiner automaticky extrahuje profil výzkumníka z webu. Shromažďuje a identifikuje relevantní stránky a poté používá jednotný přístup k extrakci dat z identifikovaných dokumentů. Extrahuje také publikace z online digitálních knihoven pomocí heuristických pravidel.
Integruje extrahované profily výzkumníků a extrahované publikace. Jako identifikátor zaměstnává jméno výzkumného pracovníka. Pro řešení problému nejednoznačnosti názvu v integraci byl navržen pravděpodobnostní rámec. Integrovaná data jsou uložena do znalostní báze výzkumné sítě (RNKB).
Dalším hlavním produktem v této oblasti jsou Google Scholar, Elsevier's Scirus a open source projekt CiteSeer.
Dějiny
Byl iniciován a vytvořen profesorem Jie Tang z Univerzita Tsinghua, Čína. Poprvé byl spuštěn v březnu 2006. Následující seznam obsahuje seznam aktualizací v minulých letech:
- Březen 2006, verze 0.1, Mezi funkce patří profilování výzkumníků, expertní vyhledávání, konferenční vyhledávání a vyhledávání publikací. Systém byl vyvinut v Perlu;
- Srpen 2006, verze 1.0, Systém byl znovu implementován v Javě;
- Červenec 2007, verze 2.0, Mezi nové funkce patří těžba zájmu výzkumných pracovníků, vyhledávání asociací, hledání příspěvků v průzkumu (nyní nedostupné);
- Duben 2008, verze 3.0, Nové funkce zahrnují porozumění dotazu, nové grafické uživatelské rozhraní a analýza protokolu vyhledávání;
- Listopad 2008, verze 4.0, Mezi nové funkce patří vyhledávání grafů, modelování témat, extrakce informací o financování NSF / NSFC;
- Duben 2009, verze 5.0, Mezi nové funkce patří edice Profilu, otevřená služba API, vyhledávání Bole, vyhledávání kurzů (nyní nedostupné);
- Prosinec 2009, verze 6.0, Mezi nové funkce patří hodnocení akademického výkonu, zpětná vazba od uživatelů, analýza konference;
- Květen 2010, Verze 7.0, Mezi nové funkce patří disambiguace jmen, doporučení recenzenta papíru, vytvoření ArnetPage;
- Březen 2012, verze II, přejmenovaná na AMiner, přepsala všechny kódy a přepracovala grafické uživatelské rozhraní. Mezi nové funkce patří: geografické vyhledávání, platforma ArnetAPP.
- Červen 2014, verze II, přejmenovaná na AMiner, přepsala všechny kódy a přepracovala grafické uživatelské rozhraní. Mezi nové funkce patří: geografické vyhledávání, platforma ArnetAPP.
- V prosinci 2015 byla online uvedena zcela nová verze.
- Květen 2017 se profesionální verze dostala online.
- Duben 2018, Mezi nové funkce patří Analýza trendů,[4] hluboká učení založená na disambiguaci jmen[5]
Zdroje
ArnetMiner zveřejnil několik datových sad pro účely akademického výzkumu, včetně Open Academic Graph,[6] Citace DBLP +[7] (datová sada rozšiřující citace do dat DBLP z Projekt digitální bibliografie a knihovny ), Rozcestník jména,[8] Analýza sociálních vazeb.[9] Další dostupné datové sady a zdrojové kódy pro výzkum najdete na.[10]
Viz také
- CiteSeerX
- Projekt digitální bibliografie a knihovny
- Google Scholar
- Microsoft Academic Search
- Seznam akademických databází a vyhledávačů
- Scirus
- Scopus
Reference
- ^ Jie Tang; Jing Zhang; Limin Yao; Juanzi Li; Li Zhang; Zhong Su (2008). „ArnetMiner: těžba a těžba akademických sociálních sítí“. Sborník příspěvků ze 14. mezinárodní konference ACM SIGKDD o získávání znalostí a dolování dat. New York: ACM.
- ^ "Arnetminer: úvod". Citováno 28. května 2010.
- ^ „SciVerse - HUB - Domů“. Archivovány od originál dne 9. září 2012. Citováno 24. dubna 2012.
- ^ "Analýza trendů". Citováno 24. prosince 2018.
- ^ Yutao Zhang; Fanjin Zhang; Peiran Yao; Jie Tang (2018). „Názvosloví v AMiner: Shlukování, údržba a člověk ve smyčce“. Sborník z 24. mezinárodní konference ACM SIGKDD o získávání znalostí a dolování dat. Londýn: ACM.
- ^ „Otevřený akademický graf“. Citováno 24. prosince 2018.
- ^ „DBLP Papers + Citation Relationship“. Citováno 24. prosince 2018.
- ^ „Rozcestník jména“. Citováno 24. dubna 2012.
- ^ „Odvození sociálních vazeb ve velkých sítích“. Citováno 24. dubna 2012.
- ^ „Open Data and Codes by ArnetMiner“. Citováno 24. dubna 2012.
externí odkazy
Další čtení
- Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, Zhong Su. Arnetminer: těžba a těžba akademických sociálních sítí. Ve sborníku z 14. mezinárodní konference ACM SIGKDD o zjišťování znalostí a dolování dat (SIGKDD'2008)
- Chi Wang, Jiawei Han, Yuntao Jia, Jie Tang, Duo Zhang, Yintao Yu a Jingyi Guo. Vztahy mezi poradcem a poradcem pro těžbu z výzkumných publikačních sítí. InProceedings of the Sixteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD'2010).
- Jie Tang, Jimeng Sun, Chi Wang a Zi Yang. Analýza sociálních vlivů ve velkých sítích. In Proceedings of the Fifteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD'2009). 807–816.
- Jie Tang, Ruoming Jin a Jing Zhang. Přístup k modelování témat a jeho integrace do rámce náhodných procházek pro akademické vyhledávání. In Proceedings of IEEE International Conference on Data Mining 2008 (ICDM'2008). str. 1055–1060.
- Jie Tang, Limin Yao, Duo Zhang a Jing Zhang. Kombinovaný přístup k profilování uživatelů webu. Transakce ACM o zjišťování znalostí z dat (TKDD), (svazek 5, č. 1), článek 2 (prosinec 2010), 44 stran.
- Yutao Zhang, Fanjin Zhang, Peiran Yao a Jie Tang. Rozcestník v AMiner: Seskupování, údržba a člověk ve smyčce. Ve sborníku z dvacáté čtvrté mezinárodní konference ACM SIGKDD o získávání znalostí a dolování dat (KDD'18). 1002-1011.