WordStat - WordStat

WordStat
Logo WordStatu od Provalis Research.png
VývojářiProvalis Research
První vydání1998
Stabilní uvolnění
8
Operační systémMicrosoft Windows
K dispozici vVícejazyčné
TypDolování textu, Obsahová analýza, Textová analytika, Analýza sentimentu
LicenceProprietární software
webová stránkawww.provalisresearch.com

WordStat je obsahová analýza a dolování textu software.[1] Poprvé byl vydán v roce 1998 poté, co jej vyvinul Normand Peladeau z Provalis Research. Nejnovější verze 8 byla vydána v roce 2018.

Tento software se používá hlavně pro business intelligence a konkurenční analýzu webových stránek, analýza sentimentu, obsahová analýza otevřených otázek, extrakce témat z dat sociálních médií atd.

Některé funkce WordStat 8[2]

  • Kategorizace obsahu pomocí uživatelem definovaných slovníků.
  • Klasifikace dokumentů pomocí Naïve-Bayes nebo k-nejbližší sousedské algoritmy aplikované na slova nebo pojmy.
  • Automatická extrakce témat pomocí hierarchického shlukování a vícerozměrného škálování prvního řádu (výskyt slov společně) nebo druhého řádu (profily společného výskytu).
  • Modelování témat k extrakci hlavních témat pomocí NNMF a faktorové analýzy.
  • Korespondenční analýza za účelem identifikace slov nebo pojmů (nebo kategorií obsahu) spojených s jakýmikoli kategorickými metadaty spojenými s dokumenty.
  • Propojte nestrukturovaný text se strukturovanými daty, jako jsou data, čísla nebo kategorická data, abyste mohli identifikovat časové trendy nebo rozdíly mezi podskupinami nebo vyhodnotit vztah s hodnocením nebo jiným druhem kategorických nebo numerických dat.
  • Vizualizační nástroje pro vizualizaci a interpretaci výsledků textové analýzy:
    • Dendrogram s volitelným sloupcovým grafem
    • 2D a 3D multidimenzionální škálování
    • Proximity plot
    • Tepelná mapa (s duálním shlukováním)
    • Bublinový graf
    • Pruhový graf, výsečový graf, spojnicový graf, slovo mraky
    • Korespondenční grafy (2D a 3D)

Reference