WordStat - WordStat
Vývojáři | Provalis Research |
---|---|
První vydání | 1998 |
Stabilní uvolnění | 8 |
Operační systém | Microsoft Windows |
K dispozici v | Vícejazyčné |
Typ | Dolování textu, Obsahová analýza, Textová analytika, Analýza sentimentu |
Licence | Proprietární software |
webová stránka | www |
WordStat je obsahová analýza a dolování textu software.[1] Poprvé byl vydán v roce 1998 poté, co jej vyvinul Normand Peladeau z Provalis Research. Nejnovější verze 8 byla vydána v roce 2018.
Tento software se používá hlavně pro business intelligence a konkurenční analýzu webových stránek, analýza sentimentu, obsahová analýza otevřených otázek, extrakce témat z dat sociálních médií atd.
Některé funkce WordStat 8[2]
- Kategorizace obsahu pomocí uživatelem definovaných slovníků.
- Klasifikace dokumentů pomocí Naïve-Bayes nebo k-nejbližší sousedské algoritmy aplikované na slova nebo pojmy.
- Automatická extrakce témat pomocí hierarchického shlukování a vícerozměrného škálování prvního řádu (výskyt slov společně) nebo druhého řádu (profily společného výskytu).
- Modelování témat k extrakci hlavních témat pomocí NNMF a faktorové analýzy.
- Korespondenční analýza za účelem identifikace slov nebo pojmů (nebo kategorií obsahu) spojených s jakýmikoli kategorickými metadaty spojenými s dokumenty.
- Propojte nestrukturovaný text se strukturovanými daty, jako jsou data, čísla nebo kategorická data, abyste mohli identifikovat časové trendy nebo rozdíly mezi podskupinami nebo vyhodnotit vztah s hodnocením nebo jiným druhem kategorických nebo numerických dat.
- Vizualizační nástroje pro vizualizaci a interpretaci výsledků textové analýzy:
- Dendrogram s volitelným sloupcovým grafem
- 2D a 3D multidimenzionální škálování
- Proximity plot
- Tepelná mapa (s duálním shlukováním)
- Bublinový graf
- Pruhový graf, výsečový graf, spojnicový graf, slovo mraky
- Korespondenční grafy (2D a 3D)