Weka (strojové učení) - Weka (machine learning) - Wikipedia
![]() | |
![]() Weka 3.5.5 s otevřeným oknem Průzkumníka s Iris UCI datová sada | |
Vývojáři | University of Waikato |
---|---|
Stabilní uvolnění | 3.8.5 (stabilní) / 21. prosince 2020 |
Náhled verze | 3.9.5 / 21. prosince 2020 |
Úložiště | ![]() |
Napsáno | Jáva |
Operační systém | Okna, OS X, Linux |
Plošina | IA-32, x86-64; Java SE |
Typ | Strojové učení |
Licence | GNU General Public License |
webová stránka | www |
Prostředí Waikato pro analýzu znalostí (Weka), vyvinutý na University of Waikato, Nový Zéland, je svobodný software licencováno pod GNU General Public License a doprovodný software ke knize „Data Mining: Practical Machine Learning Tools and Techniques“.[1]
Popis
Weka obsahuje sbírku vizualizačních nástrojů a algoritmů pro analýza dat a prediktivní modelování, společně s grafickými uživatelskými rozhraními pro snadný přístup k těmto funkcím.[1] Původní ne-jávská verze Weky byla a Tcl / Tk front-end (většinou třetích stran) modelovací algoritmy implementované v jiných programovacích jazycích, plus předzpracování dat inženýrské sítě v C a Makefile systém založený na provádění experimentů strojového učení. Tato původní verze byla primárně navržena jako nástroj pro analýzu dat ze zemědělských oblastí,[2][3] ale novější plně Jáva verze na bázi (Weka 3), jejíž vývoj byl zahájen v roce 1997, se nyní používá v mnoha různých aplikačních oblastech, zejména pro vzdělávací účely a výzkum. Mezi výhody Weky patří:
- Zdarma dostupnost pod GNU General Public License.
- Přenositelnost, protože je plně implementována v Programovací jazyk Java a tedy běží na téměř jakékoli moderní výpočetní platformě.
- Komplexní sbírka technik předzpracování a modelování dat.
- Snadné použití díky grafickým uživatelským rozhraním.
Weka podporuje několik standardů dolování dat úkoly, konkrétněji předzpracování dat, shlukování, klasifikace, regrese, vizualizace a výběr funkcí. Všechny Weka techniky vycházejí z předpokladu, že data jsou k dispozici jako jeden plochý soubor nebo relace, kde je každý datový bod popsán pevným počtem atributů (obvykle číselné nebo nominální atributy, ale podporovány jsou i některé další typy atributů) . Weka poskytuje přístup k SQL databáze použitím Připojení k databázi Java a může zpracovat výsledek vrácený databázovým dotazem. Weka poskytuje přístup k hluboké učení s Deeplearning4j.[4] Není schopen multirelační těžby dat, ale existuje samostatný software pro převod kolekce propojených databázových tabulek do jedné tabulky, která je vhodná pro zpracování pomocí Weky.[5] Další důležitou oblastí, která v současné době není pokryta algoritmy obsaženými v distribuci Weka, je sekvenční modelování.
Rozšiřující balíčky
Ve verzi 3.7.2 byl přidán správce balíčků, který umožňuje snadnější instalaci rozšiřujících balíčků.[6]Některé funkce, které byly před touto verzí zahrnuty do Weky, byly od té doby přesunuty do těchto rozšiřujících balíčků, ale tato změna také usnadňuje ostatním přidávat rozšíření do Weky a udržovat software, protože tato modulární architektura umožňuje nezávislé aktualizace jádro Weka a jednotlivé rozšíření.
Dějiny
- V roce 1993 University of Waikato v Nový Zéland zahájil vývoj původní verze Weky, která se stala kombinací Tcl / Tk, C a Makefiles.
- V roce 1997 bylo rozhodnuto o přestavbě Weky od nuly v Javě, včetně implementací modelovacích algoritmů.[7]
- V roce 2005 Weka obdržel SIGKDD Cena za těžbu dat a vyhledávání znalostí.[8][9]
- V roce 2006 Pentaho Společnost získala exkluzivní licenci k používání Weka pro obchodní inteligence.[10] Tvoří data mining a prediktivní analytika součást sady business inteligence Pentaho. Pentaho od té doby získala společnost Hitachi Vantara a Weka nyní podporuje open source komponentu PMI (Plugin for Machine Intelligence).[11]
Související nástroje
- Auto-WEKA je automatizované strojové učení systém pro Weka.[12]
- Prostředí pro aplikace DeveLoping KDD podporované indexovými strukturami (ELKI ) je podobný projekt jako Weka se zaměřením na shluková analýza tj. metody bez dozoru.
- H2O.ai je open source platforma pro datovou vědu a strojové učení
- KNIME je software pro strojové učení a dolování dat implementovaný v Jáva.
- Masivní online analýza (MOA) je open-source projekt pro těžbu datových proudů ve velkém měřítku, vyvinutý také na University of Waikato v Nový Zéland.
- Neural Designer je software pro dolování dat založený na hluboké učení techniky napsané v C ++.
- oranžový je podobný open-source projekt pro dolování dat, strojové učení a vizualizaci založenou na scikit-učit se.
- RapidMiner je reklama strojové učení rámec implementovaný v Jáva který integruje Weka.
- Scikit-učit se je populární knihovna pro strojové učení v Pythonu.
Viz také
Reference
- ^ A b Witten, Ian H.; Frank, Eibe; Hall, Mark A .; Pal, Christopher J. (2011). „Data Mining: Praktické nástroje a techniky strojového učení, 3. vydání“. Morgan Kaufmann, San Francisco (CA). Citováno 2011-01-19.
- ^ Holmes, Geoffrey; Donkin, Andrew; Witten, Ian H. (1994). „Weka: Pracovní stůl pro strojové učení“ (PDF). Sborník druhé konference o Austrálii a Novém Zélandu o inteligentních informačních systémech, Brisbane, Austrálie. Citováno 2007-06-25.
- ^ Garner, Stephen R .; Cunningham, Sally Jo; Holmes, Geoffrey; Nevill-Manning, Craig G.; Witten, Ian H. (1995). „Applying a machine learning workbench: Experience with Agricultural databases“ (PDF). Proceedings of the Machine Learning in Practice Workshop, Machine Learning Conference, Tahoe City (CA), USA. s. 14–21. Citováno 2007-06-25.
- ^ „Metadata balíčku Weka“. SourceForge. 2017. Citováno 2017-11-11.
- ^ Reutemann, Peter; Pfahringer, Bernhard; Frank, Eibe (2004). „Správné: Sada nástrojů pro učení se z relačních dat s výrokovými a víceinstančními studenty“. 17. australská společná konference o umělé inteligenci (AI2004). Springer-Verlag. CiteSeerX 10.1.1.459.8443.
- ^ "weka-wiki - Balíčky". Citováno 27. ledna 2020.
- ^ Witten, Ian H .; Frank, Eibe; Trigg, Len; Hall, Mark A .; Holmes, Geoffrey; Cunningham, Sally Jo (1999). „Weka: Praktické nástroje a techniky strojového učení s implementacemi Java“ (PDF). Sborník seminářů ICONIP / ANZIIS / ANNES'99 o rozvíjejícím se znalostním inženýrství a spojovacích informačních systémech. str. 192–196. Citováno 2007-06-26.
- ^ Piatetsky-Shapiro, Gregory I. (2005-06-28). „KDnuggets novinky o SIGKDD Service Award 2005“. Citováno 2007-06-25.
- ^ „Přehled vítězů ceny SIGKDD Service Award“. 2005. Citováno 2007-06-25.
- ^ „Pentaho získává projekt Weka“. Pentaho. Citováno 2018-02-06.
- ^ „Plugin for Machine Intelligence“.
- ^ Thornton, Chris; Hutter, Frank; Hoos, Holger H.; Leyton-Brown, Kevin (2013). Auto-WEKA: Kombinovaný výběr a optimalizace hyperparametru klasifikačních algoritmů. KDD '13 Proceedings of the 19. ACM SIGKDD international conference on Knowledge discovery and data mining. str. 847–855.
externí odkazy
- Oficiální webové stránky na University of Waikato na Novém Zélandu