Orange (software) - Orange (software) - Wikipedia
![]() | tento článek příliš spoléhá na Reference na primární zdroje.Únor 2020) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
![]() | |
Vývojáři | Univerzita v Lublani |
---|---|
První vydání | 10. října 1996[1] |
Stabilní uvolnění | 3.27.1[2] / 3. listopadu 2020 |
Úložiště | Oranžové úložiště |
Napsáno | Krajta, Cython, C ++, C |
Operační systém | Cross-platform |
Typ | Strojové učení, Dolování dat, Vizualizace dat, Analýza dat |
Licence | GPLv3 nebo novější[3][4] |
webová stránka | oranžový |
oranžový je open-source vizualizace dat, strojové učení a dolování dat sada nástrojů. Je vybaven a vizuální programování front-end pro explorativní rychlé kvalitativní analýza dat a interaktivní data vizualizace.[5]

Popis
Orange je založen na komponentách vizuální programování softwarový balíček pro vizualizace dat, strojové učení, dolování dat a analýza dat.
Oranžové komponenty se nazývají widgety a pohybují se od jednoduché vizualizace dat, výběru podmnožiny a předzpracování až po empirické vyhodnocení učení algoritmy a prediktivní modelování.
Vizuální programování je implementováno prostřednictvím rozhraní, ve kterém jsou pracovní postupy vytvářeny propojením předdefinovaných nebo navržených uživatelem widgety, zatímco pokročilí uživatelé mohou používat Orange jako knihovnu Pythonu pro manipulaci s daty a úpravy widgetů.[6]
Software
Orange je softwarový balíček open-source vydaný pod GPL. Verze do verze 3.0 obsahují základní komponenty v systému Windows C ++ s obaly v Pythonu jsou k dispozici na GitHub. Od verze 3.0 dále Orange používá běžné vědecké knihovny Pythonu pro vědecké výpočty, například numpy, scipy a scikit-učit se, zatímco jeho grafické uživatelské rozhraní funguje v rámci napříč platformami Qt rámec.
Výchozí instalace zahrnuje řadu algoritmů strojového učení, předzpracování a vizualizace dat v 6 sadách widgetů (data, vizualizace, klasifikace, regrese, vyhodnocení a bez dozoru). Další funkce jsou k dispozici jako doplňky (bioinformatika, fúze dat a těžba textu).
Oranžová je podporována na Operační Systém Mac, Okna a Linux a lze je také nainstalovat z úložiště Python Package Index (pip nainstalujte Orange3).
Od května 2018 je stabilní verze 3.13 a běží s Pythonem 3, zatímco starší verze 2.7, která běží s Pythonem 2.7, je stále k dispozici.[7]
Funkce
Oranžová se skládá z plátna rozhraní na které uživatel umisťuje widgety a vytváří pracovní postup analýzy dat. Widgety nabízejí základní funkce, jako je čtení dat, zobrazení datové tabulky, výběr funkcí, trénink prediktorů, porovnání algoritmů učení, vizualizace datových prvků atd. Uživatel může interaktivně zkoumat vizualizace nebo vkládat vybranou podmnožinu do jiných widgetů.
- Plátno: grafické rozhraní pro analýzu dat
- Widgety:
- Data: widgety pro zadávání dat, filtrování dat, vzorkování, imputace, manipulace s funkcemi a výběr funkcí
- Vizualizovat: widgety pro běžnou vizualizaci (rámeček, histogramy, bodový graf) a vícerozměrné vizualizace (zobrazení mozaiky, sítový diagram).
- Klasifikovat: sada strojové učení pod dohledem algoritmy pro klasifikaci
- Regrese: sada supervizovaných algoritmů strojového učení pro regresi
- Vyhodnoťte: křížová validace, postupy založené na vzorkování, odhad spolehlivosti a hodnocení predikčních metod
- Bez dozoru: neřízené učení algoritmy pro shlukování (k-means, hierarchické shlukování) a techniky projekce dat (vícerozměrné škálování, analýza hlavních komponent, analýza korespondence).
- Doplňky:
- Spolupracovník: widgety pro těžbu častých položek a učení asociačního pravidla
- Bioinformatika: widgety pro analýzu genové sady, obohacení a přístup do knihoven cest
- Fúze dat: widgety pro fúze různých datových souborů, faktorizace kolektivní matice a zkoumání latentních faktorů
- Vzdělávací: widgety pro výukové koncepty strojového učení, jako např k-znamená shlukování, polynomiální regrese, stochastický gradient, ...
- Geo: widgety pro práci s geoprostorová data
- Analýza obrazu: widgety pro práci s obrázky a ImageNet vložení
- Síť: widgety pro graf a síťová analýza
- Dolování textu: widgety pro zpracování přirozeného jazyka a dolování textu
- Časové řady: widgety pro časové řady analýza a modelování
- Spektroskopie: widgety pro analýzu a vizualizaci (hyper) spektrální datové sady [8]

Cíle
Program poskytuje platformu pro výběr experimentu, doporučovací systémy a prediktivní modelování a používá se v biomedicína, bioinformatika, genomický výzkum a výuka. Ve vědě se používá jako platforma pro testování nových algoritmů strojového učení a pro implementaci nových technik do genetika a bioinformatika. Ve výuce byl používán k výuce strojového učení a metod dolování dat studentům biologie, biomedicíny a informatiky.
Rozšíření
Různé projekty staví na Orange buď rozšířením základních komponent o doplňky, nebo využíváním pouze Orange Canvas k využití implementovaných funkcí vizuálního programování a grafického uživatelského rozhraní.
- OASYS sadu ORange SYnchrotron [9]
- scOrange pro biostatistiku jedné buňky
- Quasar pro analýzu dat v přírodních vědách
Dějiny
- V roce 1996 Univerzita v Lublani a Institut Jožefa Stefana zahájil vývoj ML *, rámce strojového učení v C ++.
- V roce 1997 Krajta vazby byly vyvinuty pro ML *, které společně s rozvíjejícími se moduly Pythonu vytvořily společný rámec s názvem Orange.
- Během následujících let byly nejdůležitější algoritmy pro dolování dat a strojové učení vyvinuty buď v C ++ (jádro Orange), nebo v modulech Pythonu.
- V roce 2002 byly vytvořeny první prototypy pro vytvoření flexibilního grafického uživatelského rozhraní Pmw megawidgety Pythonu.
- V roce 2003 bylo grafické uživatelské rozhraní přepracováno a znovu vyvinuto pro Qt rámec pomocí PyQt Vazby Pythonu. Byl definován rámec vizuálního programování a byl zahájen vývoj widgetů (grafických komponent potrubí pro analýzu dat).
- V roce 2005 byla rozšíření pro analýzu dat v roce 2005 bioinformatika byl vytvořen.
- V roce 2008, Mac OS X DMG a Fink byly vyvinuty instalační balíčky na základě.
- V roce 2009 bylo vytvořeno a udržováno více než 100 widgetů.
- Od roku 2009 je Orange v beta verzi 2.0 a web nabízí instalační balíčky založené na denním kompilačním cyklu.
- V roce 2012 byla zavedena nová hierarchie objektů, která nahradila starou strukturu založenou na modulech.
- V roce 2013 došlo k zásadnímu redesignu grafického uživatelského rozhraní.
- V roce 2015 je vydán Orange 3.0.
- V roce 2016 je Orange ve verzi 3.3. Vývoj využívá měsíční stabilní cyklus vydání.
Reference
- ^ "orange3 / CHANGELOG.md ve společnosti master. biolab / orange3. GitHub".
- ^ „Verze 3.27.1“. 3. listopadu 2020. Citováno 16. listopadu 2020.
- ^ „Orange - Licence“.
- ^ "orange3 / LICENCE u pána. biolab / orange3. GitHub".
- ^ DemšarJanez; CurkTomaž; ErjavecAleš; GorupČrt; HočevarTomaž; MilutinovičMitar; MožinaMartin; PolajnarMatija; ToplakMarko; StaričAnže; ŠtajdoharMiha (01.01.2013). "Oranžový". The Journal of Machine Learning Research.
- ^ Janez Demšar; Tomaž Curk; Aleš Erjavec; Črt Gorup; Tomaž Hočevar; Mitar Milutinovič; Martin Možina; Matija Polajnar; Marko Toplak; Anže Starič; Miha Stajdohar; Lan Umek; Lan Žagar; Jure Žbontar; Marinka Žitnik; Blaž Zupan (2013). „Orange: sada nástrojů pro dolování dat v Pythonu“ (PDF). JMLR. 14 (1): 2349–2353.
- ^ „Orange - Stáhnout“. oranžový. Citováno 28. května 2018.
- ^ M. Toplak, G. Birarda, S. Read, C. Sandt, S. Rosendahl, L. Vaccari, J. Demšar, F. Borondics, Synchrotron Radiation News 30, 40–45 (2017). https://doi.org/10.1080/08940886.2017.1338424
- ^ L. Rebuffi, M. Sanchez del Rio, Proc. SPIE 10388, 103880S (2017). https://doi.org/10.1117/12.2274263
Další čtení
- Demšar, Janez a Blaž Zupan, Oranžová: Těžba dat plodná a zábavná - historická perspektiva, Informatica 37, str. 55–60, (2013).