Pandy (software) - Pandas (software)
![]() | |
Původní autoři | Wes McKinney |
---|---|
Vývojáři | Společenství |
První vydání | 11. ledna 2008 |
Stabilní uvolnění | 1.1.4[1] / 30. října 2020 |
Úložiště | ![]() |
Napsáno | Krajta, Cython, C |
Operační systém | Cross-platform |
Typ | Technické výpočty |
Licence | Nová licence BSD |
webová stránka | pandy |
v programování, pandy je softwarová knihovna psáno pro Programovací jazyk Python pro manipulaci a analýzu dat. Zejména nabízí datové struktury a operace pro manipulaci s numerickými tabulkami a časové řady. to je svobodný software propuštěn pod tříčlenná licence BSD.[2] Název je odvozen od výrazu „data panelu ", an ekonometrie termín pro soubory dat, které zahrnují pozorování stejných jedinců v několika časových obdobích.[3] Jeho název je hrou na samotnou frázi „Analýza dat v Pythonu“.[4] Wes McKinney začal stavět to, z čeho se stanou pandy AQR kapitál zatímco tam působil jako výzkumný pracovník v letech 2007 až 2010.[5]
Funkce knihovny
- Objekt DataFrame pro manipulaci s daty s integrovaným indexováním.
- Nástroje pro čtení a zápis dat mezi datovými strukturami v paměti a různými formáty souborů.
- Zarovnání dat a integrované zpracování chybějících dat.
- Přetváření a otáčení souborů dat.
- Řezání podle štítků, fantastické indexování a podmnožina velkých datových sad.
- Vkládání a mazání sloupců datové struktury.
- Seskupit podle motoru umožňující operace rozdělit, aplikovat a kombinovat na souborech dat.
- Sloučení a připojení datové sady.
- Hierarchická indexace os pro práci s vysokodimenzionálními daty v nízkodimenzionální datové struktuře.
- Funkce časových řad: Generování rozsahu dat[6] a frekvenční konverze, statistiky pohyblivých oken, lineární regrese pohyblivých oken, posunutí data a zpoždění.
- Poskytuje filtrování dat.
Knihovna je vysoce optimalizována pro výkon a jsou v ní zapsány kritické cesty kódu Cython nebo C.[7]
Datové rámce
Pandy se používají hlavně pro analýza dat. Pandy umožňují import dat z různých formátů souborů, jako jsou hodnoty oddělené čárkami, JSON, SQL, Microsoft Excel.[8] Pandy umožňují různé operace manipulace s daty, jako je slučování,[9] přetváření,[10] výběr,[11] stejně jako čištění dat, a hádání dat funkce.
Dějiny
Vývojář Wes McKinney začal pracovat na pandách v roce 2008, zatímco v Správa kapitálu AQR z potřeby vysoce výkonného a flexibilního nástroje kvantitativní analýza o finančních datech. Před odchodem z AQR dokázal přesvědčit vedení, aby mu to umožnilo otevřený zdroj Knihovna.
Další zaměstnankyně AQR, Chang She, se k úsilí připojila v roce 2012 jako druhý hlavní přispěvatel do knihovny.
V roce 2015 se pandy podepsaly jako fiskálně sponzorovaný projekt společnosti NumFOCUS, a 501 (c) (3) nezisková charita ve Spojených státech.[12]
Viz také
- matplotlib
- NumPy
- SciPy
- R (programovací jazyk)
- Scikit-učit se
- statsmodels
- Seznam softwaru pro numerickou analýzu
Reference
- ^ „Verze 1.1.4“. 30. října 2020. Citováno 16. listopadu 2020.
- ^ "Licence - Přehled balíčku - dokumentace pand 1.0.0". pandy. 28. ledna 2020. Citováno 30. ledna 2020.
- ^ Wes McKinney (2011). „pandas: Foundational Python Library for Data Analysis and Statistics“ (PDF). Citováno 2. srpna 2018.
- ^ McKinney, Wes (2017). Python pro analýzu dat, druhé vydání. O'Reilly Media. p. 5. ISBN 9781491957660.
- ^ Kopf, Dan. „Seznamte se s mužem, který stojí za nejdůležitějším nástrojem v oblasti datové vědy“. Křemen. Citováno 17. listopadu 2020.
- ^ "pandas.date_range - dokumentace pandas 1.0.0". pandy. 29. ledna 2020. Citováno 30. ledna 2020.
- ^ "Knihovna pro analýzu dat v Pythonu - pandy: Knihovna pro analýzu dat v Pythonu". pandy. Citováno 13. listopadu 2017.
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html
- ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html
- ^ „NumFOCUS - pandy: fiskálně sponzorovaný projekt“. NumFOCUS. Citováno 3. dubna 2018.
Další čtení
- Chen, Daniel Y. (2018). Pandy pro každého: Analýza dat v Pythonu. Boston: Addison-Wesley. ISBN 978-0-13-454693-3.
- McKinney, Wes (2017). Python pro analýzu dat: hádání dat s Pandas, NumPy a IPython (2. vyd.). Sebastopol: O'Reilly. ISBN 978-1-4919-5766-0.
- VanderPlas, Jake (2016). "Manipulace s daty s pandami". Příručka Python Data Science: Základní nástroje pro práci s daty. O'Reilly. 97–216. ISBN 978-1-4919-1205-8.
- Pathak, Chankey (2018). "Pandas Cookbook". Pandas Cookbook. s. 1–8.