測試 | |
包裹 | |
元 |
pandas是一個 Python 包,它提供快速、靈活且富有表現力的資料結構,旨在使「關係」或「標記」資料的處理變得簡單直觀。它的目標是成為用 Python 進行實際、真實世界資料分析的基本高階構建塊。此外,它還有更廣泛的目標,即成為任何語言中最強大、最靈活的開源資料分析/操作工具。它已經在朝著這個目標前進。
主要特點
哪裡可以得到它
依賴關係
從來源安裝
執照
文件
背景
尋求協助
討論與發展
為熊貓做出貢獻
以下是 pandas 擅長的一些事情:
輕鬆處理浮點和非浮點資料中的缺失資料(表示為NaN
、 NA
或NaT
)
大小可變性:可以從 DataFrame 和更高維度物件插入和刪除列
自動和明確資料對齊:物件可以明確地與一組標籤對齊,或者使用者可以簡單地忽略標籤並讓Series
、 DataFrame
等在計算中自動為您對齊數據
強大、靈活的分組功能,可對資料集執行拆分-應用-組合操作,以聚合和轉換數據
可以輕鬆地將其他 Python 和 NumPy 資料結構中的不規則、不同索引的資料轉換為 DataFrame 對象
基於智慧標籤的切片、花式索引和大數據集的子集
直觀的合併和連接資料集
資料集的靈活重塑與旋轉
軸的分層標籤(每個刻度可能有多個標籤)
強大的 IO 工具,用於從平面文件(CSV 和分隔)、 Excel 文件、資料庫加載數據,以及從超快HDF5 格式保存/加載數據
時間序列特定功能:日期範圍產生和頻率轉換、移動視窗統計、日期平移和滯後
原始碼目前託管在 GitHub 上:https://github.com/pandas-dev/pandas
最新發布版本的二進位安裝程式可在 Python 套件索引 (PyPI) 和 Conda 上找到。
# condaconda install -c conda-forge pandas
# 或 PyPIpip 安裝 pandas
可以在此處找到每個版本之間 pandas 的變更清單。有關完整詳細信息,請參閱 https://github.com/pandas-dev/pandas 上的提交日誌。
NumPy - 增加對大型多維數組、矩陣和高級數學函數的支援以對這些數組進行操作
python-dateutil - 為標準日期時間模組提供強大的擴展
pytz - 將 Olson tz 資料庫引入 Python,允許準確的跨平台時區運算
請參閱完整的安裝說明,以了解所需、建議和選用相依性的最低支援版本。
要從來源安裝 pandas,除了上面的正常依賴項之外,您還需要 Cython。 Cython 可以從 PyPI 安裝:
pip 安裝 cython
在pandas
目錄(與複製 git 儲存庫後找到此檔案的目錄相同)中,執行:
點安裝。
或以開發模式安裝:
python -m pip install -ve 。 --no-build-isolation -Ceditable-verbose=true
請參閱從來源安裝的完整說明。
BSD 3
官方文件託管在 PyData.org 上。
AQR(量化對沖基金)於 2008 年開始對pandas
進行研究,此後一直在積極開發中。
對於使用問題,最好的地方是 StackOverflow。此外,一般問題和討論也可以在 pydata 郵件清單上進行。
大多數開發討論都是透過 GitHub 問題追蹤器在此儲存庫中的 GitHub 上進行的。
此外,pandas-dev 郵件清單還可用於專門討論或設計問題,而 Slack 頻道可用於快速開發相關問題。
也經常向社區開放專案維護者社群會議,以及每月舉行的新貢獻者會議以幫助支持新貢獻者。
有關溝通管道的更多資訊可以在貢獻者社群頁面上找到。
歡迎所有貢獻、錯誤報告、錯誤修復、文件改進、增強和想法。
有關如何貢獻的詳細概述可以在貢獻指南中找到。
如果您只是想開始使用 pandas 程式碼庫,請導航至 GitHub「問題」標籤並開始尋找有趣的問題。文件下列出了許多問題,您可以從第一個問題開始。
您也可以對問題進行分類,其中可能包括重現錯誤報告,或詢問版本號或重現說明等重要資訊。如果您想開始對問題進行分類,一種簡單的入門方法是在 CodeTriage 上訂閱 pandas。
或者也許透過使用 pandas,您有自己的想法,或者正在文件中尋找某些內容並認為「這可以改進」...您可以對此做一些事情!
請隨時在郵件清單或 Slack 上提問。
作為該專案的貢獻者和維護者,您應該遵守 pandas 的行為準則。更多資訊請參閱:貢獻者行為準則
轉到頂部