Pengujian | |
Kemasan | |
Meta |
pandas adalah paket Python yang menyediakan struktur data cepat, fleksibel, dan ekspresif yang dirancang untuk membuat pekerjaan dengan data "relasional" atau "berlabel" menjadi mudah dan intuitif. Ini bertujuan untuk menjadi landasan dasar tingkat tinggi untuk melakukan analisis data dunia nyata dan praktis dengan Python. Selain itu, ia memiliki tujuan yang lebih luas untuk menjadi alat analisis/manipulasi data sumber terbuka yang paling kuat dan fleksibel yang tersedia dalam bahasa apa pun . Negara ini sudah dalam perjalanan menuju tujuan ini.
Fitur Utama
Dimana mendapatkannya
Ketergantungan
Instalasi dari sumber
Lisensi
Dokumentasi
Latar belakang
Mendapatkan Bantuan
Diskusi dan Pengembangan
Berkontribusi pada panda
Berikut beberapa hal yang dapat dilakukan panda dengan baik:
Penanganan data yang hilang dengan mudah (direpresentasikan sebagai NaN
, NA
, atau NaT
) dalam data floating point maupun non-floating point
Perubahan ukuran: kolom dapat disisipkan dan dihapus dari DataFrame dan objek berdimensi lebih tinggi
Penyelarasan data otomatis dan eksplisit : objek dapat disejajarkan secara eksplisit ke sekumpulan label, atau pengguna dapat mengabaikan label dan membiarkan Series
, DataFrame
, dll. secara otomatis menyelaraskan data untuk Anda dalam perhitungan
Fungsi pengelompokan yang kuat dan fleksibel untuk melakukan operasi pemisahan-terapkan-gabungan pada kumpulan data, baik untuk menggabungkan maupun mentransformasikan data
Permudah konversi data yang tidak teratur dan diindeks berbeda dalam struktur data Python dan NumPy lainnya menjadi objek DataFrame
Pemotongan cerdas berbasis label, pengindeksan mewah , dan subsetting kumpulan data besar
Penggabungan dan penggabungan kumpulan data secara intuitif
Pembentukan ulang dan perputaran kumpulan data yang fleksibel
Pelabelan sumbu secara hierarkis (mungkin memiliki beberapa label per centang)
Alat IO yang kuat untuk memuat data dari file datar (CSV dan dibatasi), file Excel , database , dan menyimpan/memuat data dari format HDF5 ultracepat
Fungsi khusus deret waktu : pembuatan rentang tanggal dan konversi frekuensi, statistik jendela bergerak, pergeseran tanggal, dan penundaan
Kode sumber saat ini dihosting di GitHub di: https://github.com/pandas-dev/pandas
Penginstal biner untuk versi rilis terbaru tersedia di Python Package Index (PyPI) dan di Conda.
# condaconda install -c conda-forge pandas
# atau PyPIpip instal panda
Daftar perubahan panda di antara setiap rilis dapat ditemukan di sini. Untuk detail selengkapnya, lihat log penerapan di https://github.com/pandas-dev/pandas.
NumPy - Menambahkan dukungan untuk array multidimensi besar, matriks, dan fungsi matematika tingkat tinggi untuk beroperasi pada array ini
python-dateutil - Menyediakan ekstensi yang kuat untuk modul datetime standar
pytz - Membawa database Olson tz ke dalam Python yang memungkinkan perhitungan zona waktu yang akurat dan lintas platform
Lihat petunjuk instalasi lengkap untuk versi minimum yang didukung dari dependensi yang diperlukan, direkomendasikan, dan opsional.
Untuk menginstal panda dari sumber Anda memerlukan Cython selain dependensi normal di atas. Cython dapat diinstal dari PyPI:
pip instal cython
Di direktori pandas
(direktori yang sama tempat Anda menemukan file ini setelah mengkloning repo git), jalankan:
pemasangan pip.
atau untuk menginstal dalam mode pengembangan:
python -m pip instal -ve . --no-build-isolation -Ceditable-verbose=benar
Lihat petunjuk lengkap untuk menginstal dari sumber.
BSD3
Dokumentasi resmi dihosting di PyData.org.
Pengerjaan pandas
dimulai di AQR (dana lindung nilai kuantitatif) pada tahun 2008 dan terus dikembangkan secara aktif sejak saat itu.
Untuk pertanyaan penggunaan, tempat terbaik untuk dikunjungi adalah StackOverflow. Selanjutnya, pertanyaan umum dan diskusi juga dapat dilakukan di milis pydata.
Sebagian besar diskusi pengembangan berlangsung di GitHub di repo ini, melalui pelacak masalah GitHub.
Lebih lanjut, milis pandas-dev juga dapat digunakan untuk diskusi khusus atau masalah desain, dan saluran Slack tersedia untuk pertanyaan terkait pengembangan cepat.
Ada juga pertemuan komunitas yang sering diadakan untuk pengelola proyek yang terbuka untuk komunitas serta pertemuan kontributor baru setiap bulan untuk membantu mendukung kontributor baru.
Informasi tambahan mengenai saluran komunikasi dapat ditemukan di halaman komunitas kontributor.
Semua kontribusi, laporan bug, perbaikan bug, perbaikan dokumentasi, penyempurnaan, dan ide dipersilakan.
Ikhtisar terperinci tentang cara berkontribusi dapat ditemukan di panduan berkontribusi .
Jika Anda hanya ingin mulai bekerja dengan basis kode pandas, navigasikan ke tab "masalah" GitHub dan mulailah mencari masalah yang menarik. Ada sejumlah masalah yang tercantum di Dokumen dan masalah pertama yang bagus yang bisa Anda mulai.
Anda juga dapat melakukan triase masalah yang mungkin mencakup pembuatan ulang laporan bug, atau meminta informasi penting seperti nomor versi atau instruksi reproduksi. Jika Anda ingin mulai melakukan triase masalah, salah satu cara mudah untuk memulainya adalah dengan berlangganan pandas di CodeTriage.
Atau mungkin dengan menggunakan pandas Anda memiliki ide sendiri atau mencari sesuatu di dokumentasi dan berpikir 'ini dapat ditingkatkan'...Anda dapat melakukan sesuatu untuk mengatasinya!
Jangan ragu untuk mengajukan pertanyaan di milis atau di Slack.
Sebagai kontributor dan pengelola proyek ini, Anda diharapkan mematuhi kode etik panda. Informasi lebih lanjut dapat ditemukan di: Kode Etik Kontributor
Pergi ke Atas