การทดสอบ | |
บรรจุุภัณฑ์ | |
เมตา |
pandas เป็นแพ็คเกจ Python ที่ให้โครงสร้างข้อมูลที่รวดเร็ว ยืดหยุ่น และแสดงออกได้ชัดเจน ซึ่งออกแบบมาเพื่อให้การทำงานกับข้อมูล "เชิงสัมพันธ์" หรือ "ติดป้ายกำกับ" ทั้งง่ายและเป็นธรรมชาติ โดยมีจุดมุ่งหมายเพื่อเป็นองค์ประกอบพื้นฐานระดับสูงสำหรับการวิเคราะห์ข้อมูล ในโลกแห่งความเป็นจริง ในทางปฏิบัติใน Python นอกจากนี้ ยังมีเป้าหมายที่กว้างขึ้นในการเป็น เครื่องมือวิเคราะห์/จัดการข้อมูลโอเพ่นซอร์สที่ทรงพลังและยืดหยุ่นที่สุด ซึ่งมีให้บริการในทุกภาษา มันกำลังเดินทางมาสู่เป้าหมายนี้ด้วยดีอยู่แล้ว
คุณสมบัติหลัก
ที่จะได้รับมัน
การพึ่งพาอาศัยกัน
การติดตั้งจากแหล่งที่มา
ใบอนุญาต
เอกสารประกอบ
พื้นหลัง
การขอความช่วยเหลือ
การอภิปรายและการพัฒนา
บริจาคให้กับหมีแพนด้า
นี่เป็นเพียงบางสิ่งที่แพนด้าทำได้ดี:
การจัดการ ข้อมูลที่ขาดหายไป อย่างง่ายดาย (แสดงเป็น NaN
, NA
หรือ NaT
) ในรูปแบบจุดลอยตัวและข้อมูลจุดลอยตัว
ความไม่แน่นอนของขนาด: สามารถ แทรกและลบ คอลัมน์จาก DataFrame และอ็อบเจ็กต์มิติที่สูงกว่าได้
การจัดตำแหน่งข้อมูล อัตโนมัติและชัดเจน : ออบเจ็กต์สามารถจัดแนวให้ตรงกับชุดป้ายกำกับได้อย่างชัดเจน หรือผู้ใช้สามารถละเว้นป้ายกำกับแล้วปล่อยให้ Series
, DataFrame
ฯลฯ จัดแนวข้อมูลให้คุณโดยอัตโนมัติในการคำนวณ
จัดกลุ่มที่มีประสิทธิภาพและยืดหยุ่นตาม ฟังก์ชันการทำงานเพื่อดำเนินการแยก-นำไปใช้-รวมบนชุดข้อมูล สำหรับทั้งการรวบรวมและการแปลงข้อมูล
ทำให้ ง่ายต่อการแปลง ข้อมูลที่ขาดหายและมีดัชนีที่แตกต่างกันในโครงสร้างข้อมูล Python และ NumPy อื่น ๆ ให้เป็นวัตถุ DataFrame
การแบ่ง ส่วนตามฉลากอัจฉริยะ การจัดทำดัชนีแบบพิเศษ และ การตั้งค่าย่อย ของชุดข้อมูลขนาดใหญ่
การรวม และ การรวม ชุดข้อมูลที่ใช้งานง่าย
การปรับรูปร่าง และ การหมุน ชุดข้อมูลที่ยืดหยุ่น
การติดฉลาก แบบลำดับชั้น ของแกน (อาจมีหลายป้ายกำกับต่อขีด)
เครื่องมือ IO ที่แข็งแกร่งสำหรับการโหลดข้อมูลจาก ไฟล์แฟลต (CSV และตัวคั่น), ไฟล์ Excel , ฐานข้อมูล และการบันทึก/โหลดข้อมูลจาก รูปแบบ HDF5 ที่เร็วเป็นพิเศษ
อนุกรมเวลา - ฟังก์ชันการทำงานเฉพาะ: การสร้างช่วงวันที่และการแปลงความถี่ สถิติการย้ายหน้าต่าง การเปลี่ยนวันที่ และความล่าช้า
ขณะนี้ซอร์สโค้ดโฮสต์อยู่บน GitHub ที่: https://github.com/pandas-dev/pandas
ตัวติดตั้งไบนารีสำหรับเวอร์ชันที่วางจำหน่ายล่าสุดมีอยู่ที่ Python Package Index (PyPI) และบน Conda
# condaconda ติดตั้ง -c conda-forge pandas
# หรือ PyPIpip ติดตั้งแพนด้า
ดูรายการการเปลี่ยนแปลงแพนด้าระหว่างแต่ละรุ่นได้ที่นี่ สำหรับรายละเอียดทั้งหมด โปรดดูบันทึกการคอมมิตที่ https://github.com/pandas-dev/pandas
NumPy - เพิ่มการรองรับอาร์เรย์หลายมิติขนาดใหญ่ เมทริกซ์ และฟังก์ชันทางคณิตศาสตร์ระดับสูงเพื่อดำเนินการกับอาร์เรย์เหล่านี้
python-dateutil - จัดเตรียมส่วนขยายที่มีประสิทธิภาพให้กับโมดูล datetime มาตรฐาน
pytz - นำฐานข้อมูล Olson tz มาไว้ใน Python ซึ่งช่วยให้การคำนวณเขตเวลาข้ามแพลตฟอร์มแม่นยำและข้ามแพลตฟอร์ม
ดูคำแนะนำในการติดตั้งแบบเต็มสำหรับเวอร์ชันขั้นต่ำที่รองรับของการขึ้นต่อกันที่จำเป็น แนะนำ และเป็นทางเลือก
หากต้องการติดตั้งแพนด้าจากแหล่งที่มา คุณต้องใช้ Cython นอกเหนือจากการอ้างอิงปกติข้างต้น Cython สามารถติดตั้งได้จาก PyPI:
pip ติดตั้ง Cython
ในไดเร็กทอรี pandas
(อันเดียวกับที่คุณพบไฟล์นี้หลังจากโคลน repo git) ให้ดำเนินการ:
การติดตั้ง pip
หรือสำหรับการติดตั้งในโหมดการพัฒนา:
หลาม -m pip ติดตั้ง -ve --no-build-isolation -Ceditable-verbose=true
ดูคำแนะนำแบบเต็มสำหรับการติดตั้งจากแหล่งที่มา
บีเอสดี 3
เอกสารอย่างเป็นทางการโฮสต์อยู่บน PyData.org
งานเกี่ยวกับ pandas
เริ่มต้นที่ AQR (กองทุนป้องกันความเสี่ยงเชิงปริมาณ) ในปี 2551 และได้รับการพัฒนาอย่างแข็งขันตั้งแต่นั้นมา
สำหรับคำถามเกี่ยวกับการใช้งาน สถานที่ที่ดีที่สุดคือ StackOverflow นอกจากนี้ อาจมีคำถามและการอภิปรายทั่วไปในรายชื่อผู้รับจดหมายของ pydata
การอภิปรายด้านการพัฒนาส่วนใหญ่เกิดขึ้นบน GitHub ใน repo นี้ ผ่านทางตัวติดตามปัญหา GitHub
นอกจากนี้ รายชื่ออีเมลของ pandas-dev ยังสามารถใช้เพื่อการสนทนาเฉพาะทางหรือปัญหาการออกแบบ และช่องทาง Slack ก็พร้อมสำหรับคำถามที่เกี่ยวข้องกับการพัฒนาอย่างรวดเร็ว
นอกจากนี้ยังมีการประชุมชุมชนบ่อยครั้งสำหรับผู้ดูแลโครงการที่เปิดให้ชุมชนเข้าร่วม เช่นเดียวกับการประชุมผู้ร่วมให้ข้อมูลใหม่ทุกเดือนเพื่อช่วยสนับสนุนผู้ร่วมให้ข้อมูลรายใหม่
ข้อมูลเพิ่มเติมเกี่ยวกับช่องทางการสื่อสารสามารถดูได้ที่หน้าชุมชนผู้ร่วมให้ข้อมูล
เรายินดีต้อนรับการมีส่วนร่วม รายงานข้อผิดพลาด การแก้ไขข้อบกพร่อง การปรับปรุงเอกสาร การปรับปรุง และแนวคิดทั้งหมด
คุณสามารถดูภาพรวมโดยละเอียดเกี่ยวกับวิธีการมีส่วนร่วมได้ใน คู่มือการบริจาค
หากคุณต้องการเริ่มทำงานกับโค้ดเบสของ pandas ให้ไปที่แท็บ "ปัญหา" ของ GitHub และเริ่มค้นหาปัญหาที่น่าสนใจ มีปัญหาหลายประการแสดงอยู่ในเอกสารและฉบับแรกที่ดีที่คุณสามารถเริ่มต้นได้
คุณยังสามารถคัดแยกปัญหาซึ่งอาจรวมถึงการสร้างรายงานข้อผิดพลาดซ้ำ หรือขอข้อมูลสำคัญ เช่น หมายเลขเวอร์ชันหรือคำแนะนำในการทำซ้ำ หากคุณต้องการเริ่มปัญหาการแยกส่วน วิธีง่ายๆ วิธีหนึ่งในการเริ่มต้นคือสมัครรับ pandas บน CodeTriage
หรือบางทีจากการใช้แพนด้า คุณมีความคิดเป็นของตัวเองหรือกำลังมองหาบางอย่างในเอกสารประกอบและคิดว่า 'สิ่งนี้สามารถปรับปรุงได้'...คุณสามารถทำอะไรบางอย่างกับมันได้!
อย่าลังเลที่จะถามคำถามในรายชื่อผู้รับจดหมายหรือใน Slack
ในฐานะผู้สนับสนุนและผู้ดูแลโครงการนี้ คุณจะต้องปฏิบัติตามจรรยาบรรณของแพนด้า ดูข้อมูลเพิ่มเติมได้ที่: หลักปฏิบัติของผู้ร่วมให้ข้อมูล
ไปที่ด้านบน