พื้นที่เก็บข้อมูลนี้ประกอบด้วยคู่มือ Python Data Science Handbook ทั้งหมด ในรูปแบบของสมุดบันทึก Jupyter (ฟรี!)
อ่านหนังสือออนไลน์ฉบับเต็มได้ที่ https://jakevdp.github.io/PythonDataScienceHandbook/
รันโค้ดโดยใช้สมุดบันทึก Jupyter ที่มีอยู่ในไดเร็กทอรีสมุดบันทึกของที่เก็บนี้
เปิดตัวสมุดบันทึกเวอร์ชันปฏิบัติการเหล่านี้โดยใช้ Google Colab:
เปิดใช้งานเซิร์ฟเวอร์โน้ตบุ๊กสดด้วยโน้ตบุ๊กเหล่านี้โดยใช้เครื่องผูก:
ซื้อหนังสือที่พิมพ์ผ่าน O'Reilly Media
หนังสือเล่มนี้เขียนและทดสอบด้วย Python 3.5 แม้ว่า Python เวอร์ชันอื่นๆ (รวมถึง Python 2.7) ควรใช้งานได้ในเกือบทุกกรณี
หนังสือเล่มนี้แนะนำไลบรารีหลักที่จำเป็นสำหรับการทำงานกับข้อมูลใน Python: โดยเฉพาะ IPython, NumPy, Pandas, Matplotlib, Scikit-Learn และแพ็คเกจที่เกี่ยวข้อง ถือว่ามีความคุ้นเคยกับ Python เป็นภาษา หากคุณต้องการข้อมูลเบื้องต้นเกี่ยวกับภาษาอย่างรวดเร็ว โปรดดูโครงการร่วมฟรี A Whirlwind Tour of Python: เป็นการแนะนำภาษา Python อย่างรวดเร็วซึ่งมุ่งเป้าไปที่นักวิจัยและนักวิทยาศาสตร์
ดู Index.ipynb สำหรับดัชนีของสมุดบันทึกที่พร้อมแนบไปกับข้อความ
รหัสในหนังสือได้รับการทดสอบด้วย Python 3.5 แม้ว่าส่วนใหญ่ (แต่ไม่ใช่ทั้งหมด) จะทำงานได้อย่างถูกต้องกับ Python 2.7 และ Python เวอร์ชันเก่าอื่น ๆ
แพ็คเกจที่ฉันใช้เรียกใช้โค้ดในหนังสือแสดงอยู่ใน Requirements.txt (โปรดทราบว่าหมายเลขเวอร์ชันที่แน่นอนบางส่วนเหล่านี้อาจไม่พร้อมใช้งานบนแพลตฟอร์มของคุณ: คุณอาจต้องปรับแต่งเพื่อการใช้งานของคุณเอง) หากต้องการติดตั้งข้อกำหนดโดยใช้ conda ให้รันสิ่งต่อไปนี้ที่บรรทัดคำสั่ง:
$ conda install --file requirements.txt
หากต้องการสร้างสภาพแวดล้อมแบบสแตนด์อโลนชื่อ PDSH
ด้วย Python 3.5 และเวอร์ชันแพ็คเกจที่จำเป็นทั้งหมด ให้รันดังต่อไปนี้:
$ conda create -n PDSH python=3.5 --file requirements.txt
คุณสามารถอ่านเพิ่มเติมเกี่ยวกับการใช้สภาพแวดล้อม conda ได้ในส่วนการจัดการสภาพแวดล้อมของเอกสารประกอบ conda
โค้ดในพื้นที่เก็บข้อมูลนี้ รวมถึงตัวอย่างโค้ดทั้งหมดในโน้ตบุ๊กที่ระบุไว้ข้างต้น ได้รับการเผยแพร่ภายใต้ใบอนุญาต MIT อ่านเพิ่มเติมได้ที่ Open Source Initiative
เนื้อหาข้อความของหนังสือเล่มนี้เผยแพร่ภายใต้ใบอนุญาต CC-BY-NC-ND อ่านเพิ่มเติมได้ที่ครีเอทีฟคอมมอนส์