สคริปต์ Python เพื่อดาวน์โหลด ประมวลผล และวิเคราะห์บันทึกมากกว่า 3.69 พันล้านรายการจากชุดข้อมูลบันทึกการเดินทางของ Taxi and Limousine Commission (TLC) ของนครนิวยอร์ก ครอบคลุมตั้งแต่ปี 2009 จนถึงปัจจุบัน
ผู้ดูแลพื้นที่เก็บข้อมูลนี้พร้อมให้จ้างสำหรับโครงการให้คำปรึกษา Python/Apache Spark/Apache Arrow/Data Engineering หากต้องการทราบประมาณการต้นทุน โปรดส่งอีเมลไปที่ [email protected] (สำหรับโครงการทุกขนาดหรือซับซ้อน)
ไพธอน 3.8+
ปิ๊ป 24.2+
จ็อบลิบ 1.3+
จำนวน 1.24.+
เปียร์โรว์ 14.0+
แพนด้า 2.0+
จีโอแพนด้า 0.13+
jupyterlab>=4.0+
พิสปาร์ค 3.5+
โคลนที่เก็บนี้
โคลนคอมไพล์ https://github.com/lykmapipo/NYC-TLC-Trip-Data.gitcd NYC-TLC-Trip-Data
ติดตั้งการพึ่งพาทั้งหมด
pip ติดตั้ง -r ข้อกำหนด.txt
ตั้งค่าตัวแปรสภาพแวดล้อม (หากใช้ AWS S3)
ส่งออก AWS_ACCESS_KEY_ID="<YOUR_AWS_ACCESS_KEY>"ส่งออก AWS_SECRET_ACCESS_KEY="<YOUR_AWS_SECRET_ACCESS_KEY>"ส่งออก AWS_REGION="us-east-1"
หากต้องการแยกข้อมูลเมตาการเดินทาง ให้รัน:
python extract_trips_metadata.py -s web -t yellow -y 2024
หากต้องการแยกข้อมูลโซน (ie taxi+_zone_lookup, taxi_zones etc.)
ให้รัน:
หลาม extract_zones_data.py
หากต้องการดึงข้อมูลการเดินทาง ให้รัน:
หลาม extract_trips_data.py -s web -t สีเหลือง -y 2024 -m 1 -m 2
หากต้องการตัวอย่างข้อมูลการเดินทาง ให้รัน:
หลาม example_trips_data.py -s web -t สีเหลือง -y 2024 -m 1 -f csv
คงจะดีถ้าคุณเปิดประเด็นก่อนเพื่อให้เราทราบว่าเกิดอะไรขึ้น จากนั้นแยก repo นี้และผลักดันแนวคิดของคุณ อย่าลืมเพิ่มการทดสอบเล็กน้อยว่าคุณเพิ่มมูลค่าอะไร
[email protected] หรือเปิดปัญหา GitHub
ใบอนุญาต MIT (MIT)
ลิขสิทธิ์ (c) lykmapipo และผู้มีส่วนร่วม
อนุญาตให้บุคคลใดๆ ได้รับสำเนาของซอฟต์แวร์นี้และไฟล์เอกสารที่เกี่ยวข้อง (“ซอฟต์แวร์”) โดยไม่เสียค่าใช้จ่าย เพื่อจัดการกับซอฟต์แวร์โดยไม่มีข้อจำกัด รวมถึงแต่ไม่จำกัดเพียงสิทธิ์ในการใช้ คัดลอก ปรับเปลี่ยน ผสาน เผยแพร่ แจกจ่าย ให้อนุญาตช่วง และ/หรือขายสำเนาของซอฟต์แวร์ และอนุญาตให้บุคคลที่ได้รับซอฟต์แวร์นี้สามารถทำได้ ภายใต้เงื่อนไขต่อไปนี้:
ประกาศเกี่ยวกับลิขสิทธิ์ข้างต้นและประกาศการอนุญาตนี้จะรวมอยู่ในสำเนาทั้งหมดหรือส่วนสำคัญของซอฟต์แวร์
ซอฟต์แวร์นี้มีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย ซึ่งรวมถึงแต่ไม่จำกัดเพียงการรับประกันความสามารถในการค้าขาย ความเหมาะสมสำหรับวัตถุประสงค์เฉพาะ และการไม่ละเมิด ไม่ว่าในกรณีใดผู้เขียนหรือผู้ถือลิขสิทธิ์จะต้องรับผิดต่อการเรียกร้องค่าเสียหายหรือความรับผิดอื่นใดไม่ว่าในการกระทำของสัญญาการละเมิดหรืออย่างอื่นที่เกิดขึ้นจากหรือเกี่ยวข้องกับซอฟต์แวร์หรือการใช้งานหรือข้อตกลงอื่น ๆ ใน ซอฟต์แวร์.