โต๊ะเลื่อย
ภาพรวม
Tablesaw คือดาต้าเฟรมและไลบรารีการแสดงภาพที่รองรับการโหลด การล้าง การแปลง การกรอง และการสรุปข้อมูล หากคุณทำงานกับข้อมูลใน Java อาจช่วยคุณประหยัดเวลาและความพยายาม Tablesaw ยังรองรับสถิติเชิงพรรณนาและสามารถใช้เพื่อเตรียมข้อมูลสำหรับการทำงานกับไลบรารีการเรียนรู้ของเครื่อง เช่น Smile, Tribuo, H20.ai, DL4J
คุณสมบัติเลื่อยโต๊ะ
การประมวลผลและการเปลี่ยนแปลงข้อมูล
- นำเข้าข้อมูลจากไฟล์ข้อความ RDBMS, Excel, CSV, TSV, JSON, HTML หรือความกว้างคงที่ ไม่ว่าจะเป็นไฟล์ภายในเครื่องหรือระยะไกล (http, S3 ฯลฯ)
- ส่งออกข้อมูลเป็นไฟล์ CSV, JSON, HTML หรือความกว้างคงที่
- รวมตารางโดยการต่อท้ายหรือเข้าร่วม
- เพิ่มและลบคอลัมน์หรือแถว
- จัดเรียง จัดกลุ่ม กรอง แก้ไข ย้าย ฯลฯ
- การทำแผนที่/ลดการดำเนินการ
- จัดการกับค่าที่หายไป
การแสดงภาพ
Tablesaw รองรับการแสดงภาพข้อมูลโดยจัดให้มี wrapper สำหรับไลบรารีการลงจุด Plot.ly JavaScript นี่คือตัวอย่างบางส่วนของไลบรารีใหม่ที่ใช้งานจริง
สถิติ
- สถิติเชิงพรรณนา: ค่าเฉลี่ย ต่ำสุด สูงสุด มัธยฐาน ผลรวม ผลคูณ ส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวน เปอร์เซ็นไทล์ ค่าเฉลี่ยเรขาคณิต ความเบ้ ความโด่ง ฯลฯ
เริ่มต้นใช้งาน
เพิ่ม tableaw-core ให้กับโปรเจ็กต์ของคุณ คุณสามารถดูหมายเลขเวอร์ชันสำหรับรุ่นล่าสุดได้ในบันทึกประจำรุ่น:
< dependency >
< groupId >tech.tablesaw</ groupId >
< artifactId >tablesaw-core</ artifactId >
< version >VERSION_NUMBER_GOES_HERE</ version >
</ dependency >
คุณสามารถเพิ่มโครงการสนับสนุนได้:
-
tablesaw-beakerx
- สำหรับการใช้ Tablesaw ภายใน BeakerX -
tablesaw-excel
- สำหรับการใช้สมุดงาน Excel -
tablesaw-html
- สำหรับการใช้ HTML -
tablesaw-json
- สำหรับการใช้ JSON -
tablesaw-jsplot
- สำหรับสร้างแผนภูมิ
โครงการสนับสนุนภายนอก - ภายนอกองค์กรนี้ :
- tablesaw-parquet - สำหรับการใช้รูปแบบไฟล์ Apache Parquet กับ Tablesaw (ปัญหารายงาน)
เอกสารและการสนับสนุน
- เริ่มที่นี่: https://jtablesaw.github.io/tablesaw/gettingstarted
- จากนั้นดูหน้าเอกสารประกอบของเรา: https://jtablesaw.github.io/tablesaw/ และคู่มือผู้ใช้ Tablesaw
- ถามคำถาม ให้คำแนะนำ หรือบอกเราว่าคุณใช้ Tablesaw อย่างไรในฟอรัมสนทนา GitHub ใหม่
- คำขอคุณสมบัติและรายงานข้อผิดพลาดสามารถทำได้บนแท็บปัญหา
บูรณาการ
โน๊ตบุ๊ค Jupyter
- เราขอแนะนำให้ลองใช้ Tablesaw ในสมุดบันทึก Jupyter ซึ่งช่วยให้คุณทดลองกับ Tablesaw ในลักษณะที่มีการโต้ตอบมากขึ้น เริ่มต้นด้วยการติดตั้ง BeakerX และลองใช้โน้ตบุ๊ก Tablesaw ตัวอย่าง
- วิธีที่สองในการใช้ Tablesaw ภายในโน้ตบุ๊ก Jupyter คือการใช้ IJava ซึ่งมีการรองรับ Tablesaw ในตัว Gary Sharpe ได้เขียนบทช่วยสอนที่ยอดเยี่ยมซึ่งจะแสดงวิธีใช้ Tablesaw plots Gary ได้เขียนบทช่วยสอนอื่น ๆ มากมายที่มี Tablesaw:
- จัดระเบียบข้อมูลด้วย Java และ Jupyter
- ดาต้าเฟรมพร้อม Tablesaw — JSON
- Dataframes พร้อม Tablesaw — ไฟล์ CSV
- แนวทางที่สามคือการใช้ Google Colab Gary Sharpe มีบทช่วยสอนที่ยอดเยี่ยมอีกครั้ง: การเริ่มต้นใช้งาน Dataframes โดยใช้ Java และ Google Colab
การบูรณาการอื่น ๆ
- การใช้ Eclipse อาจพบว่า etablesaw มีประโยชน์ มีการบูรณาการ Eclipse โดยมีเป้าหมายเพื่อเปลี่ยน Eclipse ให้เป็นเวิร์กเบนช์ข้อมูล
- คุณสามารถใช้ Tablesaw กับไลบรารีการเรียนรู้ของเครื่องจำนวนมากได้ หากต้องการดูตัวอย่างการใช้ Tablesaw with Smile โปรดดูตัวอย่างสมุดบันทึก Tablesaw Jupyter
- คุณสามารถใช้ quandl4j-tablesaw ได้ หากคุณต้องการโหลดข้อมูลทางการเงินและเศรษฐกิจจาก Quandl ลงใน Tablesaw สิ่งนี้แสดงให้เห็นในสมุดบันทึก Tablesaw ตัวอย่างเช่นกัน