พื้นที่เก็บข้อมูลที่มีข้อมูลและรหัสสำหรับจีโนไทป์ของกระทิง ( Cyamopsis tetragonoloba (L.) Taub.) และโครงการ GWAS คำอธิบายสั้น ๆ ของเนื้อหาที่เก็บ:
สคริปต์ make_consensus_vcf.py
ถูกใช้เพื่อสร้างชุดข้อมูลตัวแปรสุดท้ายโดยใช้การเรียกตัวแปร GATK-HC, NGSEP และ TASSEL 5 แบบดิบ สคริปต์ make_snp_stats.py
ใช้กับอินพุตเดียวกันเพื่อสำรวจสถิติคุณภาพของการเรียกตัวแปร
สมุดบันทึก callset_refinement_filtering.ipynb
ถูกใช้เพื่อรันการควบคุมคุณภาพตัวแปร และสร้างชุดข้อมูลที่กรองขั้นสุดท้ายของตัวแปรทั่วไป
สมุดบันทึก genetic_analysis.ipynb
ถูกใช้เพื่อทำการวิเคราะห์ทางพันธุกรรมส่วนใหญ่ รวมถึง PCA, การวิเคราะห์ความไม่สมดุลของการเชื่อมโยง และการวิเคราะห์การเชื่อมโยงตามแบบจำลองเชิงเส้นทั่วไป
สคริปต์ prepare_farmcpu.py
ถูกใช้เพื่อจัดรูปแบบข้อมูลอินพุตสำหรับเครื่องมือ FarmCPU (พล็อต QQ ของค่า p ที่เป็นผลลัพธ์จะแสดงอยู่ในกระดาษและด้านล่าง)
ไฟล์ admix_file_create.py
ถูกใช้เพื่อประมวลผลจีโนไทป์ล่วงหน้าสำหรับการวิเคราะห์ ADMIXTURE (ส่วนหนึ่งทำได้โดยใช้ Hail ใน genetic_analysis.ipynb
)
สคริปต์ guar_stat.R
ใช้เพื่อดำเนินการวิเคราะห์ทางสถิติของข้อมูลสุดท้าย ดำเนินการวิเคราะห์การเชื่อมโยงทั่วทั้งจีโนมโดยใช้เครื่องมือ FarmCPU และพล็อตตัวเลขหลัก
สคริปต์ parse_vcf_fcpu.py
ถูกใช้เพื่อจัดรูปแบบตารางจีโนไทป์ SNP สุดท้ายที่มีให้เป็นไฟล์ genotypes.xlsx
ในที่เก็บนี้