Repositori yang berisi data dan kode untuk genotipe guar ( Cyamopsis tetragonoloba (L.) Taub.) dan proyek GWAS. Penjelasan singkat tentang isi repositori:
Skrip make_consensus_vcf.py
digunakan untuk menghasilkan kumpulan data varian akhir menggunakan panggilan varian GATK-HC, NGSEP, dan TASSEL 5 mentah, skrip make_snp_stats.py
digunakan dengan masukan yang sama untuk mengeksplorasi statistik kualitas panggilan varian.
notebook callset_refinement_filtering.ipynb
digunakan untuk menjalankan kontrol kualitas varian dan membuat kumpulan data akhir yang difilter dari varian umum.
notebook genetic_analysis.ipynb
digunakan untuk melakukan sebagian besar analisis genetik, termasuk PCA, analisis disekuilibrium keterkaitan, dan analisis asosiasi berbasis model linier umum.
skrip prepare_farmcpu.py
digunakan untuk memformat data masukan untuk alat FarmCPU (plot QQ dari nilai p yang dihasilkan ditunjukkan pada makalah dan di bawah).
File admix_file_create.py
digunakan untuk memproses genotipe terlebih dahulu untuk analisis ADMIXTURE (sebagiannya dilakukan menggunakan Hail di genetic_analysis.ipynb
).
skrip guar_stat.R
digunakan untuk menjalankan analisis statistik dari data akhir, melakukan analisis asosiasi genom menggunakan alat FarmCPU, dan memplot gambar utama
skrip parse_vcf_fcpu.py
digunakan untuk memformat tabel genotipe SNP akhir yang tersedia sebagai file genotypes.xlsx
di repositori ini.