مستودع يحتوي على بيانات ورمز للغوار ( Cyamopsis tetragonoloba (L.) Taub.) والتنميط الجيني ومشروع GWAS. وصف مختصر لمحتويات المستودع:
تم استخدام البرنامج النصي make_consensus_vcf.py
لإنشاء مجموعة البيانات المتغيرة النهائية باستخدام مكالمات متغيرة GATK-HC وNGSEP وTASSEL 5 الخام، وتم استخدام البرنامج النصي make_snp_stats.py
مع نفس المدخلات لاستكشاف إحصائيات الجودة للمكالمات المتغيرة.
تم استخدام دفتر callset_refinement_filtering.ipynb
لتشغيل مراقبة الجودة المتغيرة وإنشاء مجموعة البيانات النهائية التي تمت تصفيتها للمتغيرات الشائعة.
تم استخدام دفتر genetic_analysis.ipynb
لإجراء معظم التحليلات الجينية، بما في ذلك PCA، وتحليل اختلال الارتباط، وتحليل الارتباط القائم على النموذج الخطي المعمم.
تم استخدام البرنامج النصي prepare_farmcpu.py
لتنسيق بيانات الإدخال لأداة FarmCPU (يتم عرض مخطط QQ للقيم p الناتجة في الورقة وأدناه).
تم استخدام ملف admix_file_create.py
للمعالجة المسبقة للأنماط الجينية لتحليل ADMIXTURE (تم إجراء جزء من هذا باستخدام Hail في ملف genetic_analysis.ipynb
).
تم استخدام البرنامج النصي guar_stat.R
لتشغيل التحليل الإحصائي للبيانات النهائية، وإجراء تحليل الارتباط على مستوى الجينوم باستخدام أداة FarmCPU، ورسم الشخصيات الرئيسية
تم استخدام البرنامج النصي parse_vcf_fcpu.py
لتنسيق جدول النمط الجيني SNP النهائي المتوفر كملف genotypes.xlsx
في هذا المستودع.