استشهد بنا : Haoyu Chao، Zhuojin Li، Dijun Chen، Ming Chen، iSeq: أداة متكاملة لجلب بيانات التسلسل العام، المعلوماتية الحيوية ، 2024؛، btae641، https://doi.org/10.1093/bioinformatics/btae641
iSeq هو برنامج نصي Bash يسمح لك بتنزيل بيانات التسلسل والبيانات التعريفية من قواعد بيانات GSA و SRA و ENA و DDBJ . انظر تفاصيل خط الأنابيب لـ iSeq. هنا هو خط الأنابيب الأساسي لـ iSeq:
مهم
لاستخدام iSeq، يجب أن يكون نظامك متصلاً بالشبكة وأن يدعم بروتوكولات FTP وHTTP وHTTPS .
-s
, --speed
لتعيين حد سرعة التنزيل (ميجابايت/ثانية) (الافتراضي: 1000 ميجابايت/ثانية). مثل iseq -i SRR7706354 -s 10
sra-tools=2.11
إلى sra-tools>=2.11.0
. خيار -e
جديد لدمج ملفات FASTQ : تمت إضافة خيار -e
لدمج عدة ملفات FASTQ في ملف واحد لكل Experiment (-e ex)
، أو Sample (-e sa)
، أو Study (-e st)
.
خيار -i
الجديد للإدخال : يمكن لـ iSeq
الآن قبول file
يحتوي على أرقام وصول متعددة كمدخل بواسطة -i fileName
.
تغيير واجهة برمجة التطبيقات لتنزيل البيانات التعريفية لـ GSA : تم تحديث نقطة نهاية واجهة برمجة التطبيقات من getRunInfo
إلى getRunInfoByCra
لتنزيل البيانات التعريفية لـ GSA.
حفظ النتيجة في الدليل الشخصي : سيتم الآن حفظ نتائج الإخراج في الدليل الشخصي للمستخدم عن طريق الخيار -o
.
تم تحديث التعبير العادي لمطابقة SAMC : تم تغيير نمط المطابقة لـ SAMC من SAMC[AZ]?[0-9]+
إلى SAMC[0-9]+
.
إصلاح بعض الخلل
conda install bioconda::iseq
# Use the following command to check whether dependent software is installed
iseq --version
iseq -i PRJNA211801
-a
لتنزيل ملفات FASTQ بتنسيق gzip مباشرة باستخدام -g
. iseq -i SRR_Acc_List.txt -a -g
$ iseq --help
Usage:
iseq -i accession [options]
Required option:
-i, --input [text|file] Single accession or a file containing multiple accessions.
Note: Only one accession per line in the file, all accessions must be from the same database.
Optional options:
-m, --metadata Skip the sequencing data downloads and only fetch the metadata for the accession.
-g, --gzip Download FASTQ files in gzip format directly (*.fastq.gz).
Note: if *.fastq.gz files are not available, SRA files will be downloaded and converted to *.fastq.gz files.
-q, --fastq Convert SRA files to FASTQ format.
-t, --threads int The number of threads to use for converting SRA to FASTQ files or compressing FASTQ files (default: 8).
-e, --merge [ex|sa|st] Merge multiple fastq files into one fastq file for each Experiment, Sample or Study.
-d, --database [ena|sra] Specify the database to download SRA sequencing data (default: ena).
Note: new SRA files may not be available in the ENA database, even if you specify "ena".
-p, --parallel int Download sequencing data in parallel, the number of connections needs to be specified, such as -p 10.
Note: breakpoint continuation cannot be shared between different numbers of connections.
-a, --aspera Use Aspera to download sequencing data, only support GSA/ENA database.
-s, --speed int Download speed limit (MB/s) (default: 1000 MB/s).
-o, --output text The output directory. If not exists, it will be created (default: current directory).
-h, --help Show the help information.
-v, --version Show the script version.
-i
, --input
أدخل المدخل الذي تريد تنزيله، ويمكنك أيضًا إدخال ملف يحتوي على عدة مدخلات (مدخل واحد فقط في كل سطر في الملف، ويجب أن تكون جميع المدخلات من نفس قاعدة البيانات).
iseq -i PRJNA211801
أولاً، سوف يقوم iSeq باسترداد البيانات الوصفية الخاصة بالتسجيل، ثم يتابع تنزيل كل عملية تشغيل موجودة بداخله.
يدعم حاليًا 6 تنسيقات دخول من قواعد البيانات الخمس التالية، مع بادئات الوصول المدعومة كما يلي:
قواعد البيانات | مشروع حيوي | يذاكر | عينة حيوية | عينة | تجربة | يجري |
---|---|---|---|---|---|---|
GSA | بي آر جي سي | CRA | سامك | CRX | CRR | |
SRA | برجنا | SRP | سامن | SRS | SRX | سر |
إينا | بريجيب | تخطيط موارد المؤسسات | نفس | إرس | إركس | خطأ |
DDBJ | PRJDB | درب | سامد | دائرة الاستعلام والأمن | DRX | الحد من مخاطر الكوارث |
جغرافي | GSE | جي إس إم |
بالإضافة إلى ذلك، بالنسبة لتنسيقي البيانات ( GSE/GSM
) من قاعدة بيانات GEO، فإنه سيتم استرداد PRJNA/SAMN
المرتبط مباشرةً، ثم المتابعة للحصول على عمليات التشغيل المضمنة وتنزيل بيانات التسلسل. ولذلك، فإنه لا يزال يقوم بتنزيل بيانات التسلسل من قاعدة بيانات SRA.
فيما يلي بعض الأمثلة:
نوع الانضمام | البادئات | مثال |
---|---|---|
مشروع حيوي | PRJEB، PRJNA، PRJDB، PRJC، GSE | PRJEB42779، PRJNA480016، PRJDB14838، PRJCA000613، GSE122139 |
يذاكر | تخطيط موارد المؤسسات، DRP، SRP، CRA | ERP126685، DRP009283، SRP158268، CRA000553 |
عينة حيوية | سامد، سام، سامن، سامك | SAMD00258402، SAMEA7997453، SAMN06479985، SAMC017083 |
عينة | إرس، دي آر إس، إس آر إس، جي إس إم | ERS5684710، DRS259711، SRS2024210، GSM7417667 |
تجربة | إركس، DRX، SRX، CRX | ERX5050800، DRX406443، SRX4563689، CRX020217 |
يجري | الخطأ، الحد من مخاطر الكوارث، SRR، CRR | ERR5260405، DRR421224، SRR7706354، CRR311377 |
باختصار، بغض النظر عن تنسيق بيانات انضمامك من بين الخيارات الستة، فإنه سيتم في النهاية تنزيل قيمة MD5 والتحقق منها لكل عملية تشغيل متضمنة. إذا كانت قيمة MD5 لا تتطابق مع تلك الموجودة في قاعدة البيانات العامة، فستحاول ثلاث جولات من إعادة التنزيل كحد أقصى. إذا نجح بعد ثلاث محاولات للتنزيل والتحقق، فسيتم تخزين اسم الملف في success.log
؛ وإلا، إذا فشل التنزيل، فسيتم تخزين اسم الملف في fail.log
.
-m
, --metadata
قم بتنزيل معلومات العينة الخاصة بالانضمام فقط وتخطي تنزيل بيانات التسلسل.
iseq -i PRJNA211801 -m
iseq -i CRR343031 -m
لذلك، بغض النظر عما إذا تم استخدام المعلمة -m
أم لا، سيتم الحصول على معلومات عينة الانضمام. إذا تعذر استرداد البيانات التعريفية، فسيتم إنهاء برنامج iSeq دون المتابعة إلى التنزيل اللاحق.
ملحوظة
ملاحظة 1 : إذا كان المدخل المسترد موجودًا في قواعد بيانات SRA/ENA/DDBJ/GEO ، فسوف يبحث iSeq أولاً في قاعدة بيانات ENA. إذا كان من الممكن استرداد معلومات العينة، فسيتم تنزيل البيانات الوصفية بتنسيق TSV
عبر ENA API، والتي تحتوي عادةً على 191 عمودًا. ومع ذلك، قد لا تتم مزامنة بعض البيانات التي تم إصدارها مؤخرًا في قاعدة بيانات SRA مع قاعدة بيانات ENA على الفور. لذلك، إذا تعذر الحصول على البيانات التعريفية من قاعدة بيانات ENA، فسيقوم iSeq بتنزيل البيانات التعريفية مباشرةً بتنسيق CSV
عبر الواجهة الخلفية لقاعدة بيانات SRA، والتي تحتوي عادةً على 30 عمودًا. للحفاظ على الاتساق مع تنسيق TSV، سيتم تحويله إلى تنسيق TSV باستخدام sed -i 's/,/t/g'
. ومع ذلك، إذا كان الحقل الواحد يحتوي على فاصلة، فقد يتسبب ذلك في اضطراب العمود. في النهاية، سوف تحصل على معلومات نموذجية باسم ${accession}.metadata.tsv
.
ملحوظة
ملاحظة 2 : إذا كان الإدخال المسترد موجودًا في قاعدة بيانات GSA ، فسيحصل iSeq على معلومات نموذجية عبر واجهة getRunInfo الخاصة بـ GSA، وتنزيل البيانات الوصفية بتنسيق CSV
، والتي تحتوي عادةً على 25 عمودًا. سيتم حفظ البيانات الوصفية التي تم الحصول عليها أعلاه باسم ${accession}.metadata.csv
. لتكملة معلومات البيانات التعريفية الأكثر تفصيلاً، سيحصل iSeq تلقائيًا على معلومات البيانات التعريفية للمشروع الذي ينتمي إليه الانضمام عبر واجهة ExportExcelFile الخاصة بـ GSA، وتنزيل البيانات التعريفية بتنسيق XLSX
، عادةً بثلاث أوراق: Sample
و Experiment
و Run
. سيتم حفظ معلومات البيانات التعريفية النهائية باسم ${accession}.metadata.xlsx
. باختصار، ستحصل في النهاية على نموذج معلومات باسم ${accession}.metadata.csv
و CRA*.metadata.xlsx
.
-g
, --gzip
قم بتنزيل ملفات FASTQ مباشرة بتنسيق gzip . إذا لم يكن التنزيل المباشر ممكنًا، فسيتم تنزيل ملفات SRA وتحويلها إلى تنسيق gzip باستخدام مؤشرات الترابط المتعددة للتحليل والضغط.
iseq -i SRR1178105 -g
نظرًا لأن غالبية تنسيقات البيانات المخزنة مباشرة في قاعدة بيانات GSA تكون بتنسيق gzip، إذا كان المدخل الذي يتم البحث عنه من قاعدة بيانات GSA، سواء تم استخدام المعلمة -g
أم لا، فيمكنك تنزيل ملفات FASTQ مباشرةً بتنسيق gzip.
إذا كان الانضمام من قواعد بيانات SRA/ENA/DDBJ/GEO ، فسيحاول iSeq أولاً الوصول إلى قاعدة بيانات ENA. إذا كان بإمكانه تنزيل ملفات FASTQ مباشرةً بتنسيق gzip، فسيقوم بذلك؛ وإلا، فسيتم تنزيل ملفات SRA وتحويلها إلى تنسيق FASTQ باستخدام أداة fasterq-dump
، ثم ضغط ملفات FASTQ باستخدام أداة pigz
، وفي النهاية الحصول على ملفات FASTQ بتنسيق gzip.
نصيحة
يمكن لـتوازي-fastq-dump أيضًا تحويل SRA إلى ملفات FASTQ مضغوطة بـ gzip، وعادةً ما يكون أسرع 2-3 مرات من fasterq-dump + pigz
. ومع ذلك، نظرًا لقيود الإدخال والإخراج ، iSeq
لا يدعم حاليًا parallel-fastq-dump
.
-q
, --fastq
بعد تنزيل ملفات SRA، سيتم تقسيمها إلى ملفات FASTQ متعددة غير مضغوطة .
iseq -i SRR1178105 -q
تكون هذه المعلمة فعالة فقط عندما يكون الانضمام من قواعد بيانات SRA/ENA/DDBJ/GEO وتكون الملفات التي تم تنزيلها عبارة عن ملفات SRA . بعد تنزيل ملفات SRA، سيستخدم iSeq أداة fasterq-dump
لتحويلها إلى ملفات FASTQ. بالإضافة إلى ذلك، يمكنك تحديد عدد سلاسل العمليات للتحويل باستخدام المعلمة -t
.
ملحوظة
Note1 : -q
مفيد بشكل خاص لتنزيل بيانات الخلية الواحدة ، خاصة بالنسبة لبيانات scATAC-Seq، حيث يمكنه تحليل الملفات بشكل فعال إلى أربعة أجزاء: I1
، R1
، R2
، R3
. ومع ذلك، إذا تم تنزيل ملفات FASTQ مباشرة عبر المعلمة -g
، فسيتم الحصول على ملفات R1
و R3
فقط (على سبيل المثال، SRR13450125)، مما قد يسبب مشكلات أثناء تحليل البيانات اللاحقة.
ملحوظة
ملاحظة 2 : عند استخدام -q
و -g
معًا، سيتم تنزيل ملف SRA أولاً، ثم تحويله إلى ملفات FASTQ
باستخدام أداة fasterq-dump
، وأخيرًا ضغطه إلى تنسيق gzip باستخدام pigz
. ولا يقوم بتنزيل ملفات FASTQ
مباشرةً بتنسيق gzip، وهو أمر مفيد جدًا للحصول على بيانات شاملة للخلية الواحدة.
-t
، --threads
يحدد عدد مؤشرات الترابط التي سيتم استخدامها لفك ضغط ملفات SRA إلى ملفات FASTQ أو ضغط ملفات FASTQ. القيمة الافتراضية هي 8
.
iseq -i SRR1178105 -q -t 10
وبالنظر إلى أن ملفات البيانات التسلسلية كبيرة بشكل عام، يمكنك تحديد عدد سلاسل العمليات للتحليل باستخدام المعلمة -t
. ومع ذلك، فإن المزيد من سلاسل العمليات لا يعني بالضرورة أداءً أفضل لأن سلاسل العمليات الزائدة يمكن أن تؤدي إلى أحمال عالية على وحدة المعالجة المركزية أو عمليات الإدخال والإخراج ، خاصة وأن fasterq-dump
يستهلك قدرًا كبيرًا من عمليات الإدخال والإخراج، مما قد يؤثر على تنفيذ المهام الأخرى. استنادًا إلى التقييم المعياري، نوصي بحد أقصى لعدد الخيوط يبلغ 15.
-e
, --merge
دمج ملفات FASTQ متعددة في ملف FASTQ واحد لكل تجربة ( ex
)، أو عينة ( sa
) أو دراسة ( st
).
iseq -i SRX003906 -g -e ex
على الرغم من أن التجربة تحتوي في معظم الحالات على عملية تشغيل واحدة فقط، إلا أن بعض بيانات التسلسل قد تحتوي على عمليات تشغيل متعددة داخل التجربة (على سبيل المثال، SRX003906، CRX020217). ومن ثم، يمكنك استخدام المعلمة -e
لدمج ملفات FASTQ متعددة من تجربة في ملف واحد. مع الأخذ في الاعتبار التسلسل المزدوج، حيث يلزم دمج ملفات fastq_1
و fastq_2
في وقت واحد ويجب أن تظل أسماء التسلسل في الأسطر المقابلة متسقة، سيقوم iSeq بدمج ملفات FASTQ متعددة بنفس الترتيب . في النهاية، بالنسبة لبيانات التسلسل أحادية النهاية ، سيتم إنشاء ملف واحد SRX*.fastq.gz
، وبالنسبة لبيانات التسلسل المزدوجة ، سيتم إنشاء ملفين SRX*_1.fastq.gz
و SRX*_2.fastq.gz
.
ملحوظة
ملاحظة 1 : إذا كان الانضمام عبارة عن معرف تشغيل ، فلا يمكن استخدام المعلمة -e
(انظر أدناه). حاليًا، يدعم iSeq دمج ملفات FASTQ المضغوطة وغير المضغوطة بصيغة gzip ، لكنه لا يدعم دمج الملفات مثل ملفات BAM وملفات tar.gz.
-e ex
: دمج جميع ملفات fastq من نفس التجربة في ملف fastq واحد. تنسيق الانضمام المقبول: ERX, DRX, SRX, CRX
.-e sa
: دمج كافة ملفات fastq من نفس العينة في ملف fastq واحد. تنسيق الانضمام المقبول: ERS, DRS, SRS, SAMC, GSM
.-e st
: دمج جميع ملفات fastq من نفس الدراسة في ملف fastq واحد. تنسيق الانضمام المقبول: ERP, DRP, SRP, CRA
. ملحوظة
ملاحظة 2 : عادةً، عندما تحتوي التجربة على عملية تشغيل واحدة فقط، يجب أن تحتوي عمليات التشغيل المتطابقة على نفس البادئة . على سبيل المثال، SRR52991314_1.fq.gz
و SRR52991314_2.fq.gz
لهما نفس البادئة SRR52991314
. في هذه الحالة، سيقوم iSeq بإعادة تسميتهم مباشرة إلى SRX*_1.fastq.gz
و SRX*_2.fastq.gz
. ومع ذلك، هناك استثناءات، كما هو الحال في CRX006713 حيث يحتوي تشغيل CRR007192
على ملفات ذات بادئات مختلفة. في مثل هذه الحالات، سيقوم iSeq بإعادة تسميتها كـ SRX*_original_filename
، على سبيل المثال، ستتم إعادة تسميتها كـ CRX006713_CRD015671.gz
و CRX006713_CRD015672.gz
.
-d
, --database
تحديد قاعدة البيانات لتنزيل ملفات SRA، ودعم قواعد بيانات ENA و SRA .
iseq -i SRR1178105 -d sra
افتراضيًا، سيكتشف iSeq قواعد البيانات المتاحة تلقائيًا، لذا فإن تحديد المعلمة -d
عادةً ما يكون غير ضروري . ومع ذلك، قد يتم تنزيل بعض ملفات SRA ببطء من قاعدة بيانات ENA. في مثل هذه الحالات، يمكنك فرض التنزيل من قاعدة بيانات SRA عن طريق تحديد -d sra
.
ملحوظة
ملاحظة : إذا لم يتم العثور على ملف SRA المقابل في قاعدة بيانات ENA ، حتى إذا تم تحديد المعلمة -d ena
، فسيظل iSeq يتحول تلقائيًا إلى التنزيل من قاعدة بيانات SRA .
-p
, --parallel
يتيح التنزيل متعدد الخيوط ويتطلب تحديد عدد المواضيع.
iseq -i PRJNA211801 -p 10
مع الأخذ في الاعتبار أن wget
قد يكون بطيئًا في بعض الحالات، يمكنك استخدام المعلمة -p
للسماح لـ iSeq باستخدام أداة axel
للتنزيل متعدد الخيوط.
ملحوظة
ملاحظة 1 : ميزة التنزيل القابل للاستئناف للتنزيل متعدد الخيوط تكون فعالة فقط داخل نفس الموضوع . أي أنه إذا تم استخدام المعلمة -p 10
للتنزيل الأول، فيجب أيضًا استخدامها للتنزيل الثاني لتمكين التنزيل القابل للاستئناف.
ملحوظة
ملاحظة 2 : كما ذكرنا سابقًا، سيحتفظ iSeq بـ 10 اتصالات طوال عملية التنزيل. لذلك، ستشاهد تكرارات متعددة لنفس Connection * finished
الظهور أثناء عملية التنزيل. وذلك لأنه يتم تحرير بعض الاتصالات فورًا بعد اكتمال التنزيل ومن ثم يتم إنشاء اتصالات جديدة للتنزيل.
-a
، --aspera
استخدم Aspera للتنزيل.
iseq -i PRJNA211801 -a -g
نظرًا لأن Aspera يوفر سرعات تنزيل أسرع، يمكنك استخدام المعلمة -a
لتوجيه iSeq لاستخدام أداة ascp
للتنزيل. لسوء الحظ، تنزيل Aspera مدعوم حاليًا فقط من خلال قواعد بيانات GSA وENA . لا يمكن لقاعدة بيانات NCBI SRA استخدام Aspera للتنزيل لأنها تستخدم في الغالب تقنيات Google Cloud وAWS Cloud وأسباب أخرى، راجع تجنب استخدام ascp.
ملحوظة
ملاحظة 1 : عند الوصول إلى قاعدة بيانات GSA ، إذا كانت روابط التنزيل من Huawei Cloud متاحة، فسيقوم iSeq بإعطاء الأولوية للتنزيل من خلال Huawei Cloud، حتى إذا تم استخدام المعلمة -a
. وذلك لأن Huawei Cloud توفر سرعات تنزيل أسرع وأكثر استقرارًا. لذلك، عند تنزيل بيانات GSA، يوصى باستخدام المعلمة -a
r. وبهذه الطريقة، إذا كان الوصول إلى Huawei Cloud غير متاح، فإن التنزيل عبر قناة Aspera لا يزال سريعًا نسبيًا. بخلاف ذلك، سيتعين عليك اللجوء إلى التنزيل عبر wget
أو axel
، وهي طرق أبطأ.
ملحوظة
ملاحظة 2 : نظرًا لأن Asper
a يتطلب ملف مفتاح، فسوف يبحث iSeq تلقائيًا عن ملف المفتاح في بيئة conda
أو دليل ~/.aspera
. إذا لم يتم العثور على ملف المفتاح، فلن يكون التنزيل ممكنًا.
-o
, --output
دليل الإخراج. إذا لم يكن موجودًا، فسيتم إنشاؤه (الافتراضي: الدليل الحالي).
-s
، --speed
الحد الأقصى لسرعة التنزيل (ميجابايت/ثانية) (الافتراضي: 1000 ميجابايت/ثانية) لـ Wget
و AXEL
و Aspera
.
الإخراج | وصف |
---|---|
ملفات SRA | يمكن تحويلها إلى ملفات FASTQ باستخدام الخيار -q |
بيانات التعريف.tsv | البيانات الوصفية للوصول إلى الاستعلام |
Success.log | احفظ اسم ملف SRA الذي تم تنزيله بنجاح |
Fail.log | فشل حفظ اسم ملف SRA الذي تم تنزيله |
الإخراج | وصف |
---|---|
ملفات GSA | معظمها بتنسيق *.gz، وبعضها بتنسيق bam/tar/bz2 |
بيانات التعريف.csv | البيانات الوصفية للوصول إلى الاستعلام |
بيانات التعريف.xlsx | البيانات التعريفية للمشروع بما في ذلك الوصول إلى الاستعلام بتنسيق xlsx |
Success.log | احفظ اسم ملف GSA الذي تم تنزيله بنجاح |
Fail.log | فشل حفظ اسم ملف GSA الذي تم تنزيله |
iSeq مستوحى من fastq-dl، fetchngs، pysradb، Kingfisher . قد تكون هذه الأدوات الممتازة مفيدة جدًا أيضًا. فيما يلي مقارنات متعددة للبرامج المختلفة:
اسم البرنامج | لغات البرنامج | قواعد البيانات المدعومة | الانضمامات المدعومة | التنسيقات المدعومة | الأساليب المدعومة | جلب البيانات الوصفية | فحص MD5 | تحميل قابل للاستئناف | تحميل موازي | دمج فاستق | تخطي التنزيل | كوندا قابلة للتثبيت | عنوان URL |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
iSeq | صدَفَة | GSA، SRA، ENA، DDBJ، GEO | الجميع | fq، fq.gz، sra، بام | wget، أكسل، aspera | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ؟ |
com.edgeturbo | ج | GSA | تم رفض كل شيء | fq، fq.gz، بام | تحميل edgeturbo | ✔ | ؟ | ||||||
مجموعة أدوات SRA | ج | سرا، إينا، دبج | تم رفض جميع توقع معرف التشغيل | fq، fq.gz، sra | الجلب المسبق | ✔ | ✔ | ✔ | ✔ | ؟ | |||
enaBrowserTools | بايثون | سرا، إينا، دبج | الكل باستثناء معرف GSA/GEO | fq، fq.gz، sra | urllib، aspera | ✔ | ✔ | ✔ | ✔ | ✔ | ؟ | ||
fastq-dl | بايثون | سرا، إينا، دبج | الكل باستثناء معرف GSA/GEO | fq، fq.gz، sra، sra.lite | wget | ✔ | ✔ | ✔ | ✔ | ✔ | ؟ | ||
com.fetchngs | بايثون | SRA، ENA، DDBJ، GEO | الكل باستثناء معرف GSA | fq، fq.gz | wget، aspera، الجلب المسبق | ✔ | ✔ | ✔ | ✔ | ؟ | |||
بيسرادب | بايثون | SRA، ENA، DDBJ، GEO | الكل باستثناء معرف GSA | fq، fq.gz، sra، بام | الطلبات يا أسبيرا | ✔ | ✔ | ✔ | ✔ | ✔ | ؟ | ||
الرفراف | بايثون | سرا، إينا، دبج | الكل باستثناء معرف GSA/GEO | fq، fq.gz، sra | حليقة، aria2c، أسبيرا | ✔ | ✔ | ✔ | ✔ | ✔ | ؟ | ||
ffq | بايثون | SRA، ENA، DDBJ، GEO | الكل باستثناء معرف GSA | fq، fq.gz، sra، بام | طلبات | ✔ | ✔ | ✔ | ؟ |
المساهمات في iSeq هي موضع ترحيب! إذا كان لديك أي اقتراحات أو تقارير أخطاء أو طلبات ميزات، فيرجى فتح مشكلة في مستودع GitHub الخاص بالمشروع. إذا كنت ترغب في المساهمة بالكود، يرجى تفرع المستودع وإجراء التغييرات وإرسال طلب سحب.
استشهد بنا : https://doi.org/10.1101/2024.05.16.594538
هذا المشروع مرخص بموجب ترخيص MIT.