الهدف من هذا المشروع هو إنشاء بديل لأداة USEARCH التي طورها Robert C. Edgar (2010). ينبغي للأداة الجديدة:
لقد قمنا بتنفيذ أداة تسمى VSEARCH والتي تدعم اكتشاف الوهم القائم على أساس جديد ومرجعي، والتجميع، وإلغاء النسخ الكامل والبادئة، وإعادة النسخ، والتكامل العكسي، والإخفاء، والمحاذاة العالمية الزوجية الكل مقابل الكل، والبحث عن المحاذاة الدقيقة والعالمية، والخلط، أخذ العينات الفرعية والفرز. كما أنه يدعم تحليل ملفات FASTQ وتصفيتها وتحويلها ودمج القراءات المزدوجة.
يرمز VSEARCH إلى البحث المتجه، حيث تستفيد الأداة من التوازي في شكل توجيه SIMD بالإضافة إلى مؤشرات الترابط المتعددة لإجراء محاذاة دقيقة بسرعة عالية. يستخدم VSEARCH مصففًا عالميًا مثاليًا (برمجة ديناميكية كاملة Needleman-Wunsch)، على عكس USEARCH الذي يستخدم بشكل افتراضي بذرة إرشادية ومصفف ممتد. يؤدي هذا عادةً إلى محاذاة أكثر دقة وحساسية محسنة بشكل عام (استدعاء) باستخدام VSEARCH، خاصة بالنسبة للمحاذاة التي تحتوي على فجوات.
يتم توفير ثنائيات VSEARCH لنظام GNU/Linux على خمس بنيات معالج 64 بت: x86_64، POWER8 (ppc64le)، ARMv8 (aarch64)، RISC-V ذو النهاية الصغيرة 64 بت (riscv64)، والنهاية الصغيرة MIPS 64 بت ( mips64el). يتم توفير الثنائيات أيضًا لنظام التشغيل macOS (الإصدار 10.9 Mavericks أو أحدث) على Intel (x86_64) وApple Silicon (ARMv8)، بالإضافة إلى Windows (64 بت، الإصدار 7 أو أعلى، على x86_64). يحتوي VSEARCH على كود SIMD الأصلي لثلاث بنيات للمعالج (SSE2/SSSE3، AltiVec/VMX/VSX، Neon). بالإضافة إلى ذلك، يستخدم VSEARCH مكتبة SIMD Everywhere (SIMDe) لتمكين البناء على riscv64 وmips64el وغيرها من البنى ذات النهاية الصغيرة، ولكن قد يكون الأداء أقل من التنفيذ الأصلي.
وحدة المعالجة المركزية نظام التشغيل | جنو/لينكس | ماك | ويندوز |
---|---|---|---|
x86_64 | ✔ | ✔ | ✔ |
أرمv8 | ✔ | ✔ | |
الطاقة8 | ✔ | ||
RISC-V 64 جنيه | ✔ | ||
ام اي بي اس 64 جنيه | لم يتم اختباره |
تتوفر أيضًا حزم ومكونات إضافية وأغلفة مختلفة لـ VSEARCH من مصادر أخرى - انظر أدناه.
يتم تجميع الكود المصدري بشكل صحيح باستخدام gcc
(الإصدارات من 4.8.5 إلى 14.0) و llvm-clang
(من 3.8 إلى 19.0). يجب أيضًا تجميع الكود المصدري على أنظمة FreeBSD وNetBSD.
يمكن لـ VSEARCH قراءة استعلام الإدخال وملفات قاعدة البيانات المضغوطة مباشرةً باستخدام gzip (.gz) وbzip2 (.bz2) في حالة توفر مكتبات zlib وbzip2.
يتم دعم معظم الأوامر والخيارات المستندة إلى النوكليوتيدات في الإصدار 7 من USEARCH، بالإضافة إلى بعضها في الإصدار 8. وقد تم استخدام نفس أسماء الخيارات كما في الإصدار 7 من USEARCH لجعل VSEARCH بديلاً سهل الاستخدام تقريبًا. لا يدعم VSEARCH تسلسلات الأحماض الأمينية أو التحالفات المحلية. يمكن إضافة هذه الميزات في المستقبل.
إذا لم تتمكن من العثور على إجابة في وثائق VSEARCH، يرجى زيارة منتدى VSEARCH الإلكتروني لنشر سؤال أو بدء مناقشة.
في المثال أدناه، سوف تقوم VSEARCH بتعريف التسلسلات في ملف قاعدة البيانات.fsa التي تكون متطابقة بنسبة 90% على الأقل في علامة الزائد مع تسلسلات الاستعلام في الملف query.fsa وكتابة النتائج إلى الملف alnout.txt.
./vsearch --usearch_global queries.fsa --db database.fsa --id 0.9 --alnout alnout.txt
توزيع المصدر لتنزيل التوزيع المصدر من إصدار وإنشاء الملف القابل للتنفيذ والوثائق، استخدم الأوامر التالية:
wget https://github.com/torognes/vsearch/archive/v2.29.1.tar.gz
tar xzf v2.29.1.tar.gz
cd vsearch-2.29.1
./autogen.sh
./configure CFLAGS="-O3" CXXFLAGS="-O3"
make ARFLAGS="cr"
sudo make install
يمكنك تخصيص دليل التثبيت باستخدام خيار --prefix=DIR
configure
. إذا تم تثبيت مكتبات الضغط zlib و/أو bzip2 على النظام، فسيتم اكتشافها تلقائيًا وسيتم تضمين دعم الملفات المضغوطة في vsearch (راجع قسم التبعيات أدناه). قد يتم تعطيل دعم الملفات المضغوطة باستخدام خيارات --disable-zlib
و --disable-bzip2
configure
. سيتم إنشاء نسخة PDF من الدليل من ملف الدليل vsearch.1
إذا كان ps2pdf
متاحًا، ما لم يتم تعطيله باستخدام خيار --disable-pdfman
configure
. يوصى بتشغيل التكوين باستخدام الخيارين CFLAGS="-O3"
و CXXFLAGS="-O3"
. يمكن أيضًا تطبيق خيارات أخرى على configure
، يرجى تشغيل configure -h
لرؤيتها جميعًا. مطلوب GNU autoconf (الإصدار 2.63 أو أحدث)، وautomake، والمترجم الخليجي C++ ( g++
) لإنشاء vsearch. قد يكون الإصدار 3.82 أو make
أحدث مطلوبًا على نظام التشغيل Linux، بينما يكون الإصدار 3.81 كافيًا على نظام التشغيل macOS.
لإنشاء VSEARCH على Debian وتوزيعات Linux المماثلة (Ubuntu وما إلى ذلك) ستحتاج إلى الحزم التالية: autoconf، automake، g++، Ghostscript، groff، libbz2-dev، make، zlib1g-dev. قم بتضمين libsimde-dev للبناء على riscv64 أو mips64el.
لإنشاء VSEARCH على Fedora وتوزيعات Linux المماثلة (RHEL وCentos وما إلى ذلك) ستحتاج إلى الحزم التالية: autoconf، automake، bzip2-devel، gcc-c++، Ghostscript، Groff-base، make، zlib-devel.
بدلاً من تنزيل التوزيعة المصدرية كأرشيف مضغوط، يمكنك استنساخ الريبو وإنشائه كما هو موضح أدناه. لا تزال خيارات configure
كما هو موضح أعلاه صالحة.
git clone https://github.com/torognes/vsearch.git
cd vsearch
./autogen.sh
./configure CFLAGS="-O3" CXXFLAGS="-O3"
make ARFLAGS="cr"
sudo make install
التوزيع الثنائي : بدءًا من الإصدار 1.4.0، سيتم توفير ملفات التوزيع الثنائية التي تحتوي على ثنائيات مجمعة مسبقًا بالإضافة إلى الوثائق كجزء من كل إصدار. تتضمن الملفات التنفيذية المضمنة دعمًا لملفات الإدخال المضغوطة بواسطة zlib وbzip2 (مع الملفات التي تنتهي عادةً بـ .gz
أو .bz2
).
يتم توفير التوزيعات الثنائية لأنظمة x86-64 التي تعمل بنظام GNU/Linux، أو macOS (الإصدار 10.7 أو أعلى) أو Windows (64 بت، الإصدار 7 أو أعلى)، وأنظمة AMDv8 (aarch64) 64 بت التي تعمل بنظام GNU/Linux أو macOS، كما بالإضافة إلى POWER8 (ppc64le)، وRISC-V ذو النهاية الصغيرة 64 بت (risv64)، والإصدار 64 بت الصغير أنظمة MIPS (mips64el) endian التي تعمل بنظام GNU/Linux. يتم أيضًا توفير ثنائي عالمي لنظام التشغيل MacOS. بالإضافة إلى ذلك، تم توفير ملف ثنائي x86_64 مصمم لتوزيعات RHEL 7 وCentOS 7 linux المتوقفة. تم إنشاء ثنائيات Linux الأخرى على Debian 11 (oldstable، Bullseye). تتوفر الثنائيات الثابتة لجميع بنيات Linux باستثناء x86_64، ويمكن استخدامها على الأنظمة التي لم يتم تثبيت جميع المكتبات الضرورية عليها. تم إنشاء نظام Windows الثنائي باستخدام التحويل البرمجي المتقاطع باستخدام Mingw-w64.
قم بتنزيل الملف القابل للتنفيذ المناسب لنظامك باستخدام الأوامر التالية إذا كنت تستخدم نظام Linux أو macOS:
wget https://github.com/torognes/vsearch/releases/download/v{VERSION}/vsearch-{VERSION}-{OS}-{ARCH}.tar.gz
tar xzf vsearch-{VERSION}-{OS}-{ARCH}.tar.gz
استبدل {VERSION}
برقم إصدار VSEARCH (على سبيل المثال 2.29.1
)، و {OS}
بنظام التشغيل المستهدف ( linux
أو macos
)، و {ARCH}
بالبنية ( x86_64
، aarch64
، أو ppc64le
، أو riscv64
، أو mips64el
). يمكنك إضافة -static
بعد {ARCH}
للحصول على نسخة مجمعة بشكل ثابت لنظام التشغيل Linux (باستثناء x86_64). ينتهي اسم الملف الثنائي لتوزيعات RHEL 7 وCentOS 7 Linux بـ -ubi7
.
أو، إذا كنت تستخدم نظام التشغيل Windows، فقم بتنزيل واستخراج (فك ضغط) محتويات هذا الملف:
https://github.com/torognes/vsearch/releases/download/v{VERSION}/vsearch-{VERSION}-win-x86_64.zip
Linux وMac : سيكون لديك الآن التوزيع الثنائي في مجلد يسمى vsearch-{VERSION}-{OS}-{ARCH}
حيث ستجد ثلاثة مجلدات فرعية bin
و man
و doc
. نوصي بإنشاء نسخة أو رابط رمزي إلى bin/vsearch
في مجلد مضمن في $PATH
، ونسخة أو رابط رمزي إلى صفحة دليل vsearch man/vsearch.1
في مجلد مضمن في $MANPATH
الخاص بك . نسخة PDF من الدليل متاحة في doc/vsearch_manual.pdf
.
Windows : سيكون لديك الآن التوزيع الثنائي في مجلد يسمى vsearch-{VERSION}-win-x86_64
. يُطلق على الملف القابل للتنفيذ vsearch اسم vsearch.exe
. يُسمى الدليل بتنسيق PDF vsearch_manual.pdf
. إذا كنت تريد أن تكون قادرًا على استدعاء vsearch.exe
من أي نافذة موجه أوامر، فيمكنك وضع ملف VSEARCH القابل للتنفيذ في مجلد (على سبيل المثال C:Users<yourname>bin
)، وإضافة المجلد الجديد إلى Path
المستخدم : افتح نافذة Environment Variables
من خلال البحث عنها في القائمة "ابدأ"، Edit
متغيرات المستخدم، وأضف ;C:Users<yourname>bin
إلى نهاية متغير Path
، واحفظ التغييرات. يتضمن توزيع Windows أيضًا ملفات libbz2.dll
و zlib1.dll
المطلوبة لقراءة ملفات الإدخال المضغوطة. تم الحصول على ملفات DLL هذه لـ mingw-w64 من النظام الأساسي MSYS2.
التوثيق: دليل مستخدم VSEARCH متوفر في مجلد man
على شكل صفحة دليل. سيتم إنشاء نسخة pdf (vsearch_manual.pdf) بواسطة make
. لتثبيت الصفحة يدويًا، انسخ الملف vsearch.1
أو أنشئ رابطًا رمزيًا إلى vsearch.1
في مجلد مضمن في $MANPATH
. الدليل في كلا التنسيقين متاح أيضًا مع التوزيع الثنائي. الدليل في شكل PDF (vsearch_manual.pdf) مرفق أيضًا بالإصدار الأخير.
حزمة Conda بفضل فريق BioConda، توجد الآن حزمة vsearch في Conda.
حزمة دبيان بفضل فريق Debian Med، توجد الآن حزمة vsearch في دبيان.
حزمة منافذ FreeBSD بفضل Jason Bacon، تتوفر حزمة منافذ vsearch FreeBSD. قم بتثبيت الحزمة الثنائية باستخدام pkg install vsearch
أو أنشئ من المصدر مع تحسينات إضافية.
غلاف Galaxy بفضل عمل أعضاء لجنة المرافق بين المجرات، أصبح VSEARCH الآن جزءًا من Galaxy ToolShed.
حزمة Homebrew بفضل Torsten Seeman، تم إنشاء حزمة vsearch لـ Homebrew.
حزمة Pkgsrc بفضل Jason Bacon، تتوفر حزمة vsearch pkgsrc لـ NetBSD والأنظمة الأخرى المشابهة لـ UNIX. قم بتثبيت الحزمة الثنائية باستخدام pkgin install vsearch
أو أنشئ من المصدر مع تحسينات إضافية.
المكون الإضافي QIIME 2 بفضل فريق QIIME 2، يوجد الآن مكون إضافي يسمى q2-vsearch لـ QIIME 2.
باستخدام الأمر from-uc
في biom 2.1.5 أو الأحدث، من الممكن تحويل البيانات الموجودة في ملف .uc
الذي تم إنتاجه بواسطة vsearch إلى ملف biom الذي يمكن قراءته بواسطة QIIME والبرامج الأخرى. تم وصفه هنا.
يرجى ملاحظة أن VSEARCH الإصدار 2.2.0 والإصدارات الأحدث قادرة على إخراج جداول OTU مباشرة بتنسيق biom 1.0 بالإضافة إلى التنسيقات الكلاسيكية وmothur.
يرجى الاطلاع على الورقة للحصول على التفاصيل:
Rognes T، Flouri T، Nichols B، Quince C، Mahé F. (2016) VSEARCH: أداة مفتوحة المصدر متعددة الاستخدامات لعلم الميتاجينوميات. نظير J 4:e2584 دوى: 10.7717/peerj.2584
يتطلب تجميع VSEARCH إما دول مجلس التعاون الخليجي ( g++
) أو clang
و make
والأدوات التلقائية ( ui-auto
في التوزيعات المستندة إلى Debian). بشكل اختياري، تكون ملفات الرأس للمكتبتين الاختياريتين التاليتين مطلوبة إذا كان هناك حاجة إلى دعم ملفات الإدخال المضغوطة FASTA وFASTQ بتنسيق gzip وbzip2:
zlib.h
، متوفر كـ zlib1g-dev
على التوزيعات المستندة إلى Debian) (اختياري)bzlib.h
، متوفر كـ libbz2-dev
على التوزيعات المستندة إلى Debian) (اختياري)سوف يقوم VSEARCH بالتحقق تلقائيًا من توفر هذه المكتبات وتحميلها ديناميكيًا.
في نظام التشغيل Windows، تسمى هذه المكتبات zlib1.dll
و libbz2.dll
. يتم تضمين ملفات DLL هذه في التوزيعة التي تم إصدارها لـ vsearch 2.29.1 والإصدارات الأحدث.
لإنشاء ملف PDF باستخدام الدليل، يلزم استخدام أداة ps2pdf. إنه جزء من حزمة ghostscript
.
كود VSEARCH مرخص بشكل مزدوج إما بموجب ترخيص GNU General Public License الإصدار 3 أو بموجب ترخيص BSD 2-clause. الرجاء مراجعة LICENSE.txt للحصول على التفاصيل.
يتضمن VSEARCH رمزًا من عدة مشاريع أخرى. ونحن نشكر المؤلفين على إتاحة كود المصدر الخاص بهم.
يتضمن VSEARCH رمزًا برمجيًا من مشروع CityHash من Google بواسطة Geoff Pike وJyrki Alakuijala، مما يوفر بعض وظائف التجزئة الممتازة المتاحة بموجب ترخيص MIT.
يتضمن VSEARCH رمزًا مشتقًا من برنامج Tatusov وLipman’s DUST الموجود ضمن النطاق العام.
يتضمن VSEARCH رمز المجال العام الذي كتبه Alexander Peslyak لخوارزمية ملخص الرسائل MD5.
يتضمن VSEARCH رمز المجال العام الذي كتبه ستيف ريد وآخرون لخوارزمية ملخص الرسائل SHA1.
يتضمن توزيع VSEARCH رمزًا من GNU Autoconf والذي يتوفر عادةً بموجب ترخيص GNU العام، ولكن يمكن توزيعه مع استثناء البرنامج النصي الخاص لتكوين autoconf.
قد يتضمن VSEARCH رمزًا من حقوق الطبع والنشر لمكتبة zlib لـ Jean-loup Gailly وMark Adler، والموزعة بموجب ترخيص zlib.
قد يتضمن VSEARCH تعليمات برمجية من حقوق الطبع والنشر لمكتبة bzip2 Julian R. Seward، والتي يتم توزيعها بموجب ترخيص من نمط BSD.
الكود مكتوب في الغالب بلغة C++.
ملف | وصف |
---|---|
align_simd.cc | محاذاة عالمية متوازية لـ SIMD لاستعلام واحد مع 8 تسلسلات لقاعدة البيانات |
allpairs.cc | محاذاة زوجية عالمية مثالية للجميع مقابل الكل (بدون استدلالات) |
Arch.cc | كود خاص بالهندسة المعمارية (Mac/Linux) |
attributes.cc | استخراج وطباعة السمات في رؤوس FASTA |
bitmap.cc | تنفيذ الصور النقطية |
chimera.cc | كشف الكيميرا |
city.cc | كود سيتي هاش |
الكتلة.cc | التجميع (cluster_fast وcluster_smallmem) |
وحدة المعالجة المركزية.cc | يعتمد الكود على ميزات معينة لوحدة المعالجة المركزية (مثل ssse3) |
قطع.cc | تقييد قطع الموقع |
db.cc | يعالج قراءة ملف قاعدة البيانات والوصول إليها وما إلى ذلك |
dbhash.cc | تجزئة قاعدة البيانات لعمليات البحث الدقيقة |
dbindex.cc | يقوم بفهرسة قاعدة البيانات عن طريق تحديد الكيلومترات الفريدة في التسلسلات |
derep.cc | التقصير، كامل الطول |
derep_prefix.cc | إلغاء التكرار، البادئة |
derep_smallmem.cc | التقصير، واستخدام الذاكرة الصغيرة |
dynlibs.cc | التحميل الديناميكي لمكتبات الضغط |
eesats.cc | إنتاج إحصائيات لأمر fastq_eesstats |
fasta.cc | محلل ملف فاستا |
fasta2fastq.cc | تحويل FASTA إلى FASTQ |
fastq.cc | محلل ملف FASTQ |
fastq_chars.cc | إحصائيات فاستك |
fastq_join.cc | يقرأ نهاية FASTQ المقترنة الانضمام |
fastqops.cc | إحصائيات ملف FASTQ وما إلى ذلك |
fastx.cc | الكشف عن ملفات FASTA وFASTQ، والمجمع لموزعي FASTA وFASTQ |
filter.cc | تشذيب وتصفية التسلسلات في ملفات FASTA وFASTQ |
getseq.cc | استخراج التسلسلات بناءً على تسميات الرأس |
kmerhash.cc | تجزئة الكيلومترات المستخدمة من خلال دمج القراءة المزدوج |
linmemalign.cc | محاذاة التسلسل العالمي للذاكرة الخطية |
Maps.cc | مصفوفات تعيين الأحرف المختلفة |
قناع.cc | اخفاء (الغبار) |
MD5.c | ملخص رسالة MD5 |
mergepairs.cc | دمج القراءة في نهاية مقترنة |
minheap.cc | تطبيق minheap لقائمة أفضل مباريات kmer |
msa.cc | محاذاة تسلسل متعددة بسيطة وحساب تسلسل الإجماع للمجموعات |
orient.cc | اتجاه التوجيه للتسلسلات بناءً على قاعدة البيانات المرجعية |
otutable.cc | إنشاء جداول OTU بتنسيقات مختلفة |
rereplicate.cc | إعادة النسخ |
results.cc | نتائج الإخراج بتنسيقات مختلفة (alnout، userout،blast6، uc) |
search.cc | ينفذ البحث باستخدام المحاذاة العالمية |
search_exact.cc | وظائف البحث الدقيق |
searchcore.cc | وظائف البحث الأساسية للبحث والتجميع والكشف عن الوهم |
sff_convert.cc | SFF لتحويل ملف FASTQ |
sha1.c | ملخص رسالة SHA1 |
showalign.cc | قم بإخراج المحاذاة بطريقة يمكن قراءتها بواسطة الإنسان باستخدام سلسلة CIGAR والتسلسلات |
shuffle.cc | تسلسل خلط ورق اللعب |
sintax.cc | التصنيف التصنيفي باستخدام طريقة Sintax |
Sortbylength.cc | كود الفرز حسب الطول |
Sortbysize.cc | رمز الفرز حسب الحجم (الوفرة) |
عينة فرعية.cc | يقرأ المعاينة من ملف FASTA |
Tax.cc | تحليل معلومات التصنيف |
udb.cc | معالجة ملف قاعدة بيانات UDB |
Unique.cc | ابحث عن كيلومترات فريدة في تسلسل |
userfields.cc | رمز لتحليل وسيطة خيار حقول المستخدم |
util.cc | وظائف المرافق المشتركة المختلفة |
vsearch.cc | ملف البرنامج الرئيسي، التهيئة العامة، يقرأ الوسائط ويوزع الخيارات، ويكتب المعلومات. |
يوتيلز/maps.cc | المرافق، وخرائط لترميز النيوكليوتيدات |
يوتيلز/seqcmp.cc | المرافق، مقارنة التسلسل |
قد يتم تجميع VSEARCH باستخدام تكامل zlib أو bzip2 الذي يسمح له بقراءة ملفات FASTA المضغوطة. هناك حاجة إلى مكتبات zlib وbzip2 لهذا الغرض.
جميع تقارير الأخطاء هي محل تقدير كبير. يمكنك إرسال تقرير خطأ هنا على GitHub كمشكلة (مفضل)، ويمكنك نشر رسالة على منتدى الويب VSEARCH أو يمكنك إرسال بريد إلكتروني إلى [email protected].
تم تصميم VSEARCH للتسلسلات القصيرة نوعًا ما، وسيكون بطيئًا عندما تكون التسلسلات أطول من حوالي 5000 نقطة أساس. وذلك لأنه يقوم دائمًا بإجراء المحاذاة العالمية المثالية على التسلسلات المحددة.
المساهمون الرئيسيون في VSEARCH:
شكر خاص للأشخاص التاليين على التصحيحات والاقتراحات والوصول إلى الكمبيوتر وما إلى ذلك:
يرجى ذكر المنشور التالي إذا كنت تستخدم VSEARCH:
Rognes T، Flouri T، Nichols B، Quince C، Mahé F. (2016) VSEARCH: أداة مفتوحة المصدر متعددة الاستخدامات لعلم الميتاجينوميات. نظير ج 4: e2584. دوى: 10.7717/peerj.2584
يرجى ملاحظة أن الاستشهاد بأي من الخوارزميات الأساسية، على سبيل المثال UCHIME، قد يكون مناسبًا أيضًا.
تم الحصول على مجموعات بيانات الاختبار (الموجودة في مستودع بيانات vsearch المنفصل) من مشروع BioMarks (Logares et al. 2014)، ومشروع TARA OCEANS (Karsenti et al. 2011) وقاعدة البيانات المرجعية للريبوسومات الأولية (PR 2 ) (Guillou et al. آل 2013).
Edgar RC (2010) البحث عن أوامر التجميع وتجميعها بشكل أسرع من BLAST. المعلوماتية الحيوية ، 26 (19): 2460-2461. دوى:10.1093/المعلوماتية الحيوية/btq461
Edgar RC (2016) SINTAX: مصنف تصنيف بسيط غير بايزي لتسلسلات 16S وITS. bioRxiv . دوى:10.1101/074161
Edgar RC (2016) UNOISE2: تحسين تصحيح الأخطاء لتسلسل Illumina 16S وITS amplicon. bioRxiv . دوى:10.1101/081257
Edgar RC، Flyvbjerg H (2015) تصفية الأخطاء وتجميع الأزواج وتصحيح الأخطاء لقراءات تسلسل الجيل التالي. المعلوماتية الحيوية ، 31 (21): 3476-3482. دوى:10.1093/المعلوماتية الحيوية/btv401
Edgar RC، Haas BJ، Clemente JC، Quince C، Knight R (2011) UCHIME يحسن حساسية وسرعة اكتشاف الوهم. المعلوماتية الحيوية ، 27 (16): 2194-2200. دوى:10.1093/المعلوماتية الحيوية/btr381
غيلو إل، بشار دي، أوديك إس، باس دي، بيرني سي، بيتنر إل، بوتي سي، بورغود جي، دي فارغاس سي، ديسيل جيه، ديل كامبو جيه، دولان جيه، دونثورن إم، إدفاردسين بي، هولزمان إم، كويسترا دبليو، Lara E، Lebescot N، Logares R، Mahé F، Massana R، Montresor M، Morard R، Not F، Pawlowski J، Probert I، Sauvadet AL، Siano R، Stoeck T، Vaulot D، Zimmermann P & Christen R (2013) قاعدة البيانات المرجعية للريبوسوم البروتيست (PR2): كتالوج لتسلسلات الرنا الريباسي الريباسي أحادية الخلية ذات الوحدة الفرعية الصغيرة مع تصنيف منظم. أبحاث الأحماض النووية ، 41 (د1)، د597-د604. دوى:10.1093/نار/gks1160
كارسنتي إي، غونزاليس أسيناس إس، بورك بي، بولر سي، دي فارغاس سي، رايس جي، سوليفان إم بي، أرندت د، بنزوني إف، كلافيري جي إم، فوليز إم، جايلون أو، غورسكي جي، هينجامب بي، يوديكون دي، كانديلس لويس S، Krzic U، Not F، Ogata H، Pesant S، Reynaud EG، Sardet C، Sieracki ME، Speich S، Velayoudon D، Weissenbach J، Wincker P & the Tara Oceans Consortium (2011) نهج شامل لبيولوجيا النظم البيئية البحرية. علم الأحياء بلوس ، 9(10)، e1001177. دوى:10.1371/journal.pbio.1001177
لوجاريس آر، أوديك إس، باس د، بيتنر إل، بوتي سي، كريستين آر، كلافيري جي إم، ديسيل جي، دولان جي آر، دونثورن إم، إدفاردسن بي، جوبيت إيه، كويسترا WHCF، ماهي إف، نوت إف، أوغاتا إتش، باولوفسكي جي ، بيرنيس إم سي، روماك إس، شالتشيان تبريزي ك، سيمون إن، ستويك تي، سانتيني إس، سيانو آر، Wincker P، Zingone A، Richards T، de Vargas C & Massana R (2014) نقش التجمعات المجتمعية النادرة والوفيرة في حقيقيات النوى الميكروبية البحرية الساحلية. علم الأحياء الحالي , 24(8)، 813-821. دوى:10.1016/j.cub.2014.02.050
Rognes T (2011) عمليات بحث أسرع في قاعدة بيانات Smith-Waterman من خلال توازي SIMD بين التسلسل. بي إم سي للمعلوماتية الحيوية ، 12: 221. دوى:10.1186 / 1471-2105-12-221