จุดมุ่งหมายของโครงการนี้คือการสร้างทางเลือกนอกเหนือจากเครื่องมือ USEARCH ที่พัฒนาโดย Robert C. Edgar (2010) เครื่องมือใหม่ควร:
เราได้ใช้เครื่องมือที่เรียกว่า VSEARCH ซึ่งสนับสนุนการตรวจจับไคเมรา แบบ de novo และการอ้างอิง การจัดกลุ่ม การจำลองแบบเต็มความยาวและคำนำหน้า การจำลองแบบ การเสริมแบบย้อนกลับ การมาสก์ การจัดตำแหน่งส่วนกลางแบบจับคู่ทั้งหมดเทียบกับทั้งหมด การค้นหาการจัดตำแหน่งแบบตรงและส่วนกลาง การสับเปลี่ยน การสุ่มตัวอย่างและการเรียงลำดับ นอกจากนี้ยังรองรับการวิเคราะห์ไฟล์ FASTQ การกรอง การแปลง และการรวมการอ่านแบบปลายคู่
VSEARCH ย่อมาจากการค้นหาแบบเวกเตอร์ เนื่องจากเครื่องมือใช้ประโยชน์จากความเท่าเทียมในรูปแบบของเวกเตอร์ SIMD รวมถึงเธรดหลายรายการเพื่อจัดตำแหน่งที่แม่นยำด้วยความเร็วสูง VSEARCH ใช้ตัวจัดตำแหน่งส่วนกลางที่เหมาะสมที่สุด (การเขียนโปรแกรมแบบไดนามิกเต็มรูปแบบ Needleman-Wunsch) ตรงกันข้ามกับ USEARCH ซึ่งโดยค่าเริ่มต้นจะใช้ข้อมูลเริ่มต้นและตัวจัดตำแหน่งแบบขยาย ซึ่งมักจะส่งผลให้เกิดการจัดตำแหน่งที่แม่นยำยิ่งขึ้น และความไว (การเรียกคืน) โดยรวมที่ดีขึ้น (การเรียกคืน) ด้วย VSEARCH โดยเฉพาะอย่างยิ่งสำหรับการจัดตำแหน่งที่มีช่องว่าง
ไบนารี VSEARCH มีไว้สำหรับ GNU/Linux บนสถาปัตยกรรมโปรเซสเซอร์ 64 บิตห้าตัว: x86_64, POWER8 (ppc64le), ARMv8 (aarch64), RISC-V 64 บิตแบบ little-endian (riscv64) และ MIPS 64 บิตแบบ little-endian ( mips64el) ไบนารียังมีให้สำหรับ macOS (เวอร์ชัน 10.9 Mavericks หรือใหม่กว่า) บน Intel (x86_64) และ Apple Silicon (ARMv8) รวมถึง Windows (64 บิต, เวอร์ชัน 7 หรือสูงกว่า, บน x86_64) VSEARCH มีโค้ด Native SIMD สำหรับสถาปัตยกรรมโปรเซสเซอร์สามตัว (SSE2/SSSE3, AltiVec/VMX/VSX, Neon) นอกจากนี้ VSEARCH ยังใช้ไลบรารี SIMD Everywhere (SIMDe) เพื่อเปิดใช้งานการสร้างบน riscv64, mips64el และสถาปัตยกรรม little-endian อื่นๆ แต่ประสิทธิภาพอาจต่ำกว่าการใช้งานแบบเนทิฟ
ซีพียูระบบปฏิบัติการ | กนู/ลินุกซ์ | ระบบปฏิบัติการ macOS | หน้าต่าง |
---|---|---|---|
x86_64 | |||
ARMv8 | |||
พาวเวอร์8 | |||
RISC-V 64 เลอ | |||
MIPS 64 LE | ไม่ได้ทดสอบ |
แพ็คเกจ ปลั๊กอิน และตัวห่อต่างๆ สำหรับ VSEARCH มีให้จากแหล่งอื่นด้วย - ดูด้านล่าง
ซอร์สโค้ดคอมไพล์อย่างถูกต้องด้วย gcc
(เวอร์ชัน 4.8.5 ถึง 14.0) และ llvm-clang
(3.8 ถึง 19.0) ซอร์สโค้ดควรคอมไพล์บนระบบ FreeBSD และ NetBSD
VSEARCH สามารถอ่านอินพุตคิวรีและไฟล์ฐานข้อมูลที่บีบอัดโดยใช้ gzip (.gz) และ bzip2 (.bz2) ได้โดยตรง หากมีไลบรารี zlib และ bzip2
คำสั่งและตัวเลือกที่ใช้นิวคลีโอไทด์ส่วนใหญ่ใน USEARCH เวอร์ชัน 7 ได้รับการรองรับ เช่นเดียวกับบางคำสั่งในเวอร์ชัน 8 ชื่อตัวเลือกเดียวกันกับใน USEARCH เวอร์ชัน 7 ได้ถูกนำมาใช้เพื่อทำให้ VSEARCH กลายเป็นสิ่งทดแทนที่เกือบจะดรอปอิน VSEARCH ไม่รองรับลำดับกรดอะมิโนหรือการจัดตำแหน่งเฉพาะที่ คุณสมบัติเหล่านี้อาจถูกเพิ่มเข้ามาในอนาคต
หากคุณไม่พบคำตอบในเอกสาร VSEARCH โปรดไปที่ฟอรัมเว็บ VSEARCH เพื่อโพสต์คำถามหรือเริ่มการสนทนา
ในตัวอย่างด้านล่าง VSEARCH จะระบุลำดับในไฟล์database.fsaที่เหมือนกันอย่างน้อย 90% บนเส้นบวกกับลำดับคิวรีในไฟล์ query.fsa และเขียนผลลัพธ์ลงในไฟล์alnout.txt
./vsearch --usearch_global queries.fsa --db database.fsa --id 0.9 --alnout alnout.txt
การกระจายแหล่งที่มา หากต้องการดาวน์โหลดการกระจายแหล่งที่มาจากรีลีสและสร้างไฟล์ปฏิบัติการและเอกสารประกอบ ให้ใช้คำสั่งต่อไปนี้:
wget https://github.com/torognes/vsearch/archive/v2.29.1.tar.gz
tar xzf v2.29.1.tar.gz
cd vsearch-2.29.1
./autogen.sh
./configure CFLAGS="-O3" CXXFLAGS="-O3"
make ARFLAGS="cr"
sudo make install
คุณสามารถปรับแต่งไดเร็กทอรีการติดตั้งได้โดยใช้ตัวเลือก --prefix=DIR
เพื่อ configure
หากมีการติดตั้งไลบรารีการบีบอัด zlib และ/หรือ bzip2 บนระบบ ไลบรารีเหล่านั้นจะถูกตรวจพบโดยอัตโนมัติและการสนับสนุนไฟล์บีบอัดจะรวมอยู่ใน vsearch (ดูหัวข้อ การขึ้น ต่อกันด้านล่าง) การสนับสนุนไฟล์บีบอัดอาจถูกปิดใช้งานโดยใช้ตัวเลือก --disable-zlib
และ --disable-bzip2
เพื่อ configure
คู่มือเวอร์ชัน PDF จะถูกสร้างขึ้นจากไฟล์คู่มือ vsearch.1
หากมี ps2pdf
ใช้งานได้ เว้นแต่จะปิดใช้งานโดยใช้ตัวเลือก --disable-pdfman
เพื่อ configure
ขอแนะนำให้รัน configuration ด้วยตัวเลือก CFLAGS="-O3"
และ CXXFLAGS="-O3"
อาจใช้ตัวเลือกอื่นเพื่อ configure
โปรดเรียกใช้ configure -h
เพื่อดูตัวเลือกทั้งหมด GNU autoconf (เวอร์ชัน 2.63 หรือใหม่กว่า) ต้องใช้ automake และคอมไพเลอร์ GCC C++ ( g++
) เพื่อสร้าง vsearch อาจต้องใช้ make
เวอร์ชัน 3.82 หรือใหม่กว่าบน Linux ในขณะที่เวอร์ชัน 3.81 ก็เพียงพอแล้วบน macOS
ในการสร้าง VSEARCH บน Debian และ Linux ที่คล้ายกัน (Ubuntu ฯลฯ) คุณจะต้องมีแพ็คเกจต่อไปนี้: autoconf, automake, g++, ghostscript, groff, libbz2-dev, make, zlib1g-dev รวม libsimde-dev เพื่อสร้างบน riscv64 หรือ mips64el
หากต้องการสร้าง VSEARCH บน Fedora และ Linux ที่คล้ายกัน (RHEL, Centos ฯลฯ) คุณจะต้องมีแพ็คเกจต่อไปนี้: autoconf, automake, bzip2-devel, gcc-c++, ghostscript, groff-base, make, zlib-devel
แทนที่จะดาวน์โหลดการแจกจ่ายแหล่งที่มาเป็นไฟล์เก็บถาวรที่บีบอัด คุณสามารถโคลน repo และสร้างได้ตามที่แสดงด้านล่าง ตัวเลือกในการ configure
ตามที่อธิบายไว้ข้างต้นยังคงใช้ได้
git clone https://github.com/torognes/vsearch.git
cd vsearch
./autogen.sh
./configure CFLAGS="-O3" CXXFLAGS="-O3"
make ARFLAGS="cr"
sudo make install
การกระจายแบบไบนารี : ตั้งแต่เวอร์ชัน 1.4.0 เป็นต้นไป ไฟล์การแจกจ่ายแบบไบนารีที่มีไบนารีที่คอมไพล์ไว้ล่วงหน้าตลอดจนเอกสารประกอบจะพร้อมใช้งานโดยเป็นส่วนหนึ่งของแต่ละรุ่น โปรแกรมปฏิบัติการที่รวมมานั้นรองรับไฟล์อินพุตที่บีบอัดโดย zlib และ bzip2 (โดยไฟล์มักจะลงท้ายด้วย .gz
หรือ .bz2
)
การแจกแจงไบนารีมีให้สำหรับระบบ x86-64 ที่ใช้ GNU/Linux, macOS (เวอร์ชัน 10.7 หรือสูงกว่า) หรือ Windows (64 บิต, เวอร์ชัน 7 หรือสูงกว่า), ระบบ AMDv8 64 บิต (aarch64) ที่ใช้ GNU/Linux หรือ macOS เช่นเดียวกับ POWER8 (ppc64le), RISC-V ปลายเล็ก 64 บิต (risv64) และ MIPS ปลายเล็ก 64 บิต (mips64el) ระบบที่ใช้ GNU/Linux ไบนารี macOS สากลก็มีให้เช่นกัน นอกจากนี้ ยังมีไบนารี x86_64 ที่สร้างขึ้นสำหรับการกระจายลินุกซ์ RHEL 7 และ CentOS 7 ที่เลิกผลิตแล้วอีกด้วย ไบนารี Linux อื่น ๆ สร้างขึ้นบน Debian 11 (oldstable, Bullseye) ไบนารีแบบคงที่พร้อมใช้งานสำหรับสถาปัตยกรรม Linux ทั้งหมด ยกเว้น x86_64 ซึ่งสามารถใช้ได้กับระบบที่ไม่ได้ติดตั้งไลบรารีที่จำเป็นทั้งหมด ไบนารีของ Windows ถูกสร้างขึ้นด้วยการรวบรวมข้ามโดยใช้ Mingw-w64
ดาวน์โหลดโปรแกรมปฏิบัติการที่เหมาะสมสำหรับระบบของคุณโดยใช้คำสั่งต่อไปนี้ หากคุณใช้ระบบ Linux หรือ macOS:
wget https://github.com/torognes/vsearch/releases/download/v{VERSION}/vsearch-{VERSION}-{OS}-{ARCH}.tar.gz
tar xzf vsearch-{VERSION}-{OS}-{ARCH}.tar.gz
แทนที่ {VERSION}
ด้วยหมายเลขเวอร์ชัน VSEARCH (เช่น 2.29.1
), {OS}
ด้วยระบบปฏิบัติการเป้าหมาย ( linux
หรือ macos
) และ {ARCH}
ด้วยสถาปัตยกรรม ( x86_64
, aarch64
, ppc64le
, riscv64
หรือ mips64el
) คุณสามารถเพิ่ม -static
หลัง {ARCH}
เพื่อรับเวอร์ชันที่คอมไพล์แบบคงที่สำหรับ Linux (ยกเว้น x86_64) ชื่อของไบนารีสำหรับการกระจาย RHEL 7 และ CentOS 7 Linux ลงท้ายด้วย -ubi7
หรือหากคุณใช้ Windows ให้ดาวน์โหลดและแยก (แตกไฟล์) เนื้อหาของไฟล์นี้:
https://github.com/torognes/vsearch/releases/download/v{VERSION}/vsearch-{VERSION}-win-x86_64.zip
Linux และ Mac : ตอนนี้คุณจะมีการกระจายแบบไบนารีในโฟลเดอร์ชื่อ vsearch-{VERSION}-{OS}-{ARCH}
ซึ่งคุณจะพบโฟลเดอร์ย่อยสามโฟลเดอร์ bin
, man
และ doc
เราแนะนำให้ทำสำเนาหรือลิงก์สัญลักษณ์ไปยัง vsearch binary bin/vsearch
ในโฟลเดอร์ที่รวมอยู่ใน $PATH
ของคุณ และสำเนาหรือลิงก์สัญลักษณ์ไปยังหน้า vsearch man man/vsearch.1
ในโฟลเดอร์ที่รวมอยู่ใน $MANPATH
ของคุณ . คู่มือเวอร์ชัน PDF มีอยู่ใน doc/vsearch_manual.pdf
Windows : ตอนนี้คุณจะมีการกระจายแบบไบนารีในโฟลเดอร์ชื่อ vsearch-{VERSION}-win-x86_64
ไฟล์ปฏิบัติการ vsearch เรียกว่า vsearch.exe
คู่มือในรูปแบบ PDF เรียกว่า vsearch_manual.pdf
หากคุณต้องการที่จะเรียก vsearch.exe
จากหน้าต่างพรอมต์คำสั่งใด ๆ คุณสามารถใส่ VSEARCH ที่ปฏิบัติการได้ในโฟลเดอร์ (เช่น C:Users<yourname>bin
) และเพิ่มโฟลเดอร์ใหม่ลงใน Path
ของผู้ใช้ : เปิดหน้าต่าง Environment Variables
โดยค้นหาในเมนู Start Edit
ตัวแปรผู้ใช้ เพิ่ม ;C:Users<yourname>bin
ต่อท้ายตัวแปร Path
แล้วบันทึกการเปลี่ยนแปลงของคุณ การกระจาย windows ยังรวมถึงไฟล์ libbz2.dll
และ zlib1.dll
ที่จำเป็นสำหรับการอ่านไฟล์อินพุตที่ถูกบีบอัด DLL เหล่านี้ได้รับสำหรับ mingw-w64 จากแพลตฟอร์ม MSYS2
เอกสารประกอบ: คู่มือผู้ใช้ VSEARCH มีอยู่ในโฟลเดอร์ man
ในรูปแบบของ man page make
เวอร์ชัน pdf (vsearch_manual.pdf) หากต้องการติดตั้ง manpage ด้วยตนเอง ให้คัดลอกไฟล์ vsearch.1
หรือสร้างลิงก์สัญลักษณ์ไปยัง vsearch.1
ในโฟลเดอร์ที่รวมอยู่ใน $MANPATH
ของคุณ คู่มือในทั้งสองรูปแบบยังมีให้ใช้งานด้วยการแจกแจงแบบไบนารี คู่มือในรูปแบบ PDF (vsearch_manual.pdf) แนบมากับรุ่นล่าสุดด้วย
แพ็คเกจ Conda ขอบคุณทีมงาน BioConda ที่ขณะนี้มีแพ็คเกจ vsearch ใน Conda
แพ็คเกจ Debian ต้องขอบคุณทีม Debian Med ที่ตอนนี้มีแพ็คเกจ vsearch ใน Debian แล้ว
แพ็คเกจพอร์ต FreeBSD ขอบคุณ Jason Bacon ทำให้มีแพ็คเกจพอร์ต vsearch FreeBSD ให้เลือก ติดตั้งแพ็คเกจไบนารีด้วย pkg install vsearch
หรือสร้างจากแหล่งที่มาพร้อมการปรับให้เหมาะสมเพิ่มเติม
Galaxy wrapper ต้องขอบคุณการทำงานของสมาชิก Intergalactic Utilities Commission ทำให้ VSEARCH เป็นส่วนหนึ่งของ Galaxy ToolShed แล้ว
แพ็คเกจ Homebrew ต้องขอบคุณ Torsten Seeman ที่ทำให้มีการสร้างแพ็คเกจ vsearch สำหรับ Homebrew
แพ็คเกจ Pkgsrc ขอบคุณ Jason Bacon แพ็คเกจ vsearch pkgsrc พร้อมใช้งานสำหรับ NetBSD และระบบที่คล้าย UNIX อื่น ๆ ติดตั้งแพ็คเกจไบนารีด้วย pkgin install vsearch
หรือสร้างจากแหล่งที่มาพร้อมการปรับให้เหมาะสมเพิ่มเติม
ปลั๊กอิน QIIME 2 ขอบคุณทีมงาน QIIME 2 ขณะนี้มีปลั๊กอินชื่อ q2-vsearch สำหรับ QIIME 2
ด้วยคำสั่ง from-uc
ใน biom 2.1.5 หรือใหม่กว่า คุณสามารถแปลงข้อมูลในไฟล์ .uc
ที่สร้างโดย vsearch ให้เป็นไฟล์ biom ที่ QIIME และซอฟต์แวร์อื่นๆ สามารถอ่านได้ มีการอธิบายไว้ที่นี่
โปรดทราบว่า VSEARCH เวอร์ชัน 2.2.0 และใหม่กว่าสามารถส่งออกตาราง OTU ได้โดยตรงในรูปแบบ biom 1.0 รวมถึงรูปแบบคลาสสิกและรูปแบบ mothur
โปรดดูกระดาษสำหรับรายละเอียด:
Rognes T, Flouri T, Nichols B, Quince C, Mahé F. (2016) VSEARCH: เครื่องมือโอเพ่นซอร์สอเนกประสงค์สำหรับ metagenomics เพียร์เจ 4:e2584 ดอย: 10.7717/peerj.2584
การคอมไพล์ VSEARCH ต้องใช้ GCC ( g++
) หรือ clang
, make
และ autotools ( ui-auto
บนการกระจายแบบ Debian) อีกทางหนึ่ง จำเป็นต้องมีไฟล์ส่วนหัวสำหรับไลบรารีเสริมสองไลบรารีต่อไปนี้ หากจำเป็นต้องรองรับไฟล์อินพุต FASTA และ FASTQ ที่บีบอัด gzip และ bzip2:
zlib.h
พร้อมใช้งานในรูปแบบ zlib1g-dev
บนการกระจายแบบเดเบียน) (เป็นทางเลือก)bzlib.h
พร้อมใช้งานในรูปแบบ libbz2-dev
บนการกระจายแบบเดเบียน) (เป็นทางเลือก)VSEARCH จะตรวจสอบโดยอัตโนมัติว่าไลบรารีเหล่านี้พร้อมใช้งานหรือไม่และโหลดแบบไดนามิก
บน Windows ไลบรารีเหล่านี้เรียกว่า zlib1.dll
และ libbz2.dll
DLL เหล่านี้รวมอยู่ในการเผยแพร่ vsearch 2.29.1 และใหม่กว่า
หากต้องการสร้างไฟล์ PDF ด้วยคู่มือ คุณจะต้องใช้เครื่องมือ ps2pdf มันเป็นส่วนหนึ่งของแพ็คเกจ ghostscript
รหัส VSEARCH มีใบอนุญาตแบบคู่ภายใต้ GNU General Public License เวอร์ชัน 3 หรือภายใต้ใบอนุญาต BSD 2 ข้อ โปรดดู LICENSE.txt สำหรับรายละเอียด
VSEARCH มีโค้ดจากโปรเจ็กต์อื่นๆ อีกหลายโปรเจ็กต์ เราขอขอบคุณผู้เขียนที่ทำให้ซอร์สโค้ดของพวกเขาพร้อมใช้งาน
VSEARCH รวมโค้ดจากโครงการ CityHash ของ Google โดย Geoff Pike และ Jyrki Alakuijala ซึ่งมอบฟังก์ชันแฮชที่ยอดเยี่ยมภายใต้ใบอนุญาต MIT
VSEARCH มีโค้ดที่ได้มาจากโปรแกรม DUST ของ Tatusov และ Lipman ที่เป็นสาธารณสมบัติ
VSEARCH มีโค้ดโดเมนสาธารณะที่เขียนโดย Alexander Peslyak สำหรับอัลกอริทึมการแยกข้อความ MD5
VSEARCH มีรหัสโดเมนสาธารณะที่เขียนโดย Steve Reid และคนอื่นๆ สำหรับอัลกอริทึมการแยกย่อยข้อความ SHA1
การแจกจ่าย VSEARCH รวมถึงโค้ดจาก GNU Autoconf ซึ่งโดยปกติจะพร้อมใช้งานภายใต้ GNU General Public License แต่อาจแจกจ่ายโดยมีข้อยกเว้นสคริปต์การกำหนดค่า autoconf พิเศษ
VSEARCH อาจรวมโค้ดจากลิขสิทธิ์ไลบรารี zlib Jean-loup Gailly และ Mark Adler ซึ่งเผยแพร่ภายใต้ใบอนุญาต zlib
VSEARCH อาจรวมโค้ดจากไลบรารีลิขสิทธิ์ bzip2 Julian R. Seward ซึ่งเผยแพร่ภายใต้ใบอนุญาตแบบ BSD
โค้ดส่วนใหญ่เขียนด้วยภาษา C++
ไฟล์ | คำอธิบาย |
---|---|
align_simd.cc | การจัดตำแหน่งทั่วโลกแบบขนาน SIMD ของ 1 แบบสอบถามพร้อม 8 ลำดับฐานข้อมูล |
ออลแพร์ส.ซีซี | การจัดตำแหน่งแบบคู่ทั่วโลกที่เหมาะสมที่สุดทั้งหมดเทียบกับทั้งหมด (ไม่มีการวิเคราะห์พฤติกรรม) |
อาร์ค.ซีซี | รหัสเฉพาะสถาปัตยกรรม (Mac/Linux) |
คุณลักษณะ.cc | การแยกและการพิมพ์แอตทริบิวต์ในส่วนหัวของ FASTA |
บิตแมป.ซีซี | การนำบิตแมปไปใช้ |
ไคเมร่า.ซีซี | การตรวจจับคิเมร่า |
เมือง.ซีซี | รหัสซิตี้แฮช |
คลัสเตอร์.ซีซี | การทำคลัสเตอร์ (cluster_fast และคลัสเตอร์_smallmem) |
cpu.cc | รหัสขึ้นอยู่กับคุณสมบัติเฉพาะของ CPU (เช่น ssse3) |
cut.cc | การตัดไซต์ที่จำกัด |
ดีบี.ซีซี | จัดการการอ่านไฟล์ฐานข้อมูล การเข้าถึง ฯลฯ |
dbash.cc | การแฮชฐานข้อมูลสำหรับการค้นหาที่แน่นอน |
dbindex.cc | สร้างดัชนีฐานข้อมูลโดยการระบุกิโลเมตรที่ไม่ซ้ำกันในลำดับ |
ดีเร็ป.ซีซี | Dereplication เต็มความยาว |
derep_prefix.cc | Dereplication คำนำหน้า |
derep_smallmem.cc | Dereplication การใช้หน่วยความจำน้อย |
dynlibs.ซีซี | การโหลดไลบรารีการบีบอัดแบบไดนามิก |
eestats.cc | สร้างสถิติสำหรับคำสั่ง fastq_eestats |
fasta.cc | โปรแกรมแยกวิเคราะห์ไฟล์ FASTA |
fasta2fastq.cc | การแปลง FASTA เป็น FASTQ |
fastq.cc | โปรแกรมแยกวิเคราะห์ไฟล์ FASTQ |
fastq_chars.cc | สถิติ FASTQ |
fastq_join.cc | FASTQ จับคู่ปลายอ่านเข้าร่วม |
fastqops.cc | สถิติไฟล์ FASTQ เป็นต้น |
fastx.cc | การตรวจจับไฟล์ FASTA และ FASTQ, wrapper สำหรับตัวแยกวิเคราะห์ FASTA และ FASTQ |
ฟิลเตอร์.ซีซี | การตัดและการกรองลำดับในไฟล์ FASTA และ FASTQ |
getseq.cc | การแยกลำดับตามป้ายกำกับส่วนหัว |
kmerhash.cc | แฮชสำหรับ kmers ที่ใช้โดยการรวมการอ่านแบบปลายคู่ |
linmemalign.cc | ตัวจัดลำดับทั่วโลกของหน่วยความจำเชิงเส้น |
แผนที่.cc | อาร์เรย์การแมปอักขระต่างๆ |
หน้ากาก.ซีซี | การปิดบัง (ฝุ่น) |
md5.c | การแยกย่อยข้อความ MD5 |
mergepairs.cc | การรวมการอ่านแบบปลายคู่ |
minheap.cc | การใช้งาน minheap สำหรับรายการการแข่งขัน kmer อันดับต้น ๆ |
msa.ซีซี | การจัดตำแหน่งหลายลำดับอย่างง่ายและการคำนวณลำดับที่เป็นเอกฉันท์สำหรับคลัสเตอร์ |
orient.cc | ทิศทางของลำดับตามฐานข้อมูลอ้างอิง |
otutable.ซีซี | สร้างตาราง OTU ในรูปแบบต่างๆ |
ทำซ้ำ.cc | การจำลองแบบ |
ผลลัพธ์.ซีซี | ผลลัพธ์เอาต์พุตในรูปแบบต่างๆ (alnout, userout, blast6, uc) |
search.ซีซี | ดำเนินการค้นหาโดยใช้การจัดตำแหน่งทั่วโลก |
search_exact.cc | ฟังก์ชั่นการค้นหาที่แน่นอน |
searchcore.cc | ฟังก์ชันการค้นหาหลักสำหรับการค้นหา การจัดกลุ่ม และการตรวจจับไคเมรา |
sff_convert.cc | การแปลงไฟล์ SFF เป็น FASTQ |
sha1.c | สรุปข้อความ SHA1 |
showalign.cc | ส่งออกการจัดตำแหน่งในลักษณะที่มนุษย์สามารถอ่านได้โดยใช้สตริง CIGAR และลำดับ |
shuffle.cc | ลำดับสุ่ม |
sintax.cc | การจำแนกอนุกรมวิธานโดยใช้วิธีซินแท็กซ์ |
sortbylength.cc | รหัสสำหรับการจัดเรียงตามความยาว |
sortbysize.cc | รหัสการจัดเรียงตามขนาด (ความอุดมสมบูรณ์) |
subsample.cc | การสุ่มตัวอย่างอ่านจากไฟล์ FASTA |
ภาษี.cc | การแยกวิเคราะห์ข้อมูลอนุกรมวิธาน |
udb.ซีซี | การจัดการไฟล์ฐานข้อมูล UDB |
Unique.ซีซี | ค้นหา kmers ที่ไม่ซ้ำใครตามลำดับ |
userfields.cc | รหัสสำหรับการแยกวิเคราะห์อาร์กิวเมนต์ตัวเลือก userfields |
util.cc | ฟังก์ชั่นยูทิลิตี้ทั่วไปต่างๆ |
vsearch.cc | ไฟล์โปรแกรมหลัก การเริ่มต้นทั่วไป อ่านอาร์กิวเมนต์และตัวเลือกแยกวิเคราะห์ เขียนข้อมูล |
utils/maps.cc | ยูทิลิตี้แผนที่สำหรับการเข้ารหัสนิวคลีโอไทด์ |
utils/seqcmp.cc | ยูทิลิตี้การเปรียบเทียบลำดับ |
VSEARCH อาจถูกคอมไพล์ด้วยการรวม zlib หรือ bzip2 ที่อนุญาตให้อ่านไฟล์ FASTA ที่บีบอัดได้ จำเป็นต้องมีไลบรารี zlib และ bzip2 สำหรับสิ่งนี้
รายงานข้อผิดพลาดทั้งหมดได้รับการชื่นชมอย่างมาก คุณสามารถส่งรายงานข้อผิดพลาดที่นี่บน GitHub ว่าเป็นปัญหา (ตามที่ต้องการ) คุณสามารถโพสต์ข้อความบน VSEARCH Web Forum หรือคุณสามารถส่งอีเมลไปที่ [email protected]
VSEARCH ได้รับการออกแบบมาสำหรับลำดับที่ค่อนข้างสั้น และจะทำงานช้าเมื่อลำดับมีความยาวมากกว่า 5,000 bp เนื่องจากระบบจะดำเนินการจัดตำแหน่งส่วนกลางอย่างเหมาะสมที่สุดในลำดับที่เลือก
ผู้มีส่วนร่วมหลักใน VSEARCH:
ขอขอบคุณเป็นพิเศษต่อบุคคลต่อไปนี้สำหรับแพตช์ คำแนะนำ การเข้าถึงคอมพิวเตอร์ ฯลฯ:
โปรดอ้างอิงสิ่งพิมพ์ต่อไปนี้หากคุณใช้ VSEARCH:
Rognes T, Flouri T, Nichols B, Quince C, Mahé F. (2016) VSEARCH: เครื่องมือโอเพ่นซอร์สอเนกประสงค์สำหรับ metagenomics เพียร์จ 4:e2584. ดอย: 10.7717/peerj.2584
โปรดทราบว่าการอ้างอิงอัลกอริธึมพื้นฐาน เช่น UCHIME อาจมีความเหมาะสมเช่นกัน
ชุดข้อมูลทดสอบ (พบในที่เก็บข้อมูล vsearch-data แยกต่างหาก) ได้มาจากโครงการ BioMarks (Logares et al. 2014), โครงการ TARA OCEANS (Karsenti et al. 2011) และฐานข้อมูลอ้างอิง Protist Ribosomal (PR 2 ) (Guillou et al. 2011) อัล 2013)
Edgar RC (2010) ค้นหาและจัดกลุ่มลำดับขนาดได้เร็วกว่า BLAST ชีวสารสนเทศศาสตร์ , 26(19): 2460-2461. ดอย:10.1093/ชีวสารสนเทศศาสตร์/btq461
Edgar RC (2016) SINTAX: ตัวแยกประเภทอนุกรมวิธานแบบไม่ใช่เบย์อย่างง่ายสำหรับลำดับ 16S และ ITS ไบโอRxiv ดอย:10.1101/074161
Edgar RC (2016) UNOISE2: ปรับปรุงการแก้ไขข้อผิดพลาดสำหรับการจัดลำดับแอมพลิคอนของ Illumina 16S และ ITS ไบโอRxiv ดอย:10.1101/081257
Edgar RC, Flyvbjerg H (2015) การกรองข้อผิดพลาด การประกอบคู่ และการแก้ไขข้อผิดพลาดสำหรับการอ่านลำดับถัดไป ชีวสารสนเทศศาสตร์ , 31(21): 3476-3482. ดอย:10.1093/ชีวสารสนเทศศาสตร์/btv401
Edgar RC, Haas BJ, Clemente JC, Quince C, Knight R (2011) UCHIME ปรับปรุงความไวและความเร็วของการตรวจจับคิเมร่า ชีวสารสนเทศศาสตร์ , 27(16): 2194-2200. ดอย:10.1093/ชีวสารสนเทศศาสตร์/btr381
กีลู แอล, บาชาร์ ดี, ออดิค เอส, เบส ดี, เบอร์นีย์ ซี, บิตเนอร์ แอล, บูตต์ ซี, เบอร์เกาด์ จี, เดอ วาร์กัส ซี, เดเซลล์ เจ, เดล กัมโป เจ, โดลัน เจ, ดันธอร์น เอ็ม, เอ็ดวาร์ดเซ่น บี, โฮลซ์มันน์ เอ็ม, คูอิสตรา ดับเบิลยู, ลาร่า อี, เลเบสคอต เอ็น, โลกาเรส อาร์, มาเฮ เอฟ, มาสซานา อาร์, มอนเทรซอร์ เอ็ม, มอราร์ด อาร์, ไม่ใช่เอฟ, พาวโลสกี้ เจ, โปรเบิร์ต ไอ, Sauvadet AL, Siano R, Stoeck T, Vaulot D, Zimmermann P & Christen R (2013) ฐานข้อมูลอ้างอิง Protist Ribosomal (PR2): แคตตาล็อกของลำดับ rRNA ของหน่วยย่อยขนาดเล็กยูคาริโอตที่มีเซลล์เดียวพร้อมอนุกรมวิธานที่รวบรวมไว้ การวิจัยกรดนิวคลีอิก , 41 (D1), D597-D604. ดอย:10.1093/nar/gks1160
คาร์เซนติ อี, กอนซาเลซ อาซินาส เอส, บอร์ก พี, โบลเลอร์ ซี, เดอ วาร์กัส ซี, เรเอส เจ, ซัลลิแวน เอ็มบี, อาเรนด์ ดี, เบนโซนี่ เอฟ, คลาเวรี เจเอ็ม, ติดตามเอ็ม, ไจลอน โอ, กอร์สกี้ จี, ฮิงแคมป์ พี, ยูดิโคเน ดี, คันเดลส์-ลูอิส S, เคอร์ซิช ยู, ไม่ใช่ F, โอกาตะ เอช, เปซองต์ เอส, เรย์เนาด์ อีจี, ซาร์เดต ซี, Sieracki ME, Speich S, Velayoudon D, Weissenbach J, Wincker P และ Tara Oceans Consortium (2011) แนวทางแบบองค์รวมสำหรับชีววิทยาระบบนิเวศทางทะเล ชีววิทยาของ PLoS , 9(10), e1001177. ดอย:10.1371/journal.pbio.1001177
Logares R, Audic S, Bass D, Bittner L, Boutte C, Christen R, Claverie JM, Decelle J, Dolan JR, Dunthorn M, Edvardsen B, Gobet A, Kooistra WHCF, Mahé F, ไม่ใช่ F, Ogata H, Pawlowski J , เพอร์นิซ เอ็มซี, โรมัค เอส, ชาลเชียน-ทาบริซี่ เค, ไซมอน เอ็น, สตอยค์ ที, ซานตินี่ เอส, เซียโน่ อาร์, วินเกอร์ พี, Zingone A, Richards T, de Vargas C และ Massana R (2014) รูปแบบของการรวมตัวของชุมชนที่หายากและอุดมสมบูรณ์ในยูคาริโอตจุลินทรีย์แพลงก์ตอนทางทะเลชายฝั่ง ชีววิทยาปัจจุบัน , 24(8), 813-821. ดอย:10.1016/j.cub.2014.02.050
Rognes T (2011) ค้นหาฐานข้อมูล Smith-Waterman ที่เร็วขึ้นโดยการใช้ SIMD แบบขนานระหว่างลำดับ BMC ชีวสารสนเทศศาสตร์ , 12: 221. doi:10.1186/1471-2105-12-221