ดาวน์โหลด vsearch - ดาวน์โหลด vsearch ซอร์สโค้ด

vsearch

ซอร์สโค้ดอื่น ๆ

VSEARCH 2.29.1

ดาวน์โหลด

ค้นหา

การแนะนำ

จุดมุ่งหมายของโครงการนี้คือการสร้างทางเลือกนอกเหนือจากเครื่องมือ USEARCH ที่พัฒนาโดย Robert C. Edgar (2010) เครื่องมือใหม่ควร:

มีโค้ดโอเพ่นซอร์สพร้อมใบอนุญาตโอเพ่นซอร์สที่เหมาะสม
ไม่มีค่าใช้จ่าย
มีการออกแบบ 64 บิตที่จัดการฐานข้อมูลขนาดใหญ่มากและหน่วยความจำมากกว่า 4GB
มีความแม่นยำหรือแม่นยำมากกว่าการใช้งาน
จะเร็วหรือเร็วกว่า userarch

เราได้ใช้เครื่องมือที่เรียกว่า VSEARCH ซึ่งสนับสนุนการตรวจจับไคเมรา แบบ de novo และการอ้างอิง การจัดกลุ่ม การจำลองแบบเต็มความยาวและคำนำหน้า การจำลองแบบ การเสริมแบบย้อนกลับ การมาสก์ การจัดตำแหน่งส่วนกลางแบบจับคู่ทั้งหมดเทียบกับทั้งหมด การค้นหาการจัดตำแหน่งแบบตรงและส่วนกลาง การสับเปลี่ยน การสุ่มตัวอย่างและการเรียงลำดับ นอกจากนี้ยังรองรับการวิเคราะห์ไฟล์ FASTQ การกรอง การแปลง และการรวมการอ่านแบบปลายคู่

VSEARCH ย่อมาจากการค้นหาแบบเวกเตอร์ เนื่องจากเครื่องมือใช้ประโยชน์จากความเท่าเทียมในรูปแบบของเวกเตอร์ SIMD รวมถึงเธรดหลายรายการเพื่อจัดตำแหน่งที่แม่นยำด้วยความเร็วสูง VSEARCH ใช้ตัวจัดตำแหน่งส่วนกลางที่เหมาะสมที่สุด (การเขียนโปรแกรมแบบไดนามิกเต็มรูปแบบ Needleman-Wunsch) ตรงกันข้ามกับ USEARCH ซึ่งโดยค่าเริ่มต้นจะใช้ข้อมูลเริ่มต้นและตัวจัดตำแหน่งแบบขยาย ซึ่งมักจะส่งผลให้เกิดการจัดตำแหน่งที่แม่นยำยิ่งขึ้น และความไว (การเรียกคืน) โดยรวมที่ดีขึ้น (การเรียกคืน) ด้วย VSEARCH โดยเฉพาะอย่างยิ่งสำหรับการจัดตำแหน่งที่มีช่องว่าง

ไบนารี VSEARCH มีไว้สำหรับ GNU/Linux บนสถาปัตยกรรมโปรเซสเซอร์ 64 บิตห้าตัว: x86_64, POWER8 (ppc64le), ARMv8 (aarch64), RISC-V 64 บิตแบบ little-endian (riscv64) และ MIPS 64 บิตแบบ little-endian ( mips64el) ไบนารียังมีให้สำหรับ macOS (เวอร์ชัน 10.9 Mavericks หรือใหม่กว่า) บน Intel (x86_64) และ Apple Silicon (ARMv8) รวมถึง Windows (64 บิต, เวอร์ชัน 7 หรือสูงกว่า, บน x86_64) VSEARCH มีโค้ด Native SIMD สำหรับสถาปัตยกรรมโปรเซสเซอร์สามตัว (SSE2/SSSE3, AltiVec/VMX/VSX, Neon) นอกจากนี้ VSEARCH ยังใช้ไลบรารี SIMD Everywhere (SIMDe) เพื่อเปิดใช้งานการสร้างบน riscv64, mips64el และสถาปัตยกรรม little-endian อื่นๆ แต่ประสิทธิภาพอาจต่ำกว่าการใช้งานแบบเนทิฟ

ซีพียูระบบปฏิบัติการ	กนู/ลินุกซ์	ระบบปฏิบัติการ macOS	หน้าต่าง
x86_64
ARMv8
พาวเวอร์8
RISC-V 64 เลอ
MIPS 64 LE	ไม่ได้ทดสอบ

แพ็คเกจ ปลั๊กอิน และตัวห่อต่างๆ สำหรับ VSEARCH มีให้จากแหล่งอื่นด้วย - ดูด้านล่าง

ซอร์สโค้ดคอมไพล์อย่างถูกต้องด้วย gcc (เวอร์ชัน 4.8.5 ถึง 14.0) และ llvm-clang (3.8 ถึง 19.0) ซอร์สโค้ดควรคอมไพล์บนระบบ FreeBSD และ NetBSD

VSEARCH สามารถอ่านอินพุตคิวรีและไฟล์ฐานข้อมูลที่บีบอัดโดยใช้ gzip (.gz) และ bzip2 (.bz2) ได้โดยตรง หากมีไลบรารี zlib และ bzip2

คำสั่งและตัวเลือกที่ใช้นิวคลีโอไทด์ส่วนใหญ่ใน USEARCH เวอร์ชัน 7 ได้รับการรองรับ เช่นเดียวกับบางคำสั่งในเวอร์ชัน 8 ชื่อตัวเลือกเดียวกันกับใน USEARCH เวอร์ชัน 7 ได้ถูกนำมาใช้เพื่อทำให้ VSEARCH กลายเป็นสิ่งทดแทนที่เกือบจะดรอปอิน VSEARCH ไม่รองรับลำดับกรดอะมิโนหรือการจัดตำแหน่งเฉพาะที่ คุณสมบัติเหล่านี้อาจถูกเพิ่มเข้ามาในอนาคต

การขอความช่วยเหลือ

หากคุณไม่พบคำตอบในเอกสาร VSEARCH โปรดไปที่ฟอรัมเว็บ VSEARCH เพื่อโพสต์คำถามหรือเริ่มการสนทนา

ตัวอย่าง

ในตัวอย่างด้านล่าง VSEARCH จะระบุลำดับในไฟล์database.fsaที่เหมือนกันอย่างน้อย 90% บนเส้นบวกกับลำดับคิวรีในไฟล์ query.fsa และเขียนผลลัพธ์ลงในไฟล์alnout.txt

./vsearch --usearch_global queries.fsa --db database.fsa --id 0.9 --alnout alnout.txt

ดาวน์โหลดและติดตั้ง

การกระจายแหล่งที่มา หากต้องการดาวน์โหลดการกระจายแหล่งที่มาจากรีลีสและสร้างไฟล์ปฏิบัติการและเอกสารประกอบ ให้ใช้คำสั่งต่อไปนี้:

 wget https://github.com/torognes/vsearch/archive/v2.29.1.tar.gz
tar xzf v2.29.1.tar.gz
cd vsearch-2.29.1
./autogen.sh
./configure CFLAGS="-O3" CXXFLAGS="-O3"
make ARFLAGS="cr"
sudo make install

คุณสามารถปรับแต่งไดเร็กทอรีการติดตั้งได้โดยใช้ตัวเลือก --prefix=DIR เพื่อ configure หากมีการติดตั้งไลบรารีการบีบอัด zlib และ/หรือ bzip2 บนระบบ ไลบรารีเหล่านั้นจะถูกตรวจพบโดยอัตโนมัติและการสนับสนุนไฟล์บีบอัดจะรวมอยู่ใน vsearch (ดูหัวข้อ การขึ้น ต่อกันด้านล่าง) การสนับสนุนไฟล์บีบอัดอาจถูกปิดใช้งานโดยใช้ตัวเลือก --disable-zlib และ --disable-bzip2 เพื่อ configure คู่มือเวอร์ชัน PDF จะถูกสร้างขึ้นจากไฟล์คู่มือ vsearch.1 หากมี ps2pdf ใช้งานได้ เว้นแต่จะปิดใช้งานโดยใช้ตัวเลือก --disable-pdfman เพื่อ configure ขอแนะนำให้รัน configuration ด้วยตัวเลือก CFLAGS="-O3" และ CXXFLAGS="-O3" อาจใช้ตัวเลือกอื่นเพื่อ configure โปรดเรียกใช้ configure -h เพื่อดูตัวเลือกทั้งหมด GNU autoconf (เวอร์ชัน 2.63 หรือใหม่กว่า) ต้องใช้ automake และคอมไพเลอร์ GCC C++ ( g++ ) เพื่อสร้าง vsearch อาจต้องใช้ make เวอร์ชัน 3.82 หรือใหม่กว่าบน Linux ในขณะที่เวอร์ชัน 3.81 ก็เพียงพอแล้วบน macOS

ในการสร้าง VSEARCH บน Debian และ Linux ที่คล้ายกัน (Ubuntu ฯลฯ) คุณจะต้องมีแพ็คเกจต่อไปนี้: autoconf, automake, g++, ghostscript, groff, libbz2-dev, make, zlib1g-dev รวม libsimde-dev เพื่อสร้างบน riscv64 หรือ mips64el

หากต้องการสร้าง VSEARCH บน Fedora และ Linux ที่คล้ายกัน (RHEL, Centos ฯลฯ) คุณจะต้องมีแพ็คเกจต่อไปนี้: autoconf, automake, bzip2-devel, gcc-c++, ghostscript, groff-base, make, zlib-devel

แทนที่จะดาวน์โหลดการแจกจ่ายแหล่งที่มาเป็นไฟล์เก็บถาวรที่บีบอัด คุณสามารถโคลน repo และสร้างได้ตามที่แสดงด้านล่าง ตัวเลือกในการ configure ตามที่อธิบายไว้ข้างต้นยังคงใช้ได้

 git clone https://github.com/torognes/vsearch.git
cd vsearch
./autogen.sh
./configure CFLAGS="-O3" CXXFLAGS="-O3"
make ARFLAGS="cr"
sudo make install

การกระจายแบบไบนารี : ตั้งแต่เวอร์ชัน 1.4.0 เป็นต้นไป ไฟล์การแจกจ่ายแบบไบนารีที่มีไบนารีที่คอมไพล์ไว้ล่วงหน้าตลอดจนเอกสารประกอบจะพร้อมใช้งานโดยเป็นส่วนหนึ่งของแต่ละรุ่น โปรแกรมปฏิบัติการที่รวมมานั้นรองรับไฟล์อินพุตที่บีบอัดโดย zlib และ bzip2 (โดยไฟล์มักจะลงท้ายด้วย .gz หรือ .bz2 )

การแจกแจงไบนารีมีให้สำหรับระบบ x86-64 ที่ใช้ GNU/Linux, macOS (เวอร์ชัน 10.7 หรือสูงกว่า) หรือ Windows (64 บิต, เวอร์ชัน 7 หรือสูงกว่า), ระบบ AMDv8 64 บิต (aarch64) ที่ใช้ GNU/Linux หรือ macOS เช่นเดียวกับ POWER8 (ppc64le), RISC-V ปลายเล็ก 64 บิต (risv64) และ MIPS ปลายเล็ก 64 บิต (mips64el) ระบบที่ใช้ GNU/Linux ไบนารี macOS สากลก็มีให้เช่นกัน นอกจากนี้ ยังมีไบนารี x86_64 ที่สร้างขึ้นสำหรับการกระจายลินุกซ์ RHEL 7 และ CentOS 7 ที่เลิกผลิตแล้วอีกด้วย ไบนารี Linux อื่น ๆ สร้างขึ้นบน Debian 11 (oldstable, Bullseye) ไบนารีแบบคงที่พร้อมใช้งานสำหรับสถาปัตยกรรม Linux ทั้งหมด ยกเว้น x86_64 ซึ่งสามารถใช้ได้กับระบบที่ไม่ได้ติดตั้งไลบรารีที่จำเป็นทั้งหมด ไบนารีของ Windows ถูกสร้างขึ้นด้วยการรวบรวมข้ามโดยใช้ Mingw-w64

ดาวน์โหลดโปรแกรมปฏิบัติการที่เหมาะสมสำหรับระบบของคุณโดยใช้คำสั่งต่อไปนี้ หากคุณใช้ระบบ Linux หรือ macOS:

wget https://github.com/torognes/vsearch/releases/download/v{VERSION}/vsearch-{VERSION}-{OS}-{ARCH}.tar.gz
tar xzf vsearch-{VERSION}-{OS}-{ARCH}.tar.gz

แทนที่ {VERSION} ด้วยหมายเลขเวอร์ชัน VSEARCH (เช่น 2.29.1 ), {OS} ด้วยระบบปฏิบัติการเป้าหมาย ( linux หรือ macos ) และ {ARCH} ด้วยสถาปัตยกรรม ( x86_64 , aarch64 , ppc64le , riscv64 หรือ mips64el ) คุณสามารถเพิ่ม -static หลัง {ARCH} เพื่อรับเวอร์ชันที่คอมไพล์แบบคงที่สำหรับ Linux (ยกเว้น x86_64) ชื่อของไบนารีสำหรับการกระจาย RHEL 7 และ CentOS 7 Linux ลงท้ายด้วย -ubi7

หรือหากคุณใช้ Windows ให้ดาวน์โหลดและแยก (แตกไฟล์) เนื้อหาของไฟล์นี้:

 https://github.com/torognes/vsearch/releases/download/v{VERSION}/vsearch-{VERSION}-win-x86_64.zip

Linux และ Mac : ตอนนี้คุณจะมีการกระจายแบบไบนารีในโฟลเดอร์ชื่อ vsearch-{VERSION}-{OS}-{ARCH} ซึ่งคุณจะพบโฟลเดอร์ย่อยสามโฟลเดอร์ bin , man และ doc เราแนะนำให้ทำสำเนาหรือลิงก์สัญลักษณ์ไปยัง vsearch binary bin/vsearch ในโฟลเดอร์ที่รวมอยู่ใน $PATH ของคุณ และสำเนาหรือลิงก์สัญลักษณ์ไปยังหน้า vsearch man man/vsearch.1 ในโฟลเดอร์ที่รวมอยู่ใน $MANPATH ของคุณ . คู่มือเวอร์ชัน PDF มีอยู่ใน doc/vsearch_manual.pdf

Windows : ตอนนี้คุณจะมีการกระจายแบบไบนารีในโฟลเดอร์ชื่อ vsearch-{VERSION}-win-x86_64 ไฟล์ปฏิบัติการ vsearch เรียกว่า vsearch.exe คู่มือในรูปแบบ PDF เรียกว่า vsearch_manual.pdf หากคุณต้องการที่จะเรียก vsearch.exe จากหน้าต่างพรอมต์คำสั่งใด ๆ คุณสามารถใส่ VSEARCH ที่ปฏิบัติการได้ในโฟลเดอร์ (เช่น C:Users<yourname>bin ) และเพิ่มโฟลเดอร์ใหม่ลงใน Path ของผู้ใช้ : เปิดหน้าต่าง Environment Variables โดยค้นหาในเมนู Start Edit ตัวแปรผู้ใช้ เพิ่ม ;C:Users<yourname>bin ต่อท้ายตัวแปร Path แล้วบันทึกการเปลี่ยนแปลงของคุณ การกระจาย windows ยังรวมถึงไฟล์ libbz2.dll และ zlib1.dll ที่จำเป็นสำหรับการอ่านไฟล์อินพุตที่ถูกบีบอัด DLL เหล่านี้ได้รับสำหรับ mingw-w64 จากแพลตฟอร์ม MSYS2

เอกสารประกอบ: คู่มือผู้ใช้ VSEARCH มีอยู่ในโฟลเดอร์ man ในรูปแบบของ man page make เวอร์ชัน pdf (vsearch_manual.pdf) หากต้องการติดตั้ง manpage ด้วยตนเอง ให้คัดลอกไฟล์ vsearch.1 หรือสร้างลิงก์สัญลักษณ์ไปยัง vsearch.1 ในโฟลเดอร์ที่รวมอยู่ใน $MANPATH ของคุณ คู่มือในทั้งสองรูปแบบยังมีให้ใช้งานด้วยการแจกแจงแบบไบนารี คู่มือในรูปแบบ PDF (vsearch_manual.pdf) แนบมากับรุ่นล่าสุดด้วย

แพ็คเกจ ปลั๊กอิน และตัวห่อ

แพ็คเกจ Conda ขอบคุณทีมงาน BioConda ที่ขณะนี้มีแพ็คเกจ vsearch ใน Conda

แพ็คเกจ Debian ต้องขอบคุณทีม Debian Med ที่ตอนนี้มีแพ็คเกจ vsearch ใน Debian แล้ว

แพ็คเกจพอร์ต FreeBSD ขอบคุณ Jason Bacon ทำให้มีแพ็คเกจพอร์ต vsearch FreeBSD ให้เลือก ติดตั้งแพ็คเกจไบนารีด้วย pkg install vsearch หรือสร้างจากแหล่งที่มาพร้อมการปรับให้เหมาะสมเพิ่มเติม

Galaxy wrapper ต้องขอบคุณการทำงานของสมาชิก Intergalactic Utilities Commission ทำให้ VSEARCH เป็นส่วนหนึ่งของ Galaxy ToolShed แล้ว

แพ็คเกจ Homebrew ต้องขอบคุณ Torsten Seeman ที่ทำให้มีการสร้างแพ็คเกจ vsearch สำหรับ Homebrew

แพ็คเกจ Pkgsrc ขอบคุณ Jason Bacon แพ็คเกจ vsearch pkgsrc พร้อมใช้งานสำหรับ NetBSD และระบบที่คล้าย UNIX อื่น ๆ ติดตั้งแพ็คเกจไบนารีด้วย pkgin install vsearch หรือสร้างจากแหล่งที่มาพร้อมการปรับให้เหมาะสมเพิ่มเติม

ปลั๊กอิน QIIME 2 ขอบคุณทีมงาน QIIME 2 ขณะนี้มีปลั๊กอินชื่อ q2-vsearch สำหรับ QIIME 2

การแปลงเอาต์พุตเป็นไฟล์ biom เพื่อใช้ใน QIIME และซอฟต์แวร์อื่นๆ

ด้วยคำสั่ง from-uc ใน biom 2.1.5 หรือใหม่กว่า คุณสามารถแปลงข้อมูลในไฟล์ .uc ที่สร้างโดย vsearch ให้เป็นไฟล์ biom ที่ QIIME และซอฟต์แวร์อื่นๆ สามารถอ่านได้ มีการอธิบายไว้ที่นี่

โปรดทราบว่า VSEARCH เวอร์ชัน 2.2.0 และใหม่กว่าสามารถส่งออกตาราง OTU ได้โดยตรงในรูปแบบ biom 1.0 รวมถึงรูปแบบคลาสสิกและรูปแบบ mothur

รายละเอียดการดำเนินการและการประเมินเบื้องต้น

โปรดดูกระดาษสำหรับรายละเอียด:

Rognes T, Flouri T, Nichols B, Quince C, Mahé F. (2016) VSEARCH: เครื่องมือโอเพ่นซอร์สอเนกประสงค์สำหรับ metagenomics เพียร์เจ 4:e2584 ดอย: 10.7717/peerj.2584

การพึ่งพาอาศัยกัน

การคอมไพล์ VSEARCH ต้องใช้ GCC ( g++ ) หรือ clang , make และ autotools ( ui-auto บนการกระจายแบบ Debian) อีกทางหนึ่ง จำเป็นต้องมีไฟล์ส่วนหัวสำหรับไลบรารีเสริมสองไลบรารีต่อไปนี้ หากจำเป็นต้องรองรับไฟล์อินพุต FASTA และ FASTQ ที่บีบอัด gzip และ bzip2:

libz (ไลบรารี zlib) (ไฟล์ส่วนหัว zlib.h พร้อมใช้งานในรูปแบบ zlib1g-dev บนการกระจายแบบเดเบียน) (เป็นทางเลือก)
libbz2 (ไลบรารี bzip2lib) (ไฟล์ส่วนหัว bzlib.h พร้อมใช้งานในรูปแบบ libbz2-dev บนการกระจายแบบเดเบียน) (เป็นทางเลือก)

VSEARCH จะตรวจสอบโดยอัตโนมัติว่าไลบรารีเหล่านี้พร้อมใช้งานหรือไม่และโหลดแบบไดนามิก

บน Windows ไลบรารีเหล่านี้เรียกว่า zlib1.dll และ libbz2.dll DLL เหล่านี้รวมอยู่ในการเผยแพร่ vsearch 2.29.1 และใหม่กว่า

หากต้องการสร้างไฟล์ PDF ด้วยคู่มือ คุณจะต้องใช้เครื่องมือ ps2pdf มันเป็นส่วนหนึ่งของแพ็คเกจ ghostscript

ใบอนุญาต VSEARCH และใบอนุญาตบุคคลที่สาม

รหัส VSEARCH มีใบอนุญาตแบบคู่ภายใต้ GNU General Public License เวอร์ชัน 3 หรือภายใต้ใบอนุญาต BSD 2 ข้อ โปรดดู LICENSE.txt สำหรับรายละเอียด

VSEARCH มีโค้ดจากโปรเจ็กต์อื่นๆ อีกหลายโปรเจ็กต์ เราขอขอบคุณผู้เขียนที่ทำให้ซอร์สโค้ดของพวกเขาพร้อมใช้งาน

VSEARCH รวมโค้ดจากโครงการ CityHash ของ Google โดย Geoff Pike และ Jyrki Alakuijala ซึ่งมอบฟังก์ชันแฮชที่ยอดเยี่ยมภายใต้ใบอนุญาต MIT

VSEARCH มีโค้ดที่ได้มาจากโปรแกรม DUST ของ Tatusov และ Lipman ที่เป็นสาธารณสมบัติ

VSEARCH มีโค้ดโดเมนสาธารณะที่เขียนโดย Alexander Peslyak สำหรับอัลกอริทึมการแยกข้อความ MD5

VSEARCH มีรหัสโดเมนสาธารณะที่เขียนโดย Steve Reid และคนอื่นๆ สำหรับอัลกอริทึมการแยกย่อยข้อความ SHA1

การแจกจ่าย VSEARCH รวมถึงโค้ดจาก GNU Autoconf ซึ่งโดยปกติจะพร้อมใช้งานภายใต้ GNU General Public License แต่อาจแจกจ่ายโดยมีข้อยกเว้นสคริปต์การกำหนดค่า autoconf พิเศษ

VSEARCH อาจรวมโค้ดจากลิขสิทธิ์ไลบรารี zlib Jean-loup Gailly และ Mark Adler ซึ่งเผยแพร่ภายใต้ใบอนุญาต zlib

VSEARCH อาจรวมโค้ดจากไลบรารีลิขสิทธิ์ bzip2 Julian R. Seward ซึ่งเผยแพร่ภายใต้ใบอนุญาตแบบ BSD

รหัส

โค้ดส่วนใหญ่เขียนด้วยภาษา C++

ไฟล์	คำอธิบาย
align_simd.cc	การจัดตำแหน่งทั่วโลกแบบขนาน SIMD ของ 1 แบบสอบถามพร้อม 8 ลำดับฐานข้อมูล
ออลแพร์ส.ซีซี	การจัดตำแหน่งแบบคู่ทั่วโลกที่เหมาะสมที่สุดทั้งหมดเทียบกับทั้งหมด (ไม่มีการวิเคราะห์พฤติกรรม)
อาร์ค.ซีซี	รหัสเฉพาะสถาปัตยกรรม (Mac/Linux)
คุณลักษณะ.cc	การแยกและการพิมพ์แอตทริบิวต์ในส่วนหัวของ FASTA
บิตแมป.ซีซี	การนำบิตแมปไปใช้
ไคเมร่า.ซีซี	การตรวจจับคิเมร่า
เมือง.ซีซี	รหัสซิตี้แฮช
คลัสเตอร์.ซีซี	การทำคลัสเตอร์ (cluster_fast และคลัสเตอร์_smallmem)
cpu.cc	รหัสขึ้นอยู่กับคุณสมบัติเฉพาะของ CPU (เช่น ssse3)
cut.cc	การตัดไซต์ที่จำกัด
ดีบี.ซีซี	จัดการการอ่านไฟล์ฐานข้อมูล การเข้าถึง ฯลฯ
dbash.cc	การแฮชฐานข้อมูลสำหรับการค้นหาที่แน่นอน
dbindex.cc	สร้างดัชนีฐานข้อมูลโดยการระบุกิโลเมตรที่ไม่ซ้ำกันในลำดับ
ดีเร็ป.ซีซี	Dereplication เต็มความยาว
derep_prefix.cc	Dereplication คำนำหน้า
derep_smallmem.cc	Dereplication การใช้หน่วยความจำน้อย
dynlibs.ซีซี	การโหลดไลบรารีการบีบอัดแบบไดนามิก
eestats.cc	สร้างสถิติสำหรับคำสั่ง fastq_eestats
fasta.cc	โปรแกรมแยกวิเคราะห์ไฟล์ FASTA
fasta2fastq.cc	การแปลง FASTA เป็น FASTQ
fastq.cc	โปรแกรมแยกวิเคราะห์ไฟล์ FASTQ
fastq_chars.cc	สถิติ FASTQ
fastq_join.cc	FASTQ จับคู่ปลายอ่านเข้าร่วม
fastqops.cc	สถิติไฟล์ FASTQ เป็นต้น
fastx.cc	การตรวจจับไฟล์ FASTA และ FASTQ, wrapper สำหรับตัวแยกวิเคราะห์ FASTA และ FASTQ
ฟิลเตอร์.ซีซี	การตัดและการกรองลำดับในไฟล์ FASTA และ FASTQ
getseq.cc	การแยกลำดับตามป้ายกำกับส่วนหัว
kmerhash.cc	แฮชสำหรับ kmers ที่ใช้โดยการรวมการอ่านแบบปลายคู่
linmemalign.cc	ตัวจัดลำดับทั่วโลกของหน่วยความจำเชิงเส้น
แผนที่.cc	อาร์เรย์การแมปอักขระต่างๆ
หน้ากาก.ซีซี	การปิดบัง (ฝุ่น)
md5.c	การแยกย่อยข้อความ MD5
mergepairs.cc	การรวมการอ่านแบบปลายคู่
minheap.cc	การใช้งาน minheap สำหรับรายการการแข่งขัน kmer อันดับต้น ๆ
msa.ซีซี	การจัดตำแหน่งหลายลำดับอย่างง่ายและการคำนวณลำดับที่เป็นเอกฉันท์สำหรับคลัสเตอร์
orient.cc	ทิศทางของลำดับตามฐานข้อมูลอ้างอิง
otutable.ซีซี	สร้างตาราง OTU ในรูปแบบต่างๆ
ทำซ้ำ.cc	การจำลองแบบ
ผลลัพธ์.ซีซี	ผลลัพธ์เอาต์พุตในรูปแบบต่างๆ (alnout, userout, blast6, uc)
search.ซีซี	ดำเนินการค้นหาโดยใช้การจัดตำแหน่งทั่วโลก
search_exact.cc	ฟังก์ชั่นการค้นหาที่แน่นอน
searchcore.cc	ฟังก์ชันการค้นหาหลักสำหรับการค้นหา การจัดกลุ่ม และการตรวจจับไคเมรา
sff_convert.cc	การแปลงไฟล์ SFF เป็น FASTQ
sha1.c	สรุปข้อความ SHA1
showalign.cc	ส่งออกการจัดตำแหน่งในลักษณะที่มนุษย์สามารถอ่านได้โดยใช้สตริง CIGAR และลำดับ
shuffle.cc	ลำดับสุ่ม
sintax.cc	การจำแนกอนุกรมวิธานโดยใช้วิธีซินแท็กซ์
sortbylength.cc	รหัสสำหรับการจัดเรียงตามความยาว
sortbysize.cc	รหัสการจัดเรียงตามขนาด (ความอุดมสมบูรณ์)
subsample.cc	การสุ่มตัวอย่างอ่านจากไฟล์ FASTA
ภาษี.cc	การแยกวิเคราะห์ข้อมูลอนุกรมวิธาน
udb.ซีซี	การจัดการไฟล์ฐานข้อมูล UDB
Unique.ซีซี	ค้นหา kmers ที่ไม่ซ้ำใครตามลำดับ
userfields.cc	รหัสสำหรับการแยกวิเคราะห์อาร์กิวเมนต์ตัวเลือก userfields
util.cc	ฟังก์ชั่นยูทิลิตี้ทั่วไปต่างๆ
vsearch.cc	ไฟล์โปรแกรมหลัก การเริ่มต้นทั่วไป อ่านอาร์กิวเมนต์และตัวเลือกแยกวิเคราะห์ เขียนข้อมูล
utils/maps.cc	ยูทิลิตี้แผนที่สำหรับการเข้ารหัสนิวคลีโอไทด์
utils/seqcmp.cc	ยูทิลิตี้การเปรียบเทียบลำดับ

VSEARCH อาจถูกคอมไพล์ด้วยการรวม zlib หรือ bzip2 ที่อนุญาตให้อ่านไฟล์ FASTA ที่บีบอัดได้ จำเป็นต้องมีไลบรารี zlib และ bzip2 สำหรับสิ่งนี้

แมลง

รายงานข้อผิดพลาดทั้งหมดได้รับการชื่นชมอย่างมาก คุณสามารถส่งรายงานข้อผิดพลาดที่นี่บน GitHub ว่าเป็นปัญหา (ตามที่ต้องการ) คุณสามารถโพสต์ข้อความบน VSEARCH Web Forum หรือคุณสามารถส่งอีเมลไปที่ [email protected]

ข้อจำกัด

VSEARCH ได้รับการออกแบบมาสำหรับลำดับที่ค่อนข้างสั้น และจะทำงานช้าเมื่อลำดับมีความยาวมากกว่า 5,000 bp เนื่องจากระบบจะดำเนินการจัดตำแหน่งส่วนกลางอย่างเหมาะสมที่สุดในลำดับที่เลือก

ทีมงาน VSEARCH

ผู้มีส่วนร่วมหลักใน VSEARCH:

Torbjørn Rognes [email protected] (การเขียนโค้ด การทดสอบ เอกสารประกอบ การประเมินผล)
Frédéric Mahé [email protected] (เอกสาร การทดสอบ คำแนะนำคุณสมบัติ)
Tomáš Flouri [email protected] (การเขียนโค้ด การทดสอบ)
Christopher Quince [email protected] (ผู้ริเริ่ม ข้อเสนอแนะด้านคุณลักษณะ การประเมินผล)
เบ็น นิโคลส์ [email protected] (การประเมินผล)

รับทราบ

ขอขอบคุณเป็นพิเศษต่อบุคคลต่อไปนี้สำหรับแพตช์ คำแนะนำ การเข้าถึงคอมพิวเตอร์ ฯลฯ:

ดาวิเด้ อัลบาเนเซ
คอลิน บริสลอว์น
ไมเคิล อาร์. ครูโซ
เจฟฟ์ เอพเลอร์
คริสโตเฟอร์ เอ็ม. ซัลลิแวน
อันเดรียส ทิลล์
ซาราห์ เวสต์คอตต์

อ้างถึง VSEARCH

โปรดอ้างอิงสิ่งพิมพ์ต่อไปนี้หากคุณใช้ VSEARCH:

Rognes T, Flouri T, Nichols B, Quince C, Mahé F. (2016) VSEARCH: เครื่องมือโอเพ่นซอร์สอเนกประสงค์สำหรับ metagenomics เพียร์จ 4:e2584. ดอย: 10.7717/peerj.2584

โปรดทราบว่าการอ้างอิงอัลกอริธึมพื้นฐาน เช่น UCHIME อาจมีความเหมาะสมเช่นกัน

ทดสอบชุดข้อมูล

ชุดข้อมูลทดสอบ (พบในที่เก็บข้อมูล vsearch-data แยกต่างหาก) ได้มาจากโครงการ BioMarks (Logares et al. 2014), โครงการ TARA OCEANS (Karsenti et al. 2011) และฐานข้อมูลอ้างอิง Protist Ribosomal (PR ² ) (Guillou et al. 2011) อัล 2013)

อ้างอิง

Edgar RC (2010) ค้นหาและจัดกลุ่มลำดับขนาดได้เร็วกว่า BLAST ชีวสารสนเทศศาสตร์ , 26(19): 2460-2461. ดอย:10.1093/ชีวสารสนเทศศาสตร์/btq461
Edgar RC (2016) SINTAX: ตัวแยกประเภทอนุกรมวิธานแบบไม่ใช่เบย์อย่างง่ายสำหรับลำดับ 16S และ ITS ไบโอRxiv ดอย:10.1101/074161
Edgar RC (2016) UNOISE2: ปรับปรุงการแก้ไขข้อผิดพลาดสำหรับการจัดลำดับแอมพลิคอนของ Illumina 16S และ ITS ไบโอRxiv ดอย:10.1101/081257
Edgar RC, Flyvbjerg H (2015) การกรองข้อผิดพลาด การประกอบคู่ และการแก้ไขข้อผิดพลาดสำหรับการอ่านลำดับถัดไป ชีวสารสนเทศศาสตร์ , 31(21): 3476-3482. ดอย:10.1093/ชีวสารสนเทศศาสตร์/btv401
Edgar RC, Haas BJ, Clemente JC, Quince C, Knight R (2011) UCHIME ปรับปรุงความไวและความเร็วของการตรวจจับคิเมร่า ชีวสารสนเทศศาสตร์ , 27(16): 2194-2200. ดอย:10.1093/ชีวสารสนเทศศาสตร์/btr381
กีลู แอล, บาชาร์ ดี, ออดิค เอส, เบส ดี, เบอร์นีย์ ซี, บิตเนอร์ แอล, บูตต์ ซี, เบอร์เกาด์ จี, เดอ วาร์กัส ซี, เดเซลล์ เจ, เดล กัมโป เจ, โดลัน เจ, ดันธอร์น เอ็ม, เอ็ดวาร์ดเซ่น บี, โฮลซ์มันน์ เอ็ม, คูอิสตรา ดับเบิลยู, ลาร่า อี, เลเบสคอต เอ็น, โลกาเรส อาร์, มาเฮ เอฟ, มาสซานา อาร์, มอนเทรซอร์ เอ็ม, มอราร์ด อาร์, ไม่ใช่เอฟ, พาวโลสกี้ เจ, โปรเบิร์ต ไอ, Sauvadet AL, Siano R, Stoeck T, Vaulot D, Zimmermann P & Christen R (2013) ฐานข้อมูลอ้างอิง Protist Ribosomal (PR2): แคตตาล็อกของลำดับ rRNA ของหน่วยย่อยขนาดเล็กยูคาริโอตที่มีเซลล์เดียวพร้อมอนุกรมวิธานที่รวบรวมไว้ การวิจัยกรดนิวคลีอิก , 41 (D1), D597-D604. ดอย:10.1093/nar/gks1160
คาร์เซนติ อี, กอนซาเลซ อาซินาส เอส, บอร์ก พี, โบลเลอร์ ซี, เดอ วาร์กัส ซี, เรเอส เจ, ซัลลิแวน เอ็มบี, อาเรนด์ ดี, เบนโซนี่ เอฟ, คลาเวรี เจเอ็ม, ติดตามเอ็ม, ไจลอน โอ, กอร์สกี้ จี, ฮิงแคมป์ พี, ยูดิโคเน ดี, คันเดลส์-ลูอิส S, เคอร์ซิช ยู, ไม่ใช่ F, โอกาตะ เอช, เปซองต์ เอส, เรย์เนาด์ อีจี, ซาร์เดต ซี, Sieracki ME, Speich S, Velayoudon D, Weissenbach J, Wincker P และ Tara Oceans Consortium (2011) แนวทางแบบองค์รวมสำหรับชีววิทยาระบบนิเวศทางทะเล ชีววิทยาของ PLoS , 9(10), e1001177. ดอย:10.1371/journal.pbio.1001177
Logares R, Audic S, Bass D, Bittner L, Boutte C, Christen R, Claverie JM, Decelle J, Dolan JR, Dunthorn M, Edvardsen B, Gobet A, Kooistra WHCF, Mahé F, ไม่ใช่ F, Ogata H, Pawlowski J , เพอร์นิซ เอ็มซี, โรมัค เอส, ชาลเชียน-ทาบริซี่ เค, ไซมอน เอ็น, สตอยค์ ที, ซานตินี่ เอส, เซียโน่ อาร์, วินเกอร์ พี, Zingone A, Richards T, de Vargas C และ Massana R (2014) รูปแบบของการรวมตัวของชุมชนที่หายากและอุดมสมบูรณ์ในยูคาริโอตจุลินทรีย์แพลงก์ตอนทางทะเลชายฝั่ง ชีววิทยาปัจจุบัน , 24(8), 813-821. ดอย:10.1016/j.cub.2014.02.050
Rognes T (2011) ค้นหาฐานข้อมูล Smith-Waterman ที่เร็วขึ้นโดยการใช้ SIMD แบบขนานระหว่างลำดับ BMC ชีวสารสนเทศศาสตร์ , 12: 221. doi:10.1186/1471-2105-12-221

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน VSEARCH 2.29.1
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2024-12-26
ขนาด 446.94KB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
wp functions

หมวดหมู่อื่นๆ

1.0.0
termwind

หมวดหมู่อื่นๆ

v2.3.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด