Descarga yak - Descargar el código fuente yak

yak

Otro código fuente

yak-0.1 (r56)

Descargar

IMPORTANTE: Desde 3ACE4FF, el formato del volcado binario K-Mer es incompatible con las versiones anteriores. Tienes que volver a hacer yak count para generar el volcado K-Mer en el nuevo formato.

Empezando

 # Download and compile
git clone https://github.com/lh3/yak
cd yak && make

# build k-mer hash table for assembly; count singletons
./yak count -K1.5g -t32 -o asm.yak asm.fa.gz
# build k-mer hash tables for high-coverage reads; discard singletons
./yak count -b37 -t32 -o ccs.yak ccs-reads.fq.gz
# for paired end: to provide two identical streams
./yak count -b37 -t32 -o sr.yak <( zcat sr * .fq.gz ) <( zcat sr * .fq.gz )

# compute assembly or reads QV
./yak qv -t32 -p -K3.2g -l100k sr.yak asm.fa.gz > asm-sr.qv.txt
./yak qv -t32 -p sr.yak ccs-reads.fq.gz > ccs-sr.qv.txt
# compute k-mer QV for reads
./yak inspect ccs.yak sr.yak > ccs-sr.kqv.txt
# evaluate the completeness of assembly
./yak inspect sr.yak asm.yak > sr-asm.kqv.txt

# print k-mer histogram
./yak inspect sr.yak > sr.hist

# partition chrX/Y in human de novo assembly
wget -O- ' https://zenodo.org/record/7882299/files/human-chrXY-yak.tar?download=1 ' | tar tf -
./yak sexchr -K2g -t16 chrY-no-par.yak chrX-no-par.yak par.yak hap1.fa hap2.fa > cnt.txt
./groupxy.pl cnt.txt | awk ' $4==1 ' | cut -f2 | seqtk subseq -l80 <( cat hap1.fa hap2.fa ) - > new-hap1.fa
./groupxy.pl cnt.txt | awk ' $4==2 ' | cut -f2 | seqtk subseq -l80 <( cat hap1.fa hap2.fa ) - > new-hap2.fa

Introducción

Yak se desarrolla inicialmente para dos casos de uso específicos: 1) para estimar de manera sólida la precisión base de las lecturas de CCS y los contigs de ensamblaje, y 2) para investigar la tasa de error sistemática de las lecturas de CCS. Logra los objetivos comparando secuencias con el espectro K-Mer de lecturas cortas o comparando espectros. No se necesitan datos de referencia o datos de verdad.

Vale la pena señalar que estimar la precisión base es complicado. Cuando la precisión se acerca a Q50, tanto K-Mers no muestreadas y erróneas en lecturas cortas pueden interferir con un estimador ingenuo. Yak presenta un modelo empírico para abordar este problema. Su estimación se ve menos afectada por la cobertura y la calidad de las lecturas cortas.

Expandir

Información adicional

Versión yak-0.1 (r56)
Tipo Otro código fuente
Fecha de actualización 2025-02-07
tamaño 39.61KB
Proviene de Github

Aplicaciones relacionadas

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
SmartTube

Otro código fuente

24.71 Stable
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
wp functions

Otras categorias

1.0.0
termwind

Otras categorias

v2.3.0

Información relacionada Todo