우리는 다양한 기술을 사용하여 CHM13hTERT 인간 세포주의 서열을 분석했습니다. 인간 게놈 DNA는 배양된 세포주에서 추출되었습니다. DNA는 천연이므로 변형된 염기가 보존됩니다. 데이터에는 30x PacBio HiFi, 120x Oxford Nanopore 적용 범위, 70x PacBio CLR, 50x 10X Genomics, BioNano DLS 및 Arima Genomics HiC가 포함됩니다. University of Washington/PacBio에서 생성되고 NCBI SRA에서 제공되는 PacBio 데이터를 제외하고 대부분의 원시 데이터는 이 사이트에서 제공됩니다.
UCSC 브라우저 허브는 CHM13 및 T2T-영장류에 사용할 수 있습니다. hs1용 UCSC 게놈 브라우저에 통합될 때까지 이 허브에 대한 트랙 업데이트가 이루어집니다. 레거시 UCSC 브라우저는 v2.0, v1.0 및 v1.1 버전에서 사용할 수 있습니다.
모든 게놈 반복의 대화형 점도표 시각화도 resgen.io에서 사용할 수 있습니다. 어셈블리에서 식별된 알려진 문제는 CHM13 문제에서 추적됩니다.
Y를 사용한 인간 게놈의 완전한 T2T 재구성. v1.1의 변경 사항은 GIAB 및 HPRC에 의해 시퀀싱된 GIAB HG002/NA24385 샘플의 완성된 염색체 Y가 추가되었다는 것입니다. 이 게놈은 NCBI(GCA_009914755.4) 및 UCSC에서도 이용 가능합니다. UCSC 브라우저가 Genbank 접근을 브라우저 자체의 시퀀스 이름으로 표시하더라도 BED/bigBed/BAM/CRAM/bigWig 및 기타 형식으로 주석을 로드하거나 "chr1/2/etc" 이름을 사용하여 검색할 수 있습니다.
이전 어셈블리 릴리스는 아래에서 확인할 수 있습니다.
CHM13에 대해 생성된 시퀀싱 데이터세트는 이 페이지에서 확인할 수 있습니다.
매핑 기반 연구를 위한 참조로 T2T-CHM13v2.0(T2T-CHM13+Y)을 사용하기 위한 분석 세트는 aws의 README와 함께 제공됩니다.
2022년 9월 28일 업데이트: 모든 분석 세트 fa.gz 파일이 bgzip으로 다시 압축되었습니다. 색인 파일은 README의 업데이트된 md5와 함께 aws에서 사용할 수 있습니다.
파일은 s3://human-pangenomics/T2T/CHM13 및 이 웹 인터페이스를 통해 Amazon Web Services에서 넉넉하게 호스팅됩니다.
간단한 HTTP 링크로 사용할 수 있지만 Amazon Web Services 명령줄 인터페이스를 사용하면 다운로드 성능이 향상됩니다. s3://
주소 지정 체계를 사용하도록 참조를 수정해야 합니다. 즉, 다운로드하려면 https://s3-us-west-2.amazonaws.com/human-pangenomics/T2T/
s3://human-pangenomics/T2T
로 바꾸십시오. . 예를 들어 CHM13_prep5_S13_L002_I1_001.fastq.gz
현재 작업 디렉터리에 다운로드하려면 다음 명령을 사용합니다.
aws s3 --no-sign-request cp s3://human-pangenomics/T2T/CHM13/10x/CHM13_prep5_S13_L002_I1_001.fastq.gz .
또는 전체 데이터세트를 다운로드하려면 다음 명령을 사용하세요.
aws s3 --no-sign-request sync s3://human-pangenomics/T2T/CHM13/ .
s3 명령을 사용하면 데이터 세트에 대한 정보를 얻을 수도 있습니다(예: 사람이 읽을 수 있는 형식으로 모든 파일의 크기 보고).
aws s3 --no-sign-request ls --recursive --human-readable --summarize s3://human-pangenomics/T2T/CHM13/
또는 기술별 크기를 얻기 위해.
aws s3 --no-sign-request ls --recursive --human-readable --summarize s3://human-pangenomics/T2T/CHM13/nanopore/fast5
aws s3 --no-sign-request ls --recursive --human-readable --summarize s3://human-pangenomics/T2T/CHM13/nanopore/rel2
aws s3 --no-sign-request ls --recursive --human-readable --summarize s3://human-pangenomics/T2T/CHM13/assemblies
이 가이드에 따라 max_concurrent_requests
등 설정을 수정하면 다운로드 성능이 더욱 향상됩니다.
이 데이터세트와 관련하여 Github 저장소에 문제를 제기해 주세요.
모든 데이터는 공개 도메인(CC0)에 공개되며 재사용을 권장합니다. 이 데이터 생성에 대해 "Telomere-to-Telomere"(T2T) 컨소시엄을 인정하고 인용해 주시면 감사하겠습니다. 우리 컨소시엄에 대한 자세한 내용은 T2T 홈페이지에서 확인할 수 있으며 관련 인용 목록은 아래에서 확인할 수 있습니다.
* rel1 and 2: 2nd March 2019. Initial release.
* asm v0.6 and canu rel2 assembly: 28th May 2019. Assembly update.
* Hi-C data added: 25th July 2019. Data update.
* asm v0.6 alignments of rel2 added: 30th Aug 2019. Data Update
* rel3: 16th Sept 2019. Data update.
* chrX v0.7, canu 1.9 and flye 2.5 rel3 assembly: 24th Oct 2019. Assembly update.
* shasta rel3 assembly: 20th Dec 2019. Assembly update.
* chr8 v3, rel4 data: 21 Feb 2020. Data and assembly update.
* update rel3 partition names since some tars included more than a single partition. 16 Apr 2020.
* add CLR/HiFi mappings to chrX v0.7. 8 May 2020.
* update partitions 23,28,30,53,55 and add 227-231 (data was missing from upload). 13 May 2020. Data update.
* add rel5 guppy 3.6.0 data: 4 Jun 2020. Data update.
* add chr8 v9. Aug 26 2020. Assembly update.
* add v0.9/v1.0 genome releases. Sept 22 2020. Assembly update.
* add v0.9/v1.0 alignment files. Sept 29 2020. Assembly update.
* add new UW data. Oct 6 2020. Data update.
* add rna-seq data. Dec 4 2020. Data update.
* add repeat and telomere annotations for v1.0. Dec 17 2020. Assembly annotation update.
* v1.1 assembly and related files. May 7 2021. Assembly update.
* v2.0 assembly and related files. Dec 2 2022. Assembly and annotation update.
* 1KGP variant calls for all chromosomes. Jan. 3 2023. Annotation update.
* 1KGP and SGDP bam / vcf released publicly on [AnVIL_T2T_CHRY](https://anvil.terra.bio/#workspaces/anvil-datastorage/AnVIL_T2T_CHRY). May 23, 2023. Data Update.
* 1KGP AF release. Jul 6 2023. Annotation update.
* Curated RefSeq/Liftoff v5.1 release. Jul 6 2023. Annotation update.
* Curated RefSeq/Liftoff v5.2 release. Aug 23 2024. Protein coding gene annotation update.
* Link page for custom RepeatMasker library with T2T repeats. Nov 19 2024.