مجموعة من مكتبات بايثون لتحليل ملفات المعلوماتية الحيوية، أو إجراء العمليات الحسابية المتعلقة بالتجميع والتعليقات التوضيحية وعلم الجينوم المقارن.
المؤلفون | هايباو تانغ (تانغايباو) |
فيفيك كريشناكومار (فيفيكريش) | |
شينغتان تشانغ (تانجيرزهانج) | |
وون تشيول يم (wyim-pgl) | |
بريد إلكتروني | [email protected] |
رخصة | بي إس دي |
نصيحة
تم نشر JCVI الآن في iMeta!
تانغ وآخرون. (2024) JCVI: مجموعة أدوات متعددة الاستخدامات لتحليل الجينوم المقارن. آي ميتا
الوحدات التالية متاحة كطرق عامة للتعامل مع المعلوماتية الحيوية.
خوارزميات
apps
التنسيقات
يدعم حاليًا تنسيق .ace
(phrap، cap3، وما إلى ذلك)، و .agp
(goldenpath)، وتنسيق .bed
، وإخراج .blast
، وتنسيق .btab
، وتنسيق .coords
(إخراج nucmer
)، وتنسيق .fasta
، وتنسيق .fastq
، و .fpc
التنسيق، تنسيق .gff
، تنسيق obo
(علم الوجود)، تنسيق .psl
(UCSC blat، GMAP، إلخ)، تنسيق .posmap
(إخراج مجمّع Celera)، تنسيق .sam
(قراءة التعيين)، تنسيق .contig
(تنسيق تجميع TIGR) ، إلخ.
الرسومات
utils
ثم هناك وحدات تحتوي على أساليب خاصة بالمجال.
حَشد
شرح
مقارنة
يرجى زيارة الويكي للتطبيقات الكاملة.
فيما يلي قائمة بحزم بايثون التابعة لجهات خارجية والتي تستخدمها بعض الإجراءات في المكتبة. هذه التبعيات ليست إلزامية حيث أنها تستخدم فقط من قبل عدد قليل من الوحدات.
هناك وحدات بايثون أخرى هنا وهناك في نصوص برمجية مختلفة. أفضل طريقة هي تثبيتها عبر pip install
عندما ترى ImportError
.
أسهل طريقة هي تثبيته عبر PyPI:
pip install jcvi
لتثبيت النسخة التطويرية:
pip install git+git://github.com/tanghaibao/jcvi.git
وبدلاً من ذلك، إذا كنت تريد التثبيت يدويًا:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
بالإضافة إلى ذلك، قد تطلب بعض الوحدات مواقع البرامج الخارجية، إذا تعذر العثور على الملحق في PATH
الخاص بك. البرامج الخارجية التي يتم استخدامها غالباً هي:
تحتوي معظم البرامج النصية في هذه الحزمة على إجراءات متعددة. لاستخدام مثال fasta
:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
ثم تحتاج إلى استخدام إجراء واحد، يمكنك فقط القيام بما يلي:
python -m jcvi.formats.fasta extract
سيخبرك هذا بالخيارات والحجج التي يتوقعها.
لا تتردد في التحقق من البرامج النصية الأخرى في الحزمة، فهي ليست مخصصة لـ FASTA فقط.