FASTA er en tekst -baseret format , der anvendes i bioinformatik til at repræsentere sekvenser , især dem af nukleotider og peptider med basepar repræsenteret ved et enkelt bogstav. En FASTA sekvens består af en enkelt -line beskrivelse, kendetegnet ved en "større end" symbolet på den første linje , efterfulgt af en multi- line nukleotid eller peptid -sekvensen . Du kan udtrække flere sekvenser fra en FASTA -fil ved hjælp af specielle moduler, eller add-ons til programmeringssproget Perl , kendt som BioPerl , der er specielt udviklet til at håndtere FASTA format. Du kan også manuelt kode en Perl script til at matche mønstre i en fil eller bruge andre tilgængelige værktøjer til at udtrække FASTA sekvenser. Ting du skal
FASTA fil
Perl editor
BioPerl
ActiveState Perl
Biopieces
Vis Flere Instruktioner
1
Start din Perl editor ansøgning. Du kan bruge en simpel teksteditor som Notesblok . Du bliver nødt til at gemme filen med et " . Pl " udvidelse for at indikere , at det er et Perl -program.
2
Uddrag en sekvens fra en multiple- FASTA fil ved at udføre pattern- matching i Perl, ved at skrive følgende kode i editoren : Hej
# /usr /bin /perlmy $ fasta_seq = skift; min $ sekvens = skift; min $ workfile = ` cat $ fasta_seq ` , min ( $ fasta_seq ) =! $ workfile = ~ /( > $ sekvens [^ >] +) /s; print $ fasta_seq ,
3
Uddrag sekvenserne fra FASTA fil ved hjælp BioPerl . Du kan udtrække flere sekvenser ved at skrive følgende kode i editoren : Hej
# /bin /perl -w
brug Bio :: SeqIO ,
$ sequenceobject = Bio ! :: SeqIO -> new ( -file => " fasta_file_path " - format = > " fasta ")
Bio :: SeqIO modul giver problemfri sekvens forarbejdning. Du kan hente en enkelt sekvens med følgende erklæring : Hej
$ retrievedsequence = $ sequenceobject -> next_seq ,
Du kan sløjfe gennem objektet og hente flere sekvenser , som følger : Hej
while ( $ retrievedsequence = $ sequenceobject -> next_seq ) { print $ retrievedsequence -> seq , "\\ n" ;}
4
Uddrag sekvenser fra FASTA fil ved hjælp af " Biopieces " applikationen, som er ramme med et sæt af modulære værktøjer til at manipulere bioinformatik data . Du kører din Biopieces kommando på kommandolinjen
read_fasta -i fasta_file