The FASTA fil format anvendes til at lagre rækkefølgen data fra nukleinsyrer eller peptider . Flere sekvenser kan lagres i en enkelt fil , der kaldes en multi - FASTA fil . Sekvenser data formateres som en kort overskrift linje identificerer og den sekvens, data på en ny linje. Ved at placere sekvensen headere i en multi - FASTA fil med Perl kommandoer , er det muligt at udvinde de enkelte sekvenser fra en multi- FASTA fil . Instruktioner
1
Åbn en teksteditor med en tom tekstfil for at begynde et nyt Perl -program.
2
Begynd programmet ved at angive placeringen af Perl på dit system. Dette er normalt " /usr /bin /perl " eller " /usr /local /bin /perl. "
#! /Usr /bin /perl
3
Importer de " strenge " og " fil :: bASENAME " biblioteker . Den " File :: Grundnavn " bibliotek understøtter parsing af fil stier og udvidelser . Den " strenge " biblioteket begrænser usikre konstruktioner , kaster en fejl under kompilering snarere end på runtime .
Brug strictuse File :: Grundnavn
4
Læs argumentet variabel fra kommandolinjen . Dit program , bør du vælge at navngive det " fasta_extract.pl ", vil forvente at blive givet placeringen af en FASTA fil og parametre for at vælge sekvenser at udvinde. Den første parameter vil være en FASTA filnavn og den anden vil være en streng for mønstertilpasning . Argument variabel er adgang fra " $ ARGV " matrix
min $ fasta_file = $ ARGV [0 ] . Min $ pattern = $ ARGV [1],
5
Open FASTA fil ved hjælp af "open ()" funktionen . Du vil angive programmet for at holde op, hvis det ikke kan åbne filen ved hjælp af " die " kommando
åbne ( INPUT , $ fasta_file )