FASTA est un format basé sur du texte utilisé en bioinformatique pour représenter les séquences , en particulier ceux des nucléotides et des peptides , des paires de bases représentée par une seule lettre. Une séquence FASTA compose d' une description de ligne individuelle , qui se distingue par un "supérieur à" symbole sur la première ligne , suivi par une séquence nucléotidique ou d'un peptide à plusieurs lignes . Vous pouvez extraire plusieurs séquences à partir d'un fichier FASTA en utilisant des modules spéciaux ou des add-ons pour le langage de programmation Perl, connu sous le nom BioPerl , qui ont été spécialement mis au point pour gérer le format FASTA . Vous pouvez également coder manuellement un script Perl pour trouver des éléments dans un fichier ou d'utiliser d'autres outils pour extraire des séquences FASTA . Choses que vous devez
FASTA fichier
Perl éditeur
BioPerl
ActiveState Perl
Biopieces
Afficher plus Instructions
1
Lancez votre Perl demande de l'éditeur. Vous pouvez utiliser un simple éditeur de texte comme Bloc-notes . Vous aurez besoin d'enregistrer le fichier avec une extension ". Pl" pour indiquer qu'il s'agit d'un programme Perl.
2
extraire une séquence à partir d'un fichier de plusieurs FASTA en effectuant pattern-matching en Perl, en tapant le code suivant dans l'éditeur:
# /usr /bin /perlmy fasta_seq $ = shift; my $ sequence = shift; my $ workfile = `cat fasta_seq $` , mon ( fasta_seq $) = ! workfile $ = ~ /(> $ sequence [^ >] +) /s; print $ fasta_seq ;
3
Extrait les séquences du fichier FASTA utilisant BioPerl . Vous pouvez extraire plusieurs séquences en tapant le code suivant dans l'éditeur:
# /bin /perl -w
utilisation Bio :: SeqIO ;
$ sequenceobject = Bio ! :: SeqIO -> new ( -file = > " fasta_file_path " , format => " FASTA ");
Le Bio :: Module SeqIO assure le traitement de la séquence sans faille. Vous pouvez récupérer une seule séquence en utilisant la déclaration suivante:
$ retrievedsequence = $ sequenceobject -> next_seq ;
Vous pouvez parcourir l'objet et récupérer des séquences multiples , comme suit :
while ($ retrievedsequence = $ sequenceobject -> next_seq ) {print $ retrievedsequence -> seq, "\\ n ";}
4
Extrait les séquences du fichier FASTA l'aide de la application " Biopieces ", qui est cadre contenant un ensemble d'outils modulaires de manipulation de données bioinformatiques . Vous exécutez votre commande Biopieces à la ligne de commande
read_fasta -i fasta_file