Le format de fichier FASTA est utilisé pour stocker les données de séquence d'acides nucléiques ou de peptides . Plusieurs séquences peuvent être stockés dans un seul fichier, appelé fichier multi- FASTA . Les données de séquences est formatée en tant que ligne de court -tête d'identification de la séquence et les données de séquence suivant une nouvelle ligne. En plaçant les en-têtes de séquence dans un fichier multi- FASTA de commandes Perl , il est possible d'extraire les séquences individuelles à partir d'un fichier multi- FASTA . Instructions
1
Ouvrez un éditeur de texte avec un fichier texte vierge pour commencer un nouveau programme Perl.
2
commencer le programme en spécifiant l'emplacement de Perl sur votre système. C'est normalement "/usr /bin /perl " ou "/usr /local /bin /perl . "
#! /Usr /bin /perl
3
Importer le "strict " et " File :: baseName « bibliothèques . Le ":: Basename fichier " bibliothèque prend en charge l'analyse des chemins de fichiers et les extensions . La bibliothèque "strict" restreint constructions peu sûres , jetant une erreur lors de la compilation plutôt qu'à l'exécution.
Utiliser le fichier de strictuse :: Basename
4
lire la variable d'arguments de ligne de commande . Votre programme , si vous choisissez de le nommer " fasta_extract.pl , " va attendre d'avoir l' emplacement d'un fichier et les paramètres FASTA de choisir des séquences à extraire. Le premier paramètre sera le nom du fichier FASTA et la seconde sera une chaîne de pattern matching . Argument variable sont accessibles à partir du tableau "$ ARGV "
mon fasta_file $ = $ ARGV [0]; . My $ pattern = $ argv [1] ;
5
ouverte le fichier FASTA en utilisant la fonction " open () " . Vous pourrez spécifier le programme à quitter si elle ne peut pas ouvrir le fichier en utilisant la commande " die"
ouvert (INPUT , fasta_file $ )