Python est un langage de programmation orienté objet open-source optimisé pour la création d'applications Web dynamiques. Lors de la programmation en Python, vous devrez peut-être séparer formatage HTML à partir du code Python. Par exemple, un utilisateur peut entrer dans une page Web dans un champ de données , vous obligeant à dépouiller les balises HTML pour stocker les données textuelles. Pour supprimer les balises HTML dans une chaîne , utilisez le module intégré d'expression régulière Python , " regex". Instructions
1
Ouvrez votre éditeur Python .
2
Chargez le module expression régulière en tapant la commande suivante :
import re
3
définir une fonction pour supprimer toutes les balises HTML . Par exemple, tapez la commande suivante :
def delete_html (données) :
4
séparer les éléments de code HTML en utilisant la fonction " re.compile " pour compiler les modèles d'expressions régulières dans un objet que vous pouvez utiliser comme modèle de comparaison . Reprenons l'exemple , tapez ceci:
htmlPattern = re.compile (r ' < . ? * >' )
Dans cet exemple, l'attribut " re.compile " raconte Python à rechercher la chaîne « <.. >" qui signifie le début et la fin des balises HTML.
le qualificatif " . * ? " raconte Python pour correspondre uniquement les tags. Sans le qualificatif , Python retourne la chaîne "
subhead
"; avec le qualificatif , les rendements Python " .
Et
"
5
Remplacer un espace pour tout le code HTML en utilisant la fonction "sub" . Reprenons l'exemple , tapez la commande suivante :
retour htmlPattern.sub ('' , data)
Dans ce cas, Python bandes sur le code HTML et le remplace par un espace vide. À ce stade, selon la façon dont vous souhaitez structurer les données , vous pouvez utiliser la fonction " strip" de la chaîne à supprimer les espaces vides ou utiliser des expressions régulières , comme "\\ s + " pour supprimer les espaces supplémentaires . < Br >