outils d'analyse de texte existent pour les administrateurs systèmes et les concepteurs de sites Web qui ont besoin de rechercher des quantités massives de texte pour déterminer la structure et l'organisation des ordinateurs, son système ou documents de suivi marquer . Son exécution rapides et SED sale et Perl construites autour des expressions régulières sont souvent assez simples pour les emplois , mais l'analyse de documents XML complexes exige un outil plus robuste, comme la bibliothèque ElementTree du langage de programmation Python . Choses que vous devez
Python 2.5 ou supérieur
Voir Plus Instructions
1
lancer une session de terminal ou , si vous préférez , ouvrez le Python environnement de développement intégré , connu sous le nom IDLE, qui peut être trouvé dans le répertoire Python dans votre lecteur C (Windows) ou le dossier Applications ( Mac). Vérifiez votre version de Python en tapant python -v à l'invite de ligne de commande. ElementTree fait partie de la bibliothèque standard de Python à partir de Python 2.5 . Si vous avez Python 2.4 ou une version antérieure , vous devez télécharger à partir de la page principale Python .
2
Déterminer le type de données codées dans un document XML en lisant la balise racine . Sur la ligne de l'invite de commande , la charge ElementTree et sa fonction d'analyse avec la commande suivante:
> de elementtree.ElementTree importation parse
3
situer le fichier que vous souhaitez analyser et prendre note de sa trajectoire par rapport à celle de l'interpréteur Python , ou simplement déplacer le fichier dans le dossier Documents . Définir une variable pour le fichier , de le lire dans la mémoire et découvrir le type de données que le fichier contient avec la commande suivante: > arbre = ElementTree ( file = filename) > elem = tree.getroot () > print elem < br >
Cela révélera le type de données encodées dans le document XML.