Le langage VB.NET comprend une classe d'analyse HTML que vous utilisez pour extraire les valeurs HTML des pages Web . Utiliser les données analysées pour évaluer le contenu d'un site et renvoyer les informations à un utilisateur ou à stocker l'information extraite à une base de données . La classe d'analyse HTML vous permet de lire le contenu du texte ou des valeurs des éléments de formulaire tels que des zones de texte ou des listes déroulantes . Instructions
1
Ouvrez le logiciel Visual Studio dans le groupe de programmes " Microsoft . NET Framework " . Ouvrez votre projet VB après charges de Visual Studio .
Clic droit sur le nom du projet dans le panneau " Solution Explorer" et sélectionnez "Propriétés". Cliquez sur l'onglet " . NET" 2, puis double- cliquez sur le fichier DLL nommée " Microsoft.mshtml . " Cette DLL contient les classes pour analyser HTML.
3
Ajouter la bibliothèque dans le fichier de code VB vous souhaitez utiliser pour analyser le code HTML . Copiez et collez l'instruction VB suivante au début de votre fichier de code :
importations mshtml
4
instancier la classe " HTMLDocument " . Cette classe importe le texte HTML que vous avez importé à partir d'une page Web ou une chaîne et met en place les informations pour l'analyse . Ajoutez le code suivant à votre fonction d'analyse :
ParseHTML As IHTMLDocument2 = New HTMLDocumentClass () HTMLData As IHTMLElementCollection = parseHTML.body.all
5
récupérer le contenu de la chaîne HTML . Par exemple , le code suivant récupère la valeur d'une zone de texte HTML dans une page Web:
tbData As IHTMLInputElement = allElements.item ( " TextBox1 " ) MsgBox " Ce sont les données dans la zone de texte : "& tbData.Value