La page Web que vous voyez dans votre navigateur ne vous montre pas tout sur la page . Dans les coulisses, votre navigateur charge en permanence le contenu qui contient du code HTML cryptique . Ce code est constitué de "tags" comme "
. " Cette balise indique au navigateur d' afficher un paragraphe sur la page Web. En utilisant C # , le langage de développement de Microsoft qui fonctionne avec Visual Studio , vous pouvez convertir le code HTML de n'importe quel site au texte et supprimer ces balises. Instructions
1
Lancement de Microsoft Visual Studio. Cliquez sur «Fichier », puis cliquez sur "Nouveau projet ".
2
Cliquez sur " Visual C #" pour le mettre en surbrillance , puis double -cliquez sur " Application Windows Forms . " Visual Studio va créer un nouveau projet et afficher un formulaire vide dans la fenêtre du concepteur .
3
Cliquez sur "Voir ", puis cliquez sur " Boîte à outils " pour ouvrir la boîte à outils . Faites défiler vers le bas pour le contrôle WebBrowser , puis double- cliquez dessus. Ce contrôle apparaît sur le formulaire. Les noms de Visual Studio il " webBrowser1 . "
4
Appuyez sur " F4 ". La fenêtre " Propriétés " s'ouvre. Repérez l'icône « Lightning Bolt » en haut de la fenêtre. L'icône en forme d'éclair . Cliquez sur l'icône . La fenêtre «Propriétés» affiche une liste des événements que vous pouvez joindre à la commande " webBrowser1 " .
5
localiser l'élément " DocumentCompleted " dans la liste et double -cliquez dessus. Une fenêtre de code s'ouvre et affiche le code suivant :
private void webBrowser1_DocumentCompleted (object sender, WebBrowserDocumentCompletedEventArgs e)
{
}
Ce code s'exécute chaque fois que le contrôle " webBrowser1 " fin du chargement d'une page Web
6
modifier ce code afin qu'il ressemble à ceci: .
private void webBrowser1_DocumentCompleted (object sender, WebBrowserDocumentCompletedEventArgs e)
{
HtmlDocument doc = webBrowser1.Document ;
chaîne websiteText = doc.Body.InnerText ;
MessageBox.Show ( websiteText ) ;
< p >}
Après chargement d'une page Web , ce code attrape le texte de la page. Il affiche ensuite le texte dans une boîte de message pop-up .
7
Faites un clic droit n'importe où dans la fenêtre de code , puis cliquez sur "View Designer. " Le formulaire réapparaîtra dans la fenêtre du concepteur .
8
Double -cliquez sur la barre de titre de cette forme. Une autre fenêtre de code s'ouvre et affiche la méthode "Charger" du formulaire. Le code de cette méthode s'exécute lorsque le formulaire est chargé . Le code apparaît comme indiqué ci-dessous:
private void Form1_Load (object sender, EventArgs e) {
}
9
Remplacez ce code avec le code suivant :
private void Form1_Load (object sender, EventArgs e) {
site de la chaîne de
= " http://www.whitehouse.gov " ;
WebBrowser1.Navigate (site web) ;
}
Ce code provoque la commande " webBrowser1 " pour naviguer sur le site URL stockée dans la variable nommée « site ». Dans cet exemple, l'URL est " http://www.whitehouse.gov . "
10
Appuyez sur " F5 " pour exécuter le code. Le formulaire sera charger et exécuter le code " Form1_Load " . Ce code provoque la commande " webBrowser1 " pour naviguer sur le site " whitehouse.gov " . Le code " DocumentCompleted " exécutera après que le navigateur finit de charger ce site. Une boîte de dialogue pop-up va vous montrer le texte de ce site sans les balises HTML .