Le " jsoup « bibliothèque Java contient une fonction qui supprime une chaîne Java de toutes les balises HTML et convertit le contenu en texte brut. Cette bibliothèque est utile lorsque vous voulez télécharger sites web et site web HTML et évaluer seulement le texte dans votre programme. Le contenu est à gauche, de sorte que vous pouvez enregistrer le contenu d' une base de données ou stocker le contenu d' un fichier sur le serveur local . Instructions
1
clic droit sur le fichier Java que vous souhaitez modifier , puis sélectionnez " Ouvrir avec". Cliquez sur votre éditeur de l'applet Java dans la liste des programmes pour ouvrir le code .
< Br > 2
Situer la chaîne HTML que vous souhaitez analyser et créer la variable texte. Le code suivant crée une variable pour stocker le contenu HTML analysée :
document plainText = null;
3
analyser le HTML en texte brut et stocker le résultat de la " ; variables clair " . Le code suivant vous montre comment analyser les balises HTML :
plainText = Jsoup.parse (html) ;
Remplacer " html" avec votre propre chaîne HTML
.