Si vous permettez aux utilisateurs de télécharger du contenu à votre site Web , attraper contenu plagié permet de réduire vos coûts de stockage articles volés et texte. Vous pouvez utiliser PHP pour évaluer le contenu et retourne un pourcentage qui représente le facteur de similarité pour deux URL . Cela vous permet de ramper sites Web et comparer deux URLs les uns avec les autres pour savoir si le contenu d'une page est similaire à la teneur d'une autre URL. Instructions
1
Ouvrez votre éditeur PHP et le fichier de code source que vous souhaitez utiliser pour analyser les URL et comparer le contenu similaire.
2
créer deux variables d'URL et mise en place une troisième variable qui renvoie le nombre de caractères qui correspondent dans les deux pages . Le code suivant définit les variables :
url1 $ =''; $ url2 =''; $ même = 0;
3
obtenir le contenu des deux URL. Le code suivant initialise et récupère le contenu pour deux URL :
$ boucle = curl_init (); curl_setopt ($ curl, CURLOPT_URL , url1 $ ) ; MATIÈRES1 $ = curl_exec ($ boucle ) ; curl_setopt ($ curl, CURLOPT_URL , $ url2 ) ; contents2 $ = curl_exec ($ boucle ) ;
4
comparer les deux chaînes de contenu d'URL. Le code suivant renvoie le nombre de caractères consécutifs de « MATIÈRES1 $ " qui correspondent à la teneur en " contents2 $ ":
$ semblable = strstr ( contents2 $ , MATIÈRES1 $ ) ; $ similarcount = strlen ($ similaire) ;
5
diviser la valeur "$ similarcount " par la longueur totale de la chaîne de la Ce numéro vous donne le facteur de similitude ou le pourcentage de contenu similaire qui correspond à " MATIÈRES1 $ . " à partir de votre URL d'origine . Utilisez le code suivant pour calculer le facteur :
$ factor = $ similarcount /( strlen ( $ contents2 ) ) ; echo $ facteur ;