MATLAB est un progiciel standard de l'industrie pour l'analyse d'une série de données techniques et scientifiques . Un objectif sous-jacent de nombreuses méthodes d'analyse consiste à reconnaître les tendances dans les données sous-jacentes. Souvent, il s'agit de diviser les données en groupes distincts ou des groupes . Un algorithme de classification fréquemment utilisée est floue c- means , développé par Dunn en 1973 et amélioré par Bezdek en 1981. Présentation
floue c- means , ou FCM , les points de données peut appartenir à plus d'un cluster. Un algorithme itératif minimise une fonction objectif pour trouver les membres de grappe optimale pour chaque point dans les données étant regroupées . L'itération de l'algorithme de clustering s'arrête lorsque la fonction objectif atteint un minimum local ou d'un point de selle. FCM peut être combiné avec d'autres algorithmes de recherche afin de garantir un résultat optimal
Objectif Fonction
La fonction FCM J_M objectif est égale à: .
< P > somme (i = 1 ... N) [ somme ( j = 1 ... C) [ u_ij ^ m norme ( x_i - c_j ) ^ 2 ]]
La fonction objective est considérée par rapport aux valeurs réelles de m entre 1 et l'infini positif . La valeur u_ij est la composition du point de x_i données dans le cluster j , centré sur c_j
algorithme
L'algorithme d'optimisation FCM comporte quatre étapes . : Photos
1 . Initialisation de la matrice U_0 = [ u_ij ] .2 . Calculer la grappe centres C_k = [ c_j ] de U_k , où k est un nombre entier égal itération de la algorithm.3 . Mise à jour U_ ( k +1 ) à partir du nouveau C_k.4 . Calculer la valeur de J_K . Si le nouvel arrêt causé J_K d'augmenter , arrêtez , sinon retourne à l'étape 2 .
MATLAB utilisation
MATLAB œuvre floue c- means dans la fonction FCM () . La boîte à outils de la logique floue est nécessaire pour l'utilisation de la fonction de la FCM (). La syntaxe d'appel est:
[ centres , U, objFun ] = FCM ( my_data , n_clusters ) ;
La variable my_data sont les données d'entrée, où chaque ligne représente un point de données. La variable n_clusters est le nombre de clusters pour regrouper les données. La sortie des centres est la matrice des centres de cluster optimales . U est la partition floue optimale ou matrice d'adhésion. La variable objFun est la valeur finale de la fonction objectif.