Algoritmo Fuzzy c Means - Algoritmos de agrupamiento particionales

4.3. Algoritmos de agrupamiento particionales

4.3.2. Algoritmo Fuzzy c Means

En el apartado anterior se presentó el algoritmo k-means que realiza una partición

dura o estricta del conjunto de datos, lo que garantiza que un dato solo pueda ser asignado a un único grupo. Junto con la descripción del algoritmo se presentó un ejemplo de agrupamiento de datos, en el que se apreció cómo se realiza la partición de un conjunto de datos en un espacio definido por el número de características. En ese ejemplo también se apreció uno de los principales inconvenientes del algoritmo, que está relacionado con la forma en que realiza la partición de los datos. Para solucionar ese inconveniente, una de las propuestas fue aplicar otro algoritmo que fuera capaz de generar otro tipo de información que fuera de ayuda en el proceso de agrupamiento. Uno de los algoritmos que cumple con esa característica es el algoritmoFuzzy c-Means(FCM).

El FCM inicialmente fue desarrollado en [Dunn, 1973] y después generalizado en [Bezdek,1981]. Una característica importante del FCM es que sus fundamentos se basan

4 4.5 5 5.5 6 6.5 7 7.5 8 1 2 3 4 5 6 7 Logitud de sepalo Logitud de petalo Iris virginica Iris versicolor Iris setosa Datos mal agrupados

Figura 4.9: Resultado del agrupamiento utilizando el k-means sobre la base de datos Iris así como la representación de los datos que fueron asignados incorrectamente en el proceso del agrupamiento.

en la teoría de conjuntos difusos (The fuzzy set theory), que fue propuesta por el profesor [Zadeh,1965]. El FCM, al igual que elk-means, es uno de los algoritmos de agrupamiento

particionales ampliamente conocido y utilizado en una gran variedad de aplicaciones. De acuerdo con el tipo de partición que realiza el FCM sobre un conjunto de datos en el proceso de agrupamiento, ésta permite que un dato pueda pertenecer a todos los grupos en los que se ha dividido un conjunto de datos, pero con un cierto valor o grado de pertenencia, que se conoce como grado de pertenencia difuso. Finalmente, la tarea de asignación de los datos hacia un grupo se realiza mediante el valor máximo del grado de pertenencia difuso. El funcionamiento del FCM se basa en la optimización de la función objetivo definida en la expresión (4.11)

Jf cm(X;U,V)= K X j=1 n X i=1 (uji)mkx(j)_i −vjk2, (4.11)

donde, uji representa la función de pertenencia del dato xi correspondiente al j-ésimo grupo con centrov.m∈ [1,∞] es el exponente que determina el grado difusidad de los grupos resultantes. El valor demes muy importante en el algoritmo FCM debido a que

afecta directamente a los centros. Cuandom=1, el FCM funciona de igual manera que al

el valor demen los que recomiendan que se utilicen valores en el intervalo 1,5≤m≤2,5 aunque generalmente siempre se utiliza el valor dem=2 [Palet al.,2005], [Pal & Bezdek,

1995]. Sin embargo es importante destacar que las recomendaciones de utilizar el valor demen ese intervalo se basan en análisis empíricos, es decir, que el uso del valor dem

en ese intervalo no garantiza que siempre se obtengan resultados satisfactorios. Por otro lado,kx_i−v_jk2es una medida de distancia de un datox_iy el centrov_jdelj-ésimogrupo.

La minimización de la función objetivo (4.11) es un problema de optimización que se resolvió en [Bezdek,1981] tomando en cuenta las siguientes consideraciones:

0≤uji≤1 (4.12) K X j=1 uji=1, ∀i=1,2, . . . ,n (4.13) n X i=1 uji>0, ∀j=1,2, . . . ,K (4.14) De acuerdo con estas restricciones, a los algoritmos de agrupamiento difusos también se les conoce como agrupamientos probabilísticos [Timm et al., 2004]. Considerando las

restricciones (4.13) y (4.14), dji =kx_i(j)−vjk > 0 y queX contenga por lo menosndatos diferentes, entonces Jf cmpude minimizarse solo sí,

uji= K X j=1 dji dji 2/(m−1)! −1 (4.15) 1≤ j≤K; 1≤i≤n vj= Pn i=1umjixi Pn i=1umji (4.16) 1≤ j≤K

A continuación se presenta la secuencia que sigue el algoritmo FCM para realizar el proceso del agrupamiento de datos:

Algoritmo FCM

Dado un conjunto de datosX, un númeroKde grupos, un valor de difusidadm>1 y un valor de toleranciaεen el rango ( 0,001≤ε≤0,01).

2. Calcular la distancia entre los datosxi y el centrovjde cada uno grupo.

3. Calcular el valor del grado de pertenencia difuso uji de los datos mediante la expresión (4.15).

4. Actualizar los centrosvjmediante la expresión (4.16).

5. Comprobar que se cumpla la siguiente condición: kvnew−voldk ≤ε,

Si se cumple esta condición, el algoritmo termina. En caso contrario, volver al paso

4.3.2.1. Ejemplo de agrupamiento de datos mediante FCM

Para verificar el funcionamiento del FCM, se aplica el algoritmo descrito en la subsec-

ción4.3.2a la base de datos Iris bajo las siguientes condiciones iniciales:

Número de particiones de los datosK=3.

Valores iniciales de los centros: seleccionados de forma aleatoria. Tipo de distancia: euclídea.

El valor de difusidadm=2.

El valor de toleranciaε=0,001

Total de datos: 150

Número de características: 2 (longitud de sépalo y longitud de pétalo).

Los resultados obtenidos del agrupamiento aplicando el FCM se pueden observar en la Figura 4.10. Del FCM se aprovechó la información obtenida del valor del grado de pertenencia difuso de los datos respecto a cada uno los grupos para asignar los datos a los grupos en los que se dividió el conjunto de datos. La asignación de un dato hacia un grupo se hizo a través del valor máximo del grado de pertenencia difuso de ese dato respecto a los grupos o centros que los representan.

La Figura 4.11, muestra el proceso de la actualización de los centros durante el agrupamiento aplicando el FCM a la base de datos Iris. De acuerdo con los resultados obtenidos en el proceso de agrupamiento a la base de datos Iris mediante el k-means

y los resultados obtenidos mediante el FCM, se observó que los resultados son muy parecidos. La diferencia principal entre estos algoritmos es que elk-means hace que cada

4 4.5 5 5.5 6 6.5 7 7.5 8 1 2 3 4 5 6 7 Logitud de sepalo Logitud de petalo

Figura 4.10: Resultados del proceso de agrupamiento utilizando el FCM aplicado a la base de datos Iris.

4 4.5 5 5.5 6 6.5 7 7.5 8 1 2 3 4 5 6 7 Logitud de sepalo Logitud de petalo

Figura 4.11: Representación de la actualización de los centros durante el proceso de agrupamiento de la base de datos Iris aplicando el FCM.

dato pertenezca a un solo grupo, mientras que el FCM permite una pertenencia parcial de un dato a más de un grupo a través del valor del grado de pertenencia.

En la Figura 4.12 se puede apreciar el grado de pertenencia difuso uji obtenido para cada uno de los datos respecto al centro de cada grupo. Continuando con el análisis del resultado del agrupamiento aplicando el FCM, se observa claramente que los datos del grupo correspondiente a Iris setosa ( ), están perfectamente agrupados. Esto se debe a que este grupo esta disjunto del resto. En la Figura4.12, se puede observar como varía el valor del grado de pertenencia difuso de los datos de este grupo con respecto al centro de cada uno de los grupos. Con respecto al centro de su mismo grupo, la variación es muy pequeña, es decir, tienen un grado de pertenencia alto. Por otro lado, el color de los datos que están más alejados del centro del grupo tiende a oscurecer porque su grado de pertenencia empieza a disminuir. El valor del grado de pertenencia de los datos de este grupo respecto a los centros del resto de los grupos, se puede apreciar que es muy pequeño o aproximadamente 0. El problema continúa en los grupos donde los datos están solapados, Iris virginica ( ) e Iris versicolor ( ). En estos grupos, los datos que están más cercanos a su centro, tienen un valor de grado de pertenencia difuso mayor. En la Figura4.12se puede observar como el color es mucho más claro cuanto más cercanos esten los datos al centro del grupo y como ese color se oscurece en el caso de los datos más alejados de dichos centro. En los datos que se encuentran en la frontera de ambos grupos, entre los que se situan los datos solapados, el valor del grado de pertenencia hacia ambos centros de los grupos es similar. El efecto visual que se aprecia es como el color se va difuminando a medida que el grado de pertenencia disminuye. La idea de representar el valor del grado de pertenencia difuso de los datos a través de un color tiene por objetivo apreciar la ventaja que tiene el FCM sobre elk-means. Esta radica en que el FCM permite que un dato pertenezca a más de un grupo con un cierto grado de pertenencia y aprovechar este valor para realizar la asignación de los datos hacia un grupo específico.

Finalmente, en la Figura4.13se puede observar el número de datos mal agrupados en la base de datos Iris mediante el algoritmo FCM. La diferencia de errores de agrupamiento entre elk-means y el FCM fue de un error.

In document Aplicación de técnicas de inteligencia artificial para contribuir en la detección de microcalcificaciones en mamografía digitalizada (página 115-120)