next up previous
Siguiente: Cálculo proposicional difuso Un nivel arriba: Introducción a la lógica Anterior: Introducción

Conjuntos difusos

De manera intuitiva se tiene el concepto de conjunto como una colección bien definida de elementos, en la que es posible determinar para un objeto cualquiera, en un universo dado, si acaso éste pertenece o no al conjunto. La decisión, naturalmente, es ``sí pertenece'' o bien ``no pertenece''. Por ejemplo, consideremos como universo a la población económicamente activa1 en México, es decir, al conjunto formado por las personas residentes en ese país con una edad entre 18 años (cumplidos) y 66 años (por cumplir). Consideremos un mes cualquiera, digamos, diciembre de 2000 (y no porque entonces hubiera habido un cambio, sino porque era ése el último mes del siglo XX). El conjunto de personas empleadas en México en ese mes, podríamos pensar, está bien determinado: una persona en nuestro universo que entonces hubiera vendido su fuerza de trabajo, bajo un contrato de empleo, a una empresa legalmente constituída, sin duda alguna era una persona empleada, y alguien que no tuvo salario alguno en ese mes y no estuvo vinculado a ningún patrón bajo una relación contractual, pues no era empleado. El lector observará la sobresimplificación del criterio de pertenencia enunciado. En efecto, ni falta el funcionario de la Secretaría del Trabajo que dirá: ``Todo ciudadano que haya trabajado al menos una hora en ese mes y por eso haya recibido un pago, es un empleado'', y tampoco faltará quien diga: ``Qué empleo? No hallé trabajo en todo el 2000 y sólo en su último mes, mi primo me empleó a destajo para envolver regalos en su tienda: Yo no soy ningún empleado''. La noción intuitiva de conjunto puede, así, ser muy estrecha. En un conjunto difuso a cada elemento del universo se le asocia un grado de pertenencia, que es un número entre 0 y 1, a ese conjunto. Un conjunto difuso es pues una correspondencia (o función) que a cada elemento del universo le asocia su grado de pertenencia. Enunciada así esta definición parece ser cíclica, mas no lo es: un conjunto difuso es una función cuyo dominio es el universo y cuyo contradominio es el intervalo $[0,1]$. En tanto el grado de pertenencia sea más cercano a 1 tanto más estará el elemento en el conjunto y en tanto el grado de pertenencia sea más cercano a 0 tanto menos estará el elemento en el conjunto. Por ejemplo, los siguientes son conjuntos difusos, dados como funciones $g$, que pueden abarcar el concepto de empleado:
De estadística optimista
``Uno es empleado si trabaja al menos una hora, bajo pago, en un mes.'' Para cada persona $x$ sea $t(x)$ el número de horas trabajadas bajo pago el mes en cuestión. Hagamos $g_E(x)=1$ si $t(x)\geq 1$ y $g_E(x)=0$ si $t(x)= 0$.
De porcentaje en tiempo
``Uno es empleado en proporción al tiempo trabajado.'' Supongamos que el total de horas posibles a ser laboradas en un mes sea $40\times 4=160$. Hagamos $g_{PT}(x)$ igual al valor mínimo que resulte de comparar 1 con la razón $t(x)/160$.
De porcentaje en ingreso
``Uno es empleado en proporción con que pueda adquirir los bienes de consumo necesarios para su familia.'' Denotemos por $p(x)$ a la paga que recibe el ciudadano $x$ por hora de su trabajo. Supongamos que la ``canasta básica'' la evalúa la Secretaría de Comercio en $M$ pesos al mes, por persona, y que cada trabajador tiene en promedio 2 dependientes económicos, además de él mismo. El salario del trabajador ha de mantener a 3 personas. Hagamos $g_{PI}(x)$ igual al valor mínimo que resulte de comparar 1 con la razón $t(x)p(x)/(3M)$.
Ponderación de tiempo e ingreso
``Uno es empleado cuando trabaje mucho aunque no coma o no tenga apuros económicos aunque no trabaje.'' Sean $a$ y $b$ dos coeficientes entre 0 y 1 tales que $a+b=1$. Hagamos $g_{Pon}(x) = a\cdot g_{PT}(x)+ b\cdot g_{PI}(x)$.
El grado de pertenencia $g_D$ a un conjunto difuso $D$ puede ser interpretado de diversas maneras, en contextos diferentes. Las siguientes son sólo algunas posibles interpretaciones:
Proporción en la que se posee un atributo
Si consideramos que $D$ es un atributo, entonces para cada objeto $x$, $100\cdot g_D(x)$ es el ``porcentaje'' con el que $x$ posee $D$.
Probabilidad
Si consideramos que $D$ es un evento probabilista (una variable aleatoria, según se dice en la Teoría de la Probabilidad, con valores en el conjunto de partes del universo), entonces para cada objeto $x$, $g_D(x)$ es la probabilidad de que $x$ ocurra en el evento $D$, es decir, $g_D(x) = \mbox{Prob}(x\in D)$.
Medida de creencia
Si consideramos que $D$ es un atributo, entonces para cada objeto $x$, $g_D(x)$ es un grado con el que se cree que $x$ posee el atributo $D$.
Por ejemplo, $g_{PT}$, definida anteriormente, es ciertamente una proporción del tiempo laborado. $g_{Pon} = a\cdot g_{PT} + b\cdot g_{PI}$ es una medida de creencia (y la selección de pesos $a$ y $b$ sesga el énfasis que se le quiera dar al tiempo laborado o al ingreso obtenido). Para ilustrar la connotación probabilista, consideremos el conjunto difuso $D=\{'\mbox{empleados felices}'\}$. Entonces, para cada $x$, $g_D(x)$ sería una probabilidad de que $x$ sea feliz. Un conjunto, en el sentido intuitivo, posee una función característica: En cada elemento, la característica vale 1 (``'') si el elemento está en el conjunto y vale 0 (``no'') en caso contrario. En consecuencia, todo conjunto intuitivo es en sí un conjunto difuso. Recíprocamente, dado un conjunto difuso $D$ con función de pertenencia $g_D$, se puede fijar un umbral $z$ entre 0 y 1, inclusive, para formar el conjunto, en el sentido intuitivo, de elementos con grado de pertenencia al menos $z$: $x$ está en $D_z$ si y sólo si $g_D(x)\geq z$. Diremos que $D_z$ es el corte a altura $z$ de $D$. El corte a altura 0 es entonces todo el universo, en tanto que el corte a altura 1 consta de los elementos con valor de pertenencia 1 al conjunto. Es bien sabido que los conjuntos intuitivos pueden combinarse mediante las operaciones, llamadas booleanas, de complemento, unión e intersección: El complemento de un conjunto está formado por los elementos del universo que no están en él, la unión de dos conjuntos la forman los elementos que están en uno o en otro conjunto y la intersección la conforman los elementos en ambos conjuntos. Si nos referimos a funciones características, se tiene que la característica del complemento posee el valor opuesto al de la característica del conjunto, la característica de la unión de dos conjuntos vale uno si al menos una de las características de los conjuntos vale uno, y la característica de la intersección vale uno si las características de ambos conjuntos valen uno. Esto puede servir de motivación para definir operadores de composición de conjuntos difusos. De hecho, para cada una de las interpretaciones descritas arriba se puede introducir una colección particular de operadores. Veamos en cada caso operaciones de complemento, unión e intersección:
Proporción en la que se posee un atributo
En este caso, los grados de pertenencia se interpretan como proporciones, por lo cual se definen las operaciones como sigue:
Complemento
El complemento de un conjunto difuso $D$ asigna a cada objeto $x$ el grado ``complementario'': $g_{\overline{D}}(x)=1-g_D(x)$.
Intersección
La intersección de dos conjuntos difusos $D$, $E$ asocia el mínimo de los grados de pertenencia, es decir, para cada objeto $x$: $g_{D\cap E}(x)=\mbox{Min}(g_D(x),g_E(x))$.
Unión
De manera similar, la unión de dos conjuntos difusos $D$, $E$ asocia el máximo de los grados de pertenencia, es decir, para cada objeto $x$: $g_{D\cup E}(x)=\mbox{Max}(g_D(x),g_E(x))$.
Probabilidad
Vistos los grados de pertenencia como probabilidades, se tiene:
Complemento
La probabilidad del complemento de un conjunto difuso $D$ es la probabilidad ``complementaria'': $g_{\overline{D}}(x)=1-g_D(x)$.
Intersección
Ésta es la probabilidad de la ocurrencia simultánea de dos eventos. La intersección está muy ligada al concepto de probabilidad condicional. Si denotamos por $\mbox{Prob}(A\vert B)$ a la probabilidad de que ``ocurra $A$ dado que ha ocurrido $B$'', entonces por un célebre resultado de la Teoría de la Probabilidad, llamado el Teorema de Bayes, ha de valer la identidad $\mbox{Prob}(A\vert B)\mbox{Prob}(B) = \mbox{Prob}(B\vert A)\mbox{Prob}(A)$. El valor común en esta igualdad es, precisamente, la probabilidad de la intersección $\mbox{Prob}(A\cap B)$. Así pues, teniendo una función $d$ que a dos eventos cualesquiera $A$, $B$ les asocia una ``densidad de probabilidad condicional'' $d(A\vert B)$ tal que a cada objeto $x$ le asocia un valor $d(A\vert B)(x)$ de manera que
\begin{displaymath}
d(A\vert B)(x)\cdot g_B(x)=d(B\vert A)(x)\cdot g_A(x)
\end{displaymath} (1)

entonces para dos conjuntos difusos cualesquiera $D$, $E$ se puede definir el grado de pertenencia a la intersección como $g_{D\cap E}(x)=d(D\vert E)(x)\cdot g_E(x)$. Una densidad de probabilidad condicional que satisfaga la ec. (1) podría definirse haciendo, por ejemplo, que para cualesquiera dos eventos distintos e ``independientes'' $A$ y $B$: $d(A\vert B)(x)=g_A(x)$. Evidentemente, la noción de independencia dependerá del universo en cuestión. Por ejemplo, si consideramos a la población económicamente activa, el conjunto $A$ ``de profesores que enseñan en instituciones de educación superior'' y el conjunto $B$ de ``empleados con salarios altos'' pueden ser considerados independientes pues ciertamente se dan los casos de profesores universitarios con bajos salarios, de profesores universitarios con altos salarios, de empleados con altos salarios que no son profesores y de empleados con bajos salarios que no son profesores. Así pues, para cualquier ciudadano $x$, $d(A\vert B)(x)=g_A(x)$ y $d(B\vert A)(x)=g_B(x)$, es decir, se cumple la relación (1). Vemos pues que para definir la operación de intersección, basta tener un operador de ``probabilidad condicional''. De manera recíproca, si se tiene definida de alguna manera al operador de intersección, entonces siguiendo el teorema de Bayes se puede definir un operador de ``probabilidad condicional''. Por tanto, las nociones de intersección (probabilista) de conjuntos difusos y la de probabilidad condicional son reducibles una a la otra.
Unión
La probabilidad de que ocurra uno u otro evento es la probabilidad de uno, más la probabilidad del otro, menos la probabilidad de que ocurran ambos eventos: $g_{D\cup E}(x)=g_D(x) + g_E(x) - g_{D\cap E}(x)$.
Medida de creencia
Las siguientes funciones pueden parecer definidas de manera arbitraria, pero ciertamente tienen una motivación intuitiva:
Complemento
Como en los casos anteriores, se hace: $g_{\overline{D}}(x)=1-g_D(x)$.
Intersección
Dados dos conjuntos difusos $A$, $B$ con sendos grados de pertenencia $g_A$ y $g_B$, si para un punto dado $x$, la suma $g_A(x)+g_B(x)$ es menor que $1$ entonces descartamos que ese punto sea común a ambos conjuntos, es decir, no debe estar ``en la intersección''. En otro caso, se toma como grado de pertenencia, a la intersección, a la razón de la diferencia $[g_A(x)+g_B(x)]-1$ entre el máximo de $g_A(x)$ y $g_B(x)$. En símbolos

\begin{displaymath}g_{A\cap B}(x) = \left\{\begin{array}{cl}
0 &\mbox{ si }g_A(...
...(x))} &\mbox{ si }g_A(x)+g_B(x)\geq 1 %%\\
\end{array}\right.\end{displaymath}

Unión
Dados dos conjuntos difusos $A$, $B$ con sendos grados de pertenencia $g_A$ y $g_B$, si para un punto dado $x$, la suma $g_A(x)+g_B(x)$ es mayor que $1$ entonces convenimos en que ese punto está ``en la unión''. En otro caso, se toma como grado de pertenencia, a la unión, al máximo de las razones $g_A(x)/(1-g_B(x))$ y $g_B(x)/(1-g_A(x))$. En símbolos

\begin{displaymath}g_{A\cup B}(x) = \left\{\begin{array}{cl}
1 &\mbox{ si }g_A(...
...}\right) &\mbox{ si }g_A(x)+g_B(x)< 1 %%\\
\end{array}\right.\end{displaymath}

En la figura 1 mostramos las gráficas correspondientes a estos operadores de interseccón y de unión.

Figura 1: Grados de pertenencia, según el enfoque de ``medida de creencia'', de (a) intersección, $g_{A\cap B}(x)$, y (b) unión, $g_{A\cup B}(x)$, en términos de los grados de creencia $g_A(x)$ y $g_B(x)$.
\begin{figure}
\begin{center}
\setlength{\unitlength}{1cm}
\begin{tabular}{cc...
...psi}\end{picture}\par\\
(a) & (b)
\end{tabular}
\end{center}
\end{figure}

A partir de operaciones de complemento, unión e intersección, se obtienen conjuntos difusos ``más complejos'' como resultado de aplicar sucesivamente estos operadores partiendo de una colección de conjuntos difusos, digamos, ``primitivos''. Para hablar con un poco de más precisión: Si $A_1, \ldots, A_n$ son conjuntos difusos primitivos, para operadores de complemento, de intersección y de unión fijos, la clase de conjuntos definibles, partiendo de los conjuntos primitivos, son los que se obtienen mediante las reglas siguientes:
  1. Todo conjunto primitivo es definible.
  2. El complemento de todo definible es, a su vez, definible.
  3. La intersección y la unión de dos conjuntos definibles, son, a su vez, definibles, también.
Así, por ejemplo, si $A_1,A_2,A_3$ son tres conjuntos difusos primitivos, los siguientes son meros ejemplos de conjuntos difusos definibles a partir de ellos:

\begin{eqnarray*}
& & \overline{A_2} \\
& & \overline{A_1\cap\overline{A_2}}\...
...erline{A_2}\cup A_3)\cap (A_1\cup A_2\cup \overline{A_3}) %%\\
\end{eqnarray*}



Denotemos a un conjunto definible como $F(A_1, \ldots, A_n)$, sólo para enfatizar el hecho de que se obtiene de los conjuntos $A_i$. Cada tal conjunto tiene asociada una función $g_{F(A_1, \ldots, A_n)}$ que a cada objeto $x$ del universo le asocia un grado de pertenencia $g_{F(A_1, \ldots, A_n)}(x)$ al conjunto definible, la cual, naturalmente, se escribe como una composición de los grados de pertenencia de los conjuntos primitivos. Existen dos problemas fundamentales en cualquier teoría de conjuntos difusos:

Problema 2.1 (de deducción)   Para un conjunto definible $F(A_1, \ldots, A_n)$ y un objeto dado $x$, si se sabe que cada grado de pertenencia $g_{A_i}(x)$ cae en un intervalo $[a_i,b_i]$, entonces se ha de estimar en qué intervalo $I$ ha de caer el grado de pertenencia $g_{F(A_1, \ldots, A_n)}(x)$.

Utilizando una jerga técnica actual, podemos decir que éste es un problema de tipo ``hacia adelante'': conociendo los valores iniciales $g_{A_i}(x)$, mediante las funciones de los conectivos de complemento, unión e intersección, se calcula consecutivamente los grados de pertenencia de los conjuntos involucrados hasta obtener el valor $g_{F(A_1, \ldots, A_n)}(x)$. En etapas de aplicación, un resolvedor de este problema se ve como un agente que realiza ``pronósticos'': ``Si los valores iniciales son de tales características, los finales han de ser de tales cuales''.

Problema 2.2 (de inferencia)   Para un conjunto definible $F(A_1, \ldots, A_n)$ y un objeto dado $x$, si se sabe que el grado de pertenencia $g_{F(A_1, \ldots, A_n)}(x)$ cae en un intervalo $I$, y que para algunos conjuntos primitivos $A_k,A_{k+1},\ldots,A_n$ sus correspondientes grados de pertenencia $g_{A_i}(x)$ caen en intervalos $[a_i,b_i]$, $i=k,\ldots,n$, entonces se ha de estimar para los otros índices $i=1,\ldots,k-1$ en qué intervalos $[a_i,b_i]$ debieron caer los correspondientes grados de pertenencia $g_{A_i}(x)$.

También en jerga técnica, podemos decir que éste es un problema de tipo ``hacia atrás'': conociendo los valores finales $g_{F(A_1, \ldots, A_n)}(x)$ y algunos iniciales $g_{A_i}(x)$, teniendo en cuenta las funciones de los conectivos de complemento, unión e intersección, se busca determinar los valores que debieron asumir los demás grados de pertenencia iniciales para obtener el valor final. En etapas de aplicación, un resolvedor de este problema se ve como un agente que realiza ``diagnósticos'': ``Si los valores observados (finales) son de tales características en unas ciertas condiciones (iniciales), entonces las demás variables iniciales han de haber cumplido con tales hipótesis''.

Vemos pues que los conjuntos difusos involucran de manera esencial procedimientos de cálculo numérico o simbólico. Al contrario de una primera idea sugerida por su nombre, veremos que la lógica difusa es un área de cálculo preciso. Ambos problemas, de deducción y de inferencia, pueden ser resueltos, efectiva y eficientemente, analizando los tipos de las funciones matemáticas involucradas en los grados de pertenencia y en los conectivos lógicos.
next up previous
Siguiente: Cálculo proposicional difuso Un nivel arriba: Introducción a la lógica Anterior: Introducción
Guillermo Morales-Luna
2002-02-17