« Introducción a Prover… « || Inicio || » Nuevo Bloque de Curso… »

Introducción a la Lógica Difusa

Última modificación: 25 de Octubre de 2017, y ha tenido 4299 vistas

Etiquetas utilizadas: || || ||

El concepto de la lógica difusa

La forma en que la gente piensa es, inherentemente, difusa. La forma en que percibimos el mundo está cambiando continuamente y no siempre se puede definir en términos de sentencias verdaderas o falsas. Consideremos como ejemplo el conjunto de vasos del mundo, que pueden estar vacíos o llenos de agua. Ahora tomemos un vaso vacío y comencemos a echar agua poco a poco, ¿en qué momento decidimos que el vaso pasa de estar vacío a estar lleno? Evidentemente, hay dos situaciones extremas que reconocemos sin ninguna duda, la primera cuando el vaso está completamente vacío, sin una sola gota de agua en su interior, y la segunda cuando está completamente lleno, cuando no cabe ni una sola gota más en él, pero una gota antes de estar completamente lleno, ¿diríamos que es falso que el vaso está lleno?, observa que para afirmar su condición, en la frase anterior no sollo he usado el término lleno, sino que he añadido un modificador diciendo completamente lleno. Si a un vaso lleno de agua le quito una gota de agua... ¿dejo de considerarlo lleno y automáticamente pertenece para mí a otra clasificación?

Las definiciones de vaso completamente vacío y vaso completamente lleno son demasiado estrictas como para que resuten interesantes en un razonamiento en el que se consideran operaciones de llenado y vaciado de vasos, y entre los términos de lleno y vacío hay un área que no está claramente definida de pertenencia a ninguno de esos extremos. En el lenguaje natural que usamos en el mundo real hemos cubierto esta imprecisión por medio de una jerarquía de términos intermedios junto con modificadores que permiten cubrir un espectro más grande de áreas usando un número limitado de ellos, y podemos hablar de lleno, medio lleno, completamente lleno, casi lleno, etc. Matemáticamente, los conceptos de sí/no, verdadero/falso están representados por medio del concepto clásico de conjunto, pero necesitamos extenderlo para poder representar este tipo de información más difusa.

Un conjunto difuso permite a sus elementos tener un grado de pertenencia. Si el valor 1 se asigna a los elementos que están completamente en el conjunto, y 0 a los que están completamente fuera, entonces los objetos que están parcialmente en el conjunto tendrán un valor de pertenencia estrictamente entre 0 y 1. Por tanto, si un vaso completamente lleno tiene un grado de pertenencia a los vasos llenos de valor 1, y un vaso completamente vacío un grado de pertenencia de valor 0, entonces al añadir una gota a este último, su grado de pertenencia a los vasos llenos sería ligeramente superior a 0.

Definición Matemática de Conjuntos Difusos

Matemáticamente, un conjunto es una colección de objetos que verifican alguna propiedad, de forma que un objeto o bien pertenece al conjunto, o no pertenece. Por ejemplo, supongamos que decimos que una persona es alta si su altura está por encima de 180cm, algo que puede ser representado gráficamente de la siguiente forma:

La funcion anterior describe la pertenencia al conjunto de los altos, o estás dentro o estás fuera. Estas funciones nítidas funcionan muy bien con las operaciones matemáticas clásicas, pero no funcionan tan bien describiendo el mundo real. Por una parte, no hace distinción entre individuos que midan 181cm y los que miden 215cm, aunque hay una clara distinción entre ellos. El otro problema es la diferencia entre una persona que mida 180cm y otra de 181cm, apenas 1cm de diferencia entre ellos y el primero de ellos no está en el conjunto de los altos, y el segundo sí.

La aproximación de los conjuntos difusos al conjunto de los altos proporciona una representación mucho mejor sobre la propiedad ser alto de una persona. El conjunto se define por medio de una función continua que puede tomar valores intermedios entre los extremos 0 y 1.

La función de pertenencia define el conjunto difuso para los posibles valores de altura (mostrados en el eje horizontal) y proporciona el grado de pertenencia de la altura al conjunto difuso (mostrado en el eje vertical con valores entre 0 y 1). De esta forma, el grado de pertenencia de la primera persona es 0.3 y, por tanto, no es muy alto, mientras que el segundo tiene un grado de pertenencia de 0.95 y, definitivamente, es alto.

Los conjuntos difusos fueron propuestos inicialmente por Lofti A. Zadeh en su artículo de 1965 titulado "Fuzzy Sets". Este artículo establece los fundamentos de la lógica difusa que se deduce de la definición de conjunto difuso y sus propiedades. Esta definición es:

Sea \(X\) un conjunto clásico. Un conjunto difuso, \(A\), en \(X\) viene caracterizado por la función de pertenencia \(f_A(x)\), que asocia a cada punto \(x \in X\) un número real del intervalo \([0,1]\), donde los valores de \(f_A(x)\) representan el "grado de pertenencia" de \(x\) en \(A\), de forma que, cuanto más cerca esté el valor de \(f_A(x)\) a \(1\), mayor es el grado de pertenencia de \(x\) a \(A\).

Esta definición de conjunto difuso extiende de alguna forma la definición clásica de conjunto, que sería el caso particular en el que \(f_A(x)\in \{0,1\}\). Pero para trabajar con ellos también tendremos que extender las operaciones clásicas entre conjuntos (unión, intersección, etc.), lo que nos llevará a extender las operaciones lógicas binarias habituales (conjunción, disyunción, etc.).

Obsérvese que no indicamos cómo ha de ser la función de pertenencia, ya que eso dependerá de las carcterísticas propias del conjunto real que se quiere representar, pero suelen usarse algunas funciones clásicas comunes como las que se muestran a continuación:

Matizadores Lingüísticos

Pero antes de pasar a las definiciones formales de las operaciones binarias habituales, veamos cómo esta aproximación también nos permite representar matemáticamente los modificadores lingüísticos a los que hacíamos mención en la introducción.

El primer paso para convertir el lenguaje difuso en una función de pertenencia de la lógica difusa consiste en tomar los términos (normalmente adjetivos o expresiones que indican propiedades) y asociarles una función de pertenencia adecuada a nuestra experiencia del mundo real. Aquí no hay reglas fijas, salvo las restricciones propias de la lógica.

El siguente paso es elegir cómo actúan los matizadores lingüísticos sobre el lenguaje. Estos matizadores deben modificar la función de pertenencia de la propiedad sobre la que actúan, de forma que podamos reflejar adecuadamente las acciones de partículas como "mucho", "muy", "casi", "ligeramente", "extremadamente", "muchísimo", etc...

Normalmente, lo que se hace es tomar la familia de funciones de la forma:

\(h_\alpha(x)=x^\alpha\)

y se asocian valores de \(\alpha\) determinados a los distintos matizadores. Por ejemplo:

\(\alpha(muy)=2\)

\(\alpha(extremadamente)=6\)

\(\alpha(ligeramente)=\frac{1}{2}\)

Así, si queremos modificar el comportamiento de la función de pertenencia "alto" para obtener "muy alto", basta considerar:

\(f_{muy\ alto}(x)=h_{muy}(f_{alto}(x))\)

Operaciones Lógicas Difusas

La lógica tradicional bivalente usa los operadores booleanos \(\wedge\) (AND), \(\vee\) (OR), y \(\neg\) (NOT) para llevar a cabo las operaciones de conjuntos de intersección, unión y complementario. Estos operadores funcionan bien con conjuntos nítidos, clásicos, y se pueden definir sencillamente a partir de la tabla de verdad:

Las tablas de verdad anteriores funcionan bien para la lógica bivaluada, pero debido a que los conjuntos difusos no tienen porqué tomar una cantidad finita de valores, no es fácil extender las tablas para su uso en este caso. Estos operadores necesitan ser redefinidos como funciones para todos los posibles valores difusos de los grados de pertenencia, es decir, para todo el intervalo \([0,1]\), y no solo para los valores extremos. La lógica difusa es realmente un superconjuto de la lógica clásica ya que incluye los valores extremos junto a todos los valores intermedios, por lo que conseguir una forma generalizada de estos operadores que extiendan a los operadores clásicos puede ser de mucha utilidad. Una posible generalización vendría dada por:

\(x\  \wedge \ y = min(x,y)\)

\(x\  \vee \ y = max(x,y)\)

\(\neg \ x = 1 - x\)

Estas definiciones se pueden usar tanto para aplicar los operadores clásicos como para obtener combinaciones difusas. Las siguientes gráficas representan el resultado obtenido con la definición anteriores sobre todos los posibles valores de entrada:

Existen muchas otras definiciones alternativas para estos operadores, pero todas ellas suelen compartir propiedades similares (que exitienden el funcionamiento y significado clásico).

  1. La definición matemática más general del operador AND se llama norma triangular (o t-norma) y es, por definición, un operador binario, definido de \([0,1]^2 \mapsto [0,1]\), conmutativo, asociativo, que lleva el par \((1,1)\) al valor \(1\), y es creciente en cada variable.
  2. Para el operador OR las propiedades son las mismas, salvo que lleva el par \((0,0)\) al valor \(0\), y se llama t-conorma.
  3. El operador NOT puede ser redefinido siempre y cuando sea continuo y estrictamente decreciente.

La siguiente figura muestra algunos ejemplos de defniición:

Reglas Difusas

La mayoría de las decisiones que la gente toma son decisiones lógicas, miran la situación, la valoran, y toman una decisión basándose en ella. La forma generalizada de una decisión de este tipo se llama Modus Ponens Generalizado, que tiene la forma:

Esta forma de razonamiento lógico es bastante estricto. La lógica difusa pierde esta forma estricta diciendo que B se dará con más opciones si la veracidad de A es más alta. Donde ahora A y B toman valores difusos. El razonamiento anterior requiere que se defina un conjunto de reglas que lo lleven a cabo. Estas reglas son reglas lingüísticas que relacionan diferentes conjuntos y valores difusos. La forma general de estas reglas es: "si x está en A, entonces y está en B", donde \(x\) e \(y\) son valores difusos en los conjuntos difusos \(A\) y \(B\), respectivamente (y que vendrán definidos por medio de sus funciones de pertenencia).

Las reglas lingüísticas se usan para relacionar las entradas con las salidas, y vamos a ver a continuación cómo se puede hacer una valoración correcta de las mismas. Ha habido varias propuestas para determinar la ejecución de estas reglas, las más importantes han sido los métodos de inferencia y agregación de Mamdani, Larsen, Takagi-Sugeno-Kang, y Tsukamoto.

Desde un punto de vista práctico se usan fundamentalmente dos métodos para modelar la implicación, uno de ellas es por medio del mínimo (que trunca la función de pertenencia del consecuente con el valor del antecedente), y el otro por medio del producto (que escala la función del consecuente de acuerdo al antecedente).

Las figuras siguientes muestran la aplicación de estos métodos sobre las mismas reglas con los mismos valores, donde la gráfica verde muestra el resultado de la implicación superpuesta al conjunto borroso de la consecuencia, para que se vea claramente el efecto obtenido:

Sistema de Razonamiento Difuso

Desde un punto de vista práctico, hemos de aprender a pasar de los conceptos lingüísticos difusos a variables numéricas difusas, combinarlas usando los operadores lógicos difusos, obtener la deducción de cada regla de forma numérica, agregar las diversas respuestas de las distintas reglas, y volver a pasar de la respuesta numérica agregada a la lingüística.

En el siguiente diagrama (extraído de "Fuzzy Logic for Social Simulation using NetLogo") se muestra el proceso completo sobre una base de 3 reglas (a continuación analizaremos en detalle sobre el mismo ejemplo cómo es el proceso completo):

  • R1: SI (House is Inexpensive OR Close-to-work), ENTONCES Suitability is Good.
  • R2: SI (House is Expensive OR Far-from-work), ENTONCES Suitability is Low.
  • R3: SI (House is Averagely-priced AND About-50-km-from-work), ENTONCES Suitability is Regular.

En general, el proceso mostrado anteriormente responde a un esquema de modelado que permite manipular reglas de inferencia sobre conjuntos difusos, y que puede ser resumido de la siguiente forma:

  • Fuzzyficador: convierte las entradas del sistema, que son valores numéricos nítidos en conjuntos borrosos aplicando una función de borrosificación.
  • Base de conocimiento (Reglas Difusas): almacena las reglas SI-ENTONCES obtenidas de los expertos.
  • Motor de inferencia: simula el razonamiento humano haciendo inferencia sobre las entradas recibidas y las reglas SI-ENTONCES almecenadas.
  • Desfuzzyficador: convierte el conjunto borroso obtenido por el motor de inferencia en un valor numérico nítido que puede ser reutilizado.

El procedimiento de razonamiento difuso lo explicaremos ilustrándolo por medio de un problema sencillo y concreto extraido del tutorial de la propia extensión de Lógica Difusa existente para NetLogo, que trata sobre la adecuación de alquilar una vivienda dependiendo del precio y la distancia al trabajo.

En concreto, supondremos que respecto al precio tenemos tres apreciaciones difusas: barato, caro, o precio medio; respecto a la distancia al trabajo, tenemos otras tres apreciaciones difusas: cerca, lejos o alrededor de 50Km. Como resultado, podemos valorar la vivienda como: muy adecuada, poco adecuada, o medianamente adecuada. Además, los expertos (en este caso, nosotros mismos) identifican tres reglas difusas que pueden ayudarnos a tomar la decisión en función de las características de las viviendas que encontramos:

  • Si la vivienda es barata o está cerca del trabajo, entonces es muy adecuada.
  • Si la vivienda es cara o está lejos del trabajo, entonces es poco adecuada.
  • Si la vivienda es de precio medio y está alrededor de 50Kms del trabajo, entonces es medianamente adecuada.

Supondremos que el precio se puede mover entre 0 y 200€ por semana, y las viviendas han sido consideradas a una distancia máxima de 100Kms. La adecuación la vamos a valorar entre 0 y 10. Vamos a suponer que los conjuntos difusos relacionados con el precio siguen funciones lineales a trozos, mientras que aquellos asociados a la distancia y la adecuación se modelan con funciones gaussianas, tal y como muestra la siguiente figura:

y que pueden definirse con el siguiente código de NetLogo:

Nuestro objetivo es usar Lógica Difusa para extraer un valor de adecuación para cada casa que nos encontramos, y de esa forma poder comparar mejor las diversas opciones que hay a nuestro alcance. De cada vivienda a evaluar obtenemos dos valores numéricos que corresponden al precio y distancia a la que se encuentra. El proceso que se sigue es el siguiente:

  1. Convertir en borroso (codificación) los datos de entrada.
  2. Para cada regla, evaluar el antecedente de la regla sobre los datos de entrada, para ello, basta aplicar el método del operador lógico que interviene en el antecedente sobre los valores borrosos de los datos de entrada obtenidos en el apartado anterior.
  3. Obtener la conclusión de la regla borrosa aplicada. Para ello, basta aplicar el operador asociado a la implicación lógica sobre el resultado del antecedente, y considerar el conjunto difuso asociado a la conclusión de la regla.
  4. Agregar las conclusiones de todas las reglas consideradas, lo que produce un conjunto borroso, aplicando la función de agregación seleccionada para agregar todas las reglas de nuestro sistema. Debe tenerse en cuenta que aquí se obtiene un conjunto difuso, no un valor. Los operadores más comunes de agregación son el máximo, la suma, o el equivalente al OR visto anteriormente.
  5. Decodificación del conjunto agregado obtenido, aplicando el tipo de desfuzzyficación deseado, y obteniendo un valor numérico que indica la adecuación de la vivienda concreta que estamos evaluando. Para ello hay muchos métodos habituales (y ningún mecanismo para saber cuál es el que más conviene), de los cuales la extensión de NetLogo implementa algunos de ellos (First of Maxima, Last of Maxima, Middle of Maxima, Mean of Maxima, Centro de Gravedad).

En el ejemplo que estamos desarrollando, el código de NetLogo que resuelve este proceso es:

donde, tal y como muestra la siguiente figura, las funciones que implementan los operadores lógicos, de implicación, agregación y desborrificación, se deciden por el usuario en la interfaz de trabajo:

¿Por qué usar los Sistemas de inferencia borrosa?

A la hora de decidir si usar un sistemas de razonamiento borroso hemos de tener en cuenta algunas consideraciones adicionales que quizás nos ayuden a decidir de forma adecuada:

  • La lógica borrosa no resuelve problemas nuevos, sino que utiliza nuevos métodos para resolver los problemas de siempre.
  • Los conceptos matemáticos dentro del razonamiento borroso son muy simples y se pueden implementar con relativa facilidad.
  • La lógica borrosa es flexible: es fácil transformar un sistema borroso añadiendo o eliminando reglas sin tener que empezar desde cero.
  • La lógica borrosa admite datos imprecisos (pero cuidado, no estudia la incertidumbre): maneja elementos de un conjunto borroso, es decir, valores de una función de pertenencia. Por ejemplo, en lugar de manejar el dato "Mide 180 cm", maneja "Es alto con una precisión de 0.8".
  • La lógica borrosa se construye sobre la experiencia de los expertos: confía en la experiencia de quien ya conoce el sistema.
  • La lógica borrosa puede mezclarse con otras técnicas clásicas de control.

Hay muy buen material ya disponible para entrar en el mundo de la lógica difusa desde un punto de vista más técnico, por ello, se recomienda acceder a los recursos que se pueden encontrar a continuación.

Para saber más...

Video Tutorial de Lógica Difusa (inglés)

Fuzzy Logic for Social Simulation using NetLogo

Extensión de Lógica Difusa de NetLogo

« Introducción a Prover… « || Inicio || » Nuevo Bloque de Curso… »