« Fundamentos Matemátic… « || Inicio || » Introducción a Prover… »

Representación del Conocimiento

Última modificación: 24 de Septiembre de 2017, y ha tenido 236 vistas

Etiquetas utilizadas: || ||

Esta entrada es una traducción del artículo de R. Davis, H. Shrobe, and P. Szolovits. What is a Knowledge Representation? AI Magazine, 14(1):17-33, 1993

 

Aunque la Representación del Conocimiento es uno de los conceptos centrales y, de alguna manera, más conocidos en Inteligencia Artificial, la pregunta más fundamental "¿qué es?" rara vez se ha contestado directamente. En esta entrada volvemos a lo básico para abordar la cuestión directamente. Creemos que la respuesta se puede entender mejor en función de los cinco roles importantes, y claramente diferentes, que desempeña una representación, cada uno de los cuales plantea necesidades diferentes, y a veces contradictorias, a las propiedades que debe tener una representación. Sostenemos que el hecho de tener en cuenta estas cinco funciones proporciona una perspectiva útil y amplia que arroja luz sobre algunas controversias de larga duración y puede estimular tanto la investigación como la práctica en el campo.

Introducción

¿Qué es una representación del conocimiento? Esta noción se puede entender mejor en términos de los cinco posibles roles que desempeña, todos ellos cruciales para el objetivo de comprender qué es una representación del conocimiento (RC, a partir de ahora):

  • Una representación del conocimiento es fundamentalmente un sustituto, un reemplazo de la cosa misma, utilizado para permitir a una entidad determinar consecuencias pensando en lugar de actuar, es decir, razonando sobre el mundo en lugar de actuando en él.
  • Es un conjunto de compromisos ontológicos, es decir, una respuesta a la pregunta: ¿en qué términos debo pensar sobre el mundo?
  • Es una teoría parcial del razonamiento inteligente, expresada en términos de tres componentes:
    1. la concepción fundamental de la representación del razonamiento inteligente;
    2. el conjunto de inferencias que la representación establece; y
    3. el conjunto de inferencias que recomienda.
  • Es un medio para la computación pragmáticamente eficiente, es decir, el entorno computacional en el que se realiza el pensamiento. Una contribución a esta eficiencia pragmática es la que aporta la orientación que proporciona una representación para organizar la información a fin de facilitar la realización de las inferencias recomendadas.
  • Es un medio de expresión humana, es decir, una lengua en la que decimos cosas sobre el mundo.

Comprender los roles y reconocer su diversidad tiene varias consecuencias útiles.

  1. En primer lugar, cada rol requiere algo ligeramente diferente de una representación; cada uno de ellos conduce a un conjunto interesante y diferente de propiedades que queremos que tenga una representación.
  2. En segundo lugar, creemos que los roles proporcionan un marco útil para caracterizar una amplia variedad de representaciones. Sugerimos que la "mentalidad" fundamental de una representación puede ser capturada al entender cómo ve cada uno de los roles, y que al hacerlo revela similitudes y diferencias esenciales.
  3. En tercer lugar, creemos que algunos desacuerdos previos sobre la representación se disuelven provechosamente cuando los cinco roles reciben la consideración apropiada. Demostramos esto revisando y diseccionando los primeros argumentos sobre marcos y lógica.
  4. Por último, creemos que ver las representaciones de esta manera tiene consecuencias tanto para la investigación como para la práctica. Para la investigación, este punto de vista proporciona una respuesta directa a una pregunta de importancia fundamental en el campo. También sugiere adoptar una perspectiva amplia sobre lo que es importante en una representación, y argumenta que una parte significativa de la representación - capturar y representar la riqueza del mundo natural - está recibiendo atención insuficiente. Creemos que esta visión también puede mejorar la práctica recordando a los especialistas las inspiraciones que son fuentes significativas para una variedad de representaciones.

Terminología y perspectiva

Dos elementos de la terminología ayudarán en nuestra presentación.

  1. Primero, usamos el término inferencia en un sentido genérico, para referirnos a cualquier forma de obtener nuevas expresiones de lo antiguo. Sólo en raras ocasiones estamos hablando de inferencias lógicas sólidas y al hacerlo nos referimos explícitamente a eso.
  2. En segundo lugar, para darles un nombre colectivo único, nos referimos al conocido conjunto de herramientas básicas de representación como la lógica, reglas, marcos, redes semánticas, etc., como tecnologías de representación del conocimiento.

También resultará útil considerar explícitamente la práctica común de construir representaciones del conocimiento en múltiples niveles de lenguajes, normalmente con una de las tecnologías de representación del conocimiento en el nivel inferior. La ontología de líquidos de Hayes[12], por ejemplo, es a un nivel una representación compuesta de conceptos como piezas del espacio, que tienen portales, caras, lados, etc. El lenguaje en el siguiente nivel más primitivo (y como resultado, inferior) es la lógica de primer orden, donde, por ejemplo, In(s1, s2) es una relación que expresa que el espacio s1 está contenido en s2.

Esta visión es útil en parte porque permite que nuestro análisis y discusión se concentre en gran medida en las tecnologías RC. Al igual que el nivel de representación primitiva en los fundamentos de los lenguajes RC, se encuentran con todos los temas centrales para la representación del conocimiento de cualquier variedad. También son ejemplos útiles porque son ampliamente conocidos en el campo y hay un considerable conjunto de experiencias que se pueden aprovechar.

¿Qué es una Representación de Conocimiento?

Tal vez la pregunta más fundamental sobre el concepto de representación del conocimiento sea: ¿Qué es? Creemos que la respuesta se entiende mejor en términos de los cinco roles fundamentales que desempeña.

Rol I: Una RC es un sustituto

Cualquier entidad inteligente que desee razonar sobre su mundo se encuentra con un hecho importante e ineludible: el razonamiento es un proceso que transcurre internamente, mientras que la mayoría de las cosas que desea razonar sólo existen externamente. Un programa (o persona) dedicado a planificar el montaje de una bicicleta, por ejemplo, puede tener que razonar sobre entidades como ruedas, cadenas, piñones, manillares, etc., pero tales cosas existen sólo en el mundo exterior.

Esta inevitable dicotomía es una justificación y un rol fundamental para una representación: funciona como sustituto dentro del razonador, como sustituto de las cosas que existen en el mundo. Las operaciones sobre, y con, representaciones sustituyen a las operaciones sobre lo real, es decir, sustituyen a la interacción directa con el mundo. Desde este punto de vista, el razonamiento mismo es en parte un sustituto de la acción en el mundo, cuando no podemos o no queremos (todavía) tomar esa acción. (1)

Considerar las representaciones como sustitutos conduce naturalmente a dos preguntas importantes. La primera pregunta acerca de cualquier sustituto es su propia identidad: ¿para qué sirve? Debe haber alguna forma de correspondencia especificada entre el sustituto y su pretendido referente en el mundo; la correspondencia es la semántica para la representación.

La segunda pregunta es la fidelidad: ¿cuán cerca está el sustituto de lo real? ¿Qué atributos del original captura y explicita, y cuáles omite? La fidelidad perfecta es en general imposible, tanto en la práctica como por principio. Es imposible por principio, porque cualquier otra cosa que no sea la cosa en sí misma es necesariamente diferente de la cosa misma (ya sea en la ubicación si no hay otra razón). Dicho de otro modo, la única representación completamente exacta de un objeto es el objeto mismo. Todas las demás representaciones son inexactas; inevitablemente contienen suposiciones simplificadoras y posiblemente artefactos.

Dos pequeñas elaboraciones amplían esta visión de las representaciones como sustitutos. En primer lugar, parece servir tanto para los objetos intangibles como para los materiales como las ruedas dentadas: las representaciones funcionan como sustitutos de nociones abstractas como acciones, procesos, creencias, causalidad, categorías, etc., permitiendo describirlas dentro de una entidad para que pueda razonar sobre ellas. En segundo lugar, los objetos formales pueden existir dentro de la máquina con una fidelidad perfecta: las entidades matemáticas, por ejemplo, pueden ser capturadas con exactitud, precisamente porque son objetos formales. Puesto que casi cualquier tarea de razonamiento encontrará la necesidad de tratar con objetos naturales (es decir, aquellos encontrados en el mundo real) así como con objetos formales, los sustitutos imperfectos son pragmáticamente inevitables.

Sustitutos imperfectos implican inferencias incorrectas inevitables.

Dos consecuencias importantes se derivan de la inevitabilidad de sustitutos imperfectos. Una consecuencia es que al describir el mundo natural, debemos inevitablemente mentir, al menos por omisión. Como mínimo, debemos prescindir de la complejidad efectivamente ilimitada del mundo natural; nuestras descripciones pueden además introducir artefactos que no están presentes en el mundo.

La segunda y más importante consecuencia es que todos los razonamientos suficientemente amplios sobre el mundo natural deben llegar a conclusiones incorrectas, independientemente del proceso de razonamiento utilizado e independientemente de la representación empleada. El razonamiento correcto no puede salvarnos: si el modelo del mundo es de alguna manera equivocado (y debe serlo) algunas conclusiones serán incorrectas, no importa lo cuidadosamente extraídas que sean. Una mejor representación no puede salvarnos: todas las representaciones son imperfectas y cualquier imperfección puede ser fuente de error.

El significado del error puede, por supuesto, variar; de hecho, gran parte del arte de seleccionar una buena representación consiste en encontrar una que minimice (o quizás incluso elimine) el error para la tarea específica en cuestión. Pero la inevitable imperfección de los sustitutos significa que podemos proporcionar al menos una garantía para cualquier entidad razonando de cualquier manera sobre el mundo natural: si razona lo suficiente y ampliamente, está garantizado que se equivoca.

Por lo tanto, extraer sólo inferencias correctas no libera al razonamiento del error; sólo puede garantizar que la inferencia no es la fuente de ese error. Dado que el razonamiento de base general inevitablemente será incorrecto, el paso de una inferencia correcta a otros modelos de inferencia no es, por lo tanto, un movimiento desde la exactitud total hacia el error, sino una cuestión de equilibrar la posibilidad de una fuente más de error con las ganancias (por ejemplo, la eficiencia) que puede ofrecer.

No sugerimos que el razonamiento poco riguroso deba ser aceptado casualmente, pero afirmamos que, dada la inevitabilidad del error, incluso con razonamiento correcto, tiene sentido evaluar pragmáticamente los costes y beneficios relativos derivados del uso de métodos de razonamiento rigurosos y poco rigurosos.

Rol II: Una RC es un conjunto de compromisos ontológicos

Si, como hemos argumentado, todas las representaciones son aproximaciones imperfectas a la realidad, cada aproximación atendiendo a unas cosas e ignorando otras, al seleccionar cualquier representación estamos en el mismo acto tomando inevitablemente un conjunto de decisiones sobre cómo y qué ver en el mundo. Es decir, seleccionar una representación significa asumir un conjunto de compromisos ontológicos. (2) Los compromisos son en efecto un par de gafas fuertes que determinan lo que podemos ver, haciendo que alguna parte del mundo se centre en el punto de mira, a expensas de desdibujar otras partes.

Estos compromisos y su efecto de enfoque/ difuminado no son un efecto secundario incidental de una elección de representación; son esenciales: un RC es un conjunto de compromisos ontológicos. Es inevitable que así sea debido a las imperfecciones de las representaciones. Resulta útil porque una selección sensata de los compromisos ofrece la oportunidad de centrar la atención en aspectos del mundo que consideramos pertinentes.

El efecto de enfoque es una parte esencial de lo que ofrece una representación, porque la complejidad del mundo natural es abrumadora. Nosotros (y nuestras máquinas de razonamiento) necesitamos una guía para decidir qué es lo que hay que atender y qué ignorar en el mundo. Las gafas suministradas por una representación pueden proporcionar esa orientación: al decirnos qué y cómo ver, nos permiten hacer frente a lo que de otro modo sería una complejidad y un detalle insostenibles. De ahí que el compromiso ontológico de una representación pueda ser uno de los aportes más importantes que ofrece.

Hay una larga historia de trabajo que intenta construir buenas ontologías para una variedad de dominios de tareas, incluyendo el trabajo inicial sobre una ontología para líquidos[12], el modelo de elementos agrupados ampliamente utilizado en la representación de circuitos electrónicos (por ejemplo,[3]), así como ontologías para el tiempo, la creencia e incluso la programación en sí misma. Cada uno de ellos ofrece una manera de ver alguna parte del mundo.

El modelo de elementos agrupados, por ejemplo, sugiere que pensemos en circuitos en términos de componentes con conexiones entre ellos, con señales que fluyen instantáneamente a lo largo de las conexiones. Esta es una vista útil, pero no la única posible. Una ontología diferente se presenta si necesitamos ocuparnos de la electrodinámica en el dispositivo: Aquí las señales se propagan a velocidad finita y un objeto (como una resistencia) que antes se veía como un componente único con un comportamiento de E/S puede que ahora deba pensarse como un medio extendido a través del cual fluye una onda electromagnética.

Las ontologías pueden, por supuesto, ser escritas en una amplia variedad de lenguajes y notaciones (por ejemplo, la lógica, LISP, etc.); la información esencial no es la forma de ese lenguaje sino el contenido, es decir, el conjunto de conceptos ofrecidos como una forma de pensar sobre el mundo. En pocas palabras, la parte importante son las nociones como conexiones y componentes, no si optamos por escribirlas como predicados o estructuras de LISP.

El compromiso que asumimos al seleccionar una u otra ontología puede dar lugar a una visión muy distinta de la tarea que nos ocupa. Consideremos la diferencia que surge al seleccionar la representación del elemento agrupado de un circuito en lugar de la representación electrodinámica del mismo dispositivo. Como segundo ejemplo, el diagnóstico médico visto en términos de reglas (por ejemplo, MYCIN) parece sustancialmente diferente de la misma tarea vista en términos de marcos (por ejemplo, INTERNIST). Mientras que MYCIN considera que el mundo de la medicina está compuesto por asociaciones empíricas que conectan el síntoma con la enfermedad, INTERNIST considera que un conjunto de prototipos, en particular las enfermedades prototípicas, deben ser cotejados con el caso concreto.

El compromiso comienza con las primeras elecciones

El ejemplo de INTERNIST también demuestra que existe un compromiso ontológico significativo e inevitable, incluso a nivel de las tecnologías de representación habituales. Lógica, reglas, marcos, etc., cada uno encarna un punto de vista sobre el tipo de cosas que son importantes en el mundo. La lógica, por ejemplo, implica un compromiso (muy mínimo) de ver el mundo en términos de entidades individuales y relaciones entre ellas. Los sistemas basados en reglas ven el mundo en términos de triples atributo-objeto-valor y las reglas de inferencia plausible que los conectan, mientras que los marcos nos hacen pensar en términos de objetos prototípicos.

Cada uno de ellos aporta así su propia visión de lo que es importante atender, y cada uno sugiere, a la inversa, que cualquier cosa que no sea fácilmente reconocible en esos términos puede ser ignorada. Por supuesto, no se garantiza que esto sea correcto, ya que todo lo ignorado puede resultar pertinente más adelante. Pero la tarea es desesperanzadora en principio --cada representación ignora algo sobre el mundo-- de ahí que lo mejor que podemos hacer es empezar con una buena suposición. Las tecnologías de representación existentes proporcionan un conjunto de conjeturas sobre qué atender y qué ignorar. La selección de cualquiera de ellos implica un grado de compromiso ontológico: la selección tendrá un impacto significativo en nuestra percepción y enfoque de la tarea, así como en nuestra percepción del mundo que se está modelando.

Los compromisos se acumulan en capas

El compromiso ontológico de una representación comienza por lo tanto al nivel de las tecnologías de representación y se construye desde allí. A medida que ponemos la tecnología a trabajar, se establecen nuevos niveles de compromiso. El uso de estructuras enmarcadas en INTERNIST ofrece un ejemplo ilustrativo. En el nivel más fundamental, la decisión de ver el diagnóstico en términos de marcos sugiere pensar en términos de prototipos, defectos y una jerarquía taxonómica. Pero, ¿prototipos de qué y cómo se organizará la taxonomía?

Una descripción temprana del sistema[21] muestra cómo estas preguntas fueron respondidas en la tarea que nos ocupa, suministrando el segundo nivel de compromiso:

La base de conocimientos que subyace en el sistema INTERNIST se compone de dos tipos básicos de elementos: entidades y manifestaciones de la enfermedad... también contiene una... jerarquía de categorías de enfermedades, organizadas principalmente en torno al concepto de sistemas de órganos, teniendo en el nivel superior categorías tales como "enfermedad hepática","enfermedad renal", etc.

Los prototipos, en consecuencia, están destinados a captar enfermedades prototípicas (por ejemplo, un "caso clásico" de una enfermedad) y se organizarán en una taxonomía indexada en torno a los sistemas de órganos. Se trata de un conjunto de opciones razonable e intuitivo, pero claramente no es la única forma de aplicar marcos a la tarea; por lo tanto, es otro nivel de compromiso ontológico.

En la tercera (y en este caso última) capa, este conjunto de opciones es instanciado: ¿qué enfermedades serán incluidas y en qué ramas de la jerarquía aparecerán? Las cuestiones ontológicas que surgen incluso en este nivel pueden ser fundamentales. Consideremos, por ejemplo, la determinación de cuáles de los siguientes factores se consideran enfermedades (es decir, estados anormales que requieren curación): alcoholismo, homosexualidad y síndrome de fatiga crónica. El compromiso ontológico aquí es suficientemente obvio e importante como para que a menudo sea objeto de debate en el campo mismo, independientemente de la construcción de razonadores automatizados.

Hay que tomar decisiones similares con todas las tecnologías de representación, porque cada una de ellas sólo proporciona un primer orden de aproximación sobre cómo ver el mundo: ofrecen una forma de ver pero no indican cómo instanciar esa visión. Como los marcos sugieren prototipos y taxonomías, pero no nos dicen qué cosas seleccionar como prototipos, las reglas sugieren pensar en términos de inferencias plausibles, pero no nos dicen qué inferencias plausibles hay que atender. Del mismo modo, la lógica nos dice que debemos ver el mundo en términos de individuos y relaciones, pero no especifica qué individuos y relaciones utilizar.

El compromiso con una visión particular del mundo comienza con la elección de una tecnología de representación, y se acumula a medida que se van tomando decisiones sobre cómo ver el mundo en esos términos.

Recordatorio: Una RC no es una estructura de datos

Hay que tener en cuenta que en cada capa, incluso en la primera (por ejemplo, seleccionar reglas o marcos), las opciones que se toman son sobre la representación, no sobre las estructuras de datos. Parte de lo que hace que un lenguaje sea representativo es que tiene sentido[13], es decir, existe una correspondencia entre sus construcciones y las cosas en el mundo exterior. Esa correspondencia conlleva a su vez una restricción.

Una red semántica, por ejemplo, es una representación, mientras que un grafo es una estructura de datos. Son entidades de diversa índole, aunque una invariablemente se utiliza para implementar la otra, precisamente porque la red tiene (debe tener) una semántica. Esa semántica se manifestará en parte porque limita la topología de la red: una red que pretende describir las afiliaciones familiares tal como las conocemos no puede tener un ciclo en sus vínculos padre, mientras que los grafos (es decir, las estructuras de datos) no están por supuesto bajo ninguna restricción y pueden tener ciclos arbitrarios.

Mientras que cada representación debe ser implementada en la máquina por alguna estructura de datos, la propiedad representacional está en la correspondencia con algo en el mundo y en la restricción que la correspondencia impone.

Rol III: Una RC es una Teoría Parcial del Razonamiento Inteligente

El tercer rol de una representación es como teoría parcial del razonamiento inteligente. Este papel se debe a que la concepción inicial de una representación está motivada normalmente por alguna perspicacia que indica cómo la gente razona inteligentemente, o por alguna creencia sobre lo que significa razonar inteligentemente en realidad.

La teoría es parcial en dos sentidos distintos:

  1. la representación normalmente incorpora sólo una parte de la percepción o creencia que la motivó, y
  2. esa percepción o creencia es a su vez sólo una parte del fenómeno complejo y multifacético del razonamiento inteligente.

La teoría del razonamiento inteligente de una representación es a menudo implícita, pero puede hacerse más evidente examinando sus tres componentes:

  1. la concepción fundamental de inferencia inteligente de la representación;
  2. el conjunto de inferencias que la representación establece; y
  3. el conjunto de inferencias que recomienda.

Mientras que las inferencias establecidas indican lo que puede inferirse, las inferencias recomendadas se refieren a lo que debe inferirse. (Se necesitan directrices porque el conjunto de inferencias establecidas suele ser demasiado grande para ser utilizado indiscriminadamente). Mientras que la ontología que examinamos antes nos dice cómo ver, las inferencias recomendadas sugieren cómo razonar.

Estos componentes también pueden ser vistos como las respuestas de la representación a las tres cuestiones fundamentales correspondientes:

  1. ¿Qué significa razonar inteligentemente?
  2. ¿Qué podemos inferir de lo que sabemos? y
  3. ¿Qué debemos deducir de lo que sabemos?

Las respuestas a estas preguntas están en el corazón del espíritu y la mentalidad de una representación; conocer su postura acerca de estos temas nos dice mucho al respecto.

Comenzamos con el primero de estos componentes, examinando dos de las diversas concepciones fundamentalmente diferentes del razonamiento inteligente que se han explorado en la IA. Esas concepciones y sus supuestos subyacentes demuestran la amplia gama de opiniones sobre la cuestión y establecen un contexto importante para los demás componentes.

¿Qué es el razonamiento inteligente?

¿Cuáles son las propiedades esenciales que definen el razonamiento inteligente?

Como consecuencia de la relativa juventud de la IA como disciplina, las percepciones sobre la naturaleza del razonamiento inteligente a menudo han provenido del trabajo en otros campos. Cinco campos --lógica matemática, psicología, biología, estadística y economía-- han inspirado cinco nociones distinguibles de lo que constituye el razonamiento inteligente (ver Tabla siguiente).

Una visión, históricamente derivada de la lógica matemática, hace suponer que el razonamiento inteligente es una variedad de cálculos formales, típicamente deducibles; los ejemplos modernos de esta visión en AI son los logistas. Una segunda visión, arraigada en el trabajo de la psicología, ve el razonamiento como un comportamiento humano característico y ha dado lugar tanto al extenso trabajo sobre la resolución de problemas humanos como a la gran colección de sistemas basados en el conocimiento.

Un tercer enfoque, poco arraigado en la biología, opina que la clave del razonamiento es la arquitectura de la maquinaria que lo realiza, por lo que el razonamiento es un comportamiento de estímulo/respuesta característico que surge de la interconexión paralela de una gran colección de procesadores muy simples. Los investigadores que trabajan en varias variedades de conexionismo son los descendientes actuales de esta línea de trabajo. Un cuarto enfoque, derivado de la teoría de la probabilidad, añade a la lógica la noción de incertidumbre, dando lugar a una visión en la que razonar inteligentemente significa obedecer a los axiomas de la teoría de la probabilidad. Una quinta visión, desde la economía, añade el ingrediente adicional de los valores y preferencias, conduciendo a una visión del razonamiento inteligente definido por la adherencia a los principios de la teoría de utilidad.

Explorar brevemente el desarrollo histórico de los dos primeros puntos de vista ilustrará las diferentes concepciones que tienen de la naturaleza fundamental del razonamiento inteligente y demostrará las profundas diferencias de fondo que surgen como consecuencia.

Razonamiento inteligente: la visión lógica y la visión psicológica

Consideremos primero la tradición que rodea a la lógica matemática como una visión del razonamiento inteligente. Esta visión tiene sus orígenes históricos en los esfuerzos de Aristóteles por acumular y catalogar los silogismos, en un intento por determinar lo que se debe tomar como argumento convincente. (3) La línea continúa con Descartes, cuya geometría analítica muestra que la obra de Euclides, aparentemente preocupada por el material del pensamiento puro (líneas de ancho cero, círculos perfectos del tipo que sólo los dioses podían hacer), podía de hecho conectarse con el álgebra, una forma de cálculo, algo que los simples mortales podían hacer.

En tiempos de Leibnitz la agenda es bastante específica y contundente: no buscó nada menos que un "cálculo del pensamiento" que permitiera resolver todos los desacuerdos humanos con la simple invocación "Calculemos". Para entonces existe una creencia clara y concreta de que, al igual que la geometría de Euclides, que alguna vez fue una geometría divina e inalcanzable, podía ser capturada con el álgebra, alguna (o quizás cualquiera) variedad de esa materia efímera llamada pensamiento podría ser capturada en el cálculo, específicamente la deducción lógica.

En el siglo XIX, Boole proporcionó las bases para el cálculo proposicional en sus "Leyes del Pensamiento"; el trabajo posterior de Frege y Peano proporcionó una base adicional para la forma moderna del cálculo de predicados. El trabajo de Davis, Putnam y Robinson en el siglo XX proporcionó los últimos pasos en la mecanización de la deducción lo suficiente como para permitir a los primeros demostradores automáticos de teoremas.

La descendencia moderna de esta línea de desarrollo intelectual incluye los muchos esfuerzos que utilizan la lógica de primer orden como representación y alguna variedad de deducción como motor del razonamiento, así como el amplio cuerpo de trabajo con la agenda explícita de hacer computacional el razonamiento lógico, ejemplificado por PROLOG.

Esta línea de desarrollo ilustra claramente cómo los enfoques de la representación se basan en la naturaleza del razonamiento inteligente y la forma en que éste se fundamenta. Por ejemplo, se encuentra aquí el desarrollo histórico de la premisa subyacente de que razonar inteligentemente significa razonar lógicamente; cualquier otra cosa es un error o una aberración. Junto a esto, está la creencia de que "lógicamente" a su vez significa lógica de primer orden, por lo general con deducción correcta. Por simple transitividad, estos dos se contraen en una parte clave de la lógica subyacente del razonamiento inteligente: razonar inteligentemente significa razonar de la manera definida por la lógica de primer orden.

Una segunda parte importante de esta visión es la creencia asociada de que el razonamiento inteligente es un proceso que puede ser capturado en una descripción formal, particularmente una descripción formal que es precisa y concisa.

Pero también son posibles puntos de vista muy diferentes sobre la naturaleza del razonamiento inteligente. Una visión claramente diferente se encuentra en la parte de la IA influenciada por la tradición psicológica. Esa tradición, arraigada en el trabajo de Hebb, Bruner, Miller, y Newell & Simon, rompió con la visión de estímulo/respuesta exigida por el conductismo y sugirió en su lugar que el comportamiento de resolver problemas humanos podía ser visto en términos de metas, planes y otras estructuras mentales complejas. Las manifestaciones modernas incluyen el trabajo sobre SOAR como un mecanismo general para producir razonamientos inteligentes y sistemas basados en el conocimiento como un medio para capturar el razonamiento experto humano.

Comparar estas dos tradiciones revela diferencias significativas e ilustra las consecuencias de adoptar una u otra visión del razonamiento inteligente. En la tradición logicista, el razonamiento inteligente se toma como una forma de cálculo, por lo general la deducción en la lógica de primer orden, mientras que la tradición basada en la psicología toma como característica definitoria del razonamiento inteligente que es una variedad particular de la conducta humana. En la visión logicista, el objeto de interés es por lo tanto un constructo definible en términos formales a través de las matemáticas, mientras que para los influenciados por la tradición psicológica es un fenómeno empírico del mundo natural. Por lo tanto, existen dos supuestos muy diferentes sobre la naturaleza esencial del fenómeno fundamental que se debe captar.

Una segunda diferencia surge al considerar el carácter de las respuestas que cada uno busca. El punto de vista logicista ha buscado tradicionalmente caracterizaciones compactas y precisas de la inteligencia, buscando el tipo de caracterizaciones encontradas en las matemáticas (y a veces en la física). La tradición psicológica, por el contrario, sugiere que la inteligencia no es sólo un fenómeno natural, sino que es un fenómeno natural intrínsecamente complejo: como la anatomía y la fisiología humanas son sistemas intrínsecamente complejos que resultan de un largo proceso de evolución, tal vez lo sea la inteligencia. Como tal, la inteligencia puede ser una colección amplia y fundamentalmente ad hoc de mecanismos y fenómenos, para la cual puede no ser posible realizar descripciones completas y concisas.

Son varias las consecuencias útiles que se derivan de la comprensión de las diferentes posiciones adoptadas por cada tradición sobre esta cuestión fundamental. En primer lugar, demuestra que seleccionar cualquiera de los descendientes modernos de esas tradiciones -es decir, cualquiera de las tecnologías de representación mostradas al final de la tabla- significa elegir más que una representación: en el mismo acto también estamos seleccionando una concepción de la naturaleza fundamental del razonamiento inteligente.

En segundo lugar, esas concepciones difieren de manera importante: hay diferencias fundamentales en la concepción del fenómeno que intentamos captar. Las diferentes concepciones a su vez significan que existen profundas diferencias de fondo en el carácter y las metas de los diversos esfuerzos de investigación que intentan crear programas inteligentes. En pocas palabras: diferentes concepciones de la naturaleza del razonamiento inteligente conducen a diferentes metas, definiciones de éxito y diferentes artefactos creados.

Por último, esas diferencias rara vez se expresan. Esto a su vez conduce a argumentos que pueden ser expresados en términos de temas como la elección de la representación (por ejemplo, las virtudes del razonamiento sólido en FOPC vs. la dificultad de caracterizar inferencias producidas por sistemas basados en marcos), cuando los temas reales son, creemos, las diferentes concepciones de la naturaleza fundamental de la inteligencia. Comprender las diferentes posiciones ayuda a analizar y resolver los problemas de manera apropiada.

¿Qué inferencias se autorizan?

El segundo componente de la teoría del razonamiento inteligente de una representación es su conjunto de inferencias autorizadas, es decir, un conjunto seleccionado de inferencias que se consideran conclusiones apropiadas para extraer de la información disponible. La definición clásica viene dada por la lógica formal tradicional, donde las únicas inferencias autorizadas son las inferencias correctas (es decir, aquellas comprendidas por la vinculación lógica, en las que cada modelo para el conjunto de axiomas es también un modelo para la conclusión). Esta respuesta tiene una serie de importantes beneficios, incluyendo la satisfacción intuitiva (un argumento válido nunca introducirá error), explícito (ya que sabemos exactamente de qué estamos hablando), lo suficientemente preciso como para que pueda ser objeto de pruebas formales, y lo suficientemente antiguo como para que hayamos acumulado una experiencia significativa sobre él.

La lógica también ha explorado diversas formas de inferencia poco sólidas, incluyendo la circunscripción y el secuestro. Esta exploración se ha guiado normalmente por el requisito de que haya "una justificación teórica del modelo bien motivada"[19], como por ejemplo el criterio de modelo mínimo de circunscripción. Este requisito mantiene un componente fundamental del enfoque logicista: si bien está dispuesto a llegar a conclusiones que son verdaderas en algún subconjunto de los modelos (y no en cada modelo) el conjunto de inferencias sancionadas sigue siendo concebido en términos teóricos del modelo y se especifica precisamente en esos términos.

Otras representaciones han explorado otras definiciones: los sistemas de razonamiento probabilista (por ejemplo,[20]) permiten las inferencias especificadas mediante la teoría de la probabilidad, mientras que el trabajo sobre los agentes racionales (por ejemplo,[7]) se basa en conceptos de la teoría de la racionalidad económica.

Entre las tecnologías de representación de conocimiento común, los sistemas basados en reglas capturan conjeturas del tipo que hace el experto humano, conjeturas que no son necesariamente ni sólidas ni verdaderas en ningún modelo. Una representación basada en marcos anima a saltar a conclusiones posiblemente incorrectas basadas en buenos resultados, expectativas o incumplimientos. Ambos comparten la tradición psicológica de definir el conjunto de inferencias autorizadas con referencia al comportamiento del experto humano, más que a un modelo formal abstracto.

Forma y contenido de las respuestas

Como muestran estos ejemplos, los diferentes enfoques de representación especifican inferencias autorizadas de maneras que difieren tanto en el contenido como en la forma. Mientras que la especificación de la lógica, por ejemplo, se expresa en términos de teoría de modelos y es matemáticamente precisa, otras representaciones proporcionan respuestas expresadas en otros términos, a menudo con una precisión considerablemente menor. La teoría de los marcos, por ejemplo, ofrece una definición expresada en términos de comportamiento humano y se especifica sólo aproximadamente.

Las diferencias de contenido y estilo, a su vez, tienen su origen en las diferentes concepciones de razonamiento inteligente exploradas anteriormente. La definición en términos de comportamiento humano es apropiada para los marcos porque la teoría concibe el razonamiento inteligente como una forma característica del comportamiento humano. Al tratar de describir ese comportamiento, la teoría se enfrenta a la tarea de caracterizar un fenómeno empírico complejo que sólo puede ser captado en forma aproximada en este momento, y que puede que nunca sea especificable con precisión matemática, de ahí la idoneidad de una respuesta aproximada.

Para la teoría de los marcos, por tanto, la especificación de inferencias sancionadas es tanto informal como empírica, como una consecuencia inevitable de su concepción de la inteligencia. Sin embargo, el trabajo (y otros trabajos como éste) no es descuidado ni carece de precisión causal; la concepción subyacente del razonamiento inteligente dicta un enfoque diferente de la tarea, un conjunto de términos diferentes en los que expresar la respuesta y un enfoque diferente para la respuesta.

El objetivo general es reconocer la legitimidad de una variedad de enfoques para especificar inferencias aceptadas: la teoría de modelos puede ser familiar y poderosa, pero incluso para los sistemas formales no es el único lenguaje posible. En términos más generales, las definiciones formales no son los únicos términos en los que se puede especificar la respuesta. La elección del vocabulario apropiado y el grado de formalidad dependen a su vez de la concepción básica del comportamiento inteligente.

¿Qué inferencias se recomiendan?

Mientras que las inferencias autorizadas nos dicen qué conclusiones podemos sacar, ese conjunto es invariablemente muy grande y por lo tanto nos proporciona una restricción insuficiente. Cualquier sistema automatizado que intente razonar, guiado sólo por el conocimiento de las inferencias autorizadas, pronto se verá abrumado por las elecciones. De ahí que necesitemos algo más que una indicación de qué inferencias podemos hacer legalmente, también necesitamos alguna indicación de qué inferencias son las apropiadas para hacer, es decir, inteligentes. Esta indicación viene dada por el conjunto de inferencias recomendadas.

Obsérvese que la necesidad de una especificación de inferencias recomendadas significa que al especificar una representación también necesitamos decir algo sobre cómo razonar inteligentemente. La representación y el razonamiento están inextricablemente entrelazados, y son útiles: una representación del conocimiento es una teoría del razonamiento inteligente.

Razonablemente a menudo esa teoría ha sido proporcionada por la observación del comportamiento humano. La exposición original de Minsky de la teoría del marco, por ejemplo, ofrece un ejemplo claro de un conjunto de inferencias recomendadas y un conjunto inspirado en la observación del comportamiento humano. Consideremos lo siguiente, de la introducción al artículo original de marcos[17]:

Esta es una teoría parcial del pensamiento..... Cada vez que uno se encuentra con una nueva situación (o hace un cambio sustancial en su punto de vista), selecciona de la memoria una estructura llamada marco; un esquema recordado para adaptarse a la realidad cambiando los detalles según sea necesario.
Un marco...[representa] una situación estereotipada, como estar en una cierta clase de salón o ir a una fiesta de cumpleaños de un niño.

La primera frase ilustra la interrelación entre razonamiento y representación: se trata de un documento sobre la representación del conocimiento, pero anuncia desde el principio que también es una teoría del pensamiento. Esa teoría, a su vez, surgió de una percepción del razonamiento inteligente humano, es decir, de cómo la gente podía llegar a hacer el tipo de inferencias sencillas de sentido común que parecen difíciles de captar en los programas. La teoría señala un conjunto particular de inferencias para recomendar, a saber, el razonamiento en el estilo de la concordancia anticipada.

Se pueden dar caracterizaciones similares de inferencias recomendadas para la mayoría de las otras tecnologías de representación. Las redes semánticas en su forma original, por ejemplo, recomiendan la propagación bidireccional a través de la red, inspirada en el carácter interconectado de las definiciones de las palabras y la parte de la inteligencia humana manifestada en la habilidad de las personas para encontrar conexiones entre conceptos aparentemente dispares. Las reglas de los sistemas basados en el conocimiento recomiendan inferencias plausibles, inspiradas en la observación del razonamiento humano experto.

La lógica, por el contrario, ha adoptado tradicionalmente una postura minimalista al respecto. La representación en sí misma sólo ofrece una teoría de inferencias autorizadas, buscando permanecer en silencio sobre la cuestión de qué inferencias recomendar.

El silencio sobre este tema está motivado por el deseo de generalidad en la maquinaria de inferencia y una forma declarativa (es decir, independiente del uso) para el lenguaje, ambos objetivos fundamentales del enfoque logicista:"... los logicistas se esfuerzan por hacer que el proceso de inferencia sea lo más uniforme y el dominio lo más independiente posible y por representar todo el conocimiento (incluso el conocimiento sobre cómo usar el conocimiento) de forma declarativa". [19]

Pero una representación con estos objetivos no puede destacar ningún conjunto particular de inferencias que se puedan recomendar, por dos razones. En primer lugar, si el proceso de inferencia ha de ser general y uniforme (es decir, trabajar sobre todos los problemas, y trabajar de la misma manera), debe ser neutral en cuanto a qué inferencias recomendar: cualquier subconjunto particular de inferencias que se intente destacar podría ser apropiado en una situación pero fatalmente malo en otra, ya que ninguna estrategia de inferencia (preferencias unitarias, conjunto de apoyo, etc.) es universalmente apropiada. En segundo lugar, si las declaraciones en el lenguaje han de ser declarativas, deben expresar un hecho sin ninguna indicación de cómo razonar con él (la expresión libre de uso es una característica definitoria de una representación declarativa). Por lo tanto, el motor de inferencia no puede recomendar inferencias (o pierde su generalidad y uniformidad) y las afirmaciones de hecho en el lenguaje no pueden recomendar inferencias (ya que al incrustar tal información pierden su carácter declarativo). (4)

El deseo de generalidad y de expresión libre de uso impide así que la representación misma pueda elegir inferencias para recomendar. Pero si la representación en sí no puede hacer la recomendación, el usuario debe hacerlo, ya que la alternativa --búsqueda no guiada-- es insostenible.

Esto es en parte una virtud deliberada del enfoque logicista: impedir que la representación seleccione inferencias y, por lo tanto, exigir al usuario que lo haga, ofrece la oportunidad de que esa información se represente explícitamente, en lugar de estar implícitamente incrustada en la maquinaria de la representación (como, por ejemplo, en los sistemas basados en reglas, o en PROLOG).

Una dificultad con este objetivo admirable surge al tratar de proporcionar al usuario las herramientas para expresar las estrategias y guiar el sistema. Se utilizan comúnmente tres enfoques: hacer que el usuario le diga al sistema qué hacer, que el usuario lo guíe para que haga lo correcto y que construya estrategias de inferencia para propósitos especiales. Al "decirle al sistema lo que debe hacer" queremos decir que el usuario recomiende un conjunto de inferencias escribiendo declaraciones en el mismo lenguaje (declarativo) utilizado para expresar hechos sobre el mundo (por ejemplo, MRS[9]). Al "guiar al sistema a hacer lo correcto" nos referimos a que el usuario seleccione cuidadosamente los axiomas, teoremas y lemas que se le suministrarán al sistema. La presencia de un lema, por ejemplo, no es simplemente un hecho que el sistema deba conocer, sino que también proporciona una manera de abreviar una larga cadena de deducciones en un solo paso, permitiendo que el sistema dé un "gran" paso en una cierta dirección (a saber, la dirección en la que el lema nos lleva). Con una cuidadosa selección de hechos y lemas el usuario puede recomendar indirectamente un conjunto particular de inferencias. Por "estrategias de inferencia de propósito especial" nos referimos a construir estrategias de control específicas directamente en el demostrador de teoremas. Esto puede ofrecer una aceleración significativa y un nivel pragmáticamente útil de eficiencia computacional.

Cada uno de estos enfoques tiene tanto beneficios como inconvenientes. Expresar las estrategias de razonamiento en la lógica de primer orden está en consonancia con el espíritu del enfoque logicista, es decir, la representación explícita del conocimiento en una representación uniforme y declarativa. Pero esto es a menudo problemático en la práctica: un lenguaje diseñado para expresar los hechos declarativamente no es necesariamente bueno para expresar la información imperativa característica de una estrategia de razonamiento.

La selección cuidadosa de los lemas es, en el mejor de los casos, una codificación indirecta de la información orientativa que debe facilitarse. Por último, los mecanismos de deducción para fines especiales son potentes, pero incrustan la estrategia de razonamiento tanto invisible como procedimentalmente, anulando los objetivos originales de inferencia independiente del dominio y de representación explícita y declarativa.

La buena noticia aquí es que al permanecer deliberadamente en silencio sobre el tema de las inferencias recomendadas, la lógica ofrece tanto un grado de generalidad como la posibilidad de hacer que la información sobre las inferencias recomendadas sea explícita y esté disponible para ser razonada a su vez. La noticia menos positiva es que la tarea de guiar el sistema se ha dejado al usuario sin asistencia conceptual, y las prácticas que a veces provocan fracasan en algunos de los objetivos clave que motivaron el enfoque al principio.

Rol IV: Una RC es un medio para computación eficiente

Desde un punto de vista puramente mecanicista, el razonamiento en las máquinas (y algo más debatible, en las personas) es un proceso computacional. En pocas palabras, para usar una representación debemos calcular con ella. Como resultado, las preguntas acerca de la eficiencia computacional son inevitablemente centrales en la noción de representación.

Esto ha sido reconocido desde hace mucho tiempo, al menos implícitamente, por los diseñadores de representaciones: junto con su especificación de un conjunto de inferencias recomendadas, las representaciones ofrecen habitualmente un conjunto de ideas sobre cómo organizar la información de forma que se facilite hacer esas inferencias. Una parte importante de la noción original de marcos, por ejemplo, se refiere a este tipo de sugerencias, como ilustra la introducción del artículo sobre marcos:

Un marco...[representa] una situación estereotipada, como estar en una cierta clase de salón o ir a una fiesta de cumpleaños de un niño.

A cada marco se le añaden varios tipos de información. Parte de esta información se refiere a cómo utilizar el marco. Algunos hablan de lo que uno puede esperar que suceda a continuación. Algunos se refieren a qué hacer si estas expectativas no se confirman.

La noción de desencadenantes y el agregado de procedimientos en los marcos no es tanto una declaración sobre qué procedimientos escribir (sobre esto la teoría es bastante vaga), como una descripción de una manera útil de organizar la información: por ejemplo, (paráfrasis de arriba) adjuntar a cada marco información sobre cómo usar el marco, qué hacer si no se confirman las expectativas, etc. Del mismo modo, la organización de los marcos en jerarquías taxonómicas permite el razonamiento taxonómico y facilita su ejecución (como en las redes estructuradas de herencia).

Otras representaciones ofrecen orientaciones similares. Las redes semánticas tradicionales facilitan la propagación bidireccional por el simple hecho de proporcionar un conjunto apropiado de enlaces, mientras que los sistemas basados en reglas facilitan inferencias plausibles al proporcionar indicadores desde objetivos a reglas cuya conclusión coincide (para encadenamientos hacia atrás) y desde hechos a reglas cuya premisa coincide (para encadenamientos hacia adelante).

Si bien la cuestión del uso eficiente de las representaciones ha sido abordada por los diseñadores de las representaciones, en el sentido más amplio del término, el campo parece haber sido históricamente ambivalente en su reacción. El reconocimiento temprano de la noción de adecuación heurística[16] demuestra que los investigadores apreciaron desde el principio la importancia de las propiedades computacionales de una representación, pero el tono de gran parte del trabajo posterior en la lógica (por ejemplo,[13]) sugirió que la epistemología (contenido de conocimiento) por sí sola importaba, y dejaba fuera de la agenda la eficiencia computacional. La epistemología sí importa, por supuesto, y puede resultar útil estudiarla sin la posibilidad de que distraiga la atención sobre la velocidad. Pero al final debemos calcular con nuestras representaciones, por lo que la eficiencia debe ser parte de la agenda.

El péndulo más tarde se balanceó bruscamente, a lo que podríamos llamar la vista imperativa computacional. Algunos trabajos en este sentido (por ejemplo,[15]) ofrecían lenguajes de representación cuyo diseño estaba fuertemente impulsado por el deseo de proporcionar no sólo eficiencia, sino también eficacia garantizada. El resultado parece ser un lenguaje de velocidad significativa pero con una potencia expresiva restringida[6].

Cualquiera de los dos extremos de este espectro parece problemático: ignoramos las consideraciones computacionales a nuestro riesgo, pero también podemos preocuparnos demasiado por ellas, produciendo representaciones rápidas pero inadecuadas para su uso real.

Rol V: Una RC es un medio de expresión humana

Finalmente, las representaciones del conocimiento son también el medio por el que expresamos cosas sobre el mundo, el medio de expresión y comunicación en el que le contamos a la máquina (y quizás entre nosotros) sobre el mundo. Este rol de las representaciones es inevitable siempre y cuando necesitemos decirle a la máquina (u otras personas) sobre el mundo, y siempre y cuando lo hagamos creando y comunicando representaciones. (5) La quinta función de las representaciones del conocimiento es, pues, como medio de expresión y comunicación para nosotros.

A su vez, esto plantea dos grupos importantes de preguntas. Un grupo es conocido: ¿Qué tan bien funciona la representación como medio de expresión? ¿Qué tan general es? ¿Qué tan preciso? ¿Proporciona una adecuación expresiva? etc.

Una pregunta importante que se discute con menos frecuencia es: ¿Qué tan bien funciona como medio de comunicación? Es decir, ¿qué tan fácil es para nosotros "hablar" o pensar en ese idioma? ¿Qué tipo de cosas se dicen fácilmente en el lenguaje y qué tipo de cosas son tan difíciles como para ser pragmáticamente imposibles?

Observe que las preguntas aquí son de la forma "¿qué tan fácil es?" en lugar de "¿podemos?" Este es un lenguaje que debemos utilizar, por lo que las cosas que son posibles en principio son útiles pero insuficientes; la verdadera cuestión es de utilidad pragmática. Si la representación hace que las cosas sean posibles pero no fáciles, entonces como usuarios reales nunca sabremos si hemos malinterpretado la representación y no sabemos cómo usarla, o si realmente no puede expresar algunas cosas que nos gustaría decir. Una representación es el lenguaje en el que nos comunicamos, por lo que debemos ser capaces de hablarlo sin esfuerzo heroico.

Consecuencias para la investigación y la práctica

Creemos que esta visión de la representación del conocimiento puede influir de manera útil en la práctica y puede ayudar a informar el debate en torno a varias cuestiones de la investigación sobre la representación. Para la práctica ofrece un marco que ayuda a hacer explícitos los puntos de vista importantes y el "espíritu" de una representación, e ilustra la diferencia en el diseño que resulta de satisfacer en vez de violar ese espíritu.

Las consecuencias del punto de vista para la investigación incluyen (i) una concepción más amplia de la representación, instando a que se tengan en cuenta todas las funciones al crear lenguajes de representación, (ii) el reconocimiento de que una representación engloba una teoría del razonamiento inteligente, (iii) la capacidad de usar la visión más amplia de la representación para guiar la combinación de representaciones, (iv) la capacidad de usar la visión más amplia para diseccionar algunos de los argumentos sobre la equivalencia formal de las representaciones; y (v) la creencia de que la representación debe ser más amplia.

Las limitaciones de espacio requieren que esbocemos brevemente estas consecuencias aquí; una discusión completa se encuentra en[5].

Consecuencia para la práctica: Caracterización del espíritu de una representación

Los roles enumerados arriba ayudan a caracterizar y hacer explícito el "espíritu" de una representación, el importante conjunto de ideas e inspiraciones que se esconden detrás (y, significativamente, son a menudo menos obvias que) de la maquinaria concreta utilizada para implementar la representación. El espíritu es a menudo difícil de describir con precisión, pero creemos que está bien caracterizado por los últimos cuatro roles enumerados anteriormente (todas las representaciones son sustitutos, por lo tanto hay poca diferencia entre ellos en el primer rol). La postura que una representación adopta sobre cada uno de estos temas, junto con su justificación para esa postura, indica lo que la representación está tratando de decir sobre cómo ver y razonar acerca del mundo.

La idea de los marcos, por ejemplo, está en su encarnación original[17] principalmente un compromiso ontológico y una teoría del razonamiento inteligente basada en las percepciones sobre la cognición humana y la organización del conocimiento en la memoria.

El mayor compromiso ontológico, por supuesto, es observar el mundo en términos de descripciones estereotipadas, es decir, conceptos descritos en términos de lo que suele ser verdad sobre ellos. Esto es particularmente adecuado para conceptos en el mundo natural, donde las categorías rara vez tienen especificaciones precisas en términos de condiciones necesarias y suficientes, y donde abundan las excepciones. Existe un compromiso ontológico adicional en la vinculación de los marcos con los sistemas para capturar los cambios de perspectiva; esto nos anima a buscar estos cambios cuando observamos el mundo.

La teoría del razonamiento inteligente incrustado en los marcos afirma que gran parte del razonamiento se basa en el reconocimiento, en particular comparando los estereotipos con las instancias individuales. Las sugerencias relativas a la organización del conocimiento se basan en la creencia de que la información en la memoria humana está rica y explícitamente interconectada, más que estructurada como un conjunto de hechos independientes o sólo conectados implícitamente.

La teoría de los marcos recomienda inferencias producidas por la concordancia de estereotipos e instanciamiento, y facilita esas inferencias por la propia estructura del marco, así como la posterior organización de los marcos en sistemas de marcos.

La teoría permite inferencias que son poco sólidas, como en el razonamiento analógico y por defecto que se hace al emparejar marcos. También se sancionan inferencias que implican desajustes relativamente grandes, con el fin de modelar la comprensión que es persistente incluso ante inconsistencias.

La teoría proporciona un medio para el cálculo potencialmente eficiente, al considerar la comprensión como igualación en lugar de deducción. Por último, ofrece un medio de expresión particularmente útil para describir conceptos en el mundo natural, donde a menudo se necesita alguna forma de indicar qué propiedades tiene un objeto normalmente, sin comprometerse con afirmaciones sobre lo que siempre es verdad.

El espíritu debe ser complacido, no superado

Dos consecuencias útiles resultan de caracterizar una representación en estos términos, haciendo explícita y comprensible su posición sobre los roles. En primer lugar, permite una especie de teoría explícitamente invocada del uso de la representación de Whorfian. Mientras que la representación que seleccionemos tendrá consecuencias inevitables para nuestra forma de ver y razonar sobre el mundo, al menos podemos seleccionarla consciente y cuidadosamente, intentando encontrar un par de gafas apropiadas para la tarea que nos ocupa. Los pasos en esta dirección incluirían que los diseñadores de representación caracterizaran cuidadosamente la naturaleza de los vidrios que están suministrando (por ejemplo, haciendo explícitos los compromisos ontológicos, las inferencias recomendadas, etc.) y haciendo que el campo desarrolle principios para hacer coincidir las representaciones con las tareas.

En segundo lugar, esas caracterizaciones facilitarían el uso apropiado de una representación. Por apropiado queremos decir usarlo en su espíritu, es decir, usado para lo que estaba destinado a hacer, no para lo que se puede hacer. Sin embargo, con una regularidad sorprendente, el espíritu original de una representación se ve como un oponente a vencer. Con una regularidad sorprendente, el espíritu se olvida, reemplazado por una visión mucho más mecanicista que ve una estructura de datos en lugar de una representación, computación más que inferencia. Los trabajos escritos con esta mentalidad suelen contener afirmaciones de cómo el autor fue capaz, a través de un acto creativo, heroico y a menudo oscuro, de conseguir una representación para hacer algo que normalmente no hubiéramos pensado capaz de hacer.

Pero si de eso se trata el uso de una representación, se convierte en una forma extraña y terriblemente incómoda de programación: la tarea se convierte en hacer lo que ya sabemos que queremos hacer, pero nos vemos obligados a hacerlo usando sólo los constructos disponibles en la representación, no importa cuán buenos o malos sean los ajustes.

En ese caso, el trabajo creativo es a menudo la superación de la representación, viendo cómo podemos conseguir que se comporte como otra cosa (6). El resultado son representaciones del conocimiento aplicadas de un modo que no está basado en las inspiraciones y percepciones que llevaron a su invención y que son la fuente de su capacidad. Los sistemas construidos con este espíritu a menudo funcionan a pesar de sus representaciones, no por ellas; funcionan porque los autores, aunque con gran esfuerzo, lograron superar la representación.

Consecuencias para la investigación: La representación y el razonamiento están entrelazados

En varias ocasiones en el desarrollo del campo, se ha sugerido que deberíamos considerar la representación del conocimiento en términos puramente epistemológicos, es decir, asumir el papel singular de la representación para transmitir el contenido del conocimiento (por ejemplo,[13]). Como hemos señalado anteriormente, la epistemología importa, pero no es todo lo que importa. La representación y el razonamiento están inextricablemente entrelazados: no podemos hablar de uno sin también, inevitablemente, discutir el otro. Argumentamos también que el intento de tratar la representación como contenido del conocimiento por sí solo conduce a una concepción incompleta de la tarea de construir un razonador inteligente.

Cada una de estas afirmaciones se fundamenta en una observación hecha anteriormente. Observamos primero que cada representación encierra en su núcleo una concepción de lo que constituye el razonamiento inteligente (por ejemplo, la Tabla I). De ahí que toda discusión sobre la representación lleve inevitablemente consigo una visión (quizás implícita) del razonamiento inteligente.

También observamos que, al construir un razonador inteligente no basta con indicar qué inferencias son legales, sino que también necesitamos saber cuáles son las apropiadas (es decir, las recomendadas). Un ejemplo familiar de la lógica muestra muy bien este punto: de \(A\) podemos inferir \(A \wedge A\), \(A \wedge A \wedge A\), etc. Todas estas son inferencias legales, pero difícilmente son inferencias inteligentes.

De ahí nuestra afirmación de que una teoría de inferencia legal es por lo tanto insuficiente; para construir un razonador inteligente también necesitamos una teoría de inferencia inteligente. De hecho, puede haber múltiples teorías de inferencia inteligente, cada una específica a un dominio de tarea en particular.

Consecuencias para la investigación: Combinación de representaciones

Recordemos que una representación es, entre otras cosas, una teoría del razonamiento inteligente y un conjunto de mecanismos para implementar esa teoría. Creemos que la atención apropiada a ambos aspectos, en el orden apropiado, constituye una diferencia significativa en el resultado de cualquier esfuerzo de combinación de representación.

Demasiado a menudo, los esfuerzos de combinación parecen concebidos en términos de encontrar formas para que los dos mecanismos trabajen juntos, con una atención insuficiente (y a veces nula) a lo que consideramos la tarea mucho más importante: determinar cómo las dos teorías del razonamiento inteligente podrían trabajar juntas. Centrarse en los mecanismos significa determinar cómo, por ejemplo, las reglas, los procedimientos y los objetos pueden invocarse mutuamente. Centrarse en las teorías del razonamiento inteligente significa prestar atención a qué tipo de razonamiento está dentro del espíritu de cada representación y cómo esas variedades de razonamiento podrían combinarse sensatamente.

Dos esfuerzos por combinar las representaciones ilustran las diferentes concepciones de la tarea que resulta de centrarse en el mecanismo y en el razonamiento. Como primer ejemplo, consideremos esta descripción del sistema LOOPS[22] y sus esfuerzos para integrar varios paradigmas:

Algunos ejemplos ilustran la integración de paradigmas en LOOPS: el "espacio de trabajo" de un conjunto de reglas es un objeto, las reglas son objetos, y también lo son los conjuntos de reglas. Los métodos en las clases pueden ser funciones LISP o conjuntos de reglas. Los procedimientos en valores activos pueden ser funciones LISP, conjuntos de reglas o métodos de llamada. El anillo en el logo LOOPS refleja el hecho de que LOOPS no sólo contiene los diferentes paradigmas, sino que los integra. Los paradigmas están diseñados no sólo para complementarse entre sí, sino también para ser usados juntos en combinación.

Comparemos la mentalidad y el enfoque de arriba con esta visión de una empresa similar, también dirigida a combinar reglas y marcos[23]:

Las reglas y marcos son dos esquemas opuestos para representar diferentes tipos de conocimiento. Las reglas son apropiadas para representar implicaciones lógicas, o para asociar acciones a las condiciones bajo las cuales se deben tomar las acciones. ... Los marcos (o redes semánticas) son apropiados para definir términos y describir objetos y las relaciones taxonómicas de clase/miembro entre ellos. Una importante capacidad de razonamiento de los sistemas de marcos con semántica bien definida es que pueden inferir las relaciones de clase/miembro entre marcos basándose en sus definiciones.

Dado que las fortalezas y debilidades de las reglas y marcos son complementarias entre sí, un sistema que integre ambos se beneficiará de las ventajas de ambas técnicas. Este artículo describe una arquitectura híbrida llamada programación basada en la clasificación que amplía la arquitectura del sistema de producción utilizando capacidades de clasificación automática dentro de las representaciones de marcos. Al hacerlo, el sistema realza el poder de un patrón de concordancia en un sistema de producción, desde la concordancia simbólica a la semántica, organiza reglas en clases de reglas basadas en sus funcionalidades, e infiere las diversas relaciones entre reglas que facilitan la representación explícita del conocimiento de control.

Obsérvese en particular cómo el primero de estos esfuerzos se centra en los mecanismos computacionales, mientras que el segundo se refiere a la representación y al razonamiento. El primero busca permitir que varias estructuras de programación -entre ellas reglas y objetos estructurados- trabajen juntas, mientras que el segundo intenta permitir que dos representaciones -reglas y objetos estructurados- trabajen juntas. El primero busca permitir mecanismos para invocarse unos a otros, mientras que el segundo considera las diferentes variedades de inferencia naturales a dos representaciones y sugiere cómo esas dos clases de razonamiento podrían trabajar sinérgicamente: las reglas deben ser usadas para el tipo de razonamiento que captan mejor --las implicaciones lógicas no restringidas-- y los marcos deben ser usados por su fortaleza, es decir, el razonamiento taxonómico. El primer trabajo propone una arquitectura computacional, mientras que el segundo ofrece una arquitectura de representación y razonamiento.

Ambas son empresas importantes, pero creemos que donde el objetivo es combinar representaciones, la tarea debe ser concebida en términos centrales para una representación: su teoría del razonamiento inteligente. Para ello, debemos considerar qué tipo de razonamiento esperamos de cada representación, debemos proponer un diseño para la forma en que esos esquemas de razonamiento trabajarán juntos, y debemos tener una justificación para creer que esta será una combinación efectiva. Lo primero y más importante que requerimos en esta tarea es una arquitectura de representación, a partir de la cual se va a seguir la arquitectura computacional adecuada. Creemos que los esfuerzos que sólo se centran en el segundo de estos dos aspectos están comenzando en el lugar equivocado y no llegarán a ser ni mucho menos una parte crucial de la meta.

Consecuencias para la investigación: Argumentos sobre la equivalencia formal

Existe un patrón familiar en la investigación de la representación del conocimiento en el que la descripción de una nueva tecnología de representación del conocimiento es seguida por afirmaciones de que las nuevas ideas son en realidad formalmente equivalentes a una tecnología existente. Históricamente, la reivindicación se ha expresado a menudo en términos de equivalencia con la lógica. Las redes semánticas, por ejemplo, se han descrito en estos términos (por ejemplo,[11],[18], mientras que el desarrollo de marcos condujo a una secuencia de tales reivindicaciones, incluida la sugerencia de que "La mayoría de los `marcos' es sólo una nueva sintaxis para la lógica de primer orden" ([13]).

Que los marcos también pueden ser una sintaxis alternativa parece claro; que son sencilla o simplemente eso parece considerablemente menos claro. El hecho de que los marcos no sean totalmente distintos de la lógica parece claro; que toda la idea pueda verse como lógica parece mucho menos clara.

Creemos que afirmaciones como las anteriores son sustanciales sólo en el contexto de una noción de interpretación estricta de lo que es una representación del conocimiento. Hayes[13] es explícito sobre parte de su postura al respecto:"Se puede caracterizar un lenguaje representacional como uno que tiene (o se le puede dar) una teoría semántica" y también sobre las estrechas líneas trazadas alrededor del argumento:"Aunque a veces se entienden los marcos a nivel metafísico y a veces a nivel computacional, los discutiré como una propuesta representacional", es decir, como un lenguaje con una teoría semántica, y nada más. Tanto la metafísica como la computación han sido consideradas al margen. Y otra vez:"Nada de esta discusión[sobre los marcos como un "dispositivo computacional" para organizar el acceso e inferencia de la memoria] involucra cuestiones de representación". Aquí se hace evidente que la afirmación se refiere menos a marcos y más a una definición de lo que se considerará como "cuestiones de representación".

Nótese que específicamente excluidas de la discusión están el compromiso ontológico de la representación, es decir,"qué entidades se supone que existen en el mundo", y las propiedades computacionales que la representación proporciona. A pesar de las afirmaciones en sentido contrario, argumentaríamos que la ontología de los marcos (y otras representaciones) y las preguntas computacionales no sólo involucran cuestiones de representación, sino que son cuestiones de representación. Estas y otras propiedades son cruciales para la representación del conocimiento tanto en principio como en cualquier uso real.

Consecuencias para la investigación: los cinco roles son importantes

Si bien las representaciones a menudo se diseñan prestando considerable atención a uno u otro de los temas enumerados en nuestras cinco funciones, creemos que todas las funciones tienen una importancia considerable y que ignorar cualquiera de ellas puede dar lugar a insuficiencias importantes. Mientras que los diseñadores rara vez pasan por alto el papel de la representación como sustituto y como definición de inferencias autorizadas, no es raro que haya una orientación insuficiente sobre los otros roles, y las consecuencias son importantes.

Como hemos argumentado anteriormente, por ejemplo, el compromiso ontológico es importante: la orientación que proporciona al dar sentido a la profusión de detalles en el mundo es una de las cosas más importantes que ofrece una representación. Sin embargo, algunas representaciones, en una búsqueda de la generalidad, ofrecen poco apoyo en esta dimensión.

Un argumento similar se aplica a la teoría del razonamiento inteligente: una representación puede guiar y facilitar el razonamiento si tiene en su corazón una teoría de lo que el razonamiento debe hacer. Una orientación insuficiente aquí nos dejará susceptibles a las dificultades tradicionales de la elección no guiada.

La computación pragmáticamente eficiente es importante porque la mayor parte del uso de una representación es (por definición) en el caso promedio. El interés en producir representaciones más débiles para garantizar un mejor rendimiento en el peor de los casos puede ser erróneo, exigiendo mucho más de lo necesario y pagando un alto precio por ello. (7) El uso de una representación como medio de expresión y comunicación, importa porque debemos ser capaces de hablar el lenguaje para utilizarlo. Si no podemos determinar cómo decir lo que estamos pensando, no podemos usar la representación para comunicarnos con el sistema de razonamiento.

Por supuesto, intentar diseñar representaciones para acomodar los cinco roles es un reto, pero creemos que la alternativa es la creación de herramientas con deficiencias significativas.

El objetivo de la investigación en RC

Creemos que la preocupación principal del campo de la representación del conocimiento debe ser comprender y describir la riqueza del mundo. Sin embargo, en la práctica, la investigación que se describe a sí misma como un trabajo de representación del conocimiento fundamental ha concentrado casi todos sus esfuerzos en un canal mucho más estrecho, la mayor parte de ellos centrados en el razonamiento taxonómico y por defecto (por ejemplo,[2],[15],[8]).

Creemos que no es un accidente que la visión útil para encontrar un buen conjunto de abstracciones temporales provenga del examen minucioso de una tarea realista establecida en un dominio del mundo real. Subraya nuestra convicción (compartida por otros; ver[14]) de que intentar describir la riqueza del mundo natural es la función apropiada para el trabajo de RC

Nuestro argumento aquí se refiere tanto al etiquetado como a la metodología: (i) trabajos como[10] y[14] deben ser reconocidos por la comunidad RC como de importancia central para la investigación RC, no categorizados como diagnósticos o física cualitativa y vistos como no relacionados, y (ii) las percepciones obtenidas en[10] y[14] provienen del estudio del mundo, no de los lenguajes. Sostenemos que aquellos que optan por identificarse como investigadores de KR deberían estar desarrollando teoría y tecnología que facilite proyectos como estos; y, en cambio, aquellos que están construyendo proyectos como estos se dedican a una importante variedad de investigación de RC.

Si bien las herramientas y las técnicas son importantes, el campo es y debe ser mucho más rico que eso, principalmente porque el mundo es mucho más rico que eso. Creemos que entender y describir esa riqueza debe ser la preocupación central del campo.

Resumen

Hemos argumentado que una representación del conocimiento desempeña cinco roles distintos, cada uno importante para la naturaleza de la representación y sus tareas básicas. Esos roles crean demandas múltiples, a veces en competencia, que requieren un equilibrio selectivo e inteligente entre las características deseadas. Esas cinco funciones también ayudan a caracterizar claramente el espíritu de las representaciones y tecnologías de representación que se han desarrollado.

Esta visión tiene consecuencias tanto para la investigación como para la práctica en el campo. En el ámbito de la investigación, aboga por una concepción de la representación más amplia que la que se utiliza habitualmente, instando a que los cinco aspectos son cuestiones esenciales de representación. Sostiene que el compromiso ontológico que aporta una representación es una de sus contribuciones más significativas; por lo tanto, el compromiso debe ser sustancial y cuidadosamente escogido. También sugiere que la tarea fundamental de la representación es describir el mundo natural y afirma que el campo avanzaría más lejos tomando esto como su preocupación central.

Para la práctica del trabajo de RC, la perspectiva sugiere que la combinación de representaciones es una tarea que debe ser impulsada por visiones sobre cómo combinar sus teorías de razonamiento inteligente, no sus mecanismos de implementación. La opinión también insta a que se comprenda y se conceda indulgencia al espíritu fundamental de las representaciones. Sugerimos que las tecnologías de representación no deben ser consideradas como oponentes a vencer, forzadas a comportarse de una manera particular, sino que deben ser entendidas en sus propios términos y utilizadas de maneras que se basan en las ideas que fueron su inspiración original y su fuente de poder.

Notas

  1. Por el contrario, la acción puede sustituir al razonamiento. Este dualismo ofrece una manera de entender la relación entre las representaciones simbólicas tradicionales y el enfoque de la acción, que argumenta que la acción puede vincularse directamente a la percepción, sin necesidad de intermediar las representaciones simbólicas.
  2. La frase "compromiso ontológico" no es tal vez precisamente correcta para lo que tenemos en mente aquí, pero es la aproximación más cercana disponible. Mientras que la ontología, en sentido estricto, se ocupa de lo que existe en el mundo, hemos redactado esta sección cuidadosamente en términos de cómo ver el mundo, esquivando intencionalmente muchas cuestiones filosóficas espinosas comunes que rodean las afirmaciones de lo que existe. Una segunda forma de abordar el tema es observar que el "mundo" que nos interesa capturar es el mundo dentro de la mente de algún observador humano inteligente (por ejemplo, un médico, ingeniero, etc.), en cuyo caso se puede argumentar plausiblemente que en ese mundo existen reglas, prototipos, etc., que sí existen.
  3. Obsérvese que incluso al principio hay un indicio de la idea de que la forma deseada de razonamiento podría ser descriptible en un conjunto de reglas formales.
  4. Las consecuencias de este enfoque son evidentes incluso en el uso de la forma normal disyuntiva como representación canónica: aunque \(X_1 \wedge X_2 \wedge X_3 \rightarrow X_4\) es semánticamente equivalente a \(\neg X_1\vee \neg X_2 \vee X_4 \vee \neg X_3\), se pierde alguna información potencialmente útil en la transformación. La primera forma podría ser leída como sugiriendo que \(X_1\), \(X_2\) y \(X_3\) tienen algo en común, a saber, que deben ser consideradas como las precondiciones necesarias para establecer \(X_4\). Esto puede ser una pista útil sobre cómo razonar en el problema, pero si es así, se pierde en la transformación a FND. Considere en cambio lenguajes como microPLANNER y PROLOG, que hacen uso explícito de la forma de la regla de inferencia para ayudar a guiar el proceso de deducción.
  5. Probablemente seguirá siendo útil aunque las máquinas inventen sus propias representaciones de conocimiento basadas en la experiencia independiente del mundo: si sus representaciones se vuelven incomprensibles para nosotros, las máquinas no podrán ni decirnos lo que saben o explicar sus conclusiones.
  6. Por supuesto, es útil establecer la equivalencia de dos representaciones mostrando cómo se puede hacer que una persona se comporte como otra. Pero este es un ejercicio que sólo se debe hacer una vez, y se hace por su propio bien y no porque sea una buena práctica de construcción de sistemas.
  7. Como hemos argumentado en otras partes[4], un "acantilado computacional" (es decir, un comportamiento inaceptable en el peor de los casos) es un problema sólo si no se puede interrumpir toda inferencia, una vez que se pone en marcha. El simple hecho de que el cálculo limitado en recursos evita cualquier inferencia de atrapar permanentemente al programa en una tarea que requiere cantidades de tiempo irrazonables.

References

  • [1] Brachman R, Levesque H, eds., Readings in Knowledge Representation, Los Altos: Morgan Kaufman. 1985.
  • [2] Brachman, R. et. al. KL-ONE Reference Manual, BBN Report No. 3848, July 1978, Bolt, Beranek and Newman, Cambridge, MA.
  • [3] Davis R, Shrobe H E, Representing Structure and Behavior of Digital Hardware, IEEE Computer, Special Issue on Knowledge Representation, 16(10):75-82.
  • [4] Davis R, A Tale of Two Knowledge Servers, AI Magazine, 12(3):118-120, Fall 1991.
  • [5] Davis R, Shrobe H, Szolovits P, What is a Knowledge Representation, Memo, MIT AI Lab, forthcoming.
  • [6] Doyle J, Patil R, Two dogmas of knowledge representation, MIT LCS Technical Memo 387B, September 1989. A revised version of this paper appeared as Doyle J., and Patil R, Two theses of knowledge representation: Language restrictions, taxonomic classification, and the utility of representation services, Artificial Intelligence, 48(3):261-297, 1991.
  • [7] Doyle J., Rationality and Its Roles in Reasoning, Computational Intelligence, 8:376-409, 1992.
  • [8] Fahlman S, Touretzky D and van Roggen W, Cancellation in a Parallel Semantic Network, In Proc IJCAI-81, 257-263, Menlo Park: International Joint Conferences on AI.
  • [9] Russell S, The Compleat Guide to MRS, Report No. STAN-CS-85-1080, Stanford Computer Science Dept, June 1985 (see esp. chapter 6).
  • [10] Hamscher W, Modeling digital circuits for troubleshooting, Artificial Intelligence, 51:223-272, October 1991.
  • [11] Hayes P, In defense of logic, in Proc. IJCAI-77, 559-565, Menlo Park: International Joint Conferences on AI.
  • [12] Hayes P, Naive physics I: Ontology for liquids. University of Essex report, 1978, Essex, UK.
  • [13] Hayes P, The Logic of Frames, reprinted in Readings in Knowledge Representation, pp. 288-295.
  • [14] Lenat D, et al., CYC: Towards programs with common sense, CACM, 33(8):30-49.
  • [15] Levesque H, Brachman R, A fundamental tradeoff in knowledge representation and reasoning, reprinted in Readings in Knowledge Representation, pp. 42-70.
  • [16] McCarthy J, Hayes P, Some philosophical problems from the standpoint of AI, in Machine Intelligence 4, Meltzer and Michie (eds.), Edinburgh: Edinburgh University Press, pp. 463-504, 1969.
  • [17] Minsky M, A framework for representing knowledge, Memo 306, MIT AI Lab, June 1974. (A revised version appeared as: Minsky, M., A framework for representing knowledge, Chapter 6 in The Psychology of Computer Vision, Winston, P. H. (ed.), McGraw-Hill, 1975.)
  • [18] Nash-Webber B, Reiter R, Anaphora and logical form, in: Proc IJCAI-77, 121-131, Menlo Park: International Joint Conferences on AI.
  • [19] Nilsson N, Logic and artificial intelligence, AI, 47:31-56, January 1991.
  • [20] Pearl, J., Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Los Altos: Morgan-Kaufmann, 1988.
  • [21] Pople H, Heuristic methods for imposing structure on ill-structured problems, in AI in Medicine, Szolovits (ed.), AAAS Symposium 51, Boulder: Westview Press.
  • [22] Stefik M, Bobrow D, Mittal S, and L Conway, Knowledge programming in LOOPS: Report on an experimental course, AI Magazine, 4(3):3-10.
  • [23] Yen J, Neches R, MacGregor R, Classification-based Programming: A deep integration of frames and rules, Report ISI/RR-88-213, USC, Information Sciences Institute, Marina del Rey, CA, April 1989.

« Fundamentos Matemátic… « || Inicio || » Introducción a Prover… »