De vueltas con la formación científica en Ciencias de la Computación e Inteligencia Artificial

esquema de cómo aplicar model checking en un sistema industrial

La redacción de la entrada donde hablaba de la frustración con que se afronta en España el futuro de las Ciencias de la Computación e Inteligencia Artificial (CCIA) -como entidad independiente de las tecnologías que la usan- me sugirió la idea de dar nota de otros ejemplos llamativos. Básicamente, y sin pretender ser exhaustivos, me he interesado por anuncios que presenten el problema de manera diferente. También quiero dejar claro que afortunadamente existen excepciones en España que son prometedoras.

Por tanto, como la entrada a la que hago mención cubre el campo de las ofertas de trabajo, ahora comento dos que cubren otros aspectos:

  1. I+D en la empresa. Una de las start-up más interesantes que sigo es la que los autores de Pellet han creado en torno a su demostrador. Es emblemática por varios motivos. En primer lugar, adoptan la filosofía del software libre como motor de innovación y plantean el modelo de negocio en torno a sus productos. En segundo lugar, su producto estrella es un demostrador automático, palabra prohibida en la teoría o en la práctica en los curriculums de matemáticos e informáticos. Y en tercer lugar, por su activa apuesta por la formación de sus trabajadores, colaboradores y/o becarios. Es esto último lo más llamativo: Los colaboradores-estudiantes van camino de conseguir tesis doctorales en universidades de prestigio. Otra cosa impensable en nuestro desolador panorama científico. Y no sólo porque la empresa, en general, sólo desea programadores. También por el ambiente clientelista de las carreras técnicas para con las empresas contratadoras. Por supuesto, el caso del que hablo no es único; es sólo un ejemplo reciente. Este caso también es especialmente llamativo porque una de las rutinarias quejas en este país es la deficiente transferencia de la investigación de las universidades a las empresas. Cuando leo o escucho una de esas quejas, me sorprende que casi nadie (de ambos bandos) reivindique la condición necesaria para que esto ocurra: Las empresas deben incentivar, contratar y tener doctores, para así entender la importancia, evaluar y aplicar los resultados. Pero eso tiene un coste que muchas empresas en España no pueden o no desean sufragar. Porque es una actitud equivocada pensar que la Universidad debe proveer la tecnología, la herramienta acabada, convirtiéndose en una subcontrata. La Universidad puede aportar en mucho mayor grado conocimiento, que debe ser aplicado. Pero eso, como digo, es caro. Que apliquen otros.
  2. Investigación de calidad. Recientemente la Association for Computing Machinery (ACM) -cuyo lema es Advancing Computing as a Science & Profession- ha otorgado su prestigioso premio ACM Turing award a tres investigadores que he seguido con devoción estos últimos años. Se trata de Edmund M. Clarke, E. Allen Emerson, y Joseph Sifakis, los fundadores de la teoría de model-checking como la gran herramienta para la verificación formal. Cuando leí el artículo tuve la misma sensación que cuando me atreví a decir que ningún egresado de los nuevos planes de estudio españoles resolverá el problema P?NP. Pero, en este caso, con mayor dolor. Me explico. En mi opinión, ese problema sólo se podrá atacar desde la teoría de conjuntos y la teoría de modelos, es decir, realmente es un problema lógico-matemático-computacional. Sin embargo, el model checking no es una herramienta puramente teórica, es usable y está implementada en muchos sistemas. Pero el desconocimiento y las deficiencias en lógica computacional impedirán su uso generalizado en países como España, por las razones que ya comenté. Y en mi campo de interés, agentes inteligentes y Web Semántica, se puede convertir en una herramienta crítica para hacer de la teoría de agentes una verdadera ingeniería, al presentar un soporte formal para la verificación del producto software en este campo. La idea de usar semánticas de tipo Kripke en el campo de sistemas multiagente ya la adelantaron Joseph Y. Halpern, Moshe Y. Vardi en su trabajo clásico Model Checking vs. Theorem Proving: A Manifesto, donde argumentan que el razonamiento basado en modelos es mucho más eficiente que la demostración automática para la verificación (aunque teniendo en cuenta que está basado en modelos). Concluyendo, vista la situación de la ciencia en España, me atrevo a pronosticar que será muy difícil que un nuevo licenciado diseñe el lenguaje de programación orientado a agentes racionales que toda la comunidad científica de este campo persigue, desde la propuesta fundacional de Y. Shoham.

Me temo que prontamente presentaré nuevos ejemplos, de perfil completamente distinto, donde se volverá a mostrar en toda su crudeza la previsible pérdida de competitividad de la ciencia española frente a la de otros países, debido a la progresiva mercantilización de la educación superior.

Auto-reparación y persistencia de los usuarios en redes sociales

Una telaraña reparada por un humano con hilos

Esta entrada está sugerida por dos fenómenos que he observado atentamente estas últimas semanas.

  1. El primero, muy interesante, es la resonancia en menéame de la noticia sobre la consecución del campeonato de la liga de fútbol por parte del Real Madrid. La noticia, debido a problemas de validación social del sistema (principalmente, una combinación de noticias duplicadas junto con el uso de la función reputación como función de veto -restando fuerza a la noticia- por parte de algunos usuarios), no llegó a portada. Este hecho provocó una importante discusión y recelo de muchos usuarios. Lo que me interesó del fenómeno fue que esto no provocó, en apariencia, que un número significativo de usuarios manifestaran su deseo de abandonar la red. Por tanto, parece que existe algún tipo de cohesión social, más allá de las clásicas teorías sobre redes libres de escala, que permitió que la arquitectura social de menéame, basada en una función de reputación, no se resintiera con grandes pérdidas de usuarios. En cierto modo, pasado el tiempo la arquitectura social se (auto)reparó. Una cuestión muy interesante (de investigación) consiste en localizar qué parámetros reflejan ese grado de cohesión, que parece que depende mucho del tiempo de vida de la red. Aunque los parámetros o factores podrían representarse con modalidades (como se hacen en sistemas multiagente), la realidad es que esos factores deben depender fuertemente de algún tipo de conexión difícil de precisar. Creo que sería una combinación de actitudes mentales y parámetros numéricos asociados a la red, lo que permitiría formalizar tales relaciones para determinar realmente cuál es la estructura social emergente. Véase este artículo para una introducción al respecto.
  2. Otro ejemplo diferente, pero similar en cuanto a las consecuencias, es la sorprendente estabilidad social de twitter ante las contínuas deficiencias del sistema. En este caso, los usuarios siguen utilizándolo aún estando limitado, y no parecen que piensen en cambiar a otro. Personalmente, creo que en este caso sí es debido a que twitter explicita con mayor rotundidad la red social, particularmente el entorno de cada usuario(followers and followings), lo que provoca que los nodos con alta conectividad y mucho uso de twitter mantengan en la red a sus seguidores. Es decir, las características propias de una red compleja libre de escala facilitan la persistencia de los usuarios. Juega a favor de esta hipótesis la propia filosofía de twitter (se comunican cosas más personales y no se establecen relaciones discursivas permanentes).

Finalmente, también existe otro factor que puede explicar, en parte, la persistencia en la red social: los usuarios descontentos no abandonan la red por la imposibilidad de exportar su vida digital en ésta. Es decir, por la dificultad de extraer toda la información que han añadido para usarla en otra red similar (o no). Esta limitación podría, en el futuro, ser resuelta si proyectos como dataportability se consolidan.

EEUU toma posiciones en la próxima oleada de aplicaciones sociales frente a Europa (y por supuesto, frente a España)

un combate de boxeo entre un peso pesado y un hombre débil

Esta entrada es una reflexión provocada por las últimas aplicaciones que he analizado (siempre desde la perspectiva de la Inteligencia Artificial), así como por los temas en los que estoy trabajando. Me da la sensación, viendo los nuevos proyectos, que Silicon Valley toma otra vez la delantera en innovación a Europa. Más concretamente, en la utilización masiva (y con valor añadido) de tecnología de la Web Semántica. Por supuesto, si nos centramos en España, nos encontramos con un desierto. A continuación enumero las diferencias que más me han sorprendido a la hora de afrontar los proyectos más interesantes:

  1. Aquí seguimos hablando de redes sociales clásicas mientras allí hablan de sociedades y aplicaciones semánticamente aumentadas: Freebase, Twine, zigtag, Powerset… Excepciones: En Europa hay algunas, pero no se han lanzado todavía.
  2. Aquí seguimos analizando fenómenos como youtube y los vídeos en las redes, mientras que allí hablan de web semántica ubicua, aplicaciones “listas” para móviles a partir de la experiencia acumulada, etc. Excepciones: proyectos interesenates como Kimia.
  3. Aquí nos fascina la geolocalización y allí ya la tienen saturada de aplicaciones y trabajan en aplicaciones sociales que se basan en eversión…
  4. Aquí no hablan -todavía- claramente de modelos de negocio mientras que Youtube, Twitter, ya tienen opciones sobre la mesa…
  5. Aquí se hacen cientos de conferencias donde se habla de blogs, periodismo ciudadano, consecuencias sociales de la Web 2.0, etc. mientras que allí abundan conferencias de tecnología semántica y empresas. En éstas se está gestando la nueva Web .
  6. Allí los nuevos gurus tienen una importante empresa detrás. Aquí eso es raro.
  7. El crowdsourcing es, en España, una obra de beneficiencia (por ahora). Allí tienen importantísimos proyectos como Innocentive.
  8. Allí la Inteligencia Colectiva prometedora se basa en considerar a la gente como neuronas aumentadas (zigtag.com, gwap.com ). Aquí sólo se aplica la versión clásica,

Pos supuesto, existen muchas más excepciones en Europa. Una de las iniciativas más interesantes que he encontrado se basa en considerar una ciudad (sociedad) entera como laboratorio de nuevas aplicaciones. Por mantener un poco de optimismo, y dejando a un lado la crónica dependencia de las instituciones europeas para la investigación, mi opinión es que existe margen para obtener ventaja competitiva en algunos campos, pero para eso se necesita una apuesta más fuerte por proyectos que parecen completamente inviables a medio plazo, pero con una potencialidad enorme.

El procesamiento del lenguaje natural no es el camino para obtener aplicaciones semánticas, según Peter Norvig

un montoón de letras desordenadas

Peter Norvig rebaja las espectativas sobre la búsqueda en lenguaje natural. De esta forma -no sé cuanto de corporativo hay en su opinión, pues ahora trabaja para Google- desinfla la noticia sobre el buscador Powerset sobre la Wikipedia. En cierto modo, estoy de acuerdo: si este buscador tiene éxito es porque se localiza en un repositorio de conocimiento organizado. La Wikipedia no es internet, y el proyecto DBpedia ya ha mostrado la potencialidad que tiene el tratamiento del conocimiento contenido en la Wikipedia. Sin embargo, fuera de la Wikipedia hay poca organización del conocimiento (salvo en proyectos como Freebase), lo que hace muy difícil que cualquier aproximación que use el lenguaje natural sea superior a la búsqueda actual con Google. Aunque, por otro lado, sí existen otras opciones, como el tratamiento de la búsqueda mediante el aprovechamiento de la anotación social por etiquetas o la navegación lingüística. La primera se enfrenta con la absoluta libertad de los usuarios en la etiquetación, lo que hace hace el problema muy difícil de resolver. La segunda consistiría en la navegación visual sobre la información con enlaces etiquetados mediante relaciones lingüísticas (como “sirve para”, “creado por”). Es decir, aprovechar (visualmente) RDF pero a alto nivel, donde los roles correspondieran a conexiones lingüísticas.

Una oferta de trabajo versus la realidad de las Ciencias de la Computación en España

Dibujo humorístico sobre el razonamiento automático
Me acaba de reenviar mi compañero J. Antonio Alonso el siguiente correo:

ANU College of Engineering and Computer Science
Computer Sciences Laboratory

Research Fellow

Fixed Term – 2 Years

Applications are invited for a postdoctoral position to work on a project entitled “Foundations and Architectures for
Agent Systems”, which is funded by the Australian Research Council. Applicants should have research expertise in at
least one of agents, machine learning, artificial intelligence, computational logic, or a cognate discipline, and preferably
have strong mathematical skills.

Details at http://info.anu.edu.au/hr/Jobs/Academic_Positions/_CECS4794.asp

Closing Date: 6 June 2008

No es la primera ni la última oferta de este tipo que me llega (ya han llegado otras similares de empresas como Intel, de la que desarrolla el demostrador Pellet, etc.). Pensando no sólo en candidatos, sino en futuros candidatos a este tipo de puestos, he llegado a la conclusión de que algo falla en el sistema educativo español con respecto a la Computación y la Inteligencia Artificial entendida como ciencia. Veamos:

  1. No existe una implantación generalizada de (la licenciatura en) Ciencias de la Computación e IA separada de la Ingeniería Informática. Aunque muchos creen que la primera es parte de la segunda, la realidad es que la Computación juega el mismo papel que las matemáticas dentro de la Ingeniería.
  2. Se debe potenciar mucho más los contenidos matemáticos en los primeros años de los estudios de Ingeniería Informática, hasta el nivel de la licenciatura en Matemáticas. Es impensable que alguien sin conocimientos asentados en matemáticas desarrolle nuevas aplicaciones de gran calado.
  3. Se pueden contar con los dedos de una mano los programas de doctorado con esa orientación (es decir, como el que coordino). Esta situación contrasta llamativamente con lo que ocurre en otros países de nuestro entorno como Portugal, Francia, Reino Unido o Alemania. En esos países sí se forman -de manera habitual- candidatos para este tipo de ofertas.
  4. La actual dinámica de creación de másters propiciada por el proceso de Bolonia está haciendo desaparecer programas de doctorado con perfil investigador, que no pueden competir con el efecto de marketing que los primeros. De ahí que la verdadera innovación, la que nace de la ciencia, quede relegada en nuestro sistema educativo superior en aras del mercado. Me resulta sorprendente que a doctorados de nuestro programa los contraten inmediatamente en laboratorios y centros de investigación (en el Reino Unido y en Italia los últimos), mientras que la dinámica en España sea la contratación como programadores. Incluso, en el campo de mi interés -razonamiento automático en la Web Semántica- existe una potencialidad enorme que no puede ser cubierta por titulados españoles, por las carencias en lógica matemática o simplemente en matemáticas.
  5. El futuro no se presenta mejor: El proceso de creación de nuevos planes de estudios, impulsado artificialmente con el pretexto de la declaración de Bolonia, pretende un acercamiento al mercado que es muy peligroso si pervierte los estudios más proclives a ello, como por ejemplo las ingenierías.

Por resumirlo gráficamente, podemos predecir que no será un estudiante español el que resuelva el problema de si P es distinto de NP.

Factoría Web 2.0 en la ETSII, 30 de Abril

logo de factoría Web 2.0logo de flowerinspace

La empresa flower in space organizó, con la ayuda de la junta de Andalucía, un taller denominado Factoría Web 2.0 donde alumnos universitarios fueron formados para el lanzamiento de nuevos proyectos Web 2.0. El día 30 de Abril se presentaron en la escuela, dentro una jornada sobre emprendedores, los proyectos. De la jornada destacaría las intervenciones de Javier Martín (loogic.com), Bernardo Hernández (director de Google maps y Google earth e inversor en multitud de proyectos como idealista.com o tuenti) y la intervención de Rodolfo Carpintier, presidente de Digital Assets Deployment. El primero presentó una visión muy general de cómo estaba la situación de la Web 2.0 en cuanto a oportunidades de negocio, clarificando un poco el mercado potencial donde se deben mover los proyectos Web 2.0. La segunda fue una interesantísima inmersión en el agitado mundo de los emprendedores Web 2.0, desde su propia experiencia. La tercera que menciono era, quizás, la más necesaria. Rodolfo estableció en pocos minutos el terreno de juego donde los que quieran emprender deben moverse, y las condiciones generales bajo las cuales es importante, necesario o irrelevante la búsqueda de financiación de capital riesgo. Algunos de mis alumnos, con ánimo emprendedor, salieron muy animados de las charlas.

La última parte de la mañana estuvo dedicada a la presentación de los trabajos de los alumnos que han participado en el taller. Personalmente -sin minusvalorar a los que no cito- me parecieron muy interesantes tres:

  1. El dedicado a la gestión social de los viajes fin de curso (con un modelo de negocio claramente perfilado desde el principio).
  2. El dedicado a la gestión de tu curriculum online (y en el futuro, a la gestión inteligente de éstos). Si bien no es una red social, las pretensiones de los autores van más allá de una mera herramienta online, puesto que podrían ser capaces de hacer selecciones inteligentes de candidatos, una vez la información esté organizada como “conocimiento” en base a las plantillas que la plataforma facilita para la confección del curriculum.
  3. Placechannel.com. Aunque la idea en sí misma no es nueva y tiene potentísimos competidores, la aplicación es tremendamente adictiva. Consiste en utilizar la api de google earth y youtube para organizar geográficamente los vídeos de éste. Personalmente, si los creadores potenciaran la georreferenciación y aceptaran metadatos sobre el vídeo sería una verdadera killer-app.

Enhorabuena a los organizadores del evento y a los responsables y alumnos del taller por el trabajo realizado.

El estigma de la Inteligencia Artificial, la divulgación del conocimiento y la Web 2.0

imagen de un cerebro con localización de donde se presume que se hacen ciertas tareas
El estigma que surgió en el mismo nacimiento de la Inteligencia Artificial (IA) -en la conferencia de Darmouth- sigue ahí. Me refiero, claro está, a definir el objetivo de la IA como la consecución de un ser inteligente artificial. Lo curioso es que ahora lo conservan y mantienen tanto los especialistas cuando imparten conferencias generalistas (lo cual es, hasta cierto punto, inevitable) como los profanos en la materia que desean llamar la atención. Estos últimos, entre los que se incluyen periodistas (profesionales y aficionados, bloggers, etc.) producen un efecto devastador sobre la imagen de la IA. Desvirtúan muchos de los progresos que se hacen y se harán mediante metáforas completamente desafortunadas, que siempre dejan entrever más de lo que realmente se ha conseguido. Utilizar símiles antropomórficos para programas o agentes software fuera de la comunidad científica induce a errores de percepción muy peligrosos. Por ejemplo, el lector profano puede creerse completamente el símil (y creer que se ha avanzado espectacularmente en el desarrollo de agentes racionales artificiales) o, lo que es peor, no creerse absolutamente nada porque percibe que el resultado publicitado es inalcanzable (y rechazar como falso importantes avances).

En una entrada anterior sobre el problema de la difusión científica no hacía referencia a este aspecto, pero, en realidad, está muy relacionado. Ceder la difusión especializada a entidades privadas (lo que desgraciadamente sufrimos ahora) es un problema tan grave como el hecho de ceder la divulgación de los logros a blogs de aficionados, sitios de promoción de noticias, periódicos generalistas, revistas divulgativas de carácter amarillista, etc. El daño, aunque de distinto tipo, es mucho mayor porque esos artículos no pasan ningún tipo de revisión por especialistas con formación en divulgación (salvo honradas excepciones). Todos nos hemos encontrado alguna vez con un artículo sobre algo de lo que ha estudiado lleno de dislates. Incluso, con la convicción de que el autor del artículo se ha limitado a transcribir palabras clave sin saber de lo que habla (como ocurrió cuando se demostró el último teorema de Fermat, donde se podía encontrar artículos claramente errados, incomprensibles o amarillistas).

¿Cómo podríamos intentar resolver esto? Aquí la respuesta de la entrada anteriormente citada sí es válida: ecosistema de blogs académicos. En mi opinión, una de las mejores soluciones pues se apoya en una tradición Web 2.0 ya asentada con éxito. Por experiencia sé que cuando uno intenta escribir en un blog sobre su trabajo intenta, inconscientemente, usar un estilo divulgativo (otra cuestión es que se consiga). No es incompatible escribir una entrada divulgativa con un enlace a los resultados técnicos a los que hace referencia el autor, para que, mediante enlaces, se pueda nivelar la complejidad del conocimiento que deseamos comunicar. De hecho, es una buena forma de presentar nuestros trabajos más allá del sucinto abstract que siempre los acompañan.

La nueva página del programa de doctorado “Lógica, Computación e Inteligencia Artificial”

una imagen elegida del portal del CSIC

Bueno, en realidad es este portal, donde (gracias al todopoderoso moodle) se gestionará la docencia del programa. Todavía quedan muchos detalles por resolver, y evidentemente este año no se usarán todas las potencialidades que nos ofrece el sistema, pero parece que ya he conseguido introducir la información principal. Disculpad, en todo caso, los errores que todavía pueden aparecer (y aparecerán). Dentro de poco espero poder comunicar buenas e interesantes iniciativas para el curso próximo que afectarán profundamente a la docencia del programa.

Mobile Monday Andalucía, 28 de Abril

cartel del mobile monday Andalucía

Es el primer mobile monday que se celebra en Andalucía. que se puede describir como (c&p del diario metro): una comunidad global de profesionales de la industria de la telefonía móvil, que promueve la cooperación, el intercambio y la innovación entre más de cien mil hombres de negocios y sus empresas en 40 ciudades de todo el mundo centrada en los móviles. El programa de charlas, muy interesantes, consistía en:

  1. Un breve resumen de la apuesta de Yahoo! por los móviles con sus nuevas aplicaciones (Yahoo! mobile-catalyzing the mobile industry, Alejandro Romero de Yahoo!). Como ya comenté en otro post, personalmente me parece que esta compañía está apostando por dispositivos de permeabiliad, es decir, plataformas y aplicaciones que hagan la Web 2.0 ubicua, y con las aplicaciones que presentaron parece que lo van a conseguir.
  2. Una descripción de las potenciales aplicaciones de RFID en móviles (NFC and new wireless applications for mobile communications, Angel Romero de AT4 Wireless). Algunas de ellas muy interesantes. Curiosamente, algunas ideas me recordaban a las aplicaciones de RFID que se comentaron en el encuentro Inclusiva-Net 2008 en el que participé.
  3. La más interesante para mí fue la presentación de la startup (bueno, ya está un poco incubada) llamada Kimia (How Harry Potter can lead us to a new mobile Internet experience, Antonio Navas de Kimia). La idea es empaquetar contenidos múltiples obtenidos mediante el uso de RSS para enviar a usuarios y entre usuarios, contenidos seleccionados de internet en “contenedores”.
  4. Vodafone presentó su apuesta (que conozco pues me beneficio de ella) por innovaciones interesantes, concretas, y de alto valor añadido para los móviles (Vodafone Spain, Innovation in the total communications market, Jorge Gató, Vodafone). Por experiencia sé que la apuesta es fuerte, y creo que es una buena estrategia para comerle mercado a Movistar en la nueva generación de servicios.
  5. Finalmente habló, en sustitución de Rafael Selma, un antiguo alumno mío, Antonio Amador, sobre el proyecto, ya realizado, para gestionar poder usar las firmas digitales desde los móviles (Digital signature on the mobile phone). Es muy interesante como han diseñado la idea de, en definitiva, integrar una identidad digital certificada en nuestros dispositivos. En cierta manera, resuelve el problema de la identidad digital de manera directa mientras que en Internet todavía se está gestionando una solución adecuada.

Finalmente hubo una networking party donde contacté con el responsable de que la wikipedia se pueda consultar en vodafone live, y discutí algunos aspectos (sobre todo de coste) que creo que frenan mucho las aplicaciones basadas en contenidos en móviles.