Modelos para entender las redes sociales

¿Cómo estudiar, analizar y (lo que es más interesante) predecir la semiótica de una red social? En el artículo Semiotics Dynamics for embodied agents, el autor, L. Steels, analiza y plantea este nuevo reto para la AI. Para atacar esta fascinante cuestión (y relacionadas) hay que combinar y comparar métodos de muy diferentes ramas: teoría de redes, lingüística, Representación del conocimiento, Teoría de agentes, etc. A continuación voy a intentar responder a las cuestiones que, de manera natural aparecen con el planteamiento mismo de este desafío:

  1. ¿Tiene interés económico (desde luego que científico lo tiene)?. La rápida expansión de la Web 2.0 hace difícil a los economistas valorar realmente las empresas creadas. Uno de los valores intangibles de este tipo de empresas es el grado de cohesión social de los usuarios (la dimensión semiótica es uno de ellos), que mediría la frecuencia de uso, establecimiento de relaciones, etc. En la Web 2.0, el valor reside en el usuario y lo que el produce y puede producir, y eso es un bien intangible.
  2. ¿Es posible combinar todos esos campos para establecer los modelos adecuados? Sí y no. Sí porque basta establecer grupos de trabajo. No porque la disparidad es absoluta. Por tanto, la respuesta sería más bien: parece que sí.
  3. Si tuviésemos una buena teoría sobre esto, ¿Serviría para predecir el comportamiento de mi proyecto después de unos meses de vida? Por supuesto que sí, con las oportunas precauciones.
  4. ¿Dónde está la teoría de agentes en todo esto? tiempo al tiempo. Ni siquiera sabemos cómo descubrir utilidades nuevas (servicios nuevos) en una sociedad de agentes. En una ponencia que nos acaban de aceptar en el congreso IADIS Intelligent Systems and Agents, titulada Learning services by means formal concept reasoning, analizamos la cuestión de cómo descubrir (para después programar) tales servicios.

Hakia: búsqueda “razonada con sentido (semántico)”

Hakia es un buscador que un equipo multinacional con sede en Nueva York está desarrollando. El objetivo: que el buscador “entienda” la cuestión que se le plantea. Es decir, a diferencia de Google, donde las consultas se basa en palabras clave, el objetivo de Hakia es responder a preguntas como: ¿cuál es el tiempo previsto en Sevilla para mañana? y me responda con una serie de enlaces que responden (o ayudan a responder) a esa pregunta. Más información se puede encontrar en este interesante artículo.

El motivo de esta entrada no es tanto describir Hakia como plantear serias dudas sobre algunas de las ideas que se destilan del artículo antes citado. Básicamente, el artículo comienza hablando de la Web Semántica y enmarca a Hakia en ella. No es estríctamente cierto. Hakia no usa ontologías (aunque las utilice internamente) para sus razonamientos. No es su objetivo la fiabilidad. Se conforman con que se haya entendido la cuestión, para poder responderla. Eso sí puede ser un salto cualitativo, pero, sólo, con las correspondientes killer apps que sean capaces, a partir de preguntas automatizadas de manera adecuada (para que Hakia las responda aceptablemente), anotar los enlaces de resultados. Esto no es muy difícil. Pasos:

  1. Minería de ontologías (humano): experimentar hasta encontrar la ontología de las preguntas respondidas de manera aceptable por Hakia.
  2. Elegir la ontología sobre el tipo de recursos que queremos anotar (geográficos, de música, etc.)
  3. Ejecutar mediante un agente las preguntas pertinentes para poblar la ontología.

¿Qué conseguiríamos con eso? pues una primera anotación automatizada de recursos mediante un buscador con más fiabilidad semántica que Google. Para comenzar, la simple anotación por tags obtenida de esta forma ya debería de mejorar la búsqueda por palabras clave de Google (siempre que Hakia consiga un cierto éxito, claro está). Esta anotación sería (y ese es el segundo paso) una buena herramienta para unificar el penoso sistema de tags (debido a la libertad del usuario en la gestión de éstos) que arrastran muchos proyectos Web 2.0.

Autoconsciencia en redes sociales

Ultimamente he estado observando a red social menéame, que es, para quien no la conozca, una red dedicada a filtrar noticias.Es del estilo de digg, pero con algunas variantes que la hacen interesante desde el punto de vista de la inteligencia colectiva. Sobre todo, porque existen grupos de usuarios que participan activamente y habitualmente en el envío y comentario de noticias.
El motivo de esta entrada es la discusión provocada por una noticia enviada a la red, titulada Los agregadores de noticias se caen. La noticia en sí no es importante (el propio creador de menéame la rebate convincentemente), lo importante es que ha generado una interesante discusión sobre el propio sistema, cómo se valoran las noticias y cómo se valora la participación de los usuarios (mediante una función denominada karma). En la discusión se pone de manifiesto varios aspectos que están ocultos hasta que un tema concreto provoca que salga a la luz, entre los que destaco:

  1. Propuestas de cambio en algunos aspectos
  2. Existencia de subgrupos (implícitos) que condicionan la publicación de cierto tipo de noticias

Para mí, lo más importante es algo que flota en toda la discusión pero que no queda completamente formalizado (salvo en algún comentario sin mucho éxito): se mejoraría si las valoraciones dependieran de los “temas”, y aparecen en juego las etiquetas: que si deben ser proporcionadas por el sistema, que las etiquetas deben tenerse en cuenta a la hora de cálculo del karma, etc.

La protesta de que puedan existir grupos de influencia que distorsionen el servicio de noticias (en el sentido de sesgar la plausible objetividad de la publicación de éstas) es, a mi parecer, un buen campo de experimentación. En una próxima entrada presentaré un caso de estudio utilizando análisis formal de conceptos sobre esto, pero adelanto los resultados que estoy obteniendo. Parece que sí existen, pero no están coordinados, ni siquiera son conscientes del grupo. Sin embargo, si actuasen “semánticamente”, su influencia sería mucho mayor.

La semántica emerge en cualquier red

Aunque las killer apps que alcanzan popularidad no se preocupen de su dimensión semántica (debido a las precauciones de usabilidad: no desean que el potencial usuario se despida por no anotar), ésta aparece. El caso más interesante para mí, debido a las limitaciones del sistema, es la idea de marcar semánticamente los nanomensajes de Twitter. La idea, en fase de elaboración, recuerda (por ahora) a una especie de nanodublin core, llamado twitternanoformats y no sé realmente hasta donde podría llegar de profundidad (debido a la limitación de caracteres de cada mensaje). Concretamente, el truco para marcar con tags es añadir un identificador de los tags (tag:) dentro del mensaje. Aunque, personalmente, definiría dos tipos marcas, la anteriormente citada tag: y otra tagi: (la palabra a continuación es un tag y forma parte del mensaje, y por tanto hay que leerlo como parte de él también). Así, el ejemplo que ponen en la wiki:

My cat is stupid tag:cat tag:stupid

quedaría resumido como

My tagi:cat is tagi:stupid

Las aplicaciones de los nanoformatos pueden ser muchas y muy variadas, sobre todo para filtrar los nanoposts cuando pase algo importante (un atentado, por ejemplo). Una herramienta muy interesante sería una que permitiera al usuario recibir la información que le interese en base a los tags preferidos y una taxonomía personal que los jerarquize.

Un producto Web Semántica + Web 2.0

Freebase sería uno de los productos actuales más ambiciosos de la metaweb. Los datos los añaden los usuarios, pero también, y eso es lo importante, añade los metadatos. De esta forma se habilita el trabajo de agentes software. Aunque me imagino que la primera dificultad que están solventando es cómo convencer al usuario que aporte esos metadatos. Existen tres opciones:

  1. Libertad total, al estilo de siempre (tagging). Desventaja: ¿Cuál es la ontología?
  2. Añadir datos a requeridos a partir de una ontología. Desventaja: ¿Está dispuesto el usuario a entender una ontología que no es personal?
  3. Una mezcla de las dos anteriores. Desventaja: ¿Cómo hacerlo?

En este artículo de T. O’Reilly explica la solución que ahora se aplica. No parece mala. Pero puede ser incompleta. Por ejemplo, un dueño de una compañía puede tener en mente otros datos muy interesantes para su compañía que no queden anotados semánticamente de manera uniforme (son conceptos que no están especificados en la “ontología” de Freebase). Otra característica interesante: licencia creative commons.

Y una incógnita: ¿cómo ganar dinero con esto? No es una fundación al estilo de Internet Archive o la Wikipedia, y parece tener más ambición que Open Directory. La respuesta, como en la mayoría de los proyectos ambiciosos en redes sociales, la encontraremos en el futuro, en como manejarán la ingente cantidad de conocimiento que tendrán a su disposición.

Una previsión más realista

Este gráfico sí es más realista (más certero, a mi entender, que el que comenté en este otro post) sobre el futuro de la Web (debido a Nova Spivack):


En él puede verse como se crea la “MetaWeb” a partir de la Web 2.0 y la Web Semántica. Es importante hacer notar el papel de los weblogs semánticos (como quiera que eso llegue a construirse) y las redes sociales decentralizadas en ese futuro (cuando la semántica pueda llegar al P2P. Ha habido proyectos de ese tipo, como SWAP). Con una dificultad: la gestión de las ontologías no se prevee fácil. Por tanto puede ocurrir que, debido a los problemas de integración (problemas de alta complejidad lógico-cognitiva), los usuarios confíen en servicios centralizados de ontologías para su uso. Luego algo de descentralización si perderemos. Véase al respecto este post de Spivack

Curiosos consejos (e información) para los CEOs sobre Web Semántica

En el Business Week Online aparecen varias ideas sobre la Web semántica para CEOs. Es curioso la columna do y don’t. Refleja perfectamente la perplejidad del que no sabe si comprar/invertir en una tecnología nueva que no dará sus frutos y no proporcionará ventaja competitiva hasta dentro de algunos (muchos para el mundo empresarial) años. En lo que respecta a mis intereses, es muy interesante este do (corto y pego):

  • (Do) Expect training challenges: It often takes people a while to understand the technology. “We’ll spend several years of people doing it and not doing it right”, says Dave McComb, president of consulting firm Semantic Arts.

Y para completar la información un artículo para los escépticos (aquellos que creen que esto de la Web Semántica no va a ningún lado): Taming the World Wide Web.

Una gráfica muy interesante, pero…

En la gráfica que se muestra en planetrdf se representa de manera muy adecuada, a mi entender, la evolución actual de la web semántica junto con la Web 2.0. El gráfico es éste:

Una sóla pega: en la Web 4.0 sólo aparece como indicador relevante los agentes personales inteligentes (uno de las primeras ideas donde aplicar la Web Semántica) y se olvida de la dimensión de los servicios web semánticos para hacer las redes sociales verdaderas redes sociales de servicios. Esto último, de lo que no hay mucho investigado todavía, sería el equivalente -en el ámbito de los servicios web semánticos- a las folksonomías para las ontologías: una forma de ofrecer, adquirir y razonar sobre servicios ofrecidos y ejecutados por componentes de la red social. Un etiquetado “débil” de esos servicios (algo así como una extensión de RSS) podría hacer factible la publicación (y de ahí la explosión) de esos servicios.

El siguiente paso, que estaría en la Web 4.0, consistiría en hacerlos realmente semánticos. Un ejemplo de esto podría ser lo que comenta E. Dans acerca del modelo de negocio de Twitter en la entrada Twitter: ¿chorrada soberana o killer app.?: mantener los servicios gratuitos con funcionalidades básicas junto con otras premium que serán de pago. Esta vertiente comercial plantea, sin embargo, otros problemas interesantes, como la centralidad del grafo de followers y cómo estos serán capaces de gestionar de un modo adecuado los servicios twitter que se ofrezcan, así como la práctica social de este nanoblogging y su evolución futura. La solución pasa por el etiquetado de los nanoposts y aplicar de esta forma el tagging que tanto éxito tiene en otras redes. Digo “pasa” porque no es la solución final. Es un remiendo. Ahí está la Web 4.0

La Web Semántica aparece mencionada otra vez en “El país”

Un poco de divulgación. Una entrevista publicada por el país apunta en la misma línea que el post sobre el número especial de la revista JWS. En la entrevista a Hector García, de Technorati, sobre su empresa y el mundo de los blogs expresa la idea: la Web semántica en el mundo de la Web 2.0 va a implicar pasarle el problema del etiquetado a los autores de la información. Ese “marrón” (como lo llama el autor de la entrevista) es difícilmente digerible por los autores de la información, que son los que generan conocimiento, por lo que eso de que “después la pelota pasará al tejado de los buscadores” es algo idílico en general. A no ser que sean buscadores para “islas semánticas”. Aquí sí será importante, pero es que en esas islas el marcado será algo obligatorio, será parte del trabajo.

Las ontologías para la empresa no la pueden hacer (sólo) los académicos

Esta es la conclusión a la que llegamos mi doctorando Antonio Paredes, el otro codirector de la tesis, José Antonio Alonso, y yo. En la tesis que está realizando Antonio, las dos contribuciones más importantes:

  • Una metodología para la extracción de una ontología a partir de bases de datos comerciales, y
  • Una ontología “pegada a la tierra” para la gestión semántica de esos datos,

nos han demostrado que no vale la aplicación de técnicas generales, hay que especificarlas un poco más. Es necesario, además, contar obligatoriamente con un experto en los dos ámbitos (ontologías y la empresa concreta). Y lo que es más importante: no es sencilla -y en algunos casos ni siquiera relevante- la relación entre ontologías para la empresa desarrolladas en diversos proyectos (como ENTERPRISE, REA, TOVE, entre otras) con una diseñada para una empresa de tamaño medio y con necesidades específicas. Existen, incluso, dificultades para relacionar correctamente algunas clases. Cuando la tesis se termine, y se publiquen los primeros resultados, volveré sobre el tema.