¿Cómo funciona?

Indudablemente son enormes las ventajas de internet a la hora de buscar información, por años ha funcionado muy bien así, pero adolece, como ya se ha comentado en algunas entradas del Blog, de una manera de encontrar información de forma precisa y de poder realizar deducciones con la información.

Supongamos que la Web tiene la capacidad de construir una base de conocimiento sobre las preferencias de los usuarios y que, a través de una combinación entre su capacidad de conocimiento y la información disponible en Internet, sea capaz de atender de forma exacta las demandas de información por parte de los usuarios en relación, por ejemplo, a reserva de hoteles, vuelos, médicos, libros, etc.

Si esto ocurriese así en la vida real, el usuario, en su intento, por ejemplo, por encontrar todos los vuelos a Praga para mañana por la mañana, obtendría unos resultados exactos sobre su búsqueda. Sin embargo la realidad es otra. La figura 1 muestra los resultados inexactos que se obtendrían con el uso de cualquier buscador actual, el cual ofrecería información variada sobre Praga pero que no tiene nada que ver con lo que realmente el usuario buscaba. El paso siguiente por parte del usuario es realizar una búsqueda manual entre esas opciones que aparecen, con la consiguiente dificultad y pérdida de tiempo. Con la incorporación de semántica a la Web los resultados de la búsqueda serían exactos. Lafigura 2 muestra los resultados obtenidos a través de un buscador semántico. Estos resultados ofrecen al usuario la información exacta que estaba buscando. La ubicación geográfica desde la que el usuario envía su pregunta es detectada de forma automática sin necesidad de especificar el punto de partida, elementos de la oración como “mañana” adquirirían significado, convirtiéndose en un día concreto calculado en función de un “hoy”. Algo semejante ocurriría con el segundo “mañana”, que sería interpretado como un momento determinado del día. Todo ello a través de una Web en la que los datos pasan a ser información llena de significado. El resultado final sería la obtención de forma rápida y sencilla de todos los vuelos a Praga para mañana por la mañana.


Buscador Actual

Figura 1 – Resultados obtenidos con un buscador normal


La forma en la que se procesará esta información no sólo será en términos de entrada y salida de parámetros sino en términos de su SEMÁNTICA. La Web Semántica como infraestructura basada en metadatos aporta un camino para razonar en la Web, extendiendo así sus capacidades.

No se trata de una inteligencia artificial mágica que permita a las máquinas entender las palabras de los usuarios, es sólo la habilidad de una máquina para resolver problemas bien definidos, a través de operaciones bien definidas que se llevarán a cabo sobre datos existentes bien definidos.

Para obtener esa adecuada definición de los datos, la Web Semántica utiliza esencialmente RDF, SPARQL, y OWL, mecanismos que ayudan a convertir la Web en una infraestructura global en la que es posible compartir, y reutilizar datos y documentos entre diferentes tipos de usuarios.

  • RDF proporciona información descriptiva simple sobre los recursos que se encuentran en la Web y que se utiliza, por ejemplo, en catálogos de libros, directorios, colecciones personales de música, fotos, eventos, etc.
  • SPARQL es lenguaje de consulta sobre RDF, que permite hacer búsquedas sobre los recursos de la Web Semántica utilizando distintas fuentes datos.
  • OWL es un mecanismo para desarrollar temas o vocabularios específicos en los que asociar esos recursos. Lo que hace OWL es proporcionar un lenguaje para definir ontologías estructuradas que pueden ser utilizadas a través de diferentes sistemas. Las ontologías, que se encargan de definir los términos utilizados para describir y representar un área de conocimiento, son utilizadas por los usuarios, las bases de datos y las aplicaciones que necesitan compartir información específica, es decir, en un campo determinado como puede ser el de las finanzas, medicina, deporte, etc. Las ontologías incluyen definiciones de conceptos básicos en un campo determinado y la relación entre ellos.

Otra tecnología que ofrece la Web Semántica para enriquecer los contenidos de la Web tradicional es RDFa. Mediante RDFa se pueden representar los datos estructurados visibles en las páginas Web (eventos en calendarios, información de contacto personal, información sobre derechos de autor, etc.), a través de unas anotaciones semánticas incluídas en el código e invisibles para el usuario, lo que permitirá a las aplicaciones interpretar esta información y utilizarla de forma eficaz. Por ejemplo, una aplicación de calendario podría importar directamente los eventos que encuentra al navegar por cierta página Web, o se podrían especificar los datos del autor de cualquier foto publicada, así como la licencia de cualquier documento que se encuentre. Para extraer el RDF se podría utilizar GRDDL, una técnica estándar para extraer la información expresada en RDF desde documentos XML, y en particular, de las páginas XHTML.

Para finalizar con esta entrada tomada casi textualmente del a W3C, viene bien recordar:

Las ontologías permiten trabajar con conceptos, en lugar de palabras clave, en los sistemas de recuperación de información. Desde el punto de vista de las fuentes de información, éstas describen el contenido de los repositorios de datos independientemente de la representación sintáctica de los mismos, posibilitando su integración semántica.

Veamos un último ejemplo de Ontología tomado de la Universidad de Vallladolid… Supongamo que podamos preguntar sobre los dentistas que se encuentren a una cierta distancia de nuestro domicilio. Una de las respuestas que podría ofrecer el agente sería:

  • Dra. Macías – Dentista – ortodoncia
  • Consulta Particular (85€)- –
  • c/Rosa 4 – a 2 km –
  • Hospital Clínico “La Paz”- –
  • c/Principal 17 – a 5 km.

Incluso si la página Web de la Dra. Macías no tuviera especificada la dirección del hospital, el agente Web de búsqueda podía utilizar un atributo de los dentistas (Trabaja_en_Hospital), y con el valor de este atributo encontrar el atributo Dirección del concepto Hospital y mostrar esta información del hospital concreto de esa instancia de Dentista. Además de utilizar estas propiedades de relaciones y herencia de los conceptos especificados, mediante los axiomas se tendría mayor capacidad expresiva del dominio almacenado.

 

El portal dedicado al análisis y difusión de materiales y eventos de Web Semántica