Almacenamiento, consulta y razonamiento
Recuperación y organización de la información
Introducción
El rápido desarrollo de la sociedad de la información, en concreto de las tecnologías implicadas, ha hecho posible la superación de muchas barreras. El almacenamiento de datos es un reto superado. La comunicación es también otro problema resuelto gracias a Internet y la universalidad de sus protocolos de comunicación. Entonces, ¿cuáles son los nuevos retos que superar? Según muchos, es la búsqueda de información y su integración. El ejemplo más claro se puede encontrar en Internet. A pesar de la cantidad de información abrumadora en la red, ¿se encuentra siempre lo que se busca? ¿Cuánto tiempo se tarda en encontrarlo? ¿Cómo hacer las búsquedas para obtener lo que se desea? Muchas de estas preguntas tienen como respuesta viejas soluciones: los metadatos y las ontologías.
Es evidente que no se puede compartir conocimientos si no se encuentra un lenguaje común para describir las cosas. Quizá para eso son útiles las ontologías en informática. Las ontologías se usan para establecer conceptos y relaciones, pudiendo ser compartidas por todos.
Dar significado a los datos ya disponibles en Internet es una tarea que se resuelve añadiendo nuevos datos a los datos. Estos meta-datos expresan la semántica de dicha información, haciendo referencia a elementos de una ontología (compartida por todos).
La idea de la web semántica es establecer un marco, a nivel mundial, capaz de abarcar tareas como la búsqueda teniendo en cuenta la semántica y aportar esa tecnología de integración. Así, Berners Lee, a través del consorcio W3C, pretende establecer una serie de estándares lo suficientemente consensuados como para que sean globalmente utilizados. Por ello han planteado una arquitectura general:
Bases de Datos para el almacenamiento en Internet son:
WIKI de recuperación y acceso a la información
- Página principal del WIKI
- Evaluación de los principales buscadores web
- Sistemas de Question-Answering
- Metadatos y documentos XML/RDF para recuperación
- Lenguajes de recuperación: XML-Query, XQL y Tolog
- Lenguajes de recuperación: SeRQL y SPARQL
- Almacenamiento, consulta y razonamiento: Sesame y Jena
- Modelos de recuperación
- Motores de recuperación de documentos XML/RDF
- Procesamiento del Lenguaje Natural
- Usabilidad y accesibilidad en el posicionamiento
- Clasificación supervisada
- Clasificación no supervisada: clustering y Kohonen
- Fusión de ontologías de metadatos FCA, Onions y Prompt
- Minería de textos web