Buscadores semánticos

Anuncio
Buscadores basados en agentes inteligentes
Los buscadores de contenido

Estos han sido esenciales a lo largo de
todo el desarrollo de la web.

Basados en coincidencias de palabras o
frases.
Desventajas

Escasa precisión o relevancia en los resultados:
 Esto significa que se devuelven muchos documentos
poco relevantes para la búsqueda. Debemos tener en
cuenta que la presencia de una palabra clave en un
documento no implica que éste sea relevante para
nosotros.

Excesiva sensibilidad al vocabulario empleado en
las búsquedas:
 Por lo tanto, la dificultad de obtener a la primera todos los
resultados relevantes disponibles.
Semántica

El término semántica (del griego semantikos, "lo
que tiene significado") se refiere a los aspectos
del significado, sentido o interpretación de signos
lingüísticos como símbolos, palabras, expresiones
o representaciones formales.
¿Para qué sirve la tecnología
semántica?

Análisis semántico para medios sociales
 Las tecnologías semánticas son el mejor medio y el más sencillo para
escuchar y comprender lo que dice la gente, lo que gusta o disgusta,
qué tendencias emergen en cada momento.

Análisis textual (Text Analytics) para inteligencia de negocio
 La inteligencia de negocio es hoy más que el procesamiento de
números. Hay información valiosa que se transmite en forma de texto
(noticias, tweets, encuestas...) y la integración de su contenido con las
fuentes numéricas tradicionales proporciona una visión distinta de la
realidad. En el campo de redes sociales y CRM, se le conoce también
como "Social CRM".

Búsqueda semántica (Semantic Search)
 La búsqueda basada en palabras claves (un match exacto entre la
consulta del usuario y un conjunto de textos) ha demostrado tener
limitaciones (por ejemplo, la búsqueda "fusiones entre empresas" nunca
devolverá frases como "empresas fusionadas"). La Tecnología
Semántica actual hace que las búsquedas sean más fáciles y efectivas
para los usuarios finales con diferentes tipos de herramientas:
buscadores
mejorados
semánticamente,
asistentes
virtuales,
buscadores de caja única...
http://www.bitext.com
Buscador semántico

Un buscador semántico efectúa la
búsqueda atendiendo al significado del
grupo de palabras que escribes sin
basarse en las actuales etiquetas.
BUSCADOR INTELIGENTE.
¿Cómo funciona?

No se trata de una inteligencia artificial
mágica que permita a las máquinas
entender las palabras de los usuarios, es
sólo la habilidad de una máquina para
resolver problemas bien definidos, a través
de operaciones bien definidas que se
llevarán a cabo sobre datos existentes bien
definidos.

La Web Semántica utiliza esencialmente RDF, SPARQL,
y OWL.
Son mecanismos que ayudan a convertir la Web en una
infraestructura global en la que es posible compartir, y
reutilizar datos y documentos entre diferentes tipos de
usuarios.

RDF proporciona información descriptiva
simple sobre los recursos que se encuentran
en la Web y que se utiliza

SPARQL es lenguaje de consulta sobre
RDF, que permite hacer búsquedas sobre
los recursos de la Web Semántica utilizando
distintas fuentes datos.

OWL es un mecanismo para desarrollar
temas o vocabularios específicos en los que
asociar esos recursos. Lo que hace OWL es
proporcionar un lenguaje para definir
ontologías estructuradas que pueden ser
utilizadas a través de diferentes sistemas.
Ejemplos
Ideas afines
 NaturalFinder, Bibitex
 Swotti


Lista de buscadores semánticos en
http://www.javi.it/semantic.html

Referencias

W3C http://www.w3c.es

Bibtex http://www.bitext.com

Interactividad en los entornos de formación online Escrito por
Francisco Ignacio Revuelta Domínguez,Lourdes Pérez Sánchez,
Editorial OUC, septiembre 2009.
Anexos











XML aporta la sintaxis superficial para los documentos estructurados, pero sin dotarles de ninguna
restricción sobre el significado.
XML Schema es un lenguaje para definir la estructura de los documentos XML.
RDF es un modelo de datos para los recursos y las relaciones que se puedan establecer entre ellos.
Aporta una semántica básica para este modelo de datos que puede representarse mediante XML.
RDF Schema es un vocabulario para describir las propiedades y las clases de los recursos RDF, con
una semántica para establecer jerarquías de generalización entre dichas propiedades y clases.
OWL es un lenguaje para definir ontologías mediante la descripción detallada de propiedades y
clases: tales como relaciones entre clases (p.ej. disyunción), cardinalidad(por ejemplo "únicamente
uno"), igualdad, tipologías de propiedades más complejas, caracterización de propiedades (por
ejemplo simetría) o clases enumeradas.
SPARQL es un lenguaje de consulta de conjuntos de datos RDF. Además en dicha especificación
también se incluye un formato XML que detalla el modo en el que se estructuran los resultados
obtenidos.
La usabilidad y aprovechamiento de la Web y sus recursos interconectados puede aumentar con la
web semántica gracias a:
Los documentos etiquetados con información semántica (compárese ésta con la
etiqueta <meta> de HTML, usada para facilitar el trabajo de los robots). Se pretende que esta
información sea interpretada por el ordenador con una capacidad comparable a la del lector humano.
El etiquetado puede incluirmetadatos descriptivos de otros aspectos documentales o protocolarios.
Vocabularios comunes de metadatos (Ontología (Informática)) y mapas entre vocabularios que
permitan a quienes elaboran los documentos disponer de nociones claras sobre cómo deben
etiquetarlos para que los agentes automáticos puedan usar la información contenida en los
metadatos (p.ej. el metadatoauthor tenga el significado de "autor de la página" y no el del "autor del
objeto descrito en la página").
Agentes automáticos que realicen tareas para los usuarios de estos metadatos de la Web Semántica
Servicios Web (a menudo con agentes propios) que provean de información a los agentes (por
ejemplo un servicio de garantías a quien un agente pudiera consultar sobre si un comercio
electrónico tiene un historial de mal servicio o de generar correo basura).

Metadatos (del griego μετα, meta, 'después de, más allá
de'1 y latín datum, 'lo que se da', «dato»2 ), literalmente
«sobre datos», son datos que describen otros datos. En
general, un grupo de metadatos se refiere a un grupo de
datos, llamado recurso. El concepto de metadatos es
análogo al uso de índices para localizar objetos en vez de
datos. Por ejemplo, en una biblioteca se usan fichas que
especifican autores, títulos, casas editoriales y lugares
para buscar libros. Así, los metadatos ayudan a ubicar
datos.

Metadatos (Meta+datos) es un término que se refiere
a datos sobre los propios datos. Un ejemplo es un folleto
que nos informa sobre el lugar y el tipo de un libro. Nos
está dando datos sobre otros datos: el libro al que se
refiere el folleto. El contenido combinado de los datos y
metadatos se conoce generalmente como paquete
contenedor.

Las ontologías, que se encargan de
definir los términos utilizados para
describir y representar un área de
conocimiento, son utilizadas por los
usuarios, las bases de datos y las
aplicaciones que necesitan compartir
información específica, es decir, en un
campo determinado como puede ser el
de las finanzas, medicina, deporte, etc.
Las ontologías incluyen definiciones de
conceptos básicos en un campo
determinado y la relación entre ellos.
Descargar