Introducción a los sistemas de recuperación de información

Anuncio
Recuperación de información
Bibliografía
- Maristella Agosti, Fabio Crestani & Gabriella Pasi (eds.):
“Lectures on Information Retrireval”
Springer-Verlag, 2001. ISBN 3-540-41933-0.
- William B. Frakes & Ricardo Baeza Yates:
“Information Retrieval: Data Structures & Algorithms”
PTR Prentice-Hall, 1992. ISBN 0-13-463837-9.
Recuperación de información
Selección de información documental
desde un dispositivo de almacenamiento
en respuesta a consultas realizadas por un usuario.
NOTA:
Se desea que la información recuperada sea relevante para el
usuario y que se obtenga en un intervalo de tiempo adecuado.
Sistemas de Recuperación de Información
Se encargan del almacenamiento de (datos acerca de) documentos para su
posterior recuperación por parte de los usuarios
Ejemplos: Bases de datos documentales
Buscadores en la World Wide Web
Diferencias con los sistemas convencionales de gestión de bases de datos:
Las consultas en bases de datos tradicionales están muy formalizadas
mientras que en recuperación de información tienen un formato menos
estructurado.
La respuesta proporcionada por un DBMS tradicional es siempre la
información deseada (determinista). En cambio, en recuperación de
información, la respuesta suele incluir documentos no relevantes
(probabilística).
En DBMSs, la evaluación del éxito del sistema depende únicamente de la
exactitud de la respuesta. En recuperación de información existen otros
factores (como la satisfacción del usuario).
Recuperación de información
1
© Fernando Berzal
Base de Datos
Documental
doc1
Documentos
Relevantes
Necesidad de
Información
doc2
Recuperación
...
SRI
docN
doc1
doca
docb
..
dock
doc2
doc3
..
docN
Documentos
o Relevantes
Documentos
Análisis
Representación
del Documento
Cálculo de
Similitud
Documentos
Recuperados
Representación
de la Consulta
Consulta de
Usuario
Recuperación de información
Análisis
2
© Fernando Berzal
Evaluación de un sistema de recuperación de información
Eficiencia
Tiempo de respuesta
Espacio de almacenamiento necesario
Eficacia
Grado en el que el Sistema de recuperación de información trabaja correctamente.
Precisión:
En qué medida los documentos recuperados por el SRI son relevantes para el usuario.
Exhaustividad (recall):
En qué medida el SRI recupera todos los documentos relevantes de la base de datos.
No Recuperados
Recuperados
A
B
D
C
No Relevantes
Relevantes
Precisión =
Exhaustividad =
C
B+C
C
D+C
1
Precisión
0
Recuperación de información
Exhaustividad 1
3
© Fernando Berzal
Descargar