Una aplicación de las ontologías

Anuncio
Taula de Nova Recerca
Departament de Comunicació
5 Noviembre 2015
Una aplicación
de las ontologías
al estudio de la prensa
de la Edad Moderna
Francisco BAENA
Universidad de Sevilla
Proyecto BIDISO IV - Grupo IbemNEWS
[email protected]
Ontologías Web semántica Datos enlazados
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Impresos informativos de la Edad Moderna
Península ibérica - Siglo XVII
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Impresos informativos de la Edad Moderna
Península ibérica - Siglo XVII
2003-2013
2014-…
ORIGINAL
PDF/JPG
DIGITALIZACIÓN
TXT
TEI
CODIFICACIÓN
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Objetivos
Digitalización y codificación del patrimonio hemerográfico
1
ny
ó
i
c
a
v
nser
o
c
s».
o
a
t
l
n
a
e
r
cum
ibui
o
r
t
d
n
s
o
o
l
«C
de
d
a
d
i
l
i
accesib
3
«Facili
2
t ar e l
entre intercambio
lo s m i
embro de datos
s
comu
nidad de la
».
«Realizar búsquedas en el texto de
una relación de palabras concretas».
4
«Transferir el
resultado de n
uestro
trabajo a BID
ISO».
5
n d e la
ó
i
c
a
g
i
t
s
e
v
n
i
a
«Avanzar en l
odismo».
i
r
e
p
l
e
d
a
i
r
o
hist
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología
Periodismo impreso – Península ibérica – siglo XVII
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología
Definición
«Una ontología es una jerarquía de conceptos con
atributos y relaciones, que define una terminología
consensuada para definir redes semánticas de unidades
de información interrelacionadas. Proporciona un
vocabulario de clases y relaciones para describir un
dominio, poniendo el acento en la compartición del
conocimiento y en el consenso en la representación de
éste».
Pablo Castells (2003)
La Web Semántica
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología
Definición
«Es la formalización lógica de un ámbito del conocimiento».
«Lo mejor de las ontologías es la promesa de mejora de la
recuperación de información que implican, cuando
consideremos su aplicación a una hemeroteca digital».
«Podría servir para proporcionar un sistema de búsqueda
inteligente, capaz de realizar inferencias y actuar como si
fuera una verdadera inteligencia artificial, pero aún no están
implantadas en forma funcional».
Lluís Codina, Rafael Pedraza-Jimenez (2015)
Taxonomías y Ontologías:
Qué son y cómo se aplican en Medios de Comunicación
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología
Ventajas
1 ente) toda la
«Facili
2
m
a
c
t
i
a
s
f
r la a c
n lo
(grá
e
r
a
a
cesibil
t
d
i
n
e
n
s
e
t
e
r
n
i dad a
p
i
o
nform
nc
«Re
ó
i
c
es a
.
a
ación»
»
.
inform ocumentos
3
d
«Realizar búsquedas semánticas e
implícitas».
4
5
«Relacionar to
dos los datos e
común y
o
i
r
a
l
u
b
a
c
o
v
ntre sí».
«Definir un
compartido».
6
«Razonar sobre esa base de datos, es
decir, convertir la información
en CONOCIMIENTO».
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ejemplos de ontologías
BnF
brary data can be difficult to find on the Web. At the BnF, it is of course possible to access all of the resources an
rvices through our Library Website (www.bnf.fr). But, at present, few of them are indexed by search engines. An
en when they are, it is difficult to sort results from them.
Unaeven
aplicación
de are
las completely
ontologíasand
al estudio
de la prensa
de la Edad
Moderna
ome digital books,
when they
freely available,
are sometimes
impossible
to find if you don
ready know they exist. The data.bnf.fr project can be a way to open the digital library Gallica to a wider publi
Moreover, library catalogues are usually stored as relational databases: they are just no use for Web search engine
sers always access the BnF catalogues (mainly, the Main catalogue and the Archive and manuscript catalogu
rough library portals, which they often simply don’t know. As a matter of fact, users are very unlikely to find any
BnFthey already know about us.
ur resources directly from a search engine interface, unless
Ejemplos de ontologías
Some links from data.bnf.f
ata.bnf.fr is a Web interface which gathers full digital document and descriptive data from differen
atalogues and enables users finding the relevant information in our resources.
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ejemplos de ontologías
BBC
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ejemplos de ontologías
BBC
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ejemplos de ontologías
BBC
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología
Construcción paso a paso
1
nub
a
n
u
«Crear
tos».
p
e
c
n
e de co
4
3
«Defin
ir y cla
2
sificar
«Agrupar las clases y propiedades».
«Determinar e
l dominio, el r
ango y
la inversa de c
ada propiedad
».
5
cada c
o
ncepto
».
a y la
r
u
t
a
l
c
n
e
m
o
«Revisar la n
de s ,
a
d
e
i
p
o
r
p
y
s
as clase
jerarquía de l
zarlas».
i
l
a
m
r
o
n
e
d
a f in
6
«Introducir individuos de ejemplo y
representar la ontología
gráficamente».
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología
Ejemplo de la toma de decisiones
Problema
¿Cómo debíamos representar las
fechas en nuestra ontología?
Solución 1
«Importar una
ontología de t
iempo
ya existente (o
wl-time)».
Solución 2tos del tipo
e da
d
s
e
d
a
d
e
i
p
o
r
«Crear p
dataTime».
Si un impreso informativo se publica en el año 1625, según su pie de
imprenta, e informa de una noticia sucedida el 23 de mayo de 1625, podemos
acotar la fecha de publicación mediante un intervalo de tiempo.
seImprimeDesde 1625-05-23T00:00:00Z
seImprimeHasta 1625-12-31T23:59:59Z
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología de dominio especializado
Periodismo impreso de la Edad Moderna
Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna
Ontología
Retos pendientes
  Traducir la ontología al inglés.
Conseguir financiación y colaboración institucional.
Solicitar reconocimiento y almacenamiento a W3C
para formar parte de los Semantic Web Standards.
Desarrollar una herramienta o asistente que permita
poblar la ontología de una forma intuitiva y amigable.
  Poblar la ontología con los impresos informativos que
conforman nuestro corpus.
  Alojar la ontología y crear una página web que
permita visualizarla y realizar búsquedas semánticas.
Descargar