LaWebSemantica - WordPress.com

Anuncio
Tema 2: La Web semántica
Máster en Gestión de Contenidos
UB - UPF
Mari Vallez
Àrea de Coneixement de Biblioteconomia i Documentació
Universitat Pompeu Fabra
[email protected]
Contenido
1. Problemas de la Web actual
2. La Web semántica
3. Tecnologías de la Web semántica:
○ Lenguajes de descripción
○ Ontologías
○ Agentes de usuario
4.
5.
6.
7.
Web actual vs. Web semántica
Problemas de la Web semántica
Conclusiones
Referencias
Fundamentos en Edición electrónica - Curso 2012/2013
Problemas de la Web actual
● La Web es un sistema descentralizado y
heterogéneo.
● La Web carece de un modelo bien definido para
la representación de la información. El método
de marcado de la información, HTML, combina
elementos de contenido con otros de
presentación.
○ ¿Cómo podemos solucionarlos? …
Fundamentos en Edición electrónica - Curso 2012/2013
La Web Semántica
● 2001: Tim Berners-Lee enuncia la Web Semántica.
○ “El contenido de la Web será expresado de manera
que los ordenadores puedan entenderlo”.
Para ello:
● La información tiene que estar marcada.
● Son necesarias herramientas que permitan interpretar,
comparar y fusionar datos e informaciones.
> Estas herramientas son las Ontologías.
Fundamentos en Edición electrónica - Curso 2012/2013
La Web Semántica
Dotar a los documentos de información y estructura
semántica de forma explícita (Berners-Lee, 01).
Fundamentos en Edición electrónica - Curso 2012/2013
Tecnologías de la Web Semántica
● Desarrollo de lenguajes de marcado con carga
semántica:
○
○
○
○
XML
RDF
SKOS Core
OWL
● Agentes de usuario
Fundamentos en Edición electrónica - Curso 2012/2013
XML
● XML
●
● RDF
● SKOS Core
●
●
●
Primer paso para desarrollo de
la WS
Es un metalenguaje
Describe la estructura de los
documentos
Estructura jerárquica
● OWL
Fundamentos en Edición electrónica - Curso 2012/2013
XML
Fundamentos en Edición electrónica - Curso 2012/2013
RDF
● XML
● RDF
●
●
●
● SKOS Core
●
Resource Description
Framework
Representación a nivel
semántico
Representar metadatos de los
documentos
Intercambio de información
● OWL
Fundamentos en Edición electrónica - Curso 2012/2013
RDF
Sujeto
http://en.wikipedia.org/Tony_Benn
Predicado Titulo
Editor
Atributo
Wikipedia
Tony Benn
Fundamentos en Edición electrónica - Curso 2012/2013
SKOS Core
● XML
● RDF
● SKOS Core
● OWL
●
●
Simple Knowledge Organization
System
Infraestructura simple, flexible, pa
ra representar un lenguaje
controlado.
Fundamentos en Edición electrónica - Curso 2012/2013
SKOS Core
Fundamentos en Edición electrónica - Curso 2012/2013
SKOS Core
<rdf:RDF
xmlns:rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”
xmlns:skos=”http://www.w3c.org/2004/02/core#”
xml:base=”http://www.ukat.org.uk/thesaurus/concept/”>
<skos:Concept rdf:about=”1750”>
<skos:prefLabel>Economic cooperation</skos:prefLabel>
<skos:altLabel>Economic co-operation</skos:altLabel>
<skos:scopeNote>Includes cooperative measures in banking, trade, industry, etc.
between and among countries.</skos:scopeNote>
<skos:broader rdf:resource=”4382” />
<skos:narrower rdf:resource=”2108” />
<skos:narrower rdf:resource=”9505” />
<skos:narrower rdf:resource=”15053” />
<skos:narrower rdf:resource=”18987” />
<skos:related rdf:resource=”3250” />
</skos:Concept>
</rdf:RDF>
Fundamentos en Edición electrónica - Curso 2012/2013
OWL
● XML
● RDF
● SKOS Core
●
●
● OWL
●
Web Ontology Language
Utilizado para publicar y
compartir datos utilizando
ontologías
Construido sobre RDF y
codificado en XML
Fundamentos en Edición electrónica - Curso 2012/2013
OWL
Fundamentos en Edición electrónica - Curso 2012/2013
Ontologías
<?xml version=”1.0” ?>
<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”>
…
<owl:Class rdf:ID=”Perifericos”>
<rdf:comment>
Los periféricos de ordenador están conectados a la CPU pero no forman parte de
ella.
</rdf:comment>
Periférico
</owl:Class>
<owl:Class rdf:ID=”Entrada”>
<rdf:comment>
Los periféricos de entrada son una subclase de periféricos de ordenador.
Entrada
</rdf:comment>
<rdfs:subClassOf rdf:resource=”#Perifericos” />
</owl:Class>
<owl:Class rdf:ID=”Teclados”>
<rdf:comment>
Los teclados son una subclase de los periféricos de entrada.
</rdf:comment>
<rdf:subClassOf rdf:resource=”#Entrada” />
Teclado
<rdf:subClassOf rdf:resource=”#Perifericos” />
</owl:Class>
…
</rdf:RDF>
Fundamentos en Edición electrónica - Curso 2012/2013
Agentes inteligentes
● La Web semántica no alcanzará su máximo potencial
hasta que se desarrollen agentes inteligentes capaces
de buscar contenido en esta nueva Web,
procesando la información e intercambiándola con
otros programas.
Fundamentos en Edición electrónica - Curso 2012/2013
Fundamentos en Edición electrónica - Curso 2012/2013
La Web actual
Fundamentos en Edición electrónica - Curso 2012/2013
La Web Semántica
Fundamentos en Edición electrónica - Curso 2012/2013
Funcionamiento de la Web Semántica
Países
Ontología
Iraq
Kuwait
Recurso: OMS
Recurso: UN
Datos: Iraq, Demografía, ...
Datos: Iraq, Economía, ...
Economía
Demografía
...
...
Fundamentos en Edición electrónica - Curso 2012/2013
Problemática de la Web semántica
● Elevado coste de su desarrollo:
●
●
○ Tiempo
○ Dinero
Ontologías dependientes de un dominio.
Ontologías dependientes de objetivos.
¿Solución?
○ Ingeniería de Ontologías
Fundamentos en Edición electrónica - Curso 2012/2013
Conclusiones
● Tecnologías básicas de la Web
semántica:
○ Lenguajes para estructurar los contenidos: estos
lenguajes se crearán utilizando XML.
○ Herramienta para extraer el significado de la estructura
de esas informaciones: codificado con RDF
○ Lenguajes que permitan comparar y/o combinar
informaciones con distinta estructura: OWL.
○ Herramientas que permitan la recuperación eficaz de
dichas informaciones: Agentes inteligentes.
Fundamentos en Edición electrónica - Curso 2012/2013
Conclusiones
● Implicaciones en otros ámbitos:
○
○
○
○
○
○
○
○
Extracción de información
Extracción de entidades
Extracción de términos
Respuesta a preguntas
Recuperación de información
Clasificación automática
Resumen automático
Traducción automática
Fundamentos en Edición electrónica - Curso 2012/2013
Referencias
● LeeBerners-Lee, T., Hendler, J., and Lassila, O. (2001).
●
The Semantic Web. Scientific American, vol. 284, nº 5,
May 2001, pp. 34-43.
Rafael Pedraza-Jiménez, Lluís Codina, Cristòfol Rovira
(2007). “Web semántica y ontologías en el
procesamiento de la información documental”. El
Profesional de la Información, Noviembre-Diciembre
2007, vol.16, nº 6, pp. 569-578.
Fundamentos en Edición electrónica - Curso 2012/2013
Descargar