HaciaLaWebSemántica..

Anuncio
NUEVAS TENDENCIAS
EN INTERNET
HACIA LA WEB SEMÁNTICA
ERNESTO JÍMENEZ RUIZ ([email protected])
¾Sesión
1: Introducción a la Red Semántica. Creación de una Ontología
sencilla con Protégé 2000
¾ Sesión 2: La Tecnología Subyacente de los Weblogs. Creación de un
Weblog con WordPress
¾ Sesión 3: Introducción a XML y al Lenguaje de Transformación XSLT
SESIÓN 1: INTRODUCCIÓN A LA RED
SEMÁNTICA
¾
Introducción
¾
¾
Evolución de la Web
La Web Semántica
¾
¾
Ontologías
¾
¾
¾
¾
Definición
Lenguajes para la Representación de Ontologías
Aplicación de las Ontologías
El Editor de Ontologías Protégé 2000
¾
¾
Tecnologías para la Web Semántica
Construcción de una Ontología Sencilla
FOAF (Friend Of A Friend)
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
2
1
EVOLUCIÓN DE LA WEB (I)
†
Búsqueda de Información en la Web:
„
„
Utilización de motores de búsqueda basados en
palabras clave (búsqueda sintáctica).
Problemas típicos
†
†
†
26/10/2005
Precisión en resultados baja
No siempre se extraen documentos relevantes
Mucha dependencia de la terminología usada
Nuevas Tendencias en Internet: Hacia la Web Semántica
3
EVOLUCIÓN DE LA WEB (II)
†
†
†
Los contenidos de la Web han sido
concebidos para ser utilizados por humanos.
La semántica de las páginas no es de fácil
acceso para las máquinas.
Solución: Etiquetar los contenidos de las
páginas (XML). ¿Cómo estandarizar estas
etiquetas?
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
4
2
EVOLUCIÓN DE LA WEB (III)
†
†
Una máquina puede reconocer las distintas partes de
una página web y tratarlas, sin embargo las
posibilidades de procesamiento son muy limitadas
Alternativas:
„
„
Utilización de técnicas de Extracción de Información:
Procesamiento Lenguaje Natural + IA
Representar los contenidos de la Web para poder ser
procesados* por las máquinas: Web Semántica
* “procesables por máquinas” (machine processable) y no “interpretables por
máquinas” (machine understandable).
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
5
LA WEB SEMÁNTICA (I)
†
†
†
†
La Web semántica tiene como objetivo crear un
medio universal para el intercambio de información.
Basado en representaciones del significado de los
recursos de la Web, de una manera inteligible para
las máquinas.
Para ampliar la interoperabilidad entre los sistemas
informáticos y reducir la mediación de operadores
humanos en los procesos inteligentes de flujo de
información.
Tim Berners-Lee fue el precursor de la idea y
fundador del W3C
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
6
3
LA WEB SEMÁNTICA (II)
†
Tecnologías para la Web Semántica
„
„
„
„
Metadatos
Ontologías
Lógica
Agentes
†
26/10/2005
Lenguajes de Comunicación
Nuevas Tendencias en Internet: Hacia la Web Semántica
7
LA WEB SEMÁNTICA (III)
†
Tecnologías para la Web Semántica: Metadatos (I)
„
26/10/2005
Páginas Web en HTML
<h2>Nonmonotonic Reasoning: Context-Dependent
Reasoning</h2>
<i>by <b>V. Marek</b> and <b>M. Truszczynski</b></i><br>
Springer 1993<br>
ISBN 0387976892
Nuevas Tendencias en Internet: Hacia la Web Semántica
8
4
LA WEB SEMÁNTICA (IV)
†
Tecnologías para la Web Semántica: Metadatos (II)
„
Los metadatos permiten incorporar información sobre los datos (p.e.
sobre la estructura) facilitando el procesamiento automático
<book>
<title>Nonmonotonic Reasoning: Context-Dependent Reasoning</title>
<author>V. Marek</author>
<author>M. Truszczynski</author>
<publisher>Springer</publisher>
<year>1993</year>
<ISBN>0387976892</ISBN>
</book>
„
Visualización mediante hojas de transformación: XML Æ HTML
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
9
LA WEB SEMÁNTICA (V)
†
Tecnologías para La Web Semántica: Ontologías
„
„
Una ontología describe de manera mas o menos formal un
dominio de discurso.
En el contexto de la Web Semántica, pueden servir para:
†
†
†
26/10/2005
Resolver las diferencias en la terminología usada por distintos
programas, posibilitando la interoperabilidad semántica
Facilitar la organización y navegación de páginas web p.e.
usando jerarquías de conceptos para estructurar los contenidos
Mejorar los resultados de una búsqueda explotando la
información
de
conceptos
o
de
jerarquías
(generalización/especialización)
Nuevas Tendencias en Internet: Hacia la Web Semántica
10
5
LA WEB SEMÁNTICA (VI)
†
Tecnologías para La Web Semántica: Lógica (I)
„
La lógica es la disciplina que estudia los principios del
razonamiento. En general una lógica proporciona:
†
†
†
„
Un lenguaje formal para describir conocimiento
Una semántica formal que define el significado de las sentencias
que se pueden describir
Métodos de razonamiento automáticos para inferir conclusiones
(implícitas) a partir del conocimiento descrito (de forma
explícita).
Problema: un mayor poder expresivo de la lógica va en
detrimento de la eficiencia computacional de los métodos
de inferencia asociados, y viceversa
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
11
LA WEB SEMÁNTICA (VII)
†
Tecnologías para La Web Semántica: Lógica (II)
„
En la web semántica la lógica puede utilizarse
para:
†
†
†
26/10/2005
Inferir conocimiento implícito en ontologías
Implementar agentes inteligentes con conocimiento
para la toma de decisiones
Proporcionar una explicación del conocimiento
inferido (traza de los pasos de inferencia realizados)
Nuevas Tendencias en Internet: Hacia la Web Semántica
12
6
LA WEB SEMÁNTICA (VIII)
†
Tecnologías para La Web Semántica: Agentes (I)
„
Los agentes son programas software que realizan tareas de manera
autónoma y proactiva
†
†
„
Autónoma: Capaz de operar sin intervención humana y de un cierto
control sobre las propias acciones
Proactiva: Capaz de exhibir un comportamiento dirigido por objetivos.
En la Web Semántica los agentes:
†
†
†
†
†
26/10/2005
(1) Recibirán tareas del usuario.
(2) Buscarán información en la Web.
(3) Se comunicarán con otros agentes.
(4) Compararán la información con las preferencias del usuario.
(5) Seleccionarán las opciones más adecuadas y las presentarán al
usuario.
Nuevas Tendencias en Internet: Hacia la Web Semántica
13
LA WEB SEMÁNTICA (IX)
†
Tecnologías para La Web Semántica: Agentes (II)
„
Los agentes harán un uso combinado de las tecnologías
comentadas:
†
†
†
26/10/2005
Los metadatos se utilizarán para la identificación y extracción
de información de recursos web (páginas y servicios)
Las ontologías serán de ayuda en búsquedas, interpretación de
resultados de búsquedas y comunicación con otros agentes
La lógica se usará para el procesamiento de la información
recuperada y para la derivación de conclusiones
Nuevas Tendencias en Internet: Hacia la Web Semántica
14
7
LA WEB SEMÁNTICA (X)
†
Web semántica versus inteligencia artificial
„
„
26/10/2005
La mayor parte de las tecnologías para la web
semántica se basan en resultados de investigación
(más o menos maduros) del campo de la Inteligencia
Artificial (IA)
Las falsas expectativas de la IA en el pasado no
deben influir en la credibilidad de la web semántica
porque no se pretende replicar la inteligencia
humana.
Nuevas Tendencias en Internet: Hacia la Web Semántica
15
LA WEB SEMÁNTICA (XI)
†
Lecturas Interesantes:
„
T. Berners-Lee, J. Hendler and O. Lassila. “The
semantic web”. Scientific American (2001)
„
J. Hendler. “Agents and the Semantic Web”.
IEEE Intelligent Systems (2001)
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
16
8
ONTOLOGÍAS (I)
†
Definición (I)
„
El sentido filosófico del término ontología hace
referencia a la esencia misma del ser, a su
existencia (onto=ser).
„
Para los sistemas de Inteligencia Artificial, lo que
existe es lo que puede representarse.
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
17
ONTOLOGÍAS (II)
†
Definición (II)
„
Una ontología es una descripción formal y
explícita de los conceptos de un dominio, y las
relaciones entre ellos.
„
Describir un vocabulario común para
investigadores que necesiten compartir
información en un mismo dominio
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
18
9
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
19
ONTOLOGÍAS (III)
†
¿Qué es una Ontología y que no?
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
20
10
ONTOLOGÍAS (IV)
†
¿Qué es una Ontología y que no?
„
„
Tesauros: listas de términos que incorporan
relaciones como p.e. sinonimia, homonimia, más
amplio que, más restringido que
Interpretación ambigua debido al uso del lenguaje
natural, aunque las relaciones inducen algo
parecido a una jerarquía.
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
21
ONTOLOGÍAS (V)
†
¿Qué es una Ontología y que no?
„
„
Marcos (frames): sistemas de clases con información de
propiedades/atributos y con herencia (Relaciones is-a).
(Protégé 2000)
Restricciones Lógicas: Otro punto de vista en el que el
conocimiento esta distribuido en axiomas (OWL)
†
†
26/10/2005
Lógica de descripciones: expresiones lógicas que definen
conceptos
Lógica de primer orden (lógica de predicados): expresiones
lógicas que describen conceptos, propiedades y relaciones.
Nuevas Tendencias en Internet: Hacia la Web Semántica
22
11
ONTOLOGÍAS (VI)
†
Lenguajes de Representación de Ontologías (I)
„
La arquitectura de Niveles de T. Berners Lee
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
23
ONTOLOGÍAS (VII)
†
Lenguajes de Representación de Ontologías (II)
„
La arquitectura de Niveles de T. Berners Lee
†
†
†
†
†
26/10/2005
XML permite estructurar documentos según vocabularios
definidos por el usuario
RDF proporciona un modelo para describir aserciones sobre
recursos Web.
RDF Schema proporciona primitivas para organizar objetos en
jerarquías (ontologías simples)
Ontology vocabulary permite expresar relaciones más complejas
entre objetos (ontologías complejas): OWL
Nuevas Tendencias en Internet: Hacia la Web Semántica
24
12
ONTOLOGÍAS (VIII)
†
Lenguajes de Representación de Ontologías (III)
„
La arquitectura de Niveles de T. Berners Lee
†
†
†
†
26/10/2005
Logic permitirá describir conocimiento declarativo a nivel de
aplicación
Proof se ocupará de los procesos de inferencia y de la
representación de pruebas en lenguajes de niveles inferiores
Trust se apoyará en la utilización de firmas digitales y otros
recursos para garantizar las operaciones realizadas
Nuevas Tendencias en Internet: Hacia la Web Semántica
25
ONTOLOGÍAS (IX)
†
Lenguajes de Representación de Ontologías (IV)
„
XML y XML Schema / DTD
†
XML es un metalenguaje de marcado que proporciona un
marco uniforme y una serie de herramientas para el intercambio
de datos y metadatos.
<book>
<title>Nonmonotonic Reasoning: Context-Dependent
Reasoning</title>
<author>V. Marek</author>
<publisher>Springer</publisher>
<year>1993</year>
<ISBN>0387976892</ISBN>
</book>
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
26
13
ONTOLOGÍAS (IX)
†
Lenguajes de Representación de Ontologías (V)
„
RDF/RDFS: Resource Description Framework (Schema).
Basado en XML.
†
†
†
XML no proporciona herramientas para expresar la semántica
(significado) de los datos, p.e. no existe una interpretación
estándar del anidamiento de elementos
RDF(S) proporciona primitivas para organizar vocabularios en
jerarquías tipadas: relaciones subclase y subpropiedad,
restricciones de dominio y rango, e instancias de clases
XMLS VS RDFS
„
„
26/10/2005
XMLS define la estructura del documento XML.
RDFS: define la jerarquía de un dominio, las relaciones entre los
conceptos
Nuevas Tendencias en Internet: Hacia la Web Semántica
27
ONTOLOGÍAS (X)
†
Lenguajes de Representación de Ontologías (VI)
„
OWL (Ontology Web Language)
†
Limitaciones de RDF(S)
„
„
26/10/2005
Definir propiedades de ámbito local: no podemos
especificar restricciones de rango aplicables sólo a
determinadas clases, p.e. que las vacas sólo comen plantas y
que otros animales comen carne también
Expresar la disyunción de clases, p.e. no podemos
especificar que hombre y mujer son clases disjuntas
Nuevas Tendencias en Internet: Hacia la Web Semántica
28
14
ONTOLOGÍAS (XI)
†
Lenguajes de Representación de Ontologías (VII)
„
OWL (Ontology Web Language)
†
Limitaciones de RDF(S)
„
„
„
26/10/2005
Definir clases como combinación de otras (unión
intersección o complemento), p.e. no podemos especificar
que la clase persona es la unión de hombre y mujer
Expresar restricciones sobre la cardinalidad de
propiedades, p.e. no podemos especificar que una
asignatura debe tener al menos un profesor
Describir propiedades específicas de las propiedades, p.e.
no podemos expresar que una propiedad es una función
(valor único), que es transitiva o que es la inversa de otra
Nuevas Tendencias en Internet: Hacia la Web Semántica
29
ONTOLOGÍAS (XII)
†
Lenguajes de Representación de
Ontologías (VIII)
„
OWL (Ontology Web Language).
†
Requerimientos (Extensión de RDF(S)):
„
„
„
„
„
26/10/2005
Una sintaxis bien definida
Una semántica formal
Suficiente poder expresivo
Conveniencia de la expresión
Un método de razonamiento eficiente
Nuevas Tendencias en Internet: Hacia la Web Semántica
30
15
ONTOLOGÍAS (XIII)
†
Lenguajes de Representación de Ontologías (IX)
„
OWL (Ontology Web Language).
Tipos de OWL
†
OWL Full Permite utilizar todas las primitivas de OWL y
combinarlas de manera arbitraria con RDF(S), incluso
modificando las primitivas de RDF y OWL.
„
„
26/10/2005
Ventajas: todo documento RDF(S) válido es válido en OWL Full,
y toda conclusión en RDF(S) lo es también en OWL Full.
Inconvenientes: el lenguaje no es decidible
Nuevas Tendencias en Internet: Hacia la Web Semántica
31
ONTOLOGÍAS (XIV)
†
Lenguajes de Representación de Ontologías (X)
„
OWL (Ontology Web Language).
Tipos de OWL
†
OWL DL Sublenguaje de OWL Full que no permite la
aplicación de las primitivas de OWL entre sí, para asegurar la
correspondencia con una lógica de descripciones.
„
„
26/10/2005
Ventajas: es posible un método de razonamiento eficiente.
Inconvenientes: para ser válido en OWL DL, un documento RDF
tendrá que ser extendido en ciertos aspectos y restringido en otros
Nuevas Tendencias en Internet: Hacia la Web Semántica
32
16
ONTOLOGÍAS (XV)
†
Lenguajes de Representación de Ontologías (XI)
„
OWL (Ontology Web Language).
Tipos de OWL
†
OWL Lite Restricción de OWL DL que excluye
primitivas como clasesenumeradas y cardinalidades
arbitrarias.
„
„
26/10/2005
Ventajas: simplicidad del lenguaje y eficiencia del método
de razonamiento.
Inconvenientes: poder expresivo limitado
Nuevas Tendencias en Internet: Hacia la Web Semántica
33
ONTOLOGÍAS (XVI)
†
Aplicación de la Ontologías
„
„
Las ontologías facilitan la comunicación entre seres
humanos o entre sistemas informáticos
Proporcionan ventajas para la ingeniería de sistemas
informáticos:
†
†
†
26/10/2005
Reutilización: una ontología, como codificación de un dominio,
puede ser reutilizada y/o compartida
Búsqueda: los términos de la ontología pueden usarse como
meta-datos para indexar documentos
Adquisición del conocimiento: un sistema basado en el
conocimiento se construye de forma más fiable partiendo de una
ontología
Nuevas Tendencias en Internet: Hacia la Web Semántica
34
17
PROTÉGÉ 2000 (I)
†
†
†
†
†
Es un entorno para el desarrollo de ontologías
Código abierto
Desarrollado por el grupo Stanford Medical
Informatics en la Stanford University School
of Medicine
Versión Actual: 3.1.1
Página Web: http://protege.stanford.edu
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
35
PROTÉGÉ 2000 (II)
†
Clases
„
„
„
„
„
„
26/10/2005
Nombre
Documentación
Rol (Concreto, Abstracto)
Restricciones (Constraints)
Propiedades (Template slots)
Herencia múltiple
Nuevas Tendencias en Internet: Hacia la Web Semántica
36
18
PROTÉGÉ 2000 (III)
†
Propiedades (Slots)
„
„
„
„
„
26/10/2005
Nombre
Tipo de valor: Cualquiera, Booleano, Clase,
Número (Entero o Real), Instancia, Cadena o
Símbolo (Lista de valores)
Documentación
Cardinalidad: Requerido (al menos 1), múltiple
(más de 1)
Propiedad inversa
Nuevas Tendencias en Internet: Hacia la Web Semántica
37
PROTÉGÉ 2000 (IV)
†
Ejemplos de Propiedades según su tipo:
„
„
„
„
„
26/10/2005
Número: altura, numero_de_pagina
Instancia (simple): autor
Instancia (múltiple): anuncios
Lista de valores: calidad
Booleano: urgente
Nuevas Tendencias en Internet: Hacia la Web Semántica
38
19
PROTÉGÉ 2000 (V)
†
Creación de unas Ontología Sencilla
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
39
FOAF (Friend Of A Friend)
†
El objetivo de este proyecto es la creación de
paginas Web con contenido que pueda procesar
un ordenador
http://www.foaf-project.org/
†
Creación del Fichero ‘foaf.rdf’:
http://www.ldodds.com/foaf/foaf-a-matic.es.html
†
Publicación usando la etiqueta link:
<link rel="meta" type="application/rdf+xml" title="FOAF" href="foaf.rdf" />
26/10/2005
Nuevas Tendencias en Internet: Hacia la Web Semántica
40
20
FIN SESIÓN
†
Página Web Personal:
„
26/10/2005
http://ejimenez.taponcitos.com
Nuevas Tendencias en Internet: Hacia la Web Semántica
41
21
Descargar