NUEVAS TENDENCIAS EN INTERNET HACIA LA WEB SEMÁNTICA ERNESTO JÍMENEZ RUIZ ([email protected]) ¾Sesión 1: Introducción a la Red Semántica. Creación de una Ontología sencilla con Protégé 2000 ¾ Sesión 2: La Tecnología Subyacente de los Weblogs. Creación de un Weblog con WordPress ¾ Sesión 3: Introducción a XML y al Lenguaje de Transformación XSLT SESIÓN 1: INTRODUCCIÓN A LA RED SEMÁNTICA ¾ Introducción ¾ ¾ Evolución de la Web La Web Semántica ¾ ¾ Ontologías ¾ ¾ ¾ ¾ Definición Lenguajes para la Representación de Ontologías Aplicación de las Ontologías El Editor de Ontologías Protégé 2000 ¾ ¾ Tecnologías para la Web Semántica Construcción de una Ontología Sencilla FOAF (Friend Of A Friend) 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 2 1 EVOLUCIÓN DE LA WEB (I) Búsqueda de Información en la Web: Utilización de motores de búsqueda basados en palabras clave (búsqueda sintáctica). Problemas típicos 26/10/2005 Precisión en resultados baja No siempre se extraen documentos relevantes Mucha dependencia de la terminología usada Nuevas Tendencias en Internet: Hacia la Web Semántica 3 EVOLUCIÓN DE LA WEB (II) Los contenidos de la Web han sido concebidos para ser utilizados por humanos. La semántica de las páginas no es de fácil acceso para las máquinas. Solución: Etiquetar los contenidos de las páginas (XML). ¿Cómo estandarizar estas etiquetas? 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 4 2 EVOLUCIÓN DE LA WEB (III) Una máquina puede reconocer las distintas partes de una página web y tratarlas, sin embargo las posibilidades de procesamiento son muy limitadas Alternativas: Utilización de técnicas de Extracción de Información: Procesamiento Lenguaje Natural + IA Representar los contenidos de la Web para poder ser procesados* por las máquinas: Web Semántica * “procesables por máquinas” (machine processable) y no “interpretables por máquinas” (machine understandable). 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 5 LA WEB SEMÁNTICA (I) La Web semántica tiene como objetivo crear un medio universal para el intercambio de información. Basado en representaciones del significado de los recursos de la Web, de una manera inteligible para las máquinas. Para ampliar la interoperabilidad entre los sistemas informáticos y reducir la mediación de operadores humanos en los procesos inteligentes de flujo de información. Tim Berners-Lee fue el precursor de la idea y fundador del W3C 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 6 3 LA WEB SEMÁNTICA (II) Tecnologías para la Web Semántica Metadatos Ontologías Lógica Agentes 26/10/2005 Lenguajes de Comunicación Nuevas Tendencias en Internet: Hacia la Web Semántica 7 LA WEB SEMÁNTICA (III) Tecnologías para la Web Semántica: Metadatos (I) 26/10/2005 Páginas Web en HTML <h2>Nonmonotonic Reasoning: Context-Dependent Reasoning</h2> <i>by <b>V. Marek</b> and <b>M. Truszczynski</b></i><br> Springer 1993<br> ISBN 0387976892 Nuevas Tendencias en Internet: Hacia la Web Semántica 8 4 LA WEB SEMÁNTICA (IV) Tecnologías para la Web Semántica: Metadatos (II) Los metadatos permiten incorporar información sobre los datos (p.e. sobre la estructura) facilitando el procesamiento automático <book> <title>Nonmonotonic Reasoning: Context-Dependent Reasoning</title> <author>V. Marek</author> <author>M. Truszczynski</author> <publisher>Springer</publisher> <year>1993</year> <ISBN>0387976892</ISBN> </book> Visualización mediante hojas de transformación: XML Æ HTML 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 9 LA WEB SEMÁNTICA (V) Tecnologías para La Web Semántica: Ontologías Una ontología describe de manera mas o menos formal un dominio de discurso. En el contexto de la Web Semántica, pueden servir para: 26/10/2005 Resolver las diferencias en la terminología usada por distintos programas, posibilitando la interoperabilidad semántica Facilitar la organización y navegación de páginas web p.e. usando jerarquías de conceptos para estructurar los contenidos Mejorar los resultados de una búsqueda explotando la información de conceptos o de jerarquías (generalización/especialización) Nuevas Tendencias en Internet: Hacia la Web Semántica 10 5 LA WEB SEMÁNTICA (VI) Tecnologías para La Web Semántica: Lógica (I) La lógica es la disciplina que estudia los principios del razonamiento. En general una lógica proporciona: Un lenguaje formal para describir conocimiento Una semántica formal que define el significado de las sentencias que se pueden describir Métodos de razonamiento automáticos para inferir conclusiones (implícitas) a partir del conocimiento descrito (de forma explícita). Problema: un mayor poder expresivo de la lógica va en detrimento de la eficiencia computacional de los métodos de inferencia asociados, y viceversa 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 11 LA WEB SEMÁNTICA (VII) Tecnologías para La Web Semántica: Lógica (II) En la web semántica la lógica puede utilizarse para: 26/10/2005 Inferir conocimiento implícito en ontologías Implementar agentes inteligentes con conocimiento para la toma de decisiones Proporcionar una explicación del conocimiento inferido (traza de los pasos de inferencia realizados) Nuevas Tendencias en Internet: Hacia la Web Semántica 12 6 LA WEB SEMÁNTICA (VIII) Tecnologías para La Web Semántica: Agentes (I) Los agentes son programas software que realizan tareas de manera autónoma y proactiva Autónoma: Capaz de operar sin intervención humana y de un cierto control sobre las propias acciones Proactiva: Capaz de exhibir un comportamiento dirigido por objetivos. En la Web Semántica los agentes: 26/10/2005 (1) Recibirán tareas del usuario. (2) Buscarán información en la Web. (3) Se comunicarán con otros agentes. (4) Compararán la información con las preferencias del usuario. (5) Seleccionarán las opciones más adecuadas y las presentarán al usuario. Nuevas Tendencias en Internet: Hacia la Web Semántica 13 LA WEB SEMÁNTICA (IX) Tecnologías para La Web Semántica: Agentes (II) Los agentes harán un uso combinado de las tecnologías comentadas: 26/10/2005 Los metadatos se utilizarán para la identificación y extracción de información de recursos web (páginas y servicios) Las ontologías serán de ayuda en búsquedas, interpretación de resultados de búsquedas y comunicación con otros agentes La lógica se usará para el procesamiento de la información recuperada y para la derivación de conclusiones Nuevas Tendencias en Internet: Hacia la Web Semántica 14 7 LA WEB SEMÁNTICA (X) Web semántica versus inteligencia artificial 26/10/2005 La mayor parte de las tecnologías para la web semántica se basan en resultados de investigación (más o menos maduros) del campo de la Inteligencia Artificial (IA) Las falsas expectativas de la IA en el pasado no deben influir en la credibilidad de la web semántica porque no se pretende replicar la inteligencia humana. Nuevas Tendencias en Internet: Hacia la Web Semántica 15 LA WEB SEMÁNTICA (XI) Lecturas Interesantes: T. Berners-Lee, J. Hendler and O. Lassila. “The semantic web”. Scientific American (2001) J. Hendler. “Agents and the Semantic Web”. IEEE Intelligent Systems (2001) 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 16 8 ONTOLOGÍAS (I) Definición (I) El sentido filosófico del término ontología hace referencia a la esencia misma del ser, a su existencia (onto=ser). Para los sistemas de Inteligencia Artificial, lo que existe es lo que puede representarse. 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 17 ONTOLOGÍAS (II) Definición (II) Una ontología es una descripción formal y explícita de los conceptos de un dominio, y las relaciones entre ellos. Describir un vocabulario común para investigadores que necesiten compartir información en un mismo dominio 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 18 9 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 19 ONTOLOGÍAS (III) ¿Qué es una Ontología y que no? 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 20 10 ONTOLOGÍAS (IV) ¿Qué es una Ontología y que no? Tesauros: listas de términos que incorporan relaciones como p.e. sinonimia, homonimia, más amplio que, más restringido que Interpretación ambigua debido al uso del lenguaje natural, aunque las relaciones inducen algo parecido a una jerarquía. 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 21 ONTOLOGÍAS (V) ¿Qué es una Ontología y que no? Marcos (frames): sistemas de clases con información de propiedades/atributos y con herencia (Relaciones is-a). (Protégé 2000) Restricciones Lógicas: Otro punto de vista en el que el conocimiento esta distribuido en axiomas (OWL) 26/10/2005 Lógica de descripciones: expresiones lógicas que definen conceptos Lógica de primer orden (lógica de predicados): expresiones lógicas que describen conceptos, propiedades y relaciones. Nuevas Tendencias en Internet: Hacia la Web Semántica 22 11 ONTOLOGÍAS (VI) Lenguajes de Representación de Ontologías (I) La arquitectura de Niveles de T. Berners Lee 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 23 ONTOLOGÍAS (VII) Lenguajes de Representación de Ontologías (II) La arquitectura de Niveles de T. Berners Lee 26/10/2005 XML permite estructurar documentos según vocabularios definidos por el usuario RDF proporciona un modelo para describir aserciones sobre recursos Web. RDF Schema proporciona primitivas para organizar objetos en jerarquías (ontologías simples) Ontology vocabulary permite expresar relaciones más complejas entre objetos (ontologías complejas): OWL Nuevas Tendencias en Internet: Hacia la Web Semántica 24 12 ONTOLOGÍAS (VIII) Lenguajes de Representación de Ontologías (III) La arquitectura de Niveles de T. Berners Lee 26/10/2005 Logic permitirá describir conocimiento declarativo a nivel de aplicación Proof se ocupará de los procesos de inferencia y de la representación de pruebas en lenguajes de niveles inferiores Trust se apoyará en la utilización de firmas digitales y otros recursos para garantizar las operaciones realizadas Nuevas Tendencias en Internet: Hacia la Web Semántica 25 ONTOLOGÍAS (IX) Lenguajes de Representación de Ontologías (IV) XML y XML Schema / DTD XML es un metalenguaje de marcado que proporciona un marco uniforme y una serie de herramientas para el intercambio de datos y metadatos. <book> <title>Nonmonotonic Reasoning: Context-Dependent Reasoning</title> <author>V. Marek</author> <publisher>Springer</publisher> <year>1993</year> <ISBN>0387976892</ISBN> </book> 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 26 13 ONTOLOGÍAS (IX) Lenguajes de Representación de Ontologías (V) RDF/RDFS: Resource Description Framework (Schema). Basado en XML. XML no proporciona herramientas para expresar la semántica (significado) de los datos, p.e. no existe una interpretación estándar del anidamiento de elementos RDF(S) proporciona primitivas para organizar vocabularios en jerarquías tipadas: relaciones subclase y subpropiedad, restricciones de dominio y rango, e instancias de clases XMLS VS RDFS 26/10/2005 XMLS define la estructura del documento XML. RDFS: define la jerarquía de un dominio, las relaciones entre los conceptos Nuevas Tendencias en Internet: Hacia la Web Semántica 27 ONTOLOGÍAS (X) Lenguajes de Representación de Ontologías (VI) OWL (Ontology Web Language) Limitaciones de RDF(S) 26/10/2005 Definir propiedades de ámbito local: no podemos especificar restricciones de rango aplicables sólo a determinadas clases, p.e. que las vacas sólo comen plantas y que otros animales comen carne también Expresar la disyunción de clases, p.e. no podemos especificar que hombre y mujer son clases disjuntas Nuevas Tendencias en Internet: Hacia la Web Semántica 28 14 ONTOLOGÍAS (XI) Lenguajes de Representación de Ontologías (VII) OWL (Ontology Web Language) Limitaciones de RDF(S) 26/10/2005 Definir clases como combinación de otras (unión intersección o complemento), p.e. no podemos especificar que la clase persona es la unión de hombre y mujer Expresar restricciones sobre la cardinalidad de propiedades, p.e. no podemos especificar que una asignatura debe tener al menos un profesor Describir propiedades específicas de las propiedades, p.e. no podemos expresar que una propiedad es una función (valor único), que es transitiva o que es la inversa de otra Nuevas Tendencias en Internet: Hacia la Web Semántica 29 ONTOLOGÍAS (XII) Lenguajes de Representación de Ontologías (VIII) OWL (Ontology Web Language). Requerimientos (Extensión de RDF(S)): 26/10/2005 Una sintaxis bien definida Una semántica formal Suficiente poder expresivo Conveniencia de la expresión Un método de razonamiento eficiente Nuevas Tendencias en Internet: Hacia la Web Semántica 30 15 ONTOLOGÍAS (XIII) Lenguajes de Representación de Ontologías (IX) OWL (Ontology Web Language). Tipos de OWL OWL Full Permite utilizar todas las primitivas de OWL y combinarlas de manera arbitraria con RDF(S), incluso modificando las primitivas de RDF y OWL. 26/10/2005 Ventajas: todo documento RDF(S) válido es válido en OWL Full, y toda conclusión en RDF(S) lo es también en OWL Full. Inconvenientes: el lenguaje no es decidible Nuevas Tendencias en Internet: Hacia la Web Semántica 31 ONTOLOGÍAS (XIV) Lenguajes de Representación de Ontologías (X) OWL (Ontology Web Language). Tipos de OWL OWL DL Sublenguaje de OWL Full que no permite la aplicación de las primitivas de OWL entre sí, para asegurar la correspondencia con una lógica de descripciones. 26/10/2005 Ventajas: es posible un método de razonamiento eficiente. Inconvenientes: para ser válido en OWL DL, un documento RDF tendrá que ser extendido en ciertos aspectos y restringido en otros Nuevas Tendencias en Internet: Hacia la Web Semántica 32 16 ONTOLOGÍAS (XV) Lenguajes de Representación de Ontologías (XI) OWL (Ontology Web Language). Tipos de OWL OWL Lite Restricción de OWL DL que excluye primitivas como clasesenumeradas y cardinalidades arbitrarias. 26/10/2005 Ventajas: simplicidad del lenguaje y eficiencia del método de razonamiento. Inconvenientes: poder expresivo limitado Nuevas Tendencias en Internet: Hacia la Web Semántica 33 ONTOLOGÍAS (XVI) Aplicación de la Ontologías Las ontologías facilitan la comunicación entre seres humanos o entre sistemas informáticos Proporcionan ventajas para la ingeniería de sistemas informáticos: 26/10/2005 Reutilización: una ontología, como codificación de un dominio, puede ser reutilizada y/o compartida Búsqueda: los términos de la ontología pueden usarse como meta-datos para indexar documentos Adquisición del conocimiento: un sistema basado en el conocimiento se construye de forma más fiable partiendo de una ontología Nuevas Tendencias en Internet: Hacia la Web Semántica 34 17 PROTÉGÉ 2000 (I) Es un entorno para el desarrollo de ontologías Código abierto Desarrollado por el grupo Stanford Medical Informatics en la Stanford University School of Medicine Versión Actual: 3.1.1 Página Web: http://protege.stanford.edu 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 35 PROTÉGÉ 2000 (II) Clases 26/10/2005 Nombre Documentación Rol (Concreto, Abstracto) Restricciones (Constraints) Propiedades (Template slots) Herencia múltiple Nuevas Tendencias en Internet: Hacia la Web Semántica 36 18 PROTÉGÉ 2000 (III) Propiedades (Slots) 26/10/2005 Nombre Tipo de valor: Cualquiera, Booleano, Clase, Número (Entero o Real), Instancia, Cadena o Símbolo (Lista de valores) Documentación Cardinalidad: Requerido (al menos 1), múltiple (más de 1) Propiedad inversa Nuevas Tendencias en Internet: Hacia la Web Semántica 37 PROTÉGÉ 2000 (IV) Ejemplos de Propiedades según su tipo: 26/10/2005 Número: altura, numero_de_pagina Instancia (simple): autor Instancia (múltiple): anuncios Lista de valores: calidad Booleano: urgente Nuevas Tendencias en Internet: Hacia la Web Semántica 38 19 PROTÉGÉ 2000 (V) Creación de unas Ontología Sencilla 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 39 FOAF (Friend Of A Friend) El objetivo de este proyecto es la creación de paginas Web con contenido que pueda procesar un ordenador http://www.foaf-project.org/ Creación del Fichero ‘foaf.rdf’: http://www.ldodds.com/foaf/foaf-a-matic.es.html Publicación usando la etiqueta link: <link rel="meta" type="application/rdf+xml" title="FOAF" href="foaf.rdf" /> 26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 40 20 FIN SESIÓN Página Web Personal: 26/10/2005 http://ejimenez.taponcitos.com Nuevas Tendencias en Internet: Hacia la Web Semántica 41 21