200 Creación de una ontología sobre el viaje combinado: su aplicación a la terminología María Rosario Bautista Zambrana Universidad de Málaga Resumen Esta comunicación presenta cómo se ha elaborado, paso a paso, una ontología —definida como «especificación explícita de una conceptualización» (Gruber, 1993)— sobre el ámbito del viaje combinado, a fin de estructurar el conocimiento de este dominio jurídico-turístico y crear una ontoterminología unificada en español, inglés y alemán sobre el citado ámbito, que sea de utilidad para terminólogos y traductores. Para la construcción de la ontología, en primer lugar, se ha analizado a fondo el texto de la Directiva 90/314/CEE del Consejo, de 13 de junio de 1990, relativa a los viajes combinados, las vacaciones combinadas y los circuitos combinados, en sus distintas versiones lingüísticas, y a continuación se ha aplicado la metodología METHONTOLOGY (Gómez-Pérez, Fernández-López y Corcho, 2003) a los datos obtenidos en el análisis mencionado. Por otro lado, esta comunicación también explora las posibilidades que ofrece el método propuesto por Temmerman y Kerremans (2003), Termontography, para representar, en una ontoterminología, conceptos divergentes y sus respectivas realizaciones lingüísticas en los tres idiomas mencionados. Palabras clave: ontología, terminología, viaje combinado, METHONTOLOGY, Termontography Abstract This paper shows how we have created an ontology —defined as an «explicit specification of a conceptualization» (Gruber, 1993)— about the travel package domain, in order to structure the knowledge of this legal-travelling domain, and build a unified ontoterminology in 201 Spanish, English and German, which in addition should be useful for terminologists and translators. For building the ontology, in the first place, we have carried out an in-depth analysis of the text of the Council Directive 90/314/EEC of 13 June 1990 on package travel, package holidays and package tours, in its different linguistic versions; after that, the methodology METHONTOLOGY (Gómez-Pérez, Fernández-López and Corcho, 2003) was applied to the results obtained in the aforementioned analysis. On the other hand, this paper also explores the possibilities offered by the method proposed by Temmerman and Kerremans (2003), Termontography, for representing divergent concepts and their respective linguistic realisations in the three languages within an ontoterminology. Key words: ontology, terminology, package travel, METHONTOLOGY, Termontography Ontologías: aplicaciones para traductores y conceptos básicos Los traductores, a fin de llevar a cabo su trabajo de traducción y documentación, se valen de numerosos recursos: diccionarios, glosarios, textos paralelos y comparables… entre estos, los diccionarios especializados multilingües y los documentos paralelos y comparables —de estos últimos, especialmente los de carácter explicativo— son los más valorados, pues les permiten entender el dominio sobre el que traducen, así como encontrar fácilmente traducciones adecuadas y acertadas para los términos del texto origen. Por ello, consideramos que puede constituir un avance importante poner a disposición de los traductores datos sobre: a) la traducción de un término; b) cómo se relaciona ese término con otros de su mismo dominio; y c) qué propiedades y características posee. Esta idea, en la que se basan obras como el Dictionnaire Analytique de la Distribution de Dancette y Rhétoré (2000), puede ponerse en práctica a través de las ontologías. 202 Una ontología, según el DRAE, es la «parte de la metafísica que trata del ser en general y de sus propiedades trascendentales»; en otros ámbitos, como la Ingeniería del Conocimiento, se suele citar a Gruber (1993), que la define como la «especificación explícita de una conceptualización». Una definición más específica nos la ofrece Weigand (1997), para el que una ontología es una base de datos que describe los conceptos del mundo o de algún dominio, algunas de sus propiedades y cómo los conceptos se relacionan unos con otros. Las ontologías, según Gómez-Pérez et al. (2003: 8), pueden ser de dos tipos, según su complejidad: las ontologías de tipo lightweight (ligeras) incluyen conceptos, taxonomías conceptuales, relaciones entre conceptos, y propiedades que los describen; por otro lado, las ontologías de tipo heavyweight (de envergadura) contienen, además de lo anterior, axiomas y restricciones, que aclaran el significado de los conceptos almacenados en ellas. Corcho et al. (2004: 3) describen los principales componentes de las ontologías: conceptos, relaciones, instancias, constantes, atributos, axiomas y reglas. • Los conceptos, también llamados clases, representan ideas sobre los objetos físicos o abstractos que configuran un dominio. Como apuntan los autores, normalmente se organizan en forma de taxonomías a las que se pueden aplicar mecanismos de herencia. De este modo, una clase puede dividirse en subclases que representen conceptos más específicos: así, una ontología sobre el dominio del turismo puede contener la clase «viaje», y ésta a su vez contener la subclase «viaje combinado». • Las relaciones representan un tipo de asociación entre los conceptos de un dominio. La mayoría de relaciones enlazan un concepto con otro, por lo que son de tipo binario. • Las instancias representan individuos o elementos específicos de una ontología. Así, por ejemplo, el concepto viaje combinado puede instanciarse como «viaje a Lanzarote de 1-6-2008 a 8-6-2008». 203 • Las constantes son valores numéricos que no cambian en un determinado dominio. Por ejemplo, la edad mínima para contratar un viaje es de 18 años. • Los atributos describen las propiedades de los conceptos y de las instancias. Se distinguen dos tipos de atributos: atributos de clase y atributos de instancia. Los primeros describen conceptos y toman sus valores del concepto en donde están definidos. Los segundos describen instancias, y toman sus valores de ellas. • Los axiomas formales son expresiones lógicas que son siempre ciertas y que se usan para especificar restricciones en la ontología. • Las reglas se utilizan para inferir conocimiento de la ontología, como por ejemplo, valores de atributos. En cuanto a los tipos de ontologías, citaremos la clasificación de Steve et al. (1998), que distinguen: • Ontologías de dominio, en las que se representa el conocimiento especializado pertinente de un dominio o subdominio, como la medicina, la ingeniería, la cardiología, el derecho, etc. • Ontologías genéricas, en las que se representan conceptos generales y fundacionales del conocimiento, como las estructuras parte-todo, la cuantificación, los procesos o los tipos de objetos. • Ontologías representacionales, en las que se especifican las conceptualizaciones que subyacen a los formalismos de representación del conocimiento, por lo que también se denominan meta-ontologías (meta-level o top-level ontologies). 204 Construcción de ontologías: aplicación al dominio del viaje combinado A fin de construir una ontología, el primer paso consiste en determinar el dominio y el alcance de la misma. A este respecto, Noy y McGuinness (2001) proponen algunas preguntas que plantearse antes de su creación: What is the domain that the ontology will cover? For what are we going to use the ontology? For what types of questions the information in the ontology should provide answers? Who will use and maintain the ontology?1 En este sentido, el dominio será el del viaje combinado en el ámbito comunitario europeo, regulado por la Directiva 90/314/CEE del Consejo, de 13 de junio de 1990, relativa a los viajes combinados, las vacaciones combinadas y los circuitos combinados2. La ontología se usará con fines terminológicos, traductológicos y de documentación, y responderá por tanto a preguntas que puedan plantear traductores y terminólogos con respecto a textos de la especialidad del viaje combinado. De su mantenimiento se encargarán en un principio los investigadores implicados en este estudio, pero más adelante podrán llevarlo a cabo traductores y terminólogos, mediante una interfaz adecuada. Este primer paso forma parte de una metodología para construir ontologías propuesta por Noy y McGuinness (2001), que se complementa con la herramienta Protégé-2000. Según esta metodología, después de determinar el dominio, se considera la reutilización de otras ontologías existentes, se enumeran los términos importantes del dominio, se definen las clases y las jerarquías de clases, se definen las propiedades y valores de éstas, y se definen 205 instancias. Gómez-Pérez et al. (2003: 113-142) nombran otras metodologías relevantes (las de Cyc, Uschold y King, Grüninger y Fox, KACTUS) y describen una metodología, METHONTOLOGY, creada en el seno del Grupo de Ingeniería Ontológica de la Universidad Politécnica de Madrid (UPM). Esta metodología, que detallaremos en el apartado siguiente, es la que hemos aplicado en la construcción de nuestra ontología sobre el viaje combinado. Uso de METHONTOLOGY Consideramos que METHONTOLOGY se adapta en gran medida a nuestros objetivos, pues nos permite crear una ontología que luego servirá de base para fines terminológicos y de traducción. A continuación detallamos los pasos seguidos para su elaboración. 1) Construcción de un glosario de términos. El primer paso consistió en elaborar un glosario de términos basado en la Directiva 90/314. De esta manera, a partir del texto en español, se extrajeron todos los términos relevantes del dominio (conceptos, atributos, relaciones, etc.), y se especificaron datos tales como la existencia de sinónimos y su descripción. A continuación, se analizaron las versiones en inglés y alemán de la Directiva en busca de los equivalentes de los términos localizados en español; los equivalentes se introdujeron en la columna correspondiente a «Sinónimos». Mostramos aquí un extracto (Tabla 1): Nombre consumidor Sinónimos (EN) consumer; (DE) Verbraucher Descripción Tipo la persona que compra o concepto se compromete a comprar el viaje combinado («el contratante principal»), la persona en nombre de la cual el contratante principal se compromete a comprar el viaje combinado («los demás beneficiarios») o la persona a la cual el contratante principal u otro beneficiario cede el viaje combinado 206 contratante principal (EN) principal contractor; (DE) Hauptkontrahent beneficiario (EN) beneficiary; (DE) Begünstigter organizador (EN) organizer; (DE) Veranstalter viaje combinado Circuito combinado, vacaciones combinadas // (EN) package; (DE) Pauschalreise («cesionario»). la persona que compra o se compromete a comprar el viaje combinado la persona en nombre de la cual el contratante principal se compromete a comprar el viaje combinado la persona que organiza de forma no ocasional viajes combinados y los vende u ofrece a la venta, directamente o por medio de un detallista la combinación previa de, por lo menos, dos de los siguientes elementos, vendida u ofrecida a la venta con arreglo a un precio global, cuando dicha prestación sobrepase las veinticuatro horas o incluya una noche de estancia: a) transporte, b) alojamiento, c) otros servicios turísticos no accesorios del transporte o del alojamiento y que constituyan una parte significativa del viaje combinado. concepto concepto concepto concepto Tabla 1: Extracto del glosario de términos 2) Construir taxonomías de conceptos. A continuación, se seleccionaron los conceptos de la lista anterior y se definieron las jerarquías de conceptos. METHONTOLOGY propone establecer cuatro tipos de taxonomías: subclase-de, descomposición disjunta, descomposición exhaustiva y partición. En la Figura 1 mostramos un ejemplo de partición, que consiste en un conjunto de subclases que no comparten instancias comunes pero que cubren todas las posibles subclases del concepto principal del que provienen (en este caso, «consumidor»). Por tanto, no hay instancias de «consumidor» que no sean instancias de una de las subclases de la partición. 207 Consumidor Partición CONTRATANTE PRINCIPAL BENEFICIARIO CESIONARIO Figura 1: Ejemplo de partición 3) Construcción de diagramas de relaciones ad hoc. El objetivo de estos diagramas, según los autores, consiste en establecer relaciones ad hoc entre conceptos de la misma taxonomía conceptual (u otra diferente). La Figura 2 muestra la relación «organiza» y su inversa, «es organizado por». Figura 2: Ejemplo de relación ad hoc 4) Construcción del diccionario de conceptos. En él se incluyen todos los conceptos de la ontología, así como las propiedades —a nivel de concepto y a nivel de instancia— y las relaciones que los describen. La Tabla 2 muestra un extracto del diccionario de conceptos. Nombre del concepto viaje combinado transporte Atributos de clase precio global -- Atributos de instancia fecha de salida categoría alojamiento -- categoría, situación, homologación Relaciones incluye subclase-de: avión, barco -- Tabla 2: Extracto del diccionario de conceptos 5) Definir las relaciones binarias ad hoc en detalle. En esta fase se recopilan todas las relaciones binarias ad hoc incluidas en el diccionario de conceptos, detallándose el nombre de 208 la relación, los conceptos de origen y destino, la cardinalidad, y las posibles relaciones inversas (véase Tabla 3). Nombre de la Concepto origen relación vende directamente organizador Cardinalidad origen (máx.) 1 organiza compra 1 N organizador consumidor del Concepto meta viaje combinado viaje combinado viaje combinado Relación inversa es vendido directamente por es organizado por es comprado por Tabla 3: Extracto de la tabla de relaciones binarias ad hoc 6) Definir los atributos de instancia en detalle. A continuación se describen todos los atributos de instancia que se han incluido en el diccionario de conceptos (véase Tabla 4). Nombre del atributo de instancia categoría categoría situación Nombre del concepto transporte alojamiento alojamiento Tipo de valor Rango del valor String -String -String -- Cardinalidad (1, 1) (1, 1) (1, 1) Tabla 4: Extracto de la tabla de atributos de instancia 7) Definir los atributos de clase en detalle. En esta tabla se describen los atributos de clase reflejados en el diccionario de conceptos (véase Tabla 5). Atributos de clase precio global copia para el consumidor Nombre del concepto viaje combinado contrato Tipo de valor Sí/No Sí/No Cardinalidad (1, 1) (1, 1) Valores Sí Sí Tabla 5: Extracto de la tabla de atributos de clase 8) Definir las constantes en detalle. En esta fase se definen las constantes que aparecieron en el glosario de términos (véase Tabla 6). Nombre fecha límite de aplicación de la Directiva Tipo de valor Fecha Valor Unidad de medida 31 de diciembre de 1992 -- Tabla 6: Extracto de la tabla de constantes 209 9) Definir instancias. Se deben definir instancias relevantes del dominio que se esté analizando. La Tabla 7 incluye dos ejemplos: Nombre de la instancia Viaje código 08-345 Nombre del concepto Viaje combinado Hotel Baviera Hotel Atributo Fecha de salida Fecha de regreso Categoría Valores 5 de mayo de 2008 9 de mayo de 2008 3 estrellas Tabla 7: Ejemplos de instancias de la ontología sobre viajes combinados El idioma de partida ha sido el español, aunque la conceptualización es extensible igualmente a Reino Unido y Alemania, gracias a la uniformidad que garantiza la Directiva comunitaria. Disponemos en este sentido de versiones de la ontología en inglés y en alemán; a este respecto, ha resultado de gran ayuda el glosario de términos establecido desde el principio. La ontología aún se encuentra en fase de desarrollo, por lo que aún no se han establecido axiomas formales y reglas. De este modo, en su actual fase de creación, se podría considerar que se trata de una ontología de tipo lightweight, ya que contiene conceptos, taxonomías, relaciones y propiedades. El siguiente paso consistirá en definir todos los conceptos, relaciones, propiedades y axiomas a través de la plataforma online WebODE, desarrollada en el seno del Grupo de Ingeniería Ontológica de la UPM. Aplicación de Termontography Un último paso consistirá en integrar en la ontología conceptos procedentes de la transposición de la Directiva a las legislaciones nacionales de España, Reino Unido y Alemania, que ha dado lugar a normativas ligeramente diferentes. Esta fase abre interesantes posibilidades a la investigación en ontoterminogía, pues la integración en la ontología de conceptos procedentes de leyes de distintos países conlleva inevitablemente la existencia de 210 divergencias conceptuales, es decir, clases que existen en determinadas legislaciones, y que son inexistentes en otras, por lo que no disponen de traducción. Este problema ha sido ampliamente abordado por los investigadores del Centrum voor Vaktaal en Communicatie (CVC) de Bruselas, coordinados por Rita Temmerman, que proponen un enfoque de creación de terminologías basado en ontologías, llamado Termontography. Tal como lo definen Temmerman y Kerremans (2003: 4), Termontography es un enfoque que combina las teorías y métodos del análisis terminológico multilingüe del enfoque sociocognitivo (Temmerman, 2000) con los métodos y directrices del análisis ontológico. Esencialmente, esta teoría destaca por su capacidad para representar qué vacíos léxicos existen en determinadas lenguas, así como qué conceptos son exclusivos de una lengua en concreto. Para ello, sigue un método que Temmerman y Kerremans (2003: 4) denominan middle-out y que combina enfoques topdown (de arriba abajo) y bottom-up (de abajo arriba). En primer lugar, en estrecha colaboración con especialistas del dominio en cuestión, se desarrolla un marco inicial de categorías y de relaciones intercategoriales, de lo más general a lo más concreto. A continuación, este marco de categorización sirve de plantilla para la extracción manual y semiautomática de conocimiento a partir de corpus. Luego, a medida que se va extrayendo información textual del corpus y ésta se va comparando con el marco de categorización, se van ampliando las categorías —incluyendo las culturales—, y las relaciones entre ellas, con lo cual tiene lugar un análisis de tipo bottom-up, de lo más concreto a lo más general. De este modo, quedan patentes las diferencias culturales, conceptuales y lingüísticas que pueden existir dentro de un mismo dominio. Los resultados de este análisis quedan finalmente reflejados en una base de datos termontológica. El ámbito del viaje combinado, aunque regulado a nivel europeo por la Directiva, presenta divergencias culturales, conceptuales y lingüísticas cuando observamos las legislaciones nacionales al respecto de España, Reino Unido y Alemania. Por ejemplo, encontramos que el 211 concepto «Fair Trading Agreement» de la legislación británica no tiene una correspondencia exacta en sus leyes homólogas o que la «Ley General para la Defensa de los Consumidores y Usuarios» de España no presenta las mismas características que otras leyes similares de Alemania y Reino Unido. La aplicación de los principios de la termontografía podría ayudar a representar adecuadamente estos conceptos divergentes en una ontología. Además, consideramos que este enfoque se puede adaptar perfectamente a nuestra ontología, pues disponemos de un corpus de textos sobre viaje combinado (corpus Turicor, proyecto TURICOR (ref. BFF2003-04616; véase Corpas, 2004) que puede servir de elemento de contraste para las categorías. Por otro lado, el grupo de investigación del proyecto HUM-892 cuenta con especialistas en Derecho turístico que pueden ayudar a establecer esas categorías iniciales. Conclusiones Esta comunicación ha mostrado cómo crear una ontología para fines terminológicos y de traducción, partiendo de la premisa de que pueden convertirse en un valioso medio de documentación conceptual y terminológica para el traductor, pues proporcionan información no ambigua sobre los conceptos de un dominio en varios idiomas, facilitando así el trasvase de información en el ámbito internacional. De este modo, hemos comprobado que la metodología METHONTOLOGY puede aplicarse para estos fines, y que ésta puede ampliarse y perfeccionarse por medio de otras teorías más orientadas a la terminología, como es la de Termontography. Aunque este trabajo se encuentra aún en fase de desarrollo, consideramos que dará lugar a un repositorio terminológico de gran calidad, integrado por información conceptual, que explicite las relaciones y las propiedades de los conceptos, así como por información lingüística, que 212 indique las respectivas realizaciones textuales en inglés, español y alemán de los conceptos o categorías. Agradecimientos Esta investigación se inscribe en el marco del Proyecto de Excelencia La contratación turística electrónica multilingüe como mediación intercultural: aspectos legales, traductológicos y terminológicos (N.º de ref. HUM-892, 2006-2009. Junta de Andalucía. Responsable: Gloria Corpas). Bibliografía Corcho, O., M. Fernández-López, A. Gómez-Pérez & A. López-Cima. (2005). “Building Legal Ontologies with METHONTOLOGY and WebODE” en R. Bejamins, R. Casanovas, P. Gangemi, & P. Selic, Law and the Semantic Web. Springer Verlag Corpas Pastor, G. (2004). “The Turicor Project: Work in Progress”. Revista Europea de Derecho de la Navegación Marítima y Aeronáutica XX: 2990-3010. Dancette J. & C. Rhétoré (2000). Dictionnaire Analytique de la Distribution. Montreal: Las Presses de l’Université de Montréal. Gómez-Pérez, A., Fernández-López, M. y Corcho, O. (2003). Ontological Engineering. Springer Verlag. Gruber, T. (1993). “A Translation Approach to Portable Ontology Specifications”. Knowledge Acquisition 5, 2: 199-220. Noy, N. & D. McGuinness. (2001). “Ontology Development 101: A Guide to Creating Your First Ontology”, Documento Técnico KSL-01-05 de Stanford Knowledge Systems Laboratory y SMI-2001-0880 de Stanford Medical Informatics. Real Academia Española. (2001). Diccionario de la Lengua Española (DRAE). Madrid: Espasa. Steve, G., A. Gangemi & D. Pisanelli. (1998). "Integrating Medical Terminologies with ONIONS Methodology". Documento Técnico ITBM-RIM-3/1997. Italia: Laboratory for Applied Ontology, Institute of Cognitive Sciences and Technology. Temmerman, R. (2000). Towards New Ways of Terminology Description. The Sociocognitive Approach. Amsterdam/Philadelphia: John Benjamins. 213 Temmerman, R. & K. Kerremans. (2003). "Termontography: Ontology Building and the Sociocognitive Approach to Terminology Description" en E. Hajicová, A. Kotešovcová, & J. Mírovský (eds.), Proceedings of CIL17, Matfyzpress, MFF UK (CD-ROM). Praga, República Checa. Weigand, H. (1997). "Multilingual Ontology-Based Lexicon for News Filtering – The TREVI Project" en K. Mahesh (ed.), Ontologies and Multilingual NLP. Proceedings from the 15th International Joint Conference on Artificial Intelligence (IJCAI), August 23-29, 1997, 138159. Nagoya, Japón. Notas 1 ¿Cuál es el dominio que abarcará la ontología? / ¿Para qué vamos a utilizar la ontología? / ¿Para qué tipos de preguntas debería proporcionar respuestas la ontología? / ¿Quién utilizará y mantendrá la ontología? (La traducción es nuestra.) 2 Un viaje combinado, según la citada Directiva, es «la combinación previa de, por lo menos, dos de los siguientes elementos, vendida u ofrecida a la venta con arreglo a un precio global, cuando dicha prestación sobrepase las veinticuatro horas o incluya una noche de estancia: a) transporte, b) alojamiento, c) otros servicios turísticos no accesorios del transporte o del alojamiento y que constituyan una parte significativa del viaje combinado