Creación de una ontología sobre el viaje combinado: su aplicación

Anuncio
200
Creación de una ontología sobre el viaje combinado: su aplicación a la
terminología
María Rosario Bautista Zambrana
Universidad de Málaga
Resumen
Esta comunicación presenta cómo se ha elaborado, paso a paso, una ontología —definida
como «especificación explícita de una conceptualización» (Gruber, 1993)— sobre el ámbito
del viaje combinado, a fin de estructurar el conocimiento de este dominio jurídico-turístico y
crear una ontoterminología unificada en español, inglés y alemán sobre el citado ámbito, que
sea de utilidad para terminólogos y traductores. Para la construcción de la ontología, en
primer lugar, se ha analizado a fondo el texto de la Directiva 90/314/CEE del Consejo, de 13
de junio de 1990, relativa a los viajes combinados, las vacaciones combinadas y los circuitos
combinados, en sus distintas versiones lingüísticas, y a continuación se ha aplicado la
metodología METHONTOLOGY (Gómez-Pérez, Fernández-López y Corcho, 2003) a los
datos obtenidos en el análisis mencionado. Por otro lado, esta comunicación también explora
las posibilidades que ofrece el método propuesto por Temmerman y Kerremans (2003),
Termontography, para representar, en una ontoterminología, conceptos divergentes y sus
respectivas realizaciones lingüísticas en los tres idiomas mencionados.
Palabras
clave:
ontología,
terminología,
viaje
combinado,
METHONTOLOGY,
Termontography
Abstract
This paper shows how we have created an ontology —defined as an «explicit specification of
a conceptualization» (Gruber, 1993)— about the travel package domain, in order to structure
the knowledge of this legal-travelling domain, and build a unified ontoterminology in
201
Spanish, English and German, which in addition should be useful for terminologists and
translators. For building the ontology, in the first place, we have carried out an in-depth
analysis of the text of the Council Directive 90/314/EEC of 13 June 1990 on package travel,
package holidays and package tours, in its different linguistic versions; after that, the
methodology METHONTOLOGY (Gómez-Pérez, Fernández-López and Corcho, 2003) was
applied to the results obtained in the aforementioned analysis. On the other hand, this paper
also explores the possibilities offered by the method proposed by Temmerman and Kerremans
(2003), Termontography, for representing divergent concepts and their respective linguistic
realisations in the three languages within an ontoterminology.
Key words: ontology, terminology, package travel, METHONTOLOGY, Termontography
Ontologías: aplicaciones para traductores y conceptos básicos
Los traductores, a fin de llevar a cabo su trabajo de traducción y documentación, se valen de
numerosos recursos: diccionarios, glosarios, textos paralelos y comparables… entre estos, los
diccionarios especializados multilingües y los documentos paralelos y comparables —de estos
últimos, especialmente los de carácter explicativo— son los más valorados, pues les permiten
entender el dominio sobre el que traducen, así como encontrar fácilmente traducciones
adecuadas y acertadas para los términos del texto origen. Por ello, consideramos que puede
constituir un avance importante poner a disposición de los traductores datos sobre: a) la
traducción de un término; b) cómo se relaciona ese término con otros de su mismo dominio; y
c) qué propiedades y características posee. Esta idea, en la que se basan obras como el
Dictionnaire Analytique de la Distribution de Dancette y Rhétoré (2000), puede ponerse en
práctica a través de las ontologías.
202
Una ontología, según el DRAE, es la «parte de la metafísica que trata del ser en general y de
sus propiedades trascendentales»; en otros ámbitos, como la Ingeniería del Conocimiento, se
suele citar a Gruber (1993), que la define como la «especificación explícita de una
conceptualización». Una definición más específica nos la ofrece Weigand (1997), para el que
una ontología es una base de datos que describe los conceptos del mundo o de algún dominio,
algunas de sus propiedades y cómo los conceptos se relacionan unos con otros.
Las ontologías, según Gómez-Pérez et al. (2003: 8), pueden ser de dos tipos, según su
complejidad: las ontologías de tipo lightweight (ligeras) incluyen conceptos, taxonomías
conceptuales, relaciones entre conceptos, y propiedades que los describen; por otro lado, las
ontologías de tipo heavyweight (de envergadura) contienen, además de lo anterior, axiomas y
restricciones, que aclaran el significado de los conceptos almacenados en ellas.
Corcho et al. (2004: 3) describen los principales componentes de las ontologías: conceptos,
relaciones, instancias, constantes, atributos, axiomas y reglas.
•
Los conceptos, también llamados clases, representan ideas sobre los objetos físicos o
abstractos que configuran un dominio. Como apuntan los autores, normalmente se
organizan en forma de taxonomías a las que se pueden aplicar mecanismos de
herencia. De este modo, una clase puede dividirse en subclases que representen
conceptos más específicos: así, una ontología sobre el dominio del turismo puede
contener la clase «viaje», y ésta a su vez contener la subclase «viaje combinado».
•
Las relaciones representan un tipo de asociación entre los conceptos de un dominio.
La mayoría de relaciones enlazan un concepto con otro, por lo que son de tipo binario.
•
Las instancias representan individuos o elementos específicos de una ontología. Así,
por ejemplo, el concepto viaje combinado puede instanciarse como «viaje a Lanzarote
de 1-6-2008 a 8-6-2008».
203
•
Las constantes son valores numéricos que no cambian en un determinado dominio.
Por ejemplo, la edad mínima para contratar un viaje es de 18 años.
•
Los atributos describen las propiedades de los conceptos y de las instancias. Se
distinguen dos tipos de atributos: atributos de clase y atributos de instancia. Los
primeros describen conceptos y toman sus valores del concepto en donde están
definidos. Los segundos describen instancias, y toman sus valores de ellas.
•
Los axiomas formales son expresiones lógicas que son siempre ciertas y que se usan
para especificar restricciones en la ontología.
•
Las reglas se utilizan para inferir conocimiento de la ontología, como por ejemplo,
valores de atributos.
En cuanto a los tipos de ontologías, citaremos la clasificación de Steve et al. (1998), que
distinguen:
•
Ontologías de dominio, en las que se representa el conocimiento especializado
pertinente de un dominio o subdominio, como la medicina, la ingeniería, la
cardiología, el derecho, etc.
•
Ontologías genéricas, en las que se representan conceptos generales y fundacionales
del conocimiento, como las estructuras parte-todo, la cuantificación, los procesos o los
tipos de objetos.
•
Ontologías representacionales, en las que se especifican las conceptualizaciones que
subyacen a los formalismos de representación del conocimiento, por lo que también se
denominan meta-ontologías (meta-level o top-level ontologies).
204
Construcción de ontologías: aplicación al dominio del viaje combinado
A fin de construir una ontología, el primer paso consiste en determinar el dominio y el
alcance de la misma. A este respecto, Noy y McGuinness (2001) proponen algunas preguntas
que plantearse antes de su creación:
What is the domain that the ontology will cover?
For what are we going to use the ontology?
For what types of questions the information in the ontology should provide
answers?
Who will use and maintain the ontology?1
En este sentido, el dominio será el del viaje combinado en el ámbito comunitario europeo,
regulado por la Directiva 90/314/CEE del Consejo, de 13 de junio de 1990, relativa a los
viajes combinados, las vacaciones combinadas y los circuitos combinados2. La ontología se
usará con fines terminológicos, traductológicos y de documentación, y responderá por tanto a
preguntas que puedan plantear traductores y terminólogos con respecto a textos de la
especialidad del viaje combinado. De su mantenimiento se encargarán en un principio los
investigadores implicados en este estudio, pero más adelante podrán llevarlo a cabo
traductores y terminólogos, mediante una interfaz adecuada.
Este primer paso forma parte de una metodología para construir ontologías propuesta por
Noy y McGuinness (2001), que se complementa con la herramienta Protégé-2000. Según esta
metodología, después de determinar el dominio, se considera la reutilización de otras
ontologías existentes, se enumeran los términos importantes del dominio, se definen las clases
y las jerarquías de clases, se definen las propiedades y valores de éstas, y se definen
205
instancias. Gómez-Pérez et al. (2003: 113-142) nombran otras metodologías relevantes (las de
Cyc, Uschold y King, Grüninger y Fox, KACTUS) y describen una metodología,
METHONTOLOGY, creada en el seno del Grupo de Ingeniería Ontológica de la Universidad
Politécnica de Madrid (UPM). Esta metodología, que detallaremos en el apartado siguiente, es
la que hemos aplicado en la construcción de nuestra ontología sobre el viaje combinado.
Uso de METHONTOLOGY
Consideramos que METHONTOLOGY se adapta en gran medida a nuestros objetivos, pues
nos permite crear una ontología que luego servirá de base para fines terminológicos y de
traducción. A continuación detallamos los pasos seguidos para su elaboración.
1) Construcción de un glosario de términos. El primer paso consistió en elaborar un glosario
de términos basado en la Directiva 90/314. De esta manera, a partir del texto en español, se
extrajeron todos los términos relevantes del dominio (conceptos, atributos, relaciones, etc.), y
se especificaron datos tales como la existencia de sinónimos y su descripción. A continuación,
se analizaron las versiones en inglés y alemán de la Directiva en busca de los equivalentes de
los términos localizados en español; los equivalentes se introdujeron en la columna
correspondiente a «Sinónimos». Mostramos aquí un extracto (Tabla 1):
Nombre
consumidor
Sinónimos
(EN) consumer; (DE)
Verbraucher
Descripción
Tipo
la persona que compra o concepto
se compromete a
comprar el viaje
combinado («el
contratante principal»),
la persona en nombre de
la cual el contratante
principal se compromete
a comprar el viaje
combinado («los demás
beneficiarios») o la
persona a la cual el
contratante principal u
otro beneficiario cede el
viaje combinado
206
contratante principal
(EN) principal
contractor; (DE)
Hauptkontrahent
beneficiario
(EN) beneficiary; (DE)
Begünstigter
organizador
(EN) organizer; (DE)
Veranstalter
viaje combinado
Circuito combinado,
vacaciones combinadas
// (EN) package; (DE)
Pauschalreise
(«cesionario»).
la persona que compra o
se compromete a
comprar el viaje
combinado
la persona en nombre de
la cual el contratante
principal se compromete
a comprar el viaje
combinado
la persona que organiza
de forma no ocasional
viajes combinados y los
vende u ofrece a la
venta, directamente o
por medio de un
detallista
la combinación previa
de, por lo menos, dos de
los siguientes elementos,
vendida u ofrecida a la
venta con arreglo a un
precio global, cuando
dicha prestación
sobrepase las
veinticuatro horas o
incluya una noche de
estancia: a) transporte,
b) alojamiento, c) otros
servicios turísticos no
accesorios del transporte
o del alojamiento y que
constituyan una parte
significativa del viaje
combinado.
concepto
concepto
concepto
concepto
Tabla 1: Extracto del glosario de términos
2) Construir taxonomías de conceptos. A continuación, se seleccionaron los conceptos de la
lista anterior y se definieron las jerarquías de conceptos. METHONTOLOGY propone
establecer cuatro tipos de taxonomías: subclase-de, descomposición disjunta, descomposición
exhaustiva y partición. En la Figura 1 mostramos un ejemplo de partición, que consiste en un
conjunto de subclases que no comparten instancias comunes pero que cubren todas las
posibles subclases del concepto principal del que provienen (en este caso, «consumidor»). Por
tanto, no hay instancias de «consumidor» que no sean instancias de una de las subclases de la
partición.
207
Consumidor
Partición
CONTRATANTE
PRINCIPAL
BENEFICIARIO
CESIONARIO
Figura 1: Ejemplo de partición
3) Construcción de diagramas de relaciones ad hoc. El objetivo de estos diagramas, según los
autores, consiste en establecer relaciones ad hoc entre conceptos de la misma taxonomía
conceptual (u otra diferente). La Figura 2 muestra la relación «organiza» y su inversa, «es
organizado por».
Figura 2: Ejemplo de relación ad hoc
4) Construcción del diccionario de conceptos. En él se incluyen todos los conceptos de la
ontología, así como las propiedades —a nivel de concepto y a nivel de instancia— y las
relaciones que los describen. La Tabla 2 muestra un extracto del diccionario de conceptos.
Nombre del concepto
viaje combinado
transporte
Atributos de clase
precio global
--
Atributos de instancia
fecha de salida
categoría
alojamiento
--
categoría, situación,
homologación
Relaciones
incluye
subclase-de: avión,
barco
--
Tabla 2: Extracto del diccionario de conceptos
5) Definir las relaciones binarias ad hoc en detalle. En esta fase se recopilan todas las
relaciones binarias ad hoc incluidas en el diccionario de conceptos, detallándose el nombre de
208
la relación, los conceptos de origen y destino, la cardinalidad, y las posibles relaciones
inversas (véase Tabla 3).
Nombre
de
la Concepto origen
relación
vende directamente organizador
Cardinalidad
origen (máx.)
1
organiza
compra
1
N
organizador
consumidor
del Concepto meta
viaje combinado
viaje combinado
viaje combinado
Relación inversa
es vendido
directamente por
es organizado por
es comprado por
Tabla 3: Extracto de la tabla de relaciones binarias ad hoc
6) Definir los atributos de instancia en detalle. A continuación se describen todos los atributos
de instancia que se han incluido en el diccionario de conceptos (véase Tabla 4).
Nombre del atributo de instancia
categoría
categoría
situación
Nombre del
concepto
transporte
alojamiento
alojamiento
Tipo de valor Rango del
valor
String
-String
-String
--
Cardinalidad
(1, 1)
(1, 1)
(1, 1)
Tabla 4: Extracto de la tabla de atributos de instancia
7) Definir los atributos de clase en detalle. En esta tabla se describen los atributos de clase
reflejados en el diccionario de conceptos (véase Tabla 5).
Atributos de clase
precio global
copia para el
consumidor
Nombre del concepto
viaje combinado
contrato
Tipo de valor
Sí/No
Sí/No
Cardinalidad
(1, 1)
(1, 1)
Valores
Sí
Sí
Tabla 5: Extracto de la tabla de atributos de clase
8) Definir las constantes en detalle. En esta fase se definen las constantes que aparecieron en
el glosario de términos (véase Tabla 6).
Nombre
fecha límite de
aplicación de la
Directiva
Tipo de valor
Fecha
Valor
Unidad de medida
31 de diciembre de 1992 --
Tabla 6: Extracto de la tabla de constantes
209
9) Definir instancias. Se deben definir instancias relevantes del dominio que se esté
analizando. La Tabla 7 incluye dos ejemplos:
Nombre de la instancia
Viaje código 08-345
Nombre del concepto
Viaje combinado
Hotel Baviera
Hotel
Atributo
Fecha de salida
Fecha de regreso
Categoría
Valores
5 de mayo de 2008
9 de mayo de 2008
3 estrellas
Tabla 7: Ejemplos de instancias de la ontología sobre viajes combinados
El idioma de partida ha sido el español, aunque la conceptualización es extensible igualmente
a Reino Unido y Alemania, gracias a la uniformidad que garantiza la Directiva comunitaria.
Disponemos en este sentido de versiones de la ontología en inglés y en alemán; a este
respecto, ha resultado de gran ayuda el glosario de términos establecido desde el principio.
La ontología aún se encuentra en fase de desarrollo, por lo que aún no se han establecido
axiomas formales y reglas. De este modo, en su actual fase de creación, se podría considerar
que se trata de una ontología de tipo lightweight, ya que contiene conceptos, taxonomías,
relaciones y propiedades.
El siguiente paso consistirá en definir todos los conceptos, relaciones, propiedades y axiomas
a través de la plataforma online WebODE, desarrollada en el seno del Grupo de Ingeniería
Ontológica de la UPM.
Aplicación de Termontography
Un último paso consistirá en integrar en la ontología conceptos procedentes de la
transposición de la Directiva a las legislaciones nacionales de España, Reino Unido y
Alemania, que ha dado lugar a normativas ligeramente diferentes. Esta fase abre interesantes
posibilidades a la investigación en ontoterminogía, pues la integración en la ontología de
conceptos procedentes de leyes de distintos países conlleva inevitablemente la existencia de
210
divergencias conceptuales, es decir, clases que existen en determinadas legislaciones, y que
son inexistentes en otras, por lo que no disponen de traducción. Este problema ha sido
ampliamente abordado por los investigadores del Centrum voor Vaktaal en Communicatie
(CVC) de Bruselas, coordinados por Rita Temmerman, que proponen un enfoque de creación
de terminologías basado en ontologías, llamado Termontography. Tal como lo definen
Temmerman y Kerremans (2003: 4), Termontography es un enfoque que combina las teorías
y métodos del análisis terminológico multilingüe del enfoque sociocognitivo (Temmerman,
2000) con los métodos y directrices del análisis ontológico. Esencialmente, esta teoría destaca
por su capacidad para representar qué vacíos léxicos existen en determinadas lenguas, así
como qué conceptos son exclusivos de una lengua en concreto. Para ello, sigue un método
que Temmerman y Kerremans (2003: 4) denominan middle-out y que combina enfoques topdown (de arriba abajo) y bottom-up (de abajo arriba). En primer lugar, en estrecha
colaboración con especialistas del dominio en cuestión, se desarrolla un marco inicial de
categorías y de relaciones intercategoriales, de lo más general a lo más concreto. A
continuación, este marco de categorización sirve de plantilla para la extracción manual y
semiautomática de conocimiento a partir de corpus. Luego, a medida que se va extrayendo
información textual del corpus y ésta se va comparando con el marco de categorización, se
van ampliando las categorías —incluyendo las culturales—, y las relaciones entre ellas, con lo
cual tiene lugar un análisis de tipo bottom-up, de lo más concreto a lo más general. De este
modo, quedan patentes las diferencias culturales, conceptuales y lingüísticas que pueden
existir dentro de un mismo dominio. Los resultados de este análisis quedan finalmente
reflejados en una base de datos termontológica.
El ámbito del viaje combinado, aunque regulado a nivel europeo por la Directiva, presenta
divergencias culturales, conceptuales y lingüísticas cuando observamos las legislaciones
nacionales al respecto de España, Reino Unido y Alemania. Por ejemplo, encontramos que el
211
concepto «Fair Trading Agreement» de la legislación británica no tiene una correspondencia
exacta en sus leyes homólogas o que la «Ley General para la Defensa de los Consumidores y
Usuarios» de España no presenta las mismas características que otras leyes similares de
Alemania y Reino Unido. La aplicación de los principios de la termontografía podría ayudar a
representar adecuadamente estos conceptos divergentes en una ontología. Además,
consideramos que este enfoque se puede adaptar perfectamente a nuestra ontología, pues
disponemos de un corpus de textos sobre viaje combinado (corpus Turicor, proyecto
TURICOR (ref. BFF2003-04616; véase Corpas, 2004) que puede servir de elemento de
contraste para las categorías. Por otro lado, el grupo de investigación del proyecto HUM-892
cuenta con especialistas en Derecho turístico que pueden ayudar a establecer esas categorías
iniciales.
Conclusiones
Esta comunicación ha mostrado cómo crear una ontología para fines terminológicos y de
traducción, partiendo de la premisa de que pueden convertirse en un valioso medio de
documentación conceptual y terminológica para el traductor, pues proporcionan información
no ambigua sobre los conceptos de un dominio en varios idiomas, facilitando así el trasvase
de información en el ámbito internacional. De este modo, hemos comprobado que la
metodología METHONTOLOGY puede aplicarse para estos fines, y que ésta puede ampliarse
y perfeccionarse por medio de otras teorías más orientadas a la terminología, como es la de
Termontography.
Aunque este trabajo se encuentra aún en fase de desarrollo, consideramos que dará lugar a un
repositorio terminológico de gran calidad, integrado por información conceptual, que explicite
las relaciones y las propiedades de los conceptos, así como por información lingüística, que
212
indique las respectivas realizaciones textuales en inglés, español y alemán de los conceptos o
categorías.
Agradecimientos
Esta investigación se inscribe en el marco del Proyecto de Excelencia La contratación turística
electrónica multilingüe como mediación intercultural: aspectos legales, traductológicos y
terminológicos (N.º de ref. HUM-892, 2006-2009. Junta de Andalucía. Responsable: Gloria
Corpas).
Bibliografía
Corcho, O., M. Fernández-López, A. Gómez-Pérez & A. López-Cima. (2005). “Building
Legal Ontologies with METHONTOLOGY and WebODE” en R. Bejamins, R. Casanovas, P.
Gangemi, & P. Selic, Law and the Semantic Web. Springer Verlag
Corpas Pastor, G. (2004). “The Turicor Project: Work in Progress”. Revista Europea de
Derecho de la Navegación Marítima y Aeronáutica XX: 2990-3010.
Dancette J. & C. Rhétoré (2000). Dictionnaire Analytique de la Distribution. Montreal: Las
Presses de l’Université de Montréal.
Gómez-Pérez, A., Fernández-López, M. y Corcho, O. (2003). Ontological Engineering.
Springer Verlag.
Gruber, T. (1993). “A Translation Approach to Portable Ontology Specifications”.
Knowledge Acquisition 5, 2: 199-220.
Noy, N. & D. McGuinness. (2001). “Ontology Development 101: A Guide to Creating Your
First Ontology”, Documento Técnico KSL-01-05 de Stanford Knowledge Systems Laboratory
y SMI-2001-0880 de Stanford Medical Informatics.
Real Academia Española. (2001). Diccionario de la Lengua Española (DRAE). Madrid:
Espasa.
Steve, G., A. Gangemi & D. Pisanelli. (1998). "Integrating Medical Terminologies with
ONIONS Methodology". Documento Técnico ITBM-RIM-3/1997. Italia: Laboratory for
Applied Ontology, Institute of Cognitive Sciences and Technology.
Temmerman, R. (2000). Towards New Ways of Terminology Description. The
Sociocognitive Approach. Amsterdam/Philadelphia: John Benjamins.
213
Temmerman, R. & K. Kerremans. (2003). "Termontography: Ontology Building and the
Sociocognitive Approach to Terminology Description" en E. Hajicová, A. Kotešovcová, & J.
Mírovský (eds.), Proceedings of CIL17, Matfyzpress, MFF UK (CD-ROM). Praga, República
Checa.
Weigand, H. (1997). "Multilingual Ontology-Based Lexicon for News Filtering – The TREVI
Project" en K. Mahesh (ed.), Ontologies and Multilingual NLP. Proceedings from the 15th
International Joint Conference on Artificial Intelligence (IJCAI), August 23-29, 1997, 138159. Nagoya, Japón.
Notas
1
¿Cuál es el dominio que abarcará la ontología? / ¿Para qué vamos a utilizar la ontología? / ¿Para qué tipos de
preguntas debería proporcionar respuestas la ontología? / ¿Quién utilizará y mantendrá la ontología? (La
traducción es nuestra.)
2
Un viaje combinado, según la citada Directiva, es «la combinación previa de, por lo menos, dos de los
siguientes elementos, vendida u ofrecida a la venta con arreglo a un precio global, cuando dicha prestación
sobrepase las veinticuatro horas o incluya una noche de estancia: a) transporte, b) alojamiento, c) otros servicios
turísticos no accesorios del transporte o del alojamiento y que constituyan una parte significativa del viaje
combinado
Descargar