Cognición, Traducción, Computación, Utopía

Anuncio
Traducción, computación, utopía.
Dra. Anna Aguilar-Amat
Departamento de Traducción e Interpretación
Universidad Autónoma de Barcelona
Abstract
The paper aims to reconsider some questions related with Machine Translation and
Artificial Intelligence, their roles on other sciences development and their problems. It is
willed to show an historical perspective to understand Machine Translation reality and
future research. Part 3 wants to scope a general view on the analysis of knowledge and
meaning, and to place natural language processing on its social and policy effect. It is also
displayed a sample of a knowledge base developed in the Translation Faculty at
Autonomous University of Barcelona. Furthermore there is a reflection on technical uthopie
some notes on the real use of MT, and a vision of linguistics and translation from the
computational angle.
For any complex problem, there is a solution that is simple, neat, and wrong.
H.L. Mencken
Índice
1. Introducción: en torno a los términos
2. Unidad de significado y unidad de traducción
3. Historia de un concepto y de su Traducción Automática
3.1. La denominación
3.2. El sublenguaje
3.3. El contexto social
3.4. El proyecto BACUS (Base de Conocimiento UniverSitario)
3.4.1. Hipótesis conceptual de BACUS
4. Historia de una utopía
4.1. La vieja utopía: Substitución de la Traducción Humana
4.2. La nueva utopía: Automatización de la Traducción Humana
5. Cuándo es útil la Traducción Automática
5.1. Condiciones de un texto para poder ser traducido automáticamente
5.2. El concepto de ‘automático’
6. Puzzle de disciplinas
6.1. La ciencia del lenguaje
6.2. Teoría de la Traducción y Traducción Automática
1
1. Introducción: en torno a los términos
Tratándose del procesamiento del lenguaje natural, tal vez se puede comenzar por
unas notas sobre los conceptos evocados por las denominaciones de Inteligencia Artificial y
de Traducción Automática. Según Francesc Esteva (IIIA-UAB, Institut d’Investigació en
Intel·ligència Artificial de la Universitat Autónoma de Barcelona), el término “Inteligencia
Artificial” se acuñó en 1956, por convenio, en una reunión de miembros de la comunidad
científica que trabajaban en los primeros estadios del desarrollo del software y que
provenían del campo de la lógica. Aunque tiempo después se demostró la imposibilidad de
la existencia de un ‘razonador universal’, se sigue trabajando en la posibilidad de que el
ordenador resuelva problemas concretos, emita diagnósticos y tome decisiones. Así, se
considera ‘inteligente’ el hecho de que el sistema aprenda y de que pueda encontrar una
solución nueva para un problema planteado y ya resuelto otras veces de una determinada
manera. En sus primeros estadios, tanto la IA como la Traducción Automática desarrollaron
programas que tomaban sus decisiones según modelos deterministas basados en el
denominado pattern matching o comparación de patrones. En ulteriores estadios, la
aplicación de reglas de preferencia sobre los patrones así como las decisiones basadas en
criterios estocásticos, conferían mayor capacidad ‘creativa’ a los sistemas. Para lograr
cierto avance, los expertos en IA han dividido la investigación en ‘subproblemas’: la
identificación de rostros, la detección de señales procedentes del universo, el archivo de
historias clínicas, las agendas electrónicas, los sistemas de dictado automático, etc. Este
‘despiece’ afecta también al universo del lenguaje, pero de una manera un tanto más difusa.
Pero antes de entrar más de lleno en este asunto, quisiera señalar la incidencia del
término ‘inteligencia’ desde un punto de vista humanístico1. La etimología popular podría
creer que intelligere significa leer entre líneas, pero, en lo documentado, procede de legere,
elegir, escoger entre varias opciones. Se aplica, en el caso de la Inteligencia Artificial a un
aparato lógico del que se pretende obtener el resultado a partir de un proceso deductivo
fijado metódicamente de antemano sobre un conjunto seleccionado de datos. Tanto el
concepto de ‘inteligencia’ como el de ‘memoria’, asociados a este campo, están basados en
la metáfora del ordenador como cerebro. Resulta discutible si esta metáfora ayuda al
desarrollo de la Inteligencia Artificial o, por el contrario, constituye una limitación en sí
misma, debido, sobre todo, al desconocimiento que poseemos los humanos del
comportamiento de nuestros mecanismos cerebrales. También resulta discutible si esta
metáfora contribuye al avance del conocimiento sobre la mente y el cerebro.
Entender el cerebro como un procesador de información ayuda a describir
separadamente las estructuras de los procesos, siempre que esa separación sea factible y
significativa en el acto de ‘elegir’. Sucede, sin embargo, que el proceso deductivo que
protagoniza el concepto de Inteligencia Artificial no es el más importante, ni mucho menos
el único, de los que caracterizan la inteligencia humana. El cerebro posee la facultad de
tener ‘ocurrencias’, de llegar a conclusiones creativas, gracias, precisamente, a la capacidad
de abandonar la modalidad deductiva de procesamiento y dejar que la mente ‘vague’ por
todas las asociaciones posibles, muchas de ellas aparentemente estúpidas. Por eso, cuando
el concepto de ‘inteligencia’retorna de su decurso instrumental, cuando después de
1
Este decurso sobre el concepto de inteligencia tiene razón de ser si tenemos en cuenta que la inteligencia es
uno de los valores más preciados en la cultura occidental y un objeto de estudio que es proceso de frecuentes
propuestas de cambio conceptual desde diferentes perspectivas. (Ver Claxton, 1997 o Goleman, 1995).
2
aplicarlo a los ordenadores volvemos a concebir la habilidad humana, redefinimos a las
personas como procesadores de información, y a la naturaleza, en nuestro caso al lenguaje,
como ‘información que tiene que ser procesada’. Como sostiene Postman (1992), el
mensaje metafórico fundamental del ordenador es que nosotros somos ‘máquinas’
pensantes, y que la inteligencia es algo rápido, explícito, definido, basada en datos
objetivos y bajo estricto control: “El ordenador hace posible el sueño de Descartes
consistente en la matematización del mundo. Facilita la conversión de los hechos en
estadísticas y de los problemas en ecuaciones” (Ibíd., pp. 118-119).
Desde la visión humanista, este concepto tecnológico de la inteligencia parece
pernicioso cuando se hace general y dominante. En cuanto a la Traducción cabe decir que,
situados en contextos especializados, el valor de la capacidad de cálculo, la velocidad y el
volumen de la información está fuera de toda duda, pero los problemas más serios que
afectan al campo de la Traducción no son del orden de los que pueden ser resueltos con
ayuda del ‘cálculo’. Por este motivo el usuario de un sistema de Traducción Automática
debe poseer la ‘inteligencia’ o la intuición de lo que puede exigir y obtener, y de lo que va a
ser silenciado o equivocado. El resultado de un programa de Traducción Automática
depende en gran medida del carácter repetitivo de los patrones ofrecidos y de la
especificidad y especialización2 del texto y del vocabulario. La meteorología, por ser un
dominio donde la innovación conceptual es mínima, fue uno de los primeros campos en que
la TA fue aplicada con éxito. Aunque pueda hallarse soluciones ‘ad hoc’ para cada
problema, el proceso traductológico es un problema complejo, y la TA debería ser
considerada un sistema experto. Un sistema experto es un multiagente que trabaja como un
detective: utiliza grandes cantidades de información almacenada para, mediante la
aplicación de reglas lógicas, resolver un problema complejo.
El punto de partida de la investigación en TA (como el de las redes neuronales) se
caracterizó por la aplicación de la estrategia bottom up, es decir por el proceso de construir
el significado a partir de sus unidades mínimas. Parece, sin embargo, que los sistemas
expertos más efectivos parten de la aproximación top down, en la cual los programas
empiezan la casa por el tejado, es decir, por los resultados de un proceso cognitivo. Por otro
lado cabe anotar que el lenguaje natural es, en sí mismo, un sistema experto, un
extraordinario proceso de computación. Esto significa que estamos construyendo un
sistema experto para regir otro, basado en la asignación de símbolos y signos. Por eso
algunas tendencias desarrollaron la posibilidad de procesar en primer lugar los significados,
el universo conceptual (Schank , Nirenburg, entre otros).
Cuando en los años cincuenta se acuñaron los términos ‘Inteligencia Artificial’ y
‘Traducción Automática’ se creía que en unos veinte años las máquinas harían la mayor
parte de las tareas cotidianas. El resultado de esa utopía fallida fue la desconfianza de los
que invirtieron en esta área tecnológica. Hoy en día no existen aplicaciones estrella, pero sí
una invasión silenciosa y una ampliación del concepto de ‘automático’, tal y como
pretendemos mostrar en este artículo.
2. Unidad de significado y unidad de traducción.
2
La especialización de un texto es su vinculación con un área temática determinada. Depende en parte de la
clasificación de los campos del saber. La especificidad de un texto se mide por la intensidad de términos
específicos cuya denominación es descriptiva del referente desde el punto de vista de la especialidad.
3
A menudo se ha pensado que los sucesivos esfuerzos fallidos por computar el
lenguaje se debían a un desconocimiento del mismo, a una mala interpretación de los
mecanismos que conducían a la producción de significado. Por este motivo una de las
mayores contribuciones de la Traducción Automática se ha producido en el campo de la
lingüística (ver apartado 6). En 1966 (solo dos décadas después de la segunda Guerra
Mundial ) el comité ALPAC (Automatic Language Processing Advisory Committee) ya
había determinado que la Fully Automatic High Quality Translation of Unrestricted Text
(FAHQTUT) no era un objetivo posible debido a una infranqueable barrera: la semántica.
Así y todo la investigación en Traducción Automática no sólo continuó sino que se
expandió. En 1976 la Comunidad Económica Europea adquirió el programa SYSTRAN (La
Jolla, California) que se enfrentaba a la traducción inglés-ruso e inglés-francés y realizó un
plan de investigación y desarrollo para un conjunto de lenguas europeas. Representantes de
30 universidades formaron el grupo de coordinación. Una década y media después (en
1990) el proyecto EUROTRA cerraba sus puertas sin haber conseguido el producto
deseado, casi al mismo tiempo que lo hacían los japoneses con su proyecto ATLAS en el
que participaron entes privados y públicos. Sin embargo, la investigación tampoco cesó.
Algunas potencias como Estados Unidos han mantenido sus niveles de inversión en el
campo, mientras que otras han modificado la orientación de los mismos para reconducirlos
hacia la iniciativa privada.
La búsqueda de la Traducción Automática se parece al esfuerzo que ha hecho el ser
humano para hacer efectivo el sueño de volar que mantuvo durante más de diez siglos, tal
vez desde siempre. Cuando finalmente lo consiguió, ni los procedimientos ni los materiales
ni las aplicaciones se parecían mucho a los que diseñó Leonardo da Vinci a finales del siglo
XV. En un principio se pensó que para poder volar el hombre necesitaba imitar al pájaro, o
al menos, entender la esencia física de su vuelo. Ése esfuerzo (Borelli, 1680) asienta las dos
ramas de la aeronáutica: la aerostación, donde la forma de sustentación es obtenida según
el principio de Arquímedes mediante ingenios menos pesados que el aire, y la aviación, en
la cual la fuerza es obtenida con la ayuda de motores por aparatos más pesados que el aire y
según las leyes de la aerodinámica. Naturalmente, los hombres no vuelan como los pájaros.
Tal vez debamos renunciar a la idea de que las máquinas piensen o traduzcan como los
humanos para observar qué es lo que realmente pueden hacer. Y tal vez podamos entender
mejor en qué consiste la comunicación y cómo funciona cuándo se trata de comunicación
verbal. En palabras de Jackendoff (1983), desde el punto de vista de la lingüística, la pregunta
es: “¿Cuál es la naturaleza del significado en el lenguaje, qué hace que podamos hablar de
aquello que percibimos y hacemos?” Desde el punto de vista de la sicología cognitiva la
pregunta es: “¿Qué revela la estructura gramatical del lenguaje natural respecto de la
naturaleza de la percepción y la cognición?”
Tal vez una de las primeras trabas en el camino hacia la respuesta a estas preguntas
haya sido la distinción de disciplinas y la ubicación del significado en el nivel denominado
‘semántico’ al que, en el proceso de computación, se asignaba un espacio ulterior, posterior al
procesamiento de los niveles morfológico y sintáctico, en una estrategia marcadamente
vertical y ascendente, bottom-up, como indicábamos al principio. En realidad, la semántica,
como ciencia del significado, está relacionada con cualquiera de los acontecimientos sígnicos
que configuran el lenguaje. De este modo, un fonema3 , mediante sus períodos de transición de
3
La fonética queda normalmente relegada de los estudios sobre Traducción Automática, pero no de los
contenidos que afectan una disciplina que le es básica, la lingüística computacional.
4
formantes hacia otro fonema, sobre todo en el habla continua o espontánea, produce efectos
conativos o apelativos, fáticos, expresivos o meramente referenciales (cf. Jakobson, 1936). El
estudio de los aspectos prosódicos (pausas, entonación, etc.) se ha mostrado muy importante
en este sentido (oratoria política, discurso publicitario, etc.). Así, un periodo de silencio sólo es
evaluable en relación con el discurso, pero, también, el discurso puede cambiar su
intencionalidad en relación con la duración de las pausas. El significado está íntimamente
ligado con fenómenos como el cambio lingüístico: la gramática histórica, el cambio
lexicológico o lexicográfico. También en la distinción de rasgos morfológicos que conllevan
variación homonímica: espacio-s, vs. espacio-0 -interestelar-. La determinación o
indeterminación de los sintagmas nominales (un espacio vs. el espacio), así como otros
aspectos sintácticos como la modificación del núcleo (el espacio de juego, un espacio
contaminado). Los criterios semánticos, con tanta fuerza como los sintácticos, intervienen en
el estudio de la naturaleza de los nombres propios (-El- Salvador), los nombres genéricos (el
hombre), la función de ciertos pronombres (la mayoría de) o adverbios.
La lingüística, al pasar la prueba de su computación, ha dejado claro que el estudio del
lenguaje es el estudio de un sistema semiótico donde los signos son tanto entidades como
relaciones entre los diferentes signos, y donde las diferentes áreas interaccionan
profundamente. De hecho éstas relaciones eran conocidas desde el principio: “el estudio
lingüístico, constituido como una ciencia, probablemente evolucionará hasta abarcar signos
muy complejos, grandes frases, como por ejemplo una obra literaria” (Barthes 1969). Estas
afirmaciones llevaron al posterior desarrollo de la teoría del discurso y de la gramática de
texto.
Pero este nivel semántico omnipresente en todos los paradigmas de un sistema
lingüístico muta su naturaleza en el momento en que comparamos un sistema lingüístico con
otro. Emmanuel, El Salvador, El Redentor, Cristo, El Mesías, son algunos de los nombres con
los que Occidente llama a su Dios. En El Corán aparecen más de doscientos nombres para ese
referente divino. En pastún (Afganistán) o en malamayán (India) existen muchos conceptos
distintos que equivalen a nuestro concepto de ‘mujer’, según sea una mujer soltera, casada,
repudiada, viuda, joven, anciana, etc., y por ello nos enfrentamos a un problema de
ambigüedad y de selección de la equivalencia.
Este es el motivo de que no exista una definición precisa de lo que es una unidad de
significado en Traducción. Lo que se ha dado en denominar unidad de traducción (sea su
forma el término, la frase, el párrafo o el documento entero), es un compendio de las
posibilidades comparativas de un texto con otro, y por lo tanto hay tantas unidades de
traducción como posibilidades de comparar una lengua con otra.
En España los estudios de Traducción se han separado de los estudios lingüísticos y
ambos configuran licenciaturas independientes de la Filología desde 1993. El estudio sobre la
naturaleza del significado en el aspecto comunicativo del lenguaje (y, al fin, no hay otro) sólo
puede partir, a mi modo de ver, de los estudios de Traducción, y por lo tanto también lo hará
un nuevo concepto de la Traducción Automática.
5
3. Historia de un concepto y de su Traducción Automática.
3.1. La denominación
Supongamos por un momento que hemos retrocedido a los años 90 y que debemos
traducir un texto especializado en informática en el cual aparece el concepto ‘ordenador de
quinta generación’. Supongamos que la oración completa en la que aparece el concepto es
la siguiente:
“A principios de los años 90 se anuncia ya la aparición de los ordenadores de quinta
generación como una revolución tecnológica”
La automatización del proceso supone el análisis morfosintáctico de los
componentes del sintagma4. Es preciso identificar cada una de las denominaciones
implicadas como pertenecientes a una categoría gramatical, así como determinar sus
propiedades, entre otras el género y el número, para poder controlar las relaciones de
concordancia con el resto de la frase en que esté ubicado. Este proceso se realiza mediante
la comparación de cada elemento con el contenido de un diccionario o lexicón, donde la
información léxica ha sido almacenada previamente por un lexicógrafo. Existe la
posibilidad de almacenar todas las formas posibles de un lema (ordenador, ordenadores) o
la de efectuar un cálculo según unas reglas predeterminadas. Con respecto del número, por
ejemplo, es posible establecer una heurística de las posibilidades que presenta la lengua
castellana para el mismo:
tipo de lexema
según la
sufijación
1
funcionario
2
ordenador
3
fábrica
4
comisión
5
comision
6
presidente
7
director
8
zulú
9
crisis
4
Singular
masculino
femenino
Plural
masculino
o
a
s
0
es
0
s
0
-
-
femenino
es
e
0
0
0
a
s
a
es
s
s/es
0
Partimos de un sistema basado en la transferencia como el desarrollado por el proyecto Eurotra.
6
10
patrón
11
patron
12
aprendiz
13
aprendic
0
0
-
-
-
-
a
es
s
a
-
s
-
es
-
Los tipos 5, 11 y 13 responden a lexemas existentes sólo para las formas de plural.
Si bien algunos fenómenos como el anteriormente descrito permiten ser
sistematizados con exhaustividad, otros presenten paradigmas bastante más complejos, aún
tratándose de fenómenos de naturaleza aparentemente no muy diferente, como por ejemplo
el caso del diminutivo. Naturalmente que es preciso restringir las expectativas de análisis a
aquella casuística que tiene probabilidades altas de aparecer en un texto especializado (ver
apartado 5).
El paso siguiente en el proceso de análisis de un término como ‘ordenador de quinta
generación’ es el de concebir el sintagma como una unidad lexemática compleja, un multiword unit. El traductor humano sabe que ‘ordenador de quinta generación’ es un término
complejo porque se corresponde con un único concepto, porque aparece recurrentemente en
el texto, y porque cumple determinadas restricciones sintácticas como la ausencia de
determinante en el sintagma nominal modificador5. La recurrencia y la carencia de
determinante pueden ser detectadas por el ordenador. La existencia del concepto, sin una
base de conocimiento, no.
Reconocer la existencia de MWU en los primeros estadios del análisis permite
obviar el análisis de las relaciones sintácticas entre el núcleo y sus modificadores y evitar
los problemas de sobregeneración de resultados que podrían surgir en el caso de que se
produjera algún tipo de ambigüedad estructural6, es decir, que el programa considerara la
posibilidad de que el sintagma preposicional dependiera de más de un núcleo en la oración
(en nuestro ejemplo ‘de quinta generación’ puede ser considerado modificador de
‘ordenadores’ o de ‘aparición’.) En el caso de que el MWU no fuera identificado como tal,
el programa analizaría la secuencia según los constructores previstos para el análisis del
léxico simple. Una de las estrategias propuestas, una vez que el término ha sido detectado
como término complejo, es la de unir los constituyentes mediante guiones bajos, y otorgar
la categoría del núcleo y todas sus propiedades al nuevo lexema, léase
ordenador_de_quinta_generación. Las limitaciones de esta aproximación se hacen patentes
cuando contemplamos la posibilidad de que exista la siguiente frase:
“A principios de los años 90 se anuncia ya la aparición de los ordenadores
denominados de quinta generación como una revolución tecnológica”
5
Ver los criterios para identificar un término en Cabré, M.T. (1992)
La ambigüedad es connatural al lenguaje humano. Otros tipos de ambigüedad son la referencial (‘sacó la
mosca de la sopa y se la comió’ –la mosca o la sopa), la léxica (polisemia) y la funcional (‘pan para comer’ –
para ser comido, ‘gafas para leer’ –*para ser leídas).
6
7
Esto construye la certeza de que las unidades complejas deben mantener su
estructura, puesto que su naturaleza composicional es muy cohesionada semánticamente y
por lo tanto bastante rígida desde el punto de vista sintáctico, pero no absolutamente rígida.
De hecho los términos complejos se comportan como colocaciones, coocurrencias
recurrentes dentro de un sublenguaje (especializado) o un sistema lingüístico (un idioma.).
Se definen 25 tipos de estructura diferentes para las colocaciones terminológicas
para un texto de telecomunicaciones, de las cuáles la que sigue es una muestra:
%% 23
%% ordenador de quinta generacio1n
%% N1_P1_A_N2
MWU= {/cat=np} [*{},
{mwu_lu=MWU/cat=n,e_lu=N1},
{imwu=yes/cat=pp}[{/e_lu=P1},
{/cat=np}[ *{},
{/cat=ap,head=A},
{/cat=n,e_lu=N2},
*{imwu=no/cat=?}]],
*{} ].
%% 24
%% pequen&3a y mediana empresa
%% A1_CONJ_A2_N1
MWU= {/cat=np}[*{},
{imwu=yes/cat=ap,cs=yes}[
{imwu=yes/cat=ap,head=A1},
{imwu=yes/cat=ap,head=A2,conj=CONJ},
{mwu_lu=MWU/cat=n,e_lu=N1},
*{} ].
%% 25
%% red nacional analo1gica con conmutacio1n
%% N1_A1_A2_P1_N2
MWU= {/cat=np} [*{},
{mwu_lu=MWU/cat=n,e_lu=N1},
{imwu=yes/cat=ap,head=A1},
{imwu=yes/cat=ap,head=A2},
{imwu=yes/cat=pp}[{/e_lu=P1},
{/cat=np}[*{},
{/cat=n,e_lu=N2},
*{imwu=no/cat=?}]],
*{} ].
8
3.2. El sublenguaje
La identificación de las colocaciones terminológicas previa al procesamiento del
texto resulta ser una estrategia útil. Esta identificación puede hacerse de manera automática
según diferentes técnicas, pero la asignación unívoca del patrón correspondiente es
preferible que sea manual. Esto significa que el proceso sólo devendrá completamente
automático para un sublenguaje cuya terminología haya sido identificada de antemano y
clasificada según su estructura sintáctica. Como ya dijimos, para los sublenguajes donde la
repetición es máxima y la innovación terminológica mínima (como la meteorología), ésta
es una tarea posible. Para aquellos otros lenguajes más difíciles de acotar habría que buscar
técnicas que trabajaran por aproximación, con la consiguiente pérdida de exactitud.
Por otro lado, para extraer la terminología de un texto es preciso, o bien categorizar
todo el texto para poder identificar patrones de nombre + adjetivo, de nombre + preposición
+ nombre, etc., o bien utilizar criterios estadísticos.
La primera opción implicaba el trabajo de un lematizador, es decir, de una
herramienta que pudiera determinar la categoría de un lexema sin necesidad de cotejo con
un diccionario. El lematizador trabaja con ayuda de una lista de sufijaciones (nominales,
adjetivales, verbales, etc.), y por medio de reglas que efectúan un cálculo a partir de la
adyacencia con otras categorías, actuando las categorías cerradas como punteros. Es decir,
gracias a la presencia de artículos o preposiciones (categorías cerradas y listadas) es posible
desambiguar aquellos casos en los que la información de la sufijación es insuficiente. Por
ejemplo: ‘canto’ puede tratarse de un nombre o de un verbo. Si se detecta la adyacencia de
un artículo (el canto) el programa rechaza la posibilidad de que sea un verbo. El
lematizador es una herramienta que puede reutilizar la información que ella misma obtiene
gracias a su cálculo para determinar la categoría de otros casos ambiguos.
Respecto de la segunda opción, la de utilizar criterios estadísticos para detectar los
patrones léxicos coocurrentes y recurrentes, se parte del cálculo matemático de la
información mutua entre dos eventos:
(11,12)  log p (11  12 )
p(11) x (p12)
Smadja (1992) utilizó esta fórmula para identificar colocaciones en un corpus. Los
binomios podían estar separados por varias palabras sin que ello menguara la relevancia
estadística de su coocurrencia. La relevancia de las asociaciones, cuando éstas no eran
corroboradas por patrones sintácticos, se medía a partir de los factores distancia, intensión,
extensión, (distance, strenght, spread) en virtud de la frecuencia de coaparición de una
palabra (wi ) con una palabra dada (w).
ki = freqi – f
stdv
wi
ki
freqi
f
stdv
>/ 0
palabra en colocación
extensión (puntuación asignada)
frecuencia de coaparición en cualquier posición para la palabra wi
frecuencia media
desviación estándar
9
Este tipo de aproximación, que podía trabajar también sobre textos paralelos
alineados (Brown, 1991) para extraer información bilingüe (Smadja, 1993), sentó la base
para la aparición en el mercado de varios productos destinados a la explotación de los
textos y la obtención de información léxica. De entre los pioneros podemos destacar OCP
(Oxford Concordance Program) y Tact (Universitat de Toronto), pero existen muchas otras
(ver Sánchez-Gijón, 2002). Estos productos permiten obtener listas de palabras ordenadas
de diversas maneras, extraer contextos y efectuar comparaciones de textos en distintas
lenguas. Actualmente estos programas (Word Smith Tools, Kwick, System Quirck) son de
gran utilidad para el traductor humano.
3.3. El contexto social
Sin embargo, aunque éstas herramientas pudieran ponerse al servicio de un
programa de Traducción Automática, existen razones sociolingüísticas que afectan al
proceso de Traducción de tal manera que sólo podemos concebir un proceso de Traducción
Automática que trabaje con la información anteriormente procesada por un traductor
humano. En lo que concierne al término ‘ordenador de quinta generación’, en la actualidad
ha sido substituido por el término simple ‘Pentium’. Éste es un proceso muy común en
todos los lenguajes de especialidad, los únicos lenguajes que, en principio, pueden ser
traducidos automáticamente. Por lo general los términos inician su decurso conceptual con
una anatomía fuertemente descriptiva, para luego metamorfosear en formas más analógicas
o reducidas. Esto es mucho más acusado en el caso de las lenguas que importan (traducen)
tecnología, y más todavía cuando la lengua receptora es de origen latino. Las lenguas
románicas tienen menos agilidad que, por ejemplo, las anglogermánicas, para crear
términos por composición de modificadores en número superior a uno, y a menudo
prefieren la analogía:
carretilla hidráulica de elevación de horquilla (traducción literal del alemán) -> toro
También sucede a menudo que los términos son substituidos por sus siglas o,
simplemente, elididos en parte o substituidos.
pequeña y mediana empresa -> PYME
procesador esclavo -> servidor
Existe, pues, un conflicto que se resuelve sólo con el tiempo entre la necesidad de
traducir rápidamente para obtener la información que precisa la ciencia y el mercado y la
consolidación de los términos, la cual viene determinada solamente por el uso de los
mismos.
Este último tipo de cuestiones supone, tal como sugiere el tipo de inversión pública
en el sector educativo, un campo de estudio tal vez mucho más apasionante que el de la
Traducción Automática. Dónde, cuándo, qué, cómo y a qué se traduce es, al fin y al cabo,
mucho más importante que el instrumento o la velocidad, si lo que estamos traduciendo no
es una declaración de amor o de guerra.
Para estos otros casos, y cuando desconocemos por completo la lengua a la que nos
enfrentamos, es suficiente con el hecho de que la Traducción Automática nos ofrezca un
10
mensaje ‘correcto’ desde el punto de vista binomial (sí cuando es sí, no cuando es no), algo
que se puede lograr con un buen diccionario y algunas reglas. En lo que se refiere al
lenguaje natural, el control de la producción y la síntesis de significado puede efectuarse
mediante la utilización de ontologías como la que se desarrolla en el Computing Research
Laboratory de la Universidad de Nuevo Méjico, a cargo de Sergei Nirenburg
(http://crl.nmsu.edu/). Una ontología es una representación del mundo donde los conceptos
y sus denominaciones se definen en razón de sus características como procesos, entes, o
propiedades. La ontología es una jerarquía taxonómica que permite desambiguar la
polisemia por medio de la selección de los significados próximos en el árbol. Podemos ver
un ejemplo en las frases siguientes:
a) La multiplicación de grupos de immigrantes preocupa a las autoridades.
b) La multiplicación de grupos posee la propiedad conmutativa.
El conocimiento del mundo permite, en el caso de un lector humano, distinguir entre
los diferentes significados de ‘multiplicación’ y de ‘grupo’. Un programa de TA basado en
una ontología como la del CRL reconocerá la polisemia de estas unidades para luego
decidir una lectura en función de la coincidencia y proximidad que poseen algunas de las
características en a) geografía humana, y en b) matemáticas.
Pero el magnífico trabajo ontológico subvencionado por la NASA que puede
traducir titulares de periódico de lenguas como el persa, el coreano o el ruso, no es lo
bastante sutil como para acercarse a los lenguajes especializados. Un concepto como ‘ojo
anterior lateral’ que pertenece a la anatomía de la araña no puede ser procesado por la
ontología de Nirenburg. En estos casos la traducción palabra a palabra es la única solución,
aunque el resultado puede que no sea muy convincente. Una expresión como ‘agua física
metálica’ sería el resultado de traducir del griego, palabra por palabra, el concepto de ‘agua
mineral natural’, por poner un ejemplo.
Lo cierto es que la Traducción Automática que será tendrá que pasar necesariamente
por una combinación de estrategias: lógicas, estadísticas, probabilísticas, pero en cualquier
caso no podrá eludir la Ingeniería del Conocimiento.
3.4. El proyecto BACUS (Base de Conocimiento UniverSitario)
BACUS (BAse de Conocimiento UniverSitario, 1996-2001) es una base de datos que
resulta del trabajo de investigación terminológica multilingüe que realizan los alumnos de
cuarto curso de la Facultad de Traducción e Interpretación de la Universidad Autónoma de
Barcelona. Se trata de un trabajo descriptivo que parte de textos originales en diferentes
lenguas sobre un mismo tema, con el requisito de homogeneidad de los textos en cuanto a
nivel de lengua y actualidad. Se exige a los alumnos la colaboración de un experto en la
especialidad que van a tratar. Aunque los datos no se someten, de momento, a un criterio de
normalización, las referencias contextuales, lexicográficas y terminográficas colaboran a
documentar al máximo cada caso. Se calcula un incremento aproximado de BACUS en unos
1500 nuevos términos por año académico.
Las áreas de trabajo son, básicamente, técnicas y científicas, pero no se excluye la
posibilidad de que otro tipo de áreas temáticas puedan ser representadas. Los alumnos escogen
el área temática libremente, acogiéndose, si lo desean, a las propuestas de los profesores de
nuestra universidad que se prestan como asesores. Cada término está orientado temáticamente
11
a través de tres ejes: el área temática, el título del trabajo (el cual indica el nivel máximo de
especifidad) y el código de la UNESCO que más se ciña a ese nivel de especifidad.
La definición de esta base de conocimiento se ha realizado en el entorno MultiTerm
para Windows, y pretende ser una plataforma para representar la información léxica de modo
jerarquizado y relacionado. En su día se escogió este programa por haber sido acordado como
estándar por la Coordinadora Interuniversitaria para la Normalización Lingüística e
Informática (CINLI) de los países de habla catalana.
Para establecer una base de conocimiento multilingüe hemos partido de cuatro
criterios: relatividad conceptual, atomización del conocimiento, exclusión de la gramática y
navegación conceptual.
Cuando se comparan distintas lenguas se están comparando sistemas conceptuales
diferentes, lo cual presenta una dificultad en la búsqueda de equivalencias léxicas. Debemos
aceptar, pues, la relatividad de nuestro propio sistema y sustituir el ideal de biunivocidad y
exactitud por un sistema plural, para que, a ser posible, ningún sistema conceptual ejerza de
director de orquesta. Cada tema tiene como lengua de referencia aquella en la que cuenta con
mayor refinamiento conceptual.
La información debe representarse en la forma más atomizada posible. Esto puede
provocar que la información contenida en la definición y/o el contexto sea repetida en un
campo particularizado (por ejemplo color, forma, etc.). Pero, precisamente, la finalidad de la
atomización del conocimiento es evitar caer en la trampa lingüística de la paráfrasis
definitoria. Esto puede ser importante cuando queremos representar y comparar terminologías
de culturas distantes. Además, aunque la estructura de campos semánticos (unos 50) no es un
conjunto completo ni perfecto, una información atomizada puede facilitar el tratamiento y la
utilización de la información si se pretende integrar la base de datos en un sistema de
procesamiento más amplio, como pueda ser un sistema de TA.
Las cuestiones gramaticales no atañen a la base de datos, la cual se centra en la
estructura conceptual. Esto significa, por ejemplo, que los nombres predicativos y los verbos
son considerados sinónimos conceptuales. Así, ejecución y ejecutar son dos índices para el
mismo concepto. Se adjunta información sobre la categoría gramatical de cada denominación;
así se indica género femenino en los sustantivos de lenguas flexivas como silla o mesa, pero se
dejará abierto en los demás casos para que pueda flexionar según la gramática de la lengua en
cuestión.
La flexibilidad en la representación de la información de la que BACUS hace gala
también afecta al nivel monolingüe. Por ejemplo: podemos recoger un concepto constituido
por la expresión ejecutar un programa, pero este término complejo también puede ser
representado si creamos una entrada para programa y la relacionamos con otra entrada
correspondiente al concepto ejecutar a través de un determinado campo que indique el tipo de
relación verbo-objeto existente (el campo 'argument of'). Esta última representación es
preferible, porque todos los conceptos que tengan a programa como hiperónimo pueden
quedar asimismo relacionados con ejecutar a través de las relaciones cruzadas.
El léxico no se compone sólo de denominaciones que vinculan la realidad con los
conceptos, sino también de relaciones interléxicas que configuran una red de familias. Estas
familias también se relacionan unas con otras a través de relaciones lógicas, ontológicas,
analógicas, infralógicas o argumentales. Una base de datos terminológica que reflejase
solamente una información glosariada, documentada y ponderada, no sería una base de
conocimiento. Son precisamente las remisiones las que permiten al usuario navegar a través de
un sistema conceptual.
12
Una muestra de la base de datos BACUS:
3.4.1. Hipótesis conceptual de BACUS
(Aguilar-Amat, 1996)
13
┌──
│ lógicas - verticales:
│
superconcepto/subconcepto
│
. genérico/específico
│
(pala/spade-shovel)
│
. hiperónimo/hipónimo
│
(mineral/antracita)
│
│
- horizontales:
│
. coordinación (pragmáticas)
│
(mesa/silla)
│
. cohiponimia
│
(antracita/pirita)
│
│
analógicas - transferéncia:
│
. metáfora
│
. metonimia
│
│
ontológicas - parte/todo:
Relaciones │
. parte/parte (radio/llanta)
conceptuales │
. todo/parte (rueda/radio)
│
- causa/efecto (VIH/sida)
│
│
infralógicas
│
. localizaciones (cebra/África)
│
. cronológicas (Edad Media/Edad Moderna)
│
. sustancia (chupete/caucho,silicona)
│
. genéticas (Microsoft/MS-DOS)
│
. transmisión (televisión/telespectadores)
│
. instrumentales (agua oxigenada/desinfección)
│
. pragmáticas (divorcio/juicio, pensión, tutela)
│
└── argumentales (biomasa/extracción)
14
4. Historia de una utopía
El 14 de enero de 2001 en el periódico El Nacional de Venezuela, Jorge Olavarría
publicaba un artículo sobre el origen de los topónimos que los descubridores españoles
introdujeron en América. Además de reproducir los nombres de ciudades y villas de su país
de origen, los españoles que conquistaban las nuevas tierras poco después de guerrear en la
reconquista de Granada estaban fuertemente influidos por la ficción de romances
“caballerescos” y novelas del mismo tipo, desde los carolingios como La chanson de
Roland, los bretones como Don Tristán y Lanzarote, el Amadís de Gaula o el Palmerín de
Oliva. No es hasta 1605, cuando la epopeya de la conquista había llegado a su madurez,
que se publicó la primera parte de El ingenioso hidalgo Don Quijote de la Mancha, donde
el personaje se muestra como un trastornado por los temas de las aventuras de caballerías.
Con el Quijote se constata históricamente lo que podríamos llamar “alucinación
conquistadora”, la cual se nutría tanto de las espectaculares realidades naturales y humanas
descubiertas en las nuevas tierras como de un mundo de ficción ‘vivido’. Así, el nombre de
California -por la reina Calafia- procede del Amadís de Gaula, donde Garci Rodríguez de
Montalvo describe un hipotético Paraíso Terrenal llamado California poblado de mujeres
negras entre las cuales no existía varón alguno. El mismo Cristobal Colón confesaba andar
a la caza de una isla llamada Matanino o Madanina -quizá la Martinica de hoy- que estaría
poblada sólo por mujeres, las cuales usaban arcos, flechas y corazas de cobre. El río por el
que navegó Orellana fue llamado “de las Amazonas” porque en la descripción que de este
viaje hizo el padre Carvajal, se hace mención constante de una nación rica en oro y plata,
con ciudades de bravas guerreras de enormes pechos y certera puntería, que todos habían
visto pero que nadie volvió a ver. De este modo podemos intuir, lejos de los intereses
económicos, políticos y proselitistas de las clases dominantes, una utopía cotidiana que
respondía a la necesidad de relaciones con el otro sexo de un grupo de hombres, éstos sí
solos, y que había desarrollado una imaginación utópica con ayuda de las novelas y los
romances de su época. Esta epopeya es sólo una excusa para postular una visión histórica
de otra epopeya, la de la Traducción Automática. Sin duda ambas hazañas se produjeron en
momentos de circunstancias compartidas: progreso tecnológico, guerras expansionistas,
literatura de ficción, sentimiento utópico, azar y necesidad.
La aventura marítima de los navegantes del siglo XV se debe al progreso técnico,
así como la aventura computacional se debe a la revolución digital. La segunda guerra
mundial y la guerra fría, la guerra de la Reconquista y la del control del Mediterráneo para
los antiguos. La literatura de caballerías tiene algo en común con la de ficción científica7
(Asimov, Arthur C. Clarcke, Ray Bradbury). Pero ¿cuáles fueron o son todavía los
sentimientos utópicos de nuestra era tecnológica? ¿Cuál nuestra necesidad?
Decimos ‘ficción científica’ por considerarlo el calco correcto de science fiction, y para llamar atención
sobre la desvirtuación que ofrece el término ya extendido de ‘ciencia ficción’.
7
15
4.1. La vieja utopía: sustitución de la Traducción Humana
La Traducción Automática, como muchos de los avances técnicos de nuestra era,
tuvo una motivación bélica. La Segunda Guerra Mundial enfrentó a grandes potencias que,
catapultadas por el desarrollo industrial, lucharon por la supremacía de los mercados y por
imponer su modelo en el mundo. El desarrollo industrial había gestado el desarrollo
tecnológico. En la escabrosa urgencia de enfrentarse a un enemigo y de conocer sus planes
lo antes posible, la TA se convirtió en una esperanza y una necesidad. Los traductores
humanos eran pocos, lentos y, posiblemente, ambiguos respecto de la causa de cualquiera
de los bandos. Esta fue la situación que motivó la inversión en sistemas de análisis del
lenguaje y en aparatos lógicos. A pesar de este origen bélico, debemos a esta situación
grandes avances en el desarrollo de la Lingüística, y en consecuencia en la enseñanza de
idiomas, así como en las llamadas “industrias de la lengua” que engloban, de la mano del
avance en las ciencias de la computación, aspectos relacionados con el procesamiento del
habla, la corrección ortográfica y estilística de documentos procesados, las interficies para
la consulta de bases de datos y la ingeniería del conocimiento, entre otros.
La intención inicial de la inversión en Traducción Automática fue inicialmente la de
sustituir al traductor humano, ya fuera por su posible compromiso político (Guerra Fría)
como por su coste (CEE). En el primer caso el ideal utópico consistía en expandir y
proteger el ideal democrático y el sistema capitalista. En el segundo de superar el escollo de
la diversidad lingüística para poder participar en la competición capitalista ya instaurada.
La primera escuela de Traducción europea se funda en Ginebra en 1941. Por las
mismas fechas aparece la primera estadounidense en Monterrey, California. Casi al mismo
tiempo se da comienzo a la utopía computacional. En 1965, un año antes del informe
ALPAC, aparece Taum-Meteo, sistema canadiense para partes meteorológicos.
Al mismo tiempo que la ‘necesidad’ impulsa la inversión, el público y el personal
implicado convierte la ambición en un objetivo idealista. En 1987, cuando yo entré en
contacto con la Traducción Automática y el Procesamiento del Lenguaje Natural,
escuchaba de mis maestros la verbalización de esperanzas relacionadas con el
‘descubrimiento’ de la aplicación de la computación al análisis del lenguaje: los ciegos
podrían acceder a la lengua escrita porque habría máquinas que sintetizarían el texto y
producirían sonidos; estas personas dictarían al ordenador aquello que desearan fuera
reproducido. Los países pobres del tercer mundo serían capaces de realizar la revolución
tecnológica sin necesidad de pasar por la revolución industrial, y lograrían así equipararse
en poco tiempo a los países desarrollados, etc.
De estas ideas ilusionadas algunas, como la compensación de minusvalías,
es, afortunadamente, una realidad. Otros avances como el desarrollo de las autopistas de la
información no fue imaginado por muchos. Pero algunas de aquellas esperanzas, por
desgracia, han desvelado su ingenuidad con el paso del tiempo. Para que la revolución
tecnológica llegara al tercer mundo hacía falta red eléctrica, dinero para instalarla (lejos aún
hoy de los circuitos inalámbricos), pero además definir fenómenos lingüísticos muy
variados, cuestiones cognitivas muy complejas y ciertas actitudes políticas. Esto aún
admitiendo que la revolución tecnológica fuera una pieza clave de progreso para culturas de
las que desconocemos mucho. Cuáles de los sueños de nuestra década se cumplirán y
cuáles no es una pregunta sin respuesta, pero hoy probablemente ningún científico al que se
haya preguntado dirá ‘bienestar’, ‘un mundo más humano’ o ‘la paz’.
16
4.2 La nueva utopía: Automatización de la Traducción Humana
Desde le generalización del uso del correo electrónico los sistemas de Traducción
Automática han visto dispararse su uso. La mayor parte de los usuarios son personas sin
cometidos ‘lingüísticos’ que recurren a la TA para obtener traducciones urgentes, ojear los
contenidos de los documentos u obtener versiones preliminares. Pero para poder usar la
traducción como un texto es preciso que exista un corrector humano, y a ser posible,
veterano. La veteranía en Traducción es un valor muy importante. Tal vez la distinción
posible y necesaria es entre el uso de un programa para ‘leer’ un texto, y el mal uso del
mismo para producir un texto que va a ser leído.
A la luz (o la sombra) de la historia, algunos estudiosos vinculan el avance
tecnológico con la guerra. Lynn White (1973) asegura que el sistema feudal se originó
gracias a una tecnología novedosa: la aparición del estribo, el uso de la silla de montar, la
aplicación de herraduras en las pezuñas de los caballos. Todo esto dio lugar a un nuevo
cuerpo guerrero en el campo de batalla, el de los caballeros, y a través de él se congriaron
las dependencias, las jerarquías y las luchas feudales. Este determinismo tecnológico es
discutible, pero pone de manifiesto las intensas relaciones entre sociedad, tecnología,
economía y naturaleza.
En este contexto, la TA, como utopía, surge del choque entre lo que es y lo que la
sociedad cree que debería ser. Riera (2001:158) sostiene que el modelo utópico tiene un
lado positivo por su fecundidad al abrir nuevas vías y por el poder que posee de resolver el
problema que surge del desencanto de la sociedad en que se ha gestado. El lado negativo de
la utopía es, paradójicamente, su esterilidad, porque, si bien abre nuevos horizontes,
confunde la posibilidad con la imposibilidad. La mezcla de verdad y falsedad, de
posibilidad y de imposibilidad conducen otra vez al desencanto, y éste al nacimiento de una
nueva utopía.
En 1980, tal y como explica Joseba Abaitua de la Universidad de Deusto en su
artículo TA: Presente y Futuro (http://www.foreignword.com/es/Technology/), Martin Kay
redactó un informe interno para la empresa RankXerox, "The Proper Place of Men and
Machines in Language Translation", inédito para el gran público hasta su publicación en
1997 en la revista Machine Translation. En este informe, que tardó tanto en ver la luz,
Martín Kay afirmaba:
"El ordenador es un instrumento que puede servir para magnificar la productividad
humana. Usado adecuadamente, no tiene por qué deshumanizar, con la impronta de
su sello orwelliano, los productos de la creatividad y del trabajo del hombre sino
que, apropiándose de lo que es mecánico y rutinario, puede liberarle para que se
dedique íntegramente a las labores que son esencialmente humanas. La traducción,
aun siendo un arte delicado y preciso, conlleva muchas tareas que son mecánicas y
rutinarias. Si estas tareas fueran encomendadas a una máquina, la productividad del
traductor no sólo se vería magnificada, sino que su trabajo se haría más gratificante,
más apasionante, más humano."
Abaitua afirma que el artículo se publicó tan tarde debido a la primera incredulidad
y a la confirmación posterior de las expectativas de Kay. Muchos traductores humanos
fueron detractores de la TA hasta que no tuvieron la posibilidad de acceder a ella, usarla, y
17
confiar que nunca serían sustituidos. Actualmente el volumen de textos a traducir es tan
grande que hay espacio para todo tipo de traducción. Sin embargo es conveniente
diferenciar los procedimientos y los objetivos.
En el mundo de la globalización, aún de manera imperfecta, uno de los programas
modernos, convenientemente distribuido, puede producir unos 20 millones de páginas por
hora, mientras que un traductor manual puede llegar a rendir, en los casos más favorables, a
un ritmo de 20 páginas por día. (Naturalmente cabe tener en cuenta que la calidad de los
textos difiere respecto de la cantidad). Es aceptado generalmente el hecho de que la Unión
Europea es una de las potencias que más gastos de traducción sufraga, aunque tal vez haya
que poner en entredicho las afirmaciones de Abaitua en cuanto que supone “alrededor de un
50 % del presupuesto administrativo”. Las estimaciones de los traductores de la Comisión
son de un euro por año por contribuyente. Lo que sí parece cierto es que la incorporación de
nuevos países hace aumentar el volumen de traducción. Cuando Suecia y Finlandia se
incorporaron a la UE en 1995 hubo que traducir alrededor de 60.000 páginas de
regulaciones comunitarias. Al parecer en los últimos 30 años, con más de 9.000
publicaciones periódicas diarias y casi 1.000 libros en el mundo, se ha producido más
información que en los 5.000 años anteriores. El 90 por ciento de esa información es de tipo
técnico. Según Abaitua, si se tiene en cuenta que sólo un 3% del volumen total de páginas
traducidas corresponde a obras literarias, existen motivos más que suficientes para ensayar
la mecanización a gran escala de la producción plurilingüe del grueso de publicaciones
diplomáticas, administrativas, comerciales y técnicas, cuyas traducciones son, por su propia
naturaleza, mecánicas y rutinarias. (Cabe decir que la rutina y la mecánica no las hace más
fáciles).
Ahora bien, si intentamos una visión que sea exhaustivamente ‘globalizadora’
vemos como las cifras anteriormente barajadas muestran solamente un porcentaje recortado
de la producción ‘textual’ mundial. Muchas lenguas siguen produciendo sus textos en la
tradición oral, otras muchas no implican a la tecnología en la producción de sus textos, no
participan en la red ni usan con fluidez el correo electrónico. Muchas culturas basan su
dinámica en conceptos culturales, religiosos o literarios. ‘Eliminar’ esos miles de millones
de personas del mundo para que las cifras esgrimidas sean representativas de la humanidad
es una especie de ‘genocidio’ tecnológico. Traducir automáticamente un texto jurídico
¿Significa aceptar que existe un modelo jurídico único? Porque no sería cierto. Al mismo
tiempo que se invierte en evitar o acelerar ciertas tareas sería preciso invertir en aumentar
nuestro conocimiento sobre otros tipos de organización, aunque esto supusiera poner los
propios en entredicho.
Después del 11 de septiembre y de la cotidianeidad de fenómenos como la
inmigración, la nueva utopía no puede ser sino multiculturalista. Uno de los fundadores de
la sociología moderna, Georg Simmel (1911:175) esbozaba esta definición de ‘cultura’:
“Cultura es el proceso de perfeccionamiento de individuos que se obtiene gracias al espíritu
objetivado por el trabajo histórico de la especie humana”.
Cuando algún suceso pone en relieve que existen otras lenguas, otras culturas, otras
maneras de entender el mundo, los medios ponen en cuestión la bondad de las traducciones
convencionales. Expertos arabistas como Joan Vernet afirman que el término árabe Yihad
se ha traducido erróneamente por guerra santa y sugieren que debería traducirse por
‘esfuerzo’ (esfuerzo menor, puesto que el mayor, la gran Yihad, es el espiritual). Si esto es
cierto es también una muestra de la subjetividad y el desconocimiento que tenemos de la
alteridad. ¿Vamos a transmitir esa ignorancia a nuestros ordenadores al mismo tiempo que
18
el reconocimiento de la autoridad de sus procesos deductivos? No sería, éste, un acto
inocente. Es posible que no sea la tecnología lo que genere la guerra, pero el
desconocimiento y la interpretación subjetiva sí lo hacen.
Al mismo tiempo que invertimos en TA deberíamos invertir en la respuesta a esta
pregunta que formulaba T.S. Eliot en 1962:18:
The most important question that we can ask, is wether there is a permanent
standard, by which we can compare one civilisation with another, and by which we
can make some guess at the improvement or decline of our own.
El perfil del nuevo traductor es el de un experto corrector de textos traducidos
automáticamente de o al inglés, francés, español, italiano y alemán, y además el de un
profesional de la comunicación intercultural con lenguas de trabajo como el árabe, el
quechua o el chino. O tal vez tendremos dos tipos diferenciados de traductor: el lingüístico,
tecnificado, y el cultural, al servicio del cual estará el primero.
5. Cuándo es útil la Traducción Automática
Cuando la inversión lo fomenta, la TA es un instrumento útil para conseguir un
plurilingüismo igualitario y sostenible y para reforzar los procesos de estandarización en
lenguas recesivas o minorizadas. La TA es rentable cuando traducimos sistemas
lingüísticos cercanos desde el punto de vista cultural y gramatical, o si se da alguno de
ambos casos. Ahora bien, cabe tener en cuenta que ‘rentable’ no es lo mismo que ‘útil’. Los
sistemas lingüísticos en adyacencia como el castellano y el catalán comparten muchas
características que hacen relativamente sencilla la TA. Sin embargo no parece tener mucho
sentido utilizar solamente el terreno común a ambas lenguas. Después de haber sido
prohibido durante muchos años, el catalán ha perdido gran parte de la cohesión conceptual,
estilística y expresiva original. Si no se hace un esfuerzo léxico importante, la TA puede
funcionar como un cómplice más de la tendencia a hablar castellano en catalán o catalán en
castellano. La lengua no es sólo el instrumento de una fuerza política o de una clase social,
sino una fuente de riqueza conceptual y expresiva para el individuo, por lo que el proceso
de conservación y estandarización de lenguas minoritarias o minorizadas no debería
privarlas de sus rasgos más diferenciadores.
Por otro lado, como se ha dicho en apartados anteriores, la TA es útil cuando lo que
se pretende es hacer una aproximación rápida a los contenidos, y también cuando se
procede a corregir de manera profesional el resultado. La TA puede ser una potente
herramienta si el que la usa conoce las limitaciones del programa y las peculiaridades de las
lenguas en contraste. Con el paso del tiempo las estrategias, la capacidad de los
ordenadores y los diccionarios mejoran sustancialmente, y proliferan los recursos que
pueden consultarse en línea.
Pero, a mi modo de ver, la TA y lo que se denomina Traducción Asistida por
ordenador (TAO), tienen demasiados puntos en común para seguir diferenciándose. Desde
el punto de vista del traductor profesional, ambas perspectivas suponen un punto de partida
ineludible. Los programas de TAO se basan en las denominadas memorias de traducción
para proponer al traductor la reutilización de material ya elaborado y contrastado. Las bases
de datos, la información extraída de la red o de corpus clasificados proporcionan al
traductor la posibilidad de aumentar su rendimiento y de hacerlo con mayor rigor.
19
El hecho de poder compartir recursos terminológicos favorece a las diferentes
sectores porque supone una homogeneización conceptual y una mayor definición, y
también favorece al sistema lingüístico en general, puesto que evita la aparición de
variantes que distorsionan la distribución de significado de los términos.
Tanto la TA como la TAO precisan de la intervención humana para efectuar una
validación de los resultados. En este sentido cabe plantearse la automatización de la
traducción como un proceso simbiótico de la ‘inteligencia’ del ordenador, deductiva,
algorítmica, y de la capacidad creativa del traductor humano para encontrar soluciones a
problemas complejos que exigen un conocimiento maduro del mundo para los cuáles la
mera deducción a partir de datos cuantificables es insuficiente.
5.1. Condiciones de un texto para poder ser traducido automáticamente.
Algunos programas de TA como ATS (www.automatictrans.es) ofrecen una lista de
recomendaciones para aquellas personas que desean traducir automáticamente un texto.
Estas recomendaciones, similares a los principios aplicados a la comprensión de la lectura,
sirven para obtener la máxima calidad en la Traducción Automática:
1.- Realizar revisión y corrección previas. Antes de enviar el documento a traducir, es
aconsejable pasar el corrector propio del editor de textos que se esté utilizando. Éste
corregirá palabras mal escritas, o quizás proponga alguna corrección en la concordancia de
la oración.
2.- Evitar frases demasiado largas y eliminar ambigüedades del tipo: Ayer estuve en casa
del primo de mi vecino, que había vuelto de un viaje que había realizado para reencontrarse
con los familiares que emigraron al nuevo continente a finales del siglo pasado. Resultaría
más comprensible así: "Ayer estuve en casa del primo de mi vecino. Éste había vuelto del
nuevo continente. Había realizado el viaje para reencontrarse con los familiares que
emigraron allí a finales del siglo pasado".
3.- Construir frases completas. Por ejemplo: Inserte disquete y aprete aceptar. Sería más
correcto decir: "Ud. debe insertar el disquete y después debe pulsar el botón Aceptar".
4.- Tratar de evitar ciertos tipos de frases, como las pasivas. Por ejemplo, la frase: El niño
fue atropellado por un camión, podría ser: "El camión atropelló a un niño".
5.- Utilizar correctamente la puntuación: puntos, comas, puntos y coma, etc. La puntuación
es determinante para dar el correcto sentido a las frases.
6.- Evitar muchas preposiciones en la misma frase. Por ejemplo, en la frase: El niño vio el
coche en la cuneta de la calle enfrente de la academia de inglés, ¿qué o quién estaba
enfrente de la academia, el coche o el niño?
7.- Intentar evitar coloquialismos y expresiones idiomáticas. Por ejemplo, la frase: Juan no
tenía pasta y se la birló a su hermano, debería ser: "Juan no tenía dinero y se lo robó a su
hermano".
20
8.- No inventar abreviaturas. Por ejemplo, la abreviatura de departamento es "dept." y no
dpto., la abreviatura de teléfono es "tel." y no tlf., etc.
9.- Evitar palabras espaciadas o en mayúscula. Puede utilizar distintos métodos para
enfatizar una palabra o frase: escríbala en negrita, itálica o cursiva, subráyela, o
combine estas opciones. Pero existen dos formas no recomendables para el traductor: p a l a
b r a s con espacios entre letras, que no entiende, o PALABRAS en mayúsculas, que
pueden confundirse con acrónimos y por lo tanto no traducirse.
10.- Marcar palabras especiales. Por ejemplo, en un manual informático, se recomienda la
frase: "Escoja la opción "Herramientas" y haga clic en "Aceptar"." en lugar de Escoja la
opción Herramientas y haga clic en Aceptar.
Tal vez estas recomendaciones no sean útiles para escribir una novela, pero
probablemente favorecen la coherencia y la cohesión de un texto especializado. Evitar la
verbosidad, fomentar la concreción, utilizar denominaciones idénticas para el mismo
concepto, así como el uso de las convenciones estandarizadas como símbolos o
abreviaturas son aspectos que benefician a los textos técnicos y a la comunicación entre el
personal experto. Todavía queda bastante que estudiar, sin embargo, respecto de la
estructura y el contenido de estos textos. A menudo se produce lo que se ha denominado
‘contaminación conceptual’, de manera que, en jergas altamente especializadas, a veces se
produce una usurpación del significado de un término por parte de otro (cf. Antia, 1999), lo
cual supone un grave problema no sólo de traducción, sino de identidad del conocimiento.
5.2. El concepto de ‘automático’.
La definición que da el diccionario de ‘automático’ reza: “Que funciona o actúa
mecánicamente, sin la intervención del hombre. Dicho de una operación o proceso que, al
recibir un estímulo para empezar, se desarrolla por él mismo hasta el final” (Gran
Enciclopedia Catalana). Este concepto procede de la revolución industrial, y da lugar a otro,
el de ‘automación’, que aparece por primera vez en 1947 en la industria del automóvil. La
automación es la aplicación de automatismos para conseguir que partes importantes, y a ser
posible la totalidad, de un proceso de producción aumente la rentabilidad haciendo que se
mantenga un nivel uniforme de calidad. La nueva palabra fue creada por la necesidad de
distinguir entre una operación automática y una sucesión automática de operaciones.
Después de las reflexiones esbozadas en los apartados anteriores, quisiera proponer
un nuevo concepto para la TA, o por lo menos un nuevo término, basado en el concepto de
‘automación’. Cuando tenemos un problema que no podemos resolver de un solo paso hay
que encontrar la manera de dividirlo en subproblemas y buscar la solución de cada uno por
separado. En palabras de Marvin Minsky (Brockman, 1995:153) “la clave para construir
una máquina inteligente es inventar la manera de administrar una variedad de recursos, y a
partir de ahí se llega a lo que llamamos teoría de la sociedad de la mente”.
Si la mente es una sociedad, la sociedad es una mente. Este es el postulado que
pretendemos exponer en este artículo. La automación de la traducción consiste en conseguir
relacionar diferentes estrategias y métodos para que el resultado del trabajo del traductor
sea más riguroso, más fiable, más rápido, más fácil y más creativo. Me refiero al hecho de
optimizar la estación de trabajo (translator workstation ) para que el análisis, la
21
transferencia y la generación de un contenido vaya acompañado de una solución que
procede de una red conceptual (como la de BACUS), de un cotejo con la producción textual
del momento (Internet) a través de estrategias de la Lingüística de Corpus y la extracción
de información.
Las empresas de traducción que proliferan en España están extendiendo un
entramado de memorias de traducción que producirán un corpus global de documentación
técnica. A pesar de que la legislación no es lo bastante clara al respecto, es previsible que
este corpus supere las barreras legales y devenga una plataforma homogeneizada para la
comunicación técnica. La Traducción Automática o la automoción de la traducción es un
proceso que se augura más parecido a una red de carreteras, con acuerdos entre municipios,
que como un potente helicóptero que salve todos los accidentes geográficos. El objetivo
debería ser el de coordinar todos los recursos existentes para convertir la Traducción en un
protagonista de toda actividad relacionada con la transacción de información, más que en la
búsqueda de una solución que la haga inexistente.”Quizá no podamos entender nada a
menos que lo entendamos de diversas maneras diferentes; la búsqueda de la única verdad –
la mejor y más pura manera de representar el conocimiento- es un pertinaz error. Si
queremos obtener aprendizaje mediante redes neuronales, no podemos emplear sólo una
clase de red; probablemente tendremos que diseñar unas para recordar historias, otras para
representar estructuras geométricas, otras para las interacciones causales, otras para los
razonamientos en cadena, otras para las relaciones semánticas de las expresiones
lingüísticas, otras para las representaciones bidimensionales de la visión, y así
sucesivamente. El secreto de la inteligencia es que no hay ningún secreto, ningún truco
mágico especial” (Minsky, Ibid. 154).
6. Puzzle de disciplinas.
6.1. La ciencia del lenguaje.
En 1993 la Lingüística se independiza de los estudios de Filología en España. Es el
resultado del proceso de desarrollo de esta disciplina desde los años cincuenta debido a las
razones históricas ya esbozadas. La razón académica que atorga más peso a esta escisión es
la de que, debido a la aplicación del método inductivo y deductivo y al uso de lenguajes
formalizados, la lingüística deja de ser una ciencia humana o histórica. Las humanidades se
basan en el método de regresión no inductiva: regresión porque hay un remontarse del
condicionado a la condición, y no inductiva porque el condicionado no es un caso singular
de una condición universal. Por el contrario, Chomsky, sus coetaneos y seguidores,
defendían que el lenguaje era un universo infinito postulable a partir de leyes finitas.
Intentaron una ‘matemática’ del lenguaje que seguía a otros esfuerzos más ‘físicos’ o
clasificatorios como el de los estructuralistas.
En el momento en que la lingüística cobra autonomía y se acerca a la denominación
de ‘ciencia’, se escinde en dos grandes ramas: la lingüística teórica y la lingüística aplicada.
La lingüística teórica se encarga de la descripción de las lenguas y de la búsqueda de
formalismos de representación, mientras que la lingüística aplicada, con un mayor lato
sensu, se convierte en un terreno interdisciplinario que incluye la enseñanza de lenguas
(patologías en el aprendizaje de la lengua materna, aprendizaje de segundas lenguas) e
incluso del aprendizaje de lenguajes no verbales (iconografía y semiótica). La
sociolingüística (normativa, dialectología), la lexicografía, la terminología y todas aquellas
22
actividades en que se realiza investigación con finalidades aplicadas y en las que interfiere
el uso o desarrollo de herramientas tanto metodológicas como computacionales para el
análisis o la evaluación.8 La evaluación de sistemas es un área que ha recibido mucha
atención y una muestra del espacio compartido por la TA y la Lingüística teórica. Algunos
autores (Flickinger, 1987) propusieron listas de fenómenos que permitían comprobar la
eficacia o la ineficacia de un sistema de análisis. Pero, así como decíamos que el concepto
de unidad de traducción dependía de cada par de lenguas, la lista de fenómenos que debe
resolver un sistema de análisis para resultar fiable depende también de las características de
cada idioma. No todas las lenguas presentan duplicación de clítico o clitic doubling, sujetos
vacíos (pro-drop, oraciones impersonales, sujetos expletivos).
La lingüística computacional es por una lado una esposa de la lingüística teórica y
por otro una concubina de la lingüística aplicada. El hijo primogénito de la lingüística
computacional es el PLN. Los frutos de la investigación en PLN alimentan la lingüística
descriptiva y sus problemas son retos para la lingüística teórica en el plano de la
representación. Por otro lado, pasar la prueba de la computación es una baza en la
validación de una teoría gramatical, aunque obviamente esa validación tiene una
dependencia determinante respecto del avance tecnológico.
IA, la TA y el PLN tienen puntos de contacto con la Ciencia Cognitiva. La mente,
su modelización, su proyección, son áreas en las que se realiza inversión. A veces ocurre
que la inversión imanta al resto de las disciplinas y se destaca aquello que cada una puede
aportar a la investigación.
The cognitive sciences are understood to embrace anthropology, philosophy and
linguistics as web as cognitive psychology, neuroscience and artificial intelligence
(Pinker 1994).
¿Qué puede aportar la Traducción a la IA y la Ciencia Cognitiva? Los estudios de
traducción pueden jugar un papel importante mediante su visión de la comunicación
intercultural en un nivel sociológico. La TA tiene en común con la IA que se esfuerza en
dotar a una máquina (o un robot) de la información precisa para que efectúe tomas de
decisiones. La IA intenta emular el comportamiento de las neuronas (sinapsis y conexiones)
en el cerebro humano, y conseguir que el procesador saque conclusiones de los datos que se
le proporcionan. La TA pretende que el procesador analice frases o textos a partir de los
datos sobre el comportamiento de su sintaxis y la identidad de sus unidades léxicas. La TA
y la IA comparten el problema del almacenamiento optimizado de información, que en un
caso es léxica o gramatical, y en el otro puede ser auditiva o visual, y ambos se enfrentan a
una cuestión importante: proporcionar a la máquina conocimiento del mundo que le permita
decidir en caso de ambigüedad. Por eso ambas están interesadas en la ingeniería del
conocimiento y en las taxonomías, tal y como vimos en apartados anteriores.
Can the study of translation really contribute to our understanding of the mind? The
prospect is less far-fetched if we see cognitive science as two complementary and
interacting projects: on the one hand, to learn more about the human mind and
8
En España y hasta 1997 los estudios universitarios de Traducción formaron parte del área de conocimiento
de la Lingüística Aplicada. A partir de esa fecha la Traducción constituye un área de conocimiento en sí
misma.
23
behaviour; and on the other, to learn to simulate some of its functions where feasible
and desirable (for example, to do tedious or difficult jobs like screening cervical
smears or exploring the surface of Mars. As a complex cognitive activity involving
language, translation should have something to contribute to the former project,
even while progress in the latter is slow (and, some would claim, as far as
translation is concerned, not necessarily feasible or desirable). Setton (2001:114).
Si factible, ¿es la TA deseable? Como buena utopía la TA es la zanahoria que hace
avanzar al caballo (Riera, 2001:157). Enfrentándonos a los retos que plantea avanzamos en
la asunción de una idea más completa de lo que es clave para la comunicación, y cuando
eso que es clave queda fuera de nuestro alcance o del alcance de los programas. La TA ha
contribuido a plantear cuestiones básicas respecto de los comportamientos sintácticos y
semánticos, y últimamente se enfrenta a la implementación de la dimensión pragmática.En
palabras de Lakoff (1993:367), la pragmática es, o debería ser, aquella área de estudio que
nos dijera qué es lo que deseamos saber realmente, al menos en lo que se refiere al
lenguaje. La TA es aquella área de estudio que nos hace distinguir entre lo que se puede
procesar y lo que no se puede procesar del lenguaje y de la cultura.
6.2. Teoría de la Traducción y Traducción Automática
Cuando traducimos un texto encontramos una enorme casuística de problemas
relacionados con la dificultad de traducir los referentes conceptuales y culturales sin que se
pierda el sentido inicial y la función que tienen en el contexto del texto original. Encontrar
una equivalencia es una cuestión de adecuación y de toma de decisiones del traductor, y
esto es lo que hace que unos traductores sean mejores que otros. Esta labor es, en muchas
ocasiones, difícil y sutil, por lo que a menudo se asemeja más al talento artístico que al tipo
de cálculo que puede efectuar un científico. ¿Cuándo pueden las herramientas lógicas
ayudar en este proceso? La respuesta a esta pregunta debe partir de una clasificación de los
problemas posibles en el proceso de traducción, y cuáles de ellos pueden ser solucionados a
partir del almacenamiento de información en las entradas léxicas. Proponemos una
clasificación incompleta de los distintos niveles de dificultad.
1. El primer nivel de dificultad es el morfosintáctico. Algunas cuestiones han sido resueltas
con bastante éxito por el Procesamiento del Lenguaje Natural, por ejemplo el género; pero
otras presentan bastantes dificultades (por ejemplo el diminutivo).
2. El segundo tipo de dificultades se refiere al nivel léxico-semántico. Los problemas más
sutiles se refieren a las colocaciones atributivas. Las colocaciones idiomáticas y las
terminológicas poseen una rigidez sintáctica que facilita su procesamiento.
3. Un tercer tipo de problemas pertenece al ámbito de la pragmática en un sentido amplio.
Se trata de cuestiones que hemos denominado ‘problemas de localización’. Éstos pueden
dividirse en problemas de localización de primer grado, problemas de localización de
segundo grado, y, respectivamente, de tercer, cuarto y quinto grado.
24
a) Problemas de localización de primer grado. Son bien conocidos; se trata de cuestiones
del tipo de la conversión de unidades de medida: millas en kilómetros, galones en litros,
etc. Este tipo de información puede almacenarse fácilmente en tablas de conversión que
pueden ser usadas tanto por un traductor humano como por un programa de TA. Este tipo
de localización afecta sobre todo al lenguaje especializado, pero no únicamente. De hecho
vamos a prescindir de la diferencia entre lengua común y lenguaje especializado, y vamos a
considerar a la lengua común un subconjunto del lenguaje total, y por lo tanto perteneciente
a un área temática (si se quiere, el área temática de la “no especialización”). No sólo
unidades de medida, sino muchos términos compuestos consolidados pueden incluirse en
este primer nivel de localización y, a pesar de no responder a una traducción literal
(estándar) de cada uno de sus componentes, se puede obtener su equivalente a partir de
glosarios o diccionarios comunes:
hormigón armado => prestessed concrete
goma espuma => foam rubber
estrella de mar => starfish
ratoncito Pérez => tooth fairy
Naturalmente es preciso identificar la colocación terminológica como una unidad
conceptual, tal y como veíamos en el apartado 3, y también debemos contar con la
presencia del concepto en los sistemas lingüísticos que estamos comparando.
b) Un segundo grado de problemas de localización se encuentra en la conversión de
conceptos que tienen un mayor grado de dependencia de dominio o de contexto. Si
traducimos el término abstracto de 1 gallon al español , la solución es 3’785 litros (4’546
en el contexto de la Gran Bretaña), pero si de lo que estamos hablando es de un recipiente
para agua potable (a gallon container) deberemos traducirlo por “garrafa de 5 litros”,
puesto que ésa es la medida que se ha estandarizado para su comercialización en España.
Este tipo de adecuación es muy difícil que pueda ser efectuado por un programa, a no ser
que éste haya sido adaptado a un tema muy concreto, lo cual supondría a la vez una fuerte
limitación para la comercialización del mismo. (Algo parecido pero más difuso ocurre con
la traducción general de los referentes culturales marcados como ‘pancakes’ => ¿crêpes?,
¿tortas?, o ‘scones’ =>¿madalenas?, ¿pastas?)
c) Un tercer grado de dificultad en la localización procede de lo que se ha denominado
‘creencias’ o ‘inferencias’ que afectan la lengua de partida así como la lengua de llegada
(Farwell & Helmreich, 1995). El traductor debe hacer emerger a la conciencia las
asunciones y convenciones que se hallan en el texto original para construir un texto meta
que posea el grado máximo de adecuación. Esto significa columpiarse entre los dos
universos de creencias, el de la cultura origen y la cultura meta, y considerar cuáles son las
consecuencias de las decisiones que afectan el contenido. En su artículo Farwell &
Heilmreich plantean un ejemplo interesante sobre la traducción de una referencia a un autor
de teatro francés, Feydou, cuyo nombre fue sustituido por la denominación común de ‘obra
de enredo’ (bedfarce), porque el público americano incluía este referente en su conjunto de
creencias, pero no el nombre del dramaturgo francés. A pesar de la posibilidad de hacer que
la máquina consulte una base de datos como Internet, parece difícil almacenar en el
25
ordenador la ausencia de conocimiento, y entrenarla para que decida que la substitución es
la acción pertinente.
d) Todavía podemos contemplar un cuarto grado de dificultad, éste se produce cuando no
hay referentes explícitos porque el autor y el lector del texto original poseen un
conocimiento compartido al cual se hace referenciaimplícita, en una relación de
complicidad. Si contemplamos el texto siguiente:
-
Otra cerveza, por favor
No puedo servirle, señor, esto es Nuevo Méjico
Esto significa que el cliente ha bebido ya tres cervezas. El traductor deberá inferir
información que no es explícita en el texto. Sólo podrá hacerlo si ha sido bebedor de
cerveza en Nuevo Méjico, o si conoce las tasas de alcoholismo permitidas en los estados de
EEUU y sus leyes. ¿Podría una máquina hacer eso? Tal vez lo que pueda hacer es llevarnos
a otro lugar del texto donde se haga referencia a la cerveza y a Nuevo Méjico. Además de
todo esto el traductor deberá decidir si va a explicar la información que falta en una nota a
pie de página, si va a cambiar la frase en algo así como ‘la ley no le permite a usted beber
más’ o si va a dejar las cosas como están.
e) En último lugar podemos considerar un quinto nivel, éste aparentemente imposible de ser
objeto de computación. Se produce en el nivel del discurso. Considérese, por ejemplo, la
importancia que puede tener en la construcción de un personaje femenino que hable de su
estreñimiento y su menstruación en la segunda página de un libro (Angela Carter en Wise
Children. Cf. Santamaria L., 2000). ¿Considerara el traductor que es una señal del autor
para indicar que el personaje es de clase baja? ¿O que muestra una actitud desvergonzada, o
irónica? ¿Significa realmente algo? Si la respuesta a la última pregunta es afirmativa por
parte del traductor, éste deberá intentar reproducir para el lector de la traducción el efecto
que el original produce en el lector original.
Referencias
ANTIA, B.E. (2000): Language Planning and Terminology: an alternative framework of
discourse and practice. Amsterdam/Philadelphia. John Benjamins.
AGUILAR-AMAT, A. (1996): Logical Organization of Information at BACO: A
Knowledge Multilingual Database for Translation Purposes. Proceedings of the TKE'96
4th International Congress on Terminology and Knowledge Engineering, p. 238-244.
ALPAC (1966): Language and Machines; Computers in Translation and Linguistics,
Washington, DC: Publication 1416, National Academy of Sciences.
BALARI, S. (2001): Natural Language Processing as a Computational Problem
BARTHES, R. (1969): Critique et vérité, Éditions du Seuil, París.
26
BROWN P., DELLA PIETRA S. et al. (1991): Aligning Sentence in Parallel Corpora. In
Proceedings of the 29th Annual Meeting of the Association of Computational Linguistics,
Berkeley.
BROCKMAN, J. ed. (1995): The third culture. Beyond the Scientific Revolution. Versión
castellana de Ambrosio García, La tercera cultura. Más allá de la revolución científica. Ed.
Tusquets, Barcelona, 1996.
CABRÉ, M.T. (1992): La terminologia. La teoria, els mètodes, les aplicacions, ed. Empúries,
Barcelona.
CLAXTON, G. (1997): Hare Brain, Tortoise Mind. Fourth State. Versión castellana de J.J.
Estrella, Eds. Urano, 1999, Cerebro de liebre, mente de tortuga.
ELIOT, T.S (1948): Notes towards the Definition of Culture, Faber ed., London.
FARWELL, D. & HEILMREICH, S. (1995): This is not a Bedroom Farce: Pragmatics and
Translation, Fourth Colloquium on Cognitive Science.
FLICKINGER, D., NERBONNE, J., et al. (1987): Toward Evaluation of NLP Systems,
Hewlett-Packard Laboratories, Palo Alto, CA.
JACKENDOFF, R. (1983): Semantics and Cognition, The MIT Press, Cambridge,
Massachusetts.
JACKOBSON, R. (1936): "Contribución a la teoría general de los casos", en Ensayos de
Lingüística General, Seix Barral, Barcelona.
LAKOFF, R.T (1993): Lewis Carroll: subversive pragmaticist? Pragmatics 3: 367-85
NIRENBURG, S. (1989): "Knowledge-based machine translation", en Machine Translation,
n.4, Kluwer Academic Publishers, 1989, pp. 5-24
NIRENBURG, S. (ed.). (1995): Proceedings of the Conference on Theoretical and
Methodological Issues in Machine Translation. Colgate University, Hamilton, NY.
PINKER, S. (1994): The language instinct, London: Penguin Books.
POSTMAN, N. (1992): Technology (Knopf, Nueva York).
RIERA, S. (2001): Ciència, Romanticisme i Utopia, Barcelona, Edicions 62.
SANTAMARIA, L. (2001): Subtitulació i referents culturals. La traducció com a mitjà
d'adquisició de representacions socials. Tesis doctoral. Universitat Autònoma de
Barcelona.
27
SETTON, R. (2001): Translation Studies and Cognitive Science: Do we need each other?,
Olohan, M. (ed), CTIS Occasional Papers, Manchester, St. Jerome, vol.1
SIMMEL, G (1911): Weibliche Kultur, recogido en Cultura femenina y otros ensayos, Alba
Editorial, Barcelona, 1999. Traducción de Genoveva Dieterich.
SMADJA, F.A: (1992): "How to compile a bilingual collocational lexicon automatically", en
Proceedings of the AAAI workshop on statistically based NLP techniques, Columbia
University.
SMADJA, F.A. (1993): "Retrieving Collocations from Text: Xtract", Computational
Linguistics, vol. 19. 143-178.
SCHANK, R. C. & Abelson, R.P. (1987): Guiones, planes, metas y entendimiento. Un
estudio de las estructuras del conocimiento humano.Barcelona, Piados.
VERSCHUEREN, J. (1999): Understanding pragmatics, Understanding Language Series,
Arnold, NY.
WHITE, L. (1973): Tecnología medieval y cambio social, Buenos Aires, Ed. Paidós.
28
Descargar