La creación de un corpus ad hoc comparable de

Anuncio
La creación de un corpus ad hoc comparable de
gastroenterología como herramienta para la extracción de
terminología médica
Lic. Gabriel Maldonado Pantoja
Facultad de Idiomas
[email protected]
Dr. Rafael Saldívar Arreola
Facultad de Idiomas
[email protected]
Mtra. Eleonora Lozano Bachioqui
Facultad de Idiomas
[email protected]
Investigación en lenguas
Resumen
El lenguaje médico es uno de los lenguajes de especialidad más complicados para el
traductor y los profesionales en la enseñanza de lenguas con fines específicos debido a la
constante actualización del conocimiento médico y la escasez de herramientas
documentales que permitan localizar la terminología y sus equivalentes léxicos correctos en
una lengua y otra. Por ejemplo, cuando sólo se utilizan los diccionarios y no se consultan
otras fuentes, en la traducción, se suelen producir errores como resucitación
cardiopulmonar (falso cognado de cardiopulmonary resuscitation), en lugar de
reanimación cardiopulmonar (Segura, 2001, p. 52). Por ello, se requiere de la creación de
otras fuentes de consulta que permitan acercarse a este lenguaje de especialidad y observar
su uso.
Por ello, el corpus lingüístico, una herramienta documental relativamente nueva, ha
ganado importancia conforme la tecnología va facilitando su creación y los especialistas en
lenguas, particularmente los traductores, descubren las aplicaciones y virtudes que esta
herramienta puede ofrecer. En el presente trabajo se comprueba, a través de la creación y
uso de un corpus ad hoc médico comparable que este instrumento tiene mucho más
potencial que el de un simple buscador de léxico y cuyo impacto puede ser tal que, como
menciona Gloria Corpas Pastor (2002), favorezca “el desarrollo de los procesos autónomos
de enseñanza-aprendizaje”.
Como resultado, la creación de un corpus ad hoc médico comparable es muy
importante para que tanto los traductores como los profesionales de lenguas extranjeras con
fines específicos tengan a su alcance una herramienta más que les permita actualizar sus
conocimientos, extraer terminología y realizar su trabajo con la calidad requerida.
Palabras clave: Léxico médico, terminología, corpus lingüístico, traducción
especializada, enseñanza de lenguas con fines específicos.
Introducción
La frontera México-Estados Unidos es una zona de la República Mexicana privilegiada por
la relación tan estrecha entre las lenguas española e inglesa, esto convierte a esta área en un
sitio con alta oferta y demanda de servicios de enseñanza-aprendizaje y traducción
relacionados con el lenguaje médico. Esto implica que los traductores y quienes se dedican
a la enseñanza de lenguas con fines específicos tienen una gran responsabilidad.
Es conocido que el lenguaje de los médicos es sumamente extenso y complejo. Éste
contiene una gran cantidad terminología que continúa aumentando conforme se publican
nuevos descubrimientos, lo cual requiere que el especialista en esta área se mantenga en
constante actualización. No obstante, mantenerse a la vanguardia puede ser una actividad
que demande mucho tiempo incluso cuando éste sepa dónde encontrar la información que
requiere. Puede entenderse que si un médico tiene que esforzarse para mantenerse
informado, cuánto más un traductor o o una persona que se dedica a la enseñanza de
lenguas con fines específico que no están inmersos en el tema. Por lo tanto, es necesario
que ambos no sólo se actualicen sino que se familiaricen con el uso de este lenguaje de
especialidad.
Mucho se ha hablado sobre cómo desarrollar la competencia lingüística. Este es un
tema que ha preocupado a distintas organizaciones como la Unión Europea cuya nueva
política lingüística, menciona María del Carmen Acuyo Verbejo (2004), planea cursos y
seminarios de formación y actualización para traductores especialmente, que abarcan los
ámbitos lingüístico, temático y de herramientas de traducción.
Para resolver las dificultades de terminología, los especialistas en la enseñanza de
lenguas y los traductores utilizan diccionarios. Sin embargo, aunque todos los diccionarios
definen los términos que contienen, muchos no proveen el contexto para tal definición,
además que su información puede ser obsoleta. Otra fuente de consulta importante son los
artículos de divulgación, los cuales proveen información más actualizada; no obstante, en el
caso de la medicina, la mayor parte de esos artículos se publican en inglés y, si entre ellos
surgen neologismos, es necesario “inventar” un término equivalente en la lengua término
(LT). Debido a estas dificultades, es necesario que se diseñen nuevas herramientas de
consulta.
El corpus lingüístico se ha vuelto muy importante porque, de acuerdo con Oliver,
Moré y Climent (2008, p. 96) con éste se pueden obtener “datos de uso ´real´ de la lengua”.
En este sentido, quienes consultan un corpus pueden beneficiarse al observar el léxico, las
colocaciones y otras estructuras gramaticales que se utilizan en el lenguaje especializado.
Así, el presente documento trata sobre la creación de un corpus ad hoc comparable
especializado en ciencias médicas conformado por artículos en español e inglés como
herramienta para la extracción de terminología y que se está creando como producto de un
trabajo terminal para la obtención del grado de Maestría en Lenguas Modernas.
1. Planteamiento del problema
Debido a que los diccionarios médicos monolingües y bilingües no se actualizan al mismo
tiempo que la terminología médica, ¿qué aportaciones puede otorgar un corpus ad hoc
médico comparable para solucionar este problema?
2. Justificación
Muchas son los beneficios que un corpus ingüístico de ciencias médicas puede ofrecer pero,
para la comunidad traductora y quienes se dedican a la enseñanza de lenguas con fines
específicos, los más importantes son los siguientes:
El lenguaje médico es muy complejo. Un corpus puede ayudar a analizar cada una
de las partes del discurso para describir sus características y contenido. Siguiendo esta
lógica, si el traductor o el profesional en lenguas extranjeras con fines específicos no es un
médico, un corpus lingüístico sobre ciencias médicas es indispensable.
Un corpus comparable, es decir, uno compuesto por textos en su en dos o más
lenguas,
puede beneficiar a los traductores y a cualquier otra persona interesada en
comprender y redactar textos médicos. Con esta herramienta, fácilmente es posible
observar la terminología y fraseología utilizada por los médicos para familiarizarse con
ellas.
Otro aspecto relevante es que la investigación documental con córpora es de muy
bajo costo debido a que los elementos básicos para realizarla son una computadora, acceso
a internet y programas para el análisis del corpus.
Finalmente, si este corpus se pone a disposición del público, tanto de los
especialistas en lenguas como de cualquier otro interesado, la comunidad en general podría
beneficiarse del uso de este corpus, volviendose en una valiosa fuente de nuevo
conocimiento.
3 Objetivos
3.1 Objetivo general
Crear un corpus lingüístico ad hoc médico comparable especializado en el área de
gastroenterología que facilite la búsqueda terminológica.
3.2 Objetivos específicos
1. Seleccionar la muestra de los textos médicos en español e inglés que conforman el
corpus.
2. Recopilar los textos médicos en español e inglés que conforman el corpus.
3. Preparar los textos para que sean procesables por el software de análisis léxico.
4. Generar una lista de palabras clave del corpus ad hoc a través de un corpus de
referencia.
5. Extraer la terminología del área de gastroenterología.
4. Antecedentes conceptuales
El corpus lingüístico es “una recopilación de fragmentos de una lengua que se seleccionan
y se ordenan según un criterio lingüístico con la finalidad de ser utilizado como una
muestra de la lengua o de una variedad de la lengua” (Oliver et al, 2008, p. 96). Esta
herramienta se ha vuelto en la más adecuada para la identificación y descripción de las
regularidades de los patrones lingüísticos debido a que, por medio del análisis de muestras
reales de la lengua, es posible estudiar las características, la terminología y fraseología del
discurso (Mendiluche, 2002); además de la posibilidad de extraer información para fines
documentales y de enseñanza-aprendizaje (Cabré, 2007).
Existen diferentes tipos de corpus. Un corpus paralelo es aquel que contiene textos
originales en una lengua y su traducción en otra; por su parte, en un corpus comparable hay
documentos en ambas lenguas preferentemente escritos por hablantes nativos (Hunston,
2002).
Para crear un corpus hay diferentes criterios que deben tomarse en cuenta. Primero
es importante deteminar la muestra (Cabré, 2007), el contexto social y período cronológico
de procedencia (Oliver et al, 2008) y los medios de comunicación que se van a utilizar para
obtener las muestras. Otro criterio necesario a considerar, es el programa de análisis de
córpora para saber en qué formato se debe guardar cada muestra. De esta manera, es más
sencillo cumplir con el propósito buscado.
A partir de los avances tecnológicos en la informática en los últimos treinta años, la
utilización de corpus para diversos tipos de estudios se ha incrementado. La accesibilidad a
diversos tipos de textos a través del internet, así como la disponibilidad de nuevos
programas de software han hecho posible que en la actualidad el desarrollo de corpus ad
hoc sea relativamente sencillo, lo cual se ha visto reflejado en diferentes campos de interés
lingüístico. Específicamente, el uso de corpus con fines didácticos se ha convertido en una
tendencia importante al combinar una metodología sólida y confiable de análisis lingüístico
con la innovación que implica el uso de tecnología en el salón de clase, lo cual se adapta
perfectamente a las características de los estudiantes de la actualidad.
El uso de corpus en contextos de aprendizaje de lenguas fue iniciado por Tim Johns,
quien introdujo el uso de las concordancias en los años ochenta. Además de permitir a
especialistas como lexicógrafos o escritores el producir mejores materiales de referencia o
para cursos de lenguas, permitió la creación de actividades de clase basadas en ejemplos
reales los cuales resultaban más significativos. John pudo demostrar cómo los corpus
podían brindar a los estudiantes un acceso directo a una fuente virtualmente inagotable de
información sobre el lenguaje (Bernardini, Stewart y Zanettin 2003: 4).
De acuerdo a algunos expertos en adquisición de segundas lenguas (Partington
1998: 5–7; Aston 2000: 7), las herramientas de corpus se pueden utilizar en dos formas
distintas y complementarias: como un medio para favorecer el lenguaje autónomo, cuando
el corpus lo usan los estudiantes con una ayuda mínima (o nula) del profesor, o como una
fuente de materiales para la clase, donde el profesor es quien elige las muestras y controla
su uso para lograr objetivos pedagógicos específicos.
Esta misma distinción se puede aplicar a la utilización de corpus para la formación
de traductores. No obstante, en este campo, el énfasis se ha dado en el uso de corpus como
herramienta de documentación para los traductores en formación y no tanto en el desarrollo
de actividades didácticas para su aplicación en las aulas. Pearson (2003), por ejemplo,
argumenta que los corpus paralelos
juegan un rol complementario al de los corpus
comparables en el proceso de resolución de problemas de traducción que los estudiantes
llevan a cabo en su proceso formativo. La autora ilustra esto al referirse a información
específica de la cultura que se identificó en una colección de artículos científicos con sus
respectivas traducciones.
Kubler (2003) señala que el uso de corpus tiene que incorporarse en los objetivos y
la metodología de la formación de traductores, especialmente cuando se trata del campo de
la terminología. Los traductores especializados tradicionalmente han recurrido a los
llamados textos paralelos (impresos en papel) para resolver problemas de terminología, sin
embargo, los corpus digitalizados tienen la ventaja de ofrecer a los traductores una gran
cantidad de información lingüística específica solamente con pulsar un botón.
Varantola (2003) se enfoca en el uso de corpus ad hoc comparables para tareas de
traducción específicas. Dado que estos corpus se compilan solamente para el desarrollo de
proyectos específicos, se usan y luego se desechan, se les llama también corpus
desechables. La utilidad de este tipo de corpus, no se limita al campo profesional, sino que
tienen una gran potencialidad en el campo formativo ya que brindan información tanto
lingüística como específica para el campo al que pertenece la traducción que se lleva a cabo
(Sánchez-Gijón, 2009).
Varantola asevera que “el conocimiento de cómo compilar y utilizar un corpus es
una parte esencial de la competencia traductora moderna y por lo tanto se debe incluir en la
formación de los futuros traductores” (2003: 56).
5. Metodología
La metodología a seguir para la realización de este proyecto será la siguiente:
La muestra que se utiliza en este trabajo es por conveniencia e incluye textos
médicos en español e inglés del área de gastroenterología en general, con el fin de ser
utilizado en diferentes prácticas posteriormente. Los documentos que se incluirán serán
artículos de revistas electrónicas gratuitas principalmente de México y Estados Unidos,
libros especializados.
El instrumento que se utiliza para procesar el corpus es un software de análisis
léxico. A través de éste también se genera la lista de palabras clave.
El procedimiento que se sigue es el siguiente. Primero, los documentos se
convienten a texto sin formato (.txt) para poder ser procesados por el prograda de análisis
de corpus a utilizar.
Posteriormente, se genera una lista de palabras del corpus ad hoc y se compara con
una lista de palabras del CREA (Corpus de Referencia del Español Actual) para generar
una lista de palabras clave que permitan identificar la terminología del área de especialidad
de gastroenterología.
Más adelante, se procederá a subir el corpus en línea para que la comunidad de
especialistas en la enseñanza-aprendizaje de lenguas y traductores pueda acceder a ella.
6. Resultados
Actualmente se continua desarrollando el proyecto. Al momento de la redacción del
presente trabajo, se han incluido 41 artículos publicados en la Revista de Gastroenterología
de México durante los últimos dos años y 21 artículos de The American Journal of
Gastroenterology.
A pesar del tamaño reducido que tiene actualmente el corpus, se han realizado
exitosamente algunas prácticas con fines académicos. Entre ellas, se encuentra una
investigación realizada para contrastar el uso de algunos falsos cognados contra el de los
términos aceptados en español. Para ello se analizaron los 41 artículos de la Revista de
Gastroenterología de México mencionados en el párrafo anterior. De esta manera se pudo
determinar que, efectivamente hay presencia de falsos cognados en los artículos médicos
publicados en la mencionada revista. Por ejemplo, se comparó el uso del verbo “manejar”
(falso cognado originado del verbo inglés “manage”) con el del verbo “administrar”. Por
medio del corpus pudo determinarse que ambos términos son utilizados en la misma
proporción y con el mismo significado en la mayoría de las muestras analizadas. Este
experimento demuestra la utilidad del corpus para extraer la terminología correcta.
Conclusiones
Desde sus inicios, la lingüística de corpus ha demostrado su enorme utilidad en el campo
del estudio del lenguaje. A lo largo de este trabajo se ha comprobado que a través de esta
herramienta es posible extraer terminología médica y determinar su uso correcto en la
lengua.
La creación de este corpus ad hoc médico comparable será muy importante para
auxiliar en la labor de los traductores y los profesionales en la enseñanza de lenguas con
fines específicos que trabajen con el lenguaje médico. Esto abrirá un espacio donde se
podrán realizar estudios lingüísticos. Un gran punto a su favor es su confiabilidad al
realizar pruebas a pesar de que aún está en construcción.
Referencias
1. Acuyo Verbejo, María del Carmen (2004). La nueva política lingüística de la Unión
Europea: implicaciones para la traducción. En 5TH Symposium on Translation,
Terminology and Interpretation in Cuba and Canada - December 2004. Recuperado
de http://www.cttic.org/ACTI/2004/papers/Acuyo_Verdejo_MCPonenciaCuba_04.
pdf
2. Aston, G. 2000. “Corpora and language teaching”. In Rethinking Language
Pedagogy from a Corpus Perspective, L. Burnard and T. McEnery (eds.), 7–17.
Frankfurt: Peter Lang.
3. Bennet, Gera R. (2010). Using Corpora in the Language Learning Classroom:
Corpus Linguistics for Teachers. Michigan ELT, 2010. Recuperado de
www.nhlrc.ucla.edu/media/files/Using-corpora-in-the-language-learning-classroom-Corpus-linguistics-for-teachers-my-atc.pdf
4. Bernardini, S., Stewart, D. and Zanettin, F. 2003. “Corpora in Translator Education:
An Introduction”. In Corpora in Translator Education, F. Zanettin, S. Bernardini
and D. Stewart (eds.), 1–13. Manchester: St. Jerome.
5. Cabré, M.T. (2007). “Constituir un corpus de especialidad: condiciones y
posibilidades”. En Balard, M.; Pineira-Tresmontant, C. (ed.) Les corpus en
linguistique et en traductologie. Arras: Artois Presses Université.
6. Corpas Pastor, G. (2002): Traducir con corpus: de la teoría a la práctica. En: García
Palacios, J. y Fuentes, M. T. (eds.): Texto, terminología y traducción (pp. 189-226).
Salamanca: Almar.
7. Hunston, Susan. (2002). Corpora in Applied Linguistics. Reino Unido: Cambridge
University Press.
8. Kubler, N. (2003). Corpora and LSP Translation. In Corpora in Translator
Education, F. Zanettin, S. Bernardini and D. Stewart (eds.), 25–42. Manchester: St.
Jerome.
9. Mc Enery, Tony y Hardie, Andrew. (2012): Corpus Linguistics: Method, Theory
and Practice. Estados Unidos: Cambridge.
10. Mendiluce Cabrera, Gustavo (2002): La descripción del lenguaje médico escrito y
los corpus. En Bravo, José María (ed.). Nuevas perspectivas de los estudios de
traducción. José María Bravo (ed.). Universidad de Valladolid.
11. Oliver, Antoni, Moré, Joaquin y Climent, Salvador (2008). Traducción y
tecnologías. Barcelona: Editorial El Ciervo.
12. Partington, A. (1998). Patterns and Meanings. Using Corpora for English
Language Research and Teaching. Amsterdam/Philadelphia: John Benjamins.
13. Pearson, J. (2003). Using Parallel Texts in the Translator Training Environment. En
Corpora in Translator Education, F. Zanettin, S. Bernardini and D. Stewart (eds.),
15–24. Manchester: St. Jerome.
14. Sánchez-Gijón, Pilar. 2009. “Developing documentation skills to build do-ityourself corpora in the specialised translation course”. In Corpus Use and
Translating. Corpus use for learning to translate and learning corpus use to
translate. A. Beeby, P. Rodríguez, I. Sánchez-Gijón (eds.), 109-128. Amsterdam:
John Benjamins.
15. Segura, Joaquin (2001). Los anglicismos en el lenguaje médico. En Panace@.
Boletín de Medicina y Traducción. Volumen 2, Número 3, Marzo 2001.
Recuperado de: http://www.medtrad.org/panacea/IndiceGeneral/n3_ Segura.pdf.
16. Sinclair, J. (1991). Corpus, Concordance, Collocations. Reino Unido: Oxford
University Press
17. Varantola, K. 2003. “Translators and Disposable Corpora”. In Corpora in
Translator Education, F. Zanettin, S. Bernardini and D. Stewart (eds.), 55–70.
Manchester: St. Jerome.
18. Williams, Ian (1999).Traducción científico-médica. En Pinto Molina, María,
Cordón, José Antonio (eds.). Técnicas documentales aplicables a la traducción.
Murcia: Editorial Sintesis.
Descargar