La creación de un corpus ad hoc comparable de gastroenterología como herramienta para la extracción de terminología médica Lic. Gabriel Maldonado Pantoja Facultad de Idiomas [email protected] Dr. Rafael Saldívar Arreola Facultad de Idiomas [email protected] Mtra. Eleonora Lozano Bachioqui Facultad de Idiomas [email protected] Investigación en lenguas Resumen El lenguaje médico es uno de los lenguajes de especialidad más complicados para el traductor y los profesionales en la enseñanza de lenguas con fines específicos debido a la constante actualización del conocimiento médico y la escasez de herramientas documentales que permitan localizar la terminología y sus equivalentes léxicos correctos en una lengua y otra. Por ejemplo, cuando sólo se utilizan los diccionarios y no se consultan otras fuentes, en la traducción, se suelen producir errores como resucitación cardiopulmonar (falso cognado de cardiopulmonary resuscitation), en lugar de reanimación cardiopulmonar (Segura, 2001, p. 52). Por ello, se requiere de la creación de otras fuentes de consulta que permitan acercarse a este lenguaje de especialidad y observar su uso. Por ello, el corpus lingüístico, una herramienta documental relativamente nueva, ha ganado importancia conforme la tecnología va facilitando su creación y los especialistas en lenguas, particularmente los traductores, descubren las aplicaciones y virtudes que esta herramienta puede ofrecer. En el presente trabajo se comprueba, a través de la creación y uso de un corpus ad hoc médico comparable que este instrumento tiene mucho más potencial que el de un simple buscador de léxico y cuyo impacto puede ser tal que, como menciona Gloria Corpas Pastor (2002), favorezca “el desarrollo de los procesos autónomos de enseñanza-aprendizaje”. Como resultado, la creación de un corpus ad hoc médico comparable es muy importante para que tanto los traductores como los profesionales de lenguas extranjeras con fines específicos tengan a su alcance una herramienta más que les permita actualizar sus conocimientos, extraer terminología y realizar su trabajo con la calidad requerida. Palabras clave: Léxico médico, terminología, corpus lingüístico, traducción especializada, enseñanza de lenguas con fines específicos. Introducción La frontera México-Estados Unidos es una zona de la República Mexicana privilegiada por la relación tan estrecha entre las lenguas española e inglesa, esto convierte a esta área en un sitio con alta oferta y demanda de servicios de enseñanza-aprendizaje y traducción relacionados con el lenguaje médico. Esto implica que los traductores y quienes se dedican a la enseñanza de lenguas con fines específicos tienen una gran responsabilidad. Es conocido que el lenguaje de los médicos es sumamente extenso y complejo. Éste contiene una gran cantidad terminología que continúa aumentando conforme se publican nuevos descubrimientos, lo cual requiere que el especialista en esta área se mantenga en constante actualización. No obstante, mantenerse a la vanguardia puede ser una actividad que demande mucho tiempo incluso cuando éste sepa dónde encontrar la información que requiere. Puede entenderse que si un médico tiene que esforzarse para mantenerse informado, cuánto más un traductor o o una persona que se dedica a la enseñanza de lenguas con fines específico que no están inmersos en el tema. Por lo tanto, es necesario que ambos no sólo se actualicen sino que se familiaricen con el uso de este lenguaje de especialidad. Mucho se ha hablado sobre cómo desarrollar la competencia lingüística. Este es un tema que ha preocupado a distintas organizaciones como la Unión Europea cuya nueva política lingüística, menciona María del Carmen Acuyo Verbejo (2004), planea cursos y seminarios de formación y actualización para traductores especialmente, que abarcan los ámbitos lingüístico, temático y de herramientas de traducción. Para resolver las dificultades de terminología, los especialistas en la enseñanza de lenguas y los traductores utilizan diccionarios. Sin embargo, aunque todos los diccionarios definen los términos que contienen, muchos no proveen el contexto para tal definición, además que su información puede ser obsoleta. Otra fuente de consulta importante son los artículos de divulgación, los cuales proveen información más actualizada; no obstante, en el caso de la medicina, la mayor parte de esos artículos se publican en inglés y, si entre ellos surgen neologismos, es necesario “inventar” un término equivalente en la lengua término (LT). Debido a estas dificultades, es necesario que se diseñen nuevas herramientas de consulta. El corpus lingüístico se ha vuelto muy importante porque, de acuerdo con Oliver, Moré y Climent (2008, p. 96) con éste se pueden obtener “datos de uso ´real´ de la lengua”. En este sentido, quienes consultan un corpus pueden beneficiarse al observar el léxico, las colocaciones y otras estructuras gramaticales que se utilizan en el lenguaje especializado. Así, el presente documento trata sobre la creación de un corpus ad hoc comparable especializado en ciencias médicas conformado por artículos en español e inglés como herramienta para la extracción de terminología y que se está creando como producto de un trabajo terminal para la obtención del grado de Maestría en Lenguas Modernas. 1. Planteamiento del problema Debido a que los diccionarios médicos monolingües y bilingües no se actualizan al mismo tiempo que la terminología médica, ¿qué aportaciones puede otorgar un corpus ad hoc médico comparable para solucionar este problema? 2. Justificación Muchas son los beneficios que un corpus ingüístico de ciencias médicas puede ofrecer pero, para la comunidad traductora y quienes se dedican a la enseñanza de lenguas con fines específicos, los más importantes son los siguientes: El lenguaje médico es muy complejo. Un corpus puede ayudar a analizar cada una de las partes del discurso para describir sus características y contenido. Siguiendo esta lógica, si el traductor o el profesional en lenguas extranjeras con fines específicos no es un médico, un corpus lingüístico sobre ciencias médicas es indispensable. Un corpus comparable, es decir, uno compuesto por textos en su en dos o más lenguas, puede beneficiar a los traductores y a cualquier otra persona interesada en comprender y redactar textos médicos. Con esta herramienta, fácilmente es posible observar la terminología y fraseología utilizada por los médicos para familiarizarse con ellas. Otro aspecto relevante es que la investigación documental con córpora es de muy bajo costo debido a que los elementos básicos para realizarla son una computadora, acceso a internet y programas para el análisis del corpus. Finalmente, si este corpus se pone a disposición del público, tanto de los especialistas en lenguas como de cualquier otro interesado, la comunidad en general podría beneficiarse del uso de este corpus, volviendose en una valiosa fuente de nuevo conocimiento. 3 Objetivos 3.1 Objetivo general Crear un corpus lingüístico ad hoc médico comparable especializado en el área de gastroenterología que facilite la búsqueda terminológica. 3.2 Objetivos específicos 1. Seleccionar la muestra de los textos médicos en español e inglés que conforman el corpus. 2. Recopilar los textos médicos en español e inglés que conforman el corpus. 3. Preparar los textos para que sean procesables por el software de análisis léxico. 4. Generar una lista de palabras clave del corpus ad hoc a través de un corpus de referencia. 5. Extraer la terminología del área de gastroenterología. 4. Antecedentes conceptuales El corpus lingüístico es “una recopilación de fragmentos de una lengua que se seleccionan y se ordenan según un criterio lingüístico con la finalidad de ser utilizado como una muestra de la lengua o de una variedad de la lengua” (Oliver et al, 2008, p. 96). Esta herramienta se ha vuelto en la más adecuada para la identificación y descripción de las regularidades de los patrones lingüísticos debido a que, por medio del análisis de muestras reales de la lengua, es posible estudiar las características, la terminología y fraseología del discurso (Mendiluche, 2002); además de la posibilidad de extraer información para fines documentales y de enseñanza-aprendizaje (Cabré, 2007). Existen diferentes tipos de corpus. Un corpus paralelo es aquel que contiene textos originales en una lengua y su traducción en otra; por su parte, en un corpus comparable hay documentos en ambas lenguas preferentemente escritos por hablantes nativos (Hunston, 2002). Para crear un corpus hay diferentes criterios que deben tomarse en cuenta. Primero es importante deteminar la muestra (Cabré, 2007), el contexto social y período cronológico de procedencia (Oliver et al, 2008) y los medios de comunicación que se van a utilizar para obtener las muestras. Otro criterio necesario a considerar, es el programa de análisis de córpora para saber en qué formato se debe guardar cada muestra. De esta manera, es más sencillo cumplir con el propósito buscado. A partir de los avances tecnológicos en la informática en los últimos treinta años, la utilización de corpus para diversos tipos de estudios se ha incrementado. La accesibilidad a diversos tipos de textos a través del internet, así como la disponibilidad de nuevos programas de software han hecho posible que en la actualidad el desarrollo de corpus ad hoc sea relativamente sencillo, lo cual se ha visto reflejado en diferentes campos de interés lingüístico. Específicamente, el uso de corpus con fines didácticos se ha convertido en una tendencia importante al combinar una metodología sólida y confiable de análisis lingüístico con la innovación que implica el uso de tecnología en el salón de clase, lo cual se adapta perfectamente a las características de los estudiantes de la actualidad. El uso de corpus en contextos de aprendizaje de lenguas fue iniciado por Tim Johns, quien introdujo el uso de las concordancias en los años ochenta. Además de permitir a especialistas como lexicógrafos o escritores el producir mejores materiales de referencia o para cursos de lenguas, permitió la creación de actividades de clase basadas en ejemplos reales los cuales resultaban más significativos. John pudo demostrar cómo los corpus podían brindar a los estudiantes un acceso directo a una fuente virtualmente inagotable de información sobre el lenguaje (Bernardini, Stewart y Zanettin 2003: 4). De acuerdo a algunos expertos en adquisición de segundas lenguas (Partington 1998: 5–7; Aston 2000: 7), las herramientas de corpus se pueden utilizar en dos formas distintas y complementarias: como un medio para favorecer el lenguaje autónomo, cuando el corpus lo usan los estudiantes con una ayuda mínima (o nula) del profesor, o como una fuente de materiales para la clase, donde el profesor es quien elige las muestras y controla su uso para lograr objetivos pedagógicos específicos. Esta misma distinción se puede aplicar a la utilización de corpus para la formación de traductores. No obstante, en este campo, el énfasis se ha dado en el uso de corpus como herramienta de documentación para los traductores en formación y no tanto en el desarrollo de actividades didácticas para su aplicación en las aulas. Pearson (2003), por ejemplo, argumenta que los corpus paralelos juegan un rol complementario al de los corpus comparables en el proceso de resolución de problemas de traducción que los estudiantes llevan a cabo en su proceso formativo. La autora ilustra esto al referirse a información específica de la cultura que se identificó en una colección de artículos científicos con sus respectivas traducciones. Kubler (2003) señala que el uso de corpus tiene que incorporarse en los objetivos y la metodología de la formación de traductores, especialmente cuando se trata del campo de la terminología. Los traductores especializados tradicionalmente han recurrido a los llamados textos paralelos (impresos en papel) para resolver problemas de terminología, sin embargo, los corpus digitalizados tienen la ventaja de ofrecer a los traductores una gran cantidad de información lingüística específica solamente con pulsar un botón. Varantola (2003) se enfoca en el uso de corpus ad hoc comparables para tareas de traducción específicas. Dado que estos corpus se compilan solamente para el desarrollo de proyectos específicos, se usan y luego se desechan, se les llama también corpus desechables. La utilidad de este tipo de corpus, no se limita al campo profesional, sino que tienen una gran potencialidad en el campo formativo ya que brindan información tanto lingüística como específica para el campo al que pertenece la traducción que se lleva a cabo (Sánchez-Gijón, 2009). Varantola asevera que “el conocimiento de cómo compilar y utilizar un corpus es una parte esencial de la competencia traductora moderna y por lo tanto se debe incluir en la formación de los futuros traductores” (2003: 56). 5. Metodología La metodología a seguir para la realización de este proyecto será la siguiente: La muestra que se utiliza en este trabajo es por conveniencia e incluye textos médicos en español e inglés del área de gastroenterología en general, con el fin de ser utilizado en diferentes prácticas posteriormente. Los documentos que se incluirán serán artículos de revistas electrónicas gratuitas principalmente de México y Estados Unidos, libros especializados. El instrumento que se utiliza para procesar el corpus es un software de análisis léxico. A través de éste también se genera la lista de palabras clave. El procedimiento que se sigue es el siguiente. Primero, los documentos se convienten a texto sin formato (.txt) para poder ser procesados por el prograda de análisis de corpus a utilizar. Posteriormente, se genera una lista de palabras del corpus ad hoc y se compara con una lista de palabras del CREA (Corpus de Referencia del Español Actual) para generar una lista de palabras clave que permitan identificar la terminología del área de especialidad de gastroenterología. Más adelante, se procederá a subir el corpus en línea para que la comunidad de especialistas en la enseñanza-aprendizaje de lenguas y traductores pueda acceder a ella. 6. Resultados Actualmente se continua desarrollando el proyecto. Al momento de la redacción del presente trabajo, se han incluido 41 artículos publicados en la Revista de Gastroenterología de México durante los últimos dos años y 21 artículos de The American Journal of Gastroenterology. A pesar del tamaño reducido que tiene actualmente el corpus, se han realizado exitosamente algunas prácticas con fines académicos. Entre ellas, se encuentra una investigación realizada para contrastar el uso de algunos falsos cognados contra el de los términos aceptados en español. Para ello se analizaron los 41 artículos de la Revista de Gastroenterología de México mencionados en el párrafo anterior. De esta manera se pudo determinar que, efectivamente hay presencia de falsos cognados en los artículos médicos publicados en la mencionada revista. Por ejemplo, se comparó el uso del verbo “manejar” (falso cognado originado del verbo inglés “manage”) con el del verbo “administrar”. Por medio del corpus pudo determinarse que ambos términos son utilizados en la misma proporción y con el mismo significado en la mayoría de las muestras analizadas. Este experimento demuestra la utilidad del corpus para extraer la terminología correcta. Conclusiones Desde sus inicios, la lingüística de corpus ha demostrado su enorme utilidad en el campo del estudio del lenguaje. A lo largo de este trabajo se ha comprobado que a través de esta herramienta es posible extraer terminología médica y determinar su uso correcto en la lengua. La creación de este corpus ad hoc médico comparable será muy importante para auxiliar en la labor de los traductores y los profesionales en la enseñanza de lenguas con fines específicos que trabajen con el lenguaje médico. Esto abrirá un espacio donde se podrán realizar estudios lingüísticos. Un gran punto a su favor es su confiabilidad al realizar pruebas a pesar de que aún está en construcción. Referencias 1. Acuyo Verbejo, María del Carmen (2004). La nueva política lingüística de la Unión Europea: implicaciones para la traducción. En 5TH Symposium on Translation, Terminology and Interpretation in Cuba and Canada - December 2004. Recuperado de http://www.cttic.org/ACTI/2004/papers/Acuyo_Verdejo_MCPonenciaCuba_04. pdf 2. Aston, G. 2000. “Corpora and language teaching”. In Rethinking Language Pedagogy from a Corpus Perspective, L. Burnard and T. McEnery (eds.), 7–17. Frankfurt: Peter Lang. 3. Bennet, Gera R. (2010). Using Corpora in the Language Learning Classroom: Corpus Linguistics for Teachers. Michigan ELT, 2010. Recuperado de www.nhlrc.ucla.edu/media/files/Using-corpora-in-the-language-learning-classroom-Corpus-linguistics-for-teachers-my-atc.pdf 4. Bernardini, S., Stewart, D. and Zanettin, F. 2003. “Corpora in Translator Education: An Introduction”. In Corpora in Translator Education, F. Zanettin, S. Bernardini and D. Stewart (eds.), 1–13. Manchester: St. Jerome. 5. Cabré, M.T. (2007). “Constituir un corpus de especialidad: condiciones y posibilidades”. En Balard, M.; Pineira-Tresmontant, C. (ed.) Les corpus en linguistique et en traductologie. Arras: Artois Presses Université. 6. Corpas Pastor, G. (2002): Traducir con corpus: de la teoría a la práctica. En: García Palacios, J. y Fuentes, M. T. (eds.): Texto, terminología y traducción (pp. 189-226). Salamanca: Almar. 7. Hunston, Susan. (2002). Corpora in Applied Linguistics. Reino Unido: Cambridge University Press. 8. Kubler, N. (2003). Corpora and LSP Translation. In Corpora in Translator Education, F. Zanettin, S. Bernardini and D. Stewart (eds.), 25–42. Manchester: St. Jerome. 9. Mc Enery, Tony y Hardie, Andrew. (2012): Corpus Linguistics: Method, Theory and Practice. Estados Unidos: Cambridge. 10. Mendiluce Cabrera, Gustavo (2002): La descripción del lenguaje médico escrito y los corpus. En Bravo, José María (ed.). Nuevas perspectivas de los estudios de traducción. José María Bravo (ed.). Universidad de Valladolid. 11. Oliver, Antoni, Moré, Joaquin y Climent, Salvador (2008). Traducción y tecnologías. Barcelona: Editorial El Ciervo. 12. Partington, A. (1998). Patterns and Meanings. Using Corpora for English Language Research and Teaching. Amsterdam/Philadelphia: John Benjamins. 13. Pearson, J. (2003). Using Parallel Texts in the Translator Training Environment. En Corpora in Translator Education, F. Zanettin, S. Bernardini and D. Stewart (eds.), 15–24. Manchester: St. Jerome. 14. Sánchez-Gijón, Pilar. 2009. “Developing documentation skills to build do-ityourself corpora in the specialised translation course”. In Corpus Use and Translating. Corpus use for learning to translate and learning corpus use to translate. A. Beeby, P. Rodríguez, I. Sánchez-Gijón (eds.), 109-128. Amsterdam: John Benjamins. 15. Segura, Joaquin (2001). Los anglicismos en el lenguaje médico. En Panace@. Boletín de Medicina y Traducción. Volumen 2, Número 3, Marzo 2001. Recuperado de: http://www.medtrad.org/panacea/IndiceGeneral/n3_ Segura.pdf. 16. Sinclair, J. (1991). Corpus, Concordance, Collocations. Reino Unido: Oxford University Press 17. Varantola, K. 2003. “Translators and Disposable Corpora”. In Corpora in Translator Education, F. Zanettin, S. Bernardini and D. Stewart (eds.), 55–70. Manchester: St. Jerome. 18. Williams, Ian (1999).Traducción científico-médica. En Pinto Molina, María, Cordón, José Antonio (eds.). Técnicas documentales aplicables a la traducción. Murcia: Editorial Sintesis.