Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf NUEVAS TECNOLOGÍAS Y ENSEÑANZA DE LA LENGUA ESPAÑOLA JOAQUIM LLISTERRI Departament de Filologia Espanyola Universitat Autònoma de Barcelona [email protected] http://liceu.uab.es/~joaquim/home.html 1.- Introducción En el documento que, como parte del Real Decreto 3474/2000 de 29 de diciembre de 2000, define los objetivos, contenidos y criterios de evaluación de las materias “Lengua Castellana y Literatura I y II” en el Bachillerato, se puede apreciar un constante interés por el uso de las denominadas “nuevas tecnologías”, tanto en lo que se refiere a su aplicación a las técnicas de trabajo como en lo que respecta a los propios contenidos de las asignaturas. En “Lengua Castellana y Literatura I” se mencionan, en el apartado dedicado al estudio de la lengua, los “principios generales del diccionario en soporte CD-ROM y en las páginas de Internet” (p.46), mientras que en la materia de segundo curso se incluye “La lengua española en Internet. Recursos lingüísticos fundamentales. RAE, Agencias de prensa, medios de comunicación digitales, colecciones de textos, etc. (p.49). En cuanto a la metodología, se requiere el conocimiento por parte del alumno de las técnicas de búsqueda de información empleando “nuevas tecnologías (CD-ROM, bases de datos, Internet, etc.)” (p.46) y se cuentan entre los criterios de evaluación el manejo de recursos informáticos básicos y su aplicación a la búsqueda y elaboración de información. El presente trabajo1 tiene como objetivo presentar, en primer lugar, algunos de los recursos lingüísticos en español que pueden encontrarse tanto en CD-ROM como en Internet, centrándose principalmente en los diccionarios y en los corpus textuales y orales. En segundo lugar, se exponen sucintamente otros recursos y materiales para el estudio de la lengua española disponibles en la red, así como algunos foros de discusión y listas de difusión de información que pueden ser útiles al profesor. 1 Este trabajo se basa en las sesiones “La enseñanza de la lengua española y las nuevas tecnologías” y “Recursos lingüísticos escritos y orales” del Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores”, dirigido por el Dr. J.M. Blecua y celebrado en la Universidad Internacional Menéndez Pelayo en Santander en septiembre de 2001. Ambas presentaciones completas, así como una bibliografía detallada y enlaces a diversos recursos se encuentran en: http://liceu.uab.es/~joaquim/teaching/Applied_linguistics/UIMP_01/UIMP _Santander_01.html Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 1 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf 2.- Recursos lingüísticos básicos: diccionarios y corpus Los diccionarios y los corpus constituyen recursos esenciales para el estudio de la lengua. Si la función de los primeros es bien conocida por los profesionales de la enseñanza, el papel de un corpus – es decir, de una colección estructurada de textos, sean escritos u orales – en la descripción lingüística y en la exploración de los diversos usos de la lengua no siempre ha sido tenido en cuenta, especialmente desde la perspectiva de los planteamientos teóricos más orientados hacia la introspección. Por ello, tras una breve revisión de los diccionarios de español disponibles en CD-ROM y en Internet, se presentarán en este apartado algunos corpus, tanto textuales como orales, que el profesor o el estudiante pueden utilizar provechosamente para ampliar sus conocimientos a partir de datos reales. 2.1.- Diccionarios en soporte electrónico Una primera constatación importante sobre los diccionarios en formato electrónico es que, al menos en el caso de las obras lexicográficas fundamentales, su contenido coincide con las respectivas versiones en papel. Las ventajas de utilizar los diccionarios en formato electrónico residen sobre todo en la flexibilidad en la búsqueda de información, que se manifiesta, por ejemplo, en la posibilidad de localizar elementos dentro de las definiciones, algo prácticamente imposible de realizar en las obras impresas. Por otra parte, Internet ofrece, como veremos, la facilidad de acceso a repertorios léxicos que difícilmente se encuentran en otros medios y la nada desdeñable posibilidad de la consulta a obras de las que puede no disponerse en un momento dado. 2.1.1.- DICCIONARIOS EN CD-ROM Tal como indicábamos anteriormente, muchas de las obras lexicográficas de referencia del español se encuentran en CD-ROM, con alguna notable excepción como es el caso de los diccionarios de Casares y de Seco. Encontramos versiones en este soporte del diccionario de la Real Academia Española y del de María Moliner, así como el Diccionario General de la Lengua Española de Vox, el Gran Diccionario de la Lengua Española de Larousse, y el Diccionario de uso del español actual (Clave) de la Editorial SM. Recientemente, siguiendo con la línea iniciada en su momento por el Bookshelf en español de Microsoft, que reunía en un único CD-ROM varias obras de consulta entre las que figuraban el diccionario general de la lengua de Vox y el de sinónimos y antónimos de Espasa, han aparecido compilaciones como la Biblioteca Multimedia Santillana, que incluye el Nuevo Diccionario Esencial de la Lengua Española y un Diccionario de Dificultades de la Lengua Española, o el volumen E-diccion@rios Espasa, en el que se encuentran nueve diccionarios, entre ellos uno general de la lengua y otro de sinónimos y antónimos, acompañados de diccionarios de argot, de citas, de dichos y frases hechas, de refranes y de un diccionario etimológico. Existen también en CD-ROM diccionarios de sinónimos como el de Ediciones Nauta o el Diccionario interactivo Océano de sinónimos editado por Océano Multimedia, además de los incluidos en otras obras. Igualmente puede encontrarse en este formato el Multidiccionario Everest de la lengua española, en el que se recoge, además, información de tipo enciclopédico. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 2 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Desde la perspectiva que ahora nos concierne, es interesante mencionar la edición electrónica de, al menos, tres diccionarios para estudiantes: el Diccionario del estudiante de la lengua española de Larousse, especialmente creado para los alumnos de la ESO, la versión en CD-ROM del Diccionario escolar de la lengua española de E. Fontanilla y M.I. Riesco, publicada por Vicens Vives, y el Diccionario escolar de la lengua española de la editorial Everest. Finalmente, aunque se aparte un tanto del tipo de materiales que estamos describiendo, cabe citar el Nuevo Tesoro Lexicográfico de la Lengua Española, publicado por Espasa en DVD-ROM, en el que se han recopilado en versión facsímil – es decir, con las imágenes digitalizadas de las páginas - sesenta y seis diccionarios de la lengua española, desde el de Nebrija hasta la última edición del DRAE. El DVD incorpora un sistema que permite visualizar la página correspondiente a la entrada buscada en las ediciones de los diccionarios previamente seleccionadas. Decíamos también al comienzo que el principal interés de los diccionarios en CD-ROM reside en la flexibilidad en la búsqueda de información. Puesto que, por razones de espacio, no es posible describir detalladamente cada una de las obras disponibles en el mercado editorial, ejemplificaremos brevemente las posibilidades de un diccionario en en CD-ROM tomando como referencia la segunda edición electrónica del Diccionario de Uso del Español (DUE) de María Moliner. El primer tipo de búsqueda que puede realizarse es, obviamente, la de una entrada del diccionario para consultar la definición. Tal como se ve en la figura 1, en el panel superior de la columna de la izquierda aparece la lista de entradas ordenada alfabéticamente, mientras que en el inferior se muestra la estructura de la entrada; a la derecha, se encuentra la definición de la palabra con todas sus acepciones. Figura 1: Ejemplo de búsqueda de la definición de una palabra en la segunda edición electrónica del Diccionario de Uso del Español de María Moliner. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 3 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Desde cualquier palabra presente en la definición y que esté incluida en el diccionario puede accederse, a través de un menú contextual que aparece al pulsar el botón derecho del ratón – recordemos que el DUE en CD-ROM existe, por el momento, únicamente para el sistema operativo Windows -, a la definición de otra, de modo que el diccionario se convierte en un completo sistema hipertextual. También en el interior de una entrada es posible realizar búsquedas, tal como se observa en la figura 2. En este caso, aparecen señaladas las apariciones de “derecha”, el término buscado, dentro de la entrada “mano”. Figura 2: Ejemplo de búsqueda en el interior de la definición de una palabra en la segunda edición electrónica del Diccionario de Uso del Español de María Moliner. Sin embargo, como ya hemos señalado, una de las posibilidades más interesantes de los diccionarios en CD-ROM es la localización de información en el interior de las definiciones. La figura 3 recoge parcialmente el resultado de este tipo de búsqueda en el caso de la palabra “mano”. En la columna de la izquierda encontramos todas las palabras en cuya definición aparece “mano”, mientras que en la de la derecha podemos ver señalada la palabra buscada en el interior de la definición de la preposición “a”. Como el resultado puede ser muy amplio, el DUE incluye diferentes criterios de selección, con el fin de efectuar la búsqueda únicamente en determinadas partes de la entrada, como pueden ser los ejemplos, los sinónimos y las variantes, las notas de uso, etc. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 4 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Figura 3: Ejemplo de búsqueda en las definiciones y de los criterios de selección en la segunda edición electrónica del Diccionario de Uso del Español de María Moliner. Las mayores posibilidades de encontrar información muy específica la ofrecen las llamadas “búsquedas avanzadas”, que permiten combinar distintos criterios. En el caso del DUE, como se muestra en la figura 4, es posible seleccionar entradas que contengan determinados nombres científicos, buscar lemas que incluyan expresiones pluriverbales, restringir la búsqueda a palabras que presenten una determinada marca relativa a la etimología, la zona geográfica en la que se usa la palabra, la especialidad, la categoría gramatical o el registro, buscar palabras que empiecen o terminen con una determinada secuencia de letras o que contengan esta secuencia, e incluso palabras que sean formas flexionadas de otras. Este tipo de búsquedas puede combinarse con las denominadas “búsquedas complejas”, que permiten incorporar operadores lógicos como “y”, “o”, “no”, así como combinaciones entre ellos. En la figura 4 se reproduce el cuadro de diálogo que se usaría para encontrar palabras que simultáneamente tengan la marca de registro “informal”, sean “nombres” y contengan “España” como marca de uso geográfico. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 5 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Figura 4: Cuadro de diálogo de búsquedas avanzadas y de búsquedas complejas en la segunda edición electrónica del Diccionario de Uso del Español de María Moliner. Otra posibilidad interesante es el empleo de “comodines”, símbolos especiales que substituyen a cualquier letra o a una serie de letras. Escribiendo, por ejemplo, “p?t?c?” pueden hallarse todas las palabras que contienen “p”, “t” y “c” con una letra intercalada entre cada consonante, como “petaca”; en cambio, la búsqueda de “*oide” daría como resultado todas las palabras que acaban en “-oide”. Podríamos combinar esta búsqueda con las posibilidades mencionadas anteriormente y obtener, por ejemplo, todas las entradas que simultáneamente acaban en “-oide”, son adjetivos y tienen la marca de registro “informal”, con los resultados que se observan en la figura 5. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 6 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Figura 5: Resultado de la búsqueda de adjetivos acabados en “-oide” y con la marca de registro “informal” en la segunda edición electrónica del Diccionario de Uso del Español de María Moliner. Es claro que un diccionario en papel no permite, en la práctica, obtener la información que nos proporciona un diccionario en CD-ROM. Sin embargo, debe tenerse en cuenta que si, como sucede a menudo, la edición electrónica reproduce fielmente la impresa, accederemos siempre a datos procedentes de la misma fuente; es decir, que en el caso de la búsqueda que ejemplificábamos más arriba, sólo hallaremos las palabras que en el DUE contengan explícitamente las marcas “adjetivo” e “informal”, y no ninguna otra. En el campo de la enseñanza del español se han publicado algunas experiencias sobre el uso de diccionarios en CD-ROM que, aun estando principalmente orientadas a la enseñanza a extranjeros, pueden proporcionar ideas útiles para la clase de lengua materna (Capanaga, 1998; Carbó, 2001). Una relación de las obras lexicográficas disponibles en CD-ROM se encuentra en las páginas dedicadas a la enseñanza de la lengua en Secundaria de E. Larequi, y una reseña de algunas de ellas se presenta en Pajares (1998). 2.1.2. DICCIONARIOS EN INTERNET Si el diccionario en CD-ROM tiene como principal ventaja la flexibilidad en la localización de información, seguramente el diccionario en Internet debe caracterizarse, en primer lugar, por su accesibilidad. Torruella (2002) lleva a cabo un análisis de las principales características de los diccionarios en línea, entre las que destacaríamos, además, la facilidad de manejo, el carácter hipertextual, la posibilidad de consultar simultáneamente más de un diccionario y, cuando así lo programan los responsables de la obra, la actualización permanente. No es tarea fácil realizar una presentación exhaustiva de los diccionarios de español que se encuentran en la Red, precisamente debido al carácter dinámico de la misma. Nos centraremos, por ello, en las obras lexicográficas en línea puestas a disposición del Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 7 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf público por instituciones oficiales y por editoriales, y dejaremos de lado los numerosos diccionarios bilingües o multilingües, así como los glosarios especializados. El lector interesado en encontrar información sobre este tipo de obras puede consultar páginas especializadas como YourDictionary.com, ForeignWord.com, One Look Dictionaries o reseñas como la de Bullón (2001). Dos son quizás los diccionarios generales de la lengua más frecuentemente consultados en Internet: el de la Real Academia Española y el Diccionario General de la Lengua Española de Vox. El acceso al primero, en su vigésima segunda edición, puede realizarse desde la página de la RAE; desde esta misma dirección se ofrece también la posibilidad de añadir un práctico sistema de búsqueda directa a la barra de favoritos del navegador. En la figura 6 se muestra la ventana de búsqueda y las primeras líneas de la entrada correspondiente a la palabra “mano”. Es interesante destacar que situando el ratón sobre una abreviatura o una marca puede leerse su significado, y que desde el texto de una entrada es posible también consultar palabras relacionadas con ella. Figura 6: Ventana de búsqueda y primeras líneas de la entrada correspondiente a “mano” en el Diccionario de la Real Academia Española en línea. El diccionario Vox es accesible tanto desde las páginas de la propia editorial como desde un sitio específicamente dedicado a la consulta de diccionarios, en el que también es posible consultar el Diccionario de Sinónimos y Antónimos de la Lengua Española y los diccionarios bilingües de inglés, francés y catalán publicados por Vox. Registrándose gratuitamente como usuario se pueden realizar búsquedas más complejas, especificando por ejemplo las letras en las que empieza o termina una palabra, y acceder Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 8 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf también a las numerosas relaciones hipertextuales establecidas en el diccionario, así como introducir formas verbales flexionadas para obtener el lema correspondiente. En la Figura 7 se muestra la pantalla inicial de búsqueda de diccionarios.com. Figura 7: Pantalla inicial de búsqueda en los diccionarios Vox en línea. Existen, como indicábamos, otras obras lexicográficas en red. Los diccionarios de la RAE reunidos en el Tesoro Lexicográfico de la Lengua Española anteriormente comentado están también disponibles en Internet, y el Departamento de Español Urgente (DEU) de la Agencia EFE ofrece en línea su Vademécum del Español Urgente. Debe mencionarse también el exhaustivo sitio dedicado a diccionarios de variantes del español elaborado por J.R. Morala en la Universidad de León. Referencias sobre otros diccionarios se encuentran en el citado trabajo de Torruella (2002), en Gelpí (1999) o en índices especializados en lengua española como El Oteador del Centro Virtual Cervantes (CVC). Aunque no se trate propiamente de un diccionario convencional, podemos consultar actualmente en Internet de una versión española de WordNet – accesible desde las páginas de demostraciones del Centre de Lingüística i Computació (CLiC) de la Universidad de Barcelona y del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP) de la Universidad Politécnica de Cataluña -, un recurso léxico concebido como una red semántica en el que las palabras se ordenan y clasifican por su significado. Por ejemplo, la figura 8 muestran los hipónimos de “coche” que aparecen en WordNet, mientras que en la figura 9 se recogen sus hiperónimos y en la 10 los merónimos de “coche” que corresponden a la relación “partes de”. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 9 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Fig. 8: Hipónimos de “coche” recogidos en la versión castellana de WordNet accesible desde las páginas del Centre de Llenguatge i Computació (CLiC) de la Universidad de Barcelona. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 10 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Fig. 9: Hiperónimos de “coche” recogidos en la versión castellana de WordNet accesible desde las páginas del Centre de Llenguatge i Computació (CLiC) de la Universidad de Barcelona. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 11 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Fig. 10: Merónimos (“partes de”) de “coche” recogidos en la versión castellana de WordNet accesible desde las páginas del Centre de Llenguatge i Computació (CLiC) de la Universidad de Barcelona. 2.2.- Corpus textuales y corpus orales Junto con los diccionarios, los corpus constituyen un recurso básico para el estudio de la lengua. Los hemos definido ya como colecciones estructuradas de textos, que pueden Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 12 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf proceder de la lengua escrita o de transcripciones de la lengua hablada. En este último caso, también deberían formar parte del corpus las grabaciones realizadas por los investigadores que lo han recogido, ya que así es posible acceder a información que, de otro modo, no se refleja adecuadamente en una representación ortográfica. El estudio de la lengua mediante corpus y las técnicas para su recopilación y explotación constituyen hoy en día una rama muy activa de las ciencias del lenguaje, denominada “Lingüística de corpus”. Aunque no es posible realizar aquí una presentación detallada de la disciplina – remitimos al lector interesado a trabajos como los de Biber et al. (1998), Garside et al. (1997), Habert et al. (1997), Kennedy (1998), McEnery y Wilson (1996), Rafel – Soler (2001) o Stubbs (1996) -, mencionaremos que en el proceso de diseño de un corpus suelen tenerse en cuenta elementos como la finalidad del corpus, sus límites temporales, geográficos o lingüísticos, la proporción de los diversos tipos de textos que se incorporan, el tamaño de la muestra de cada tipo de texto y, como consecuencia de todos estos criterios, el grado de representatividad del corpus (Torruella – Llisterri 1999; Moreno, 1999). Un segundo aspecto importante es el procedimiento de recogida de los materiales, ya sean textos procedentes de Internet o escaneados de fuentes impresas y procesados con un sistema de reconocimiento óptico de caracteres (OCR) para convertirlos en documentos en formato textual. Si se trata de un corpus oral, es preciso realizar también una transcripción ortográfica de las grabaciones realizadas, estableciendo para ello una serie de convenciones, de modo que el corpus final sea coherente. En tercer lugar, un corpus verdaderamente útil para la investigación contiene lo que se denomina una “anotación”, o un conjunto de “etiquetas” relacionadas con el texto. Esta anotación puede realizarse en todos los niveles del análisis lingüístico, y generalmente se centra en el léxico, asignando a cada palabra un conjunto de códigos que describen sus propiedades morfológicas – género, número, modo, tiempo, etc. – e indican a qué parte de la oración pertenece. También es posible realizar una anotación sintáctica, indicando los constituyentes de una oración y la función de cada uno. Existen herramientas que permiten llevar a cabo de forma automática este tipo de anotaciones, aunque se requiere, en última instancia, la revisión final por parte de un lingüista. En la figuras 11 y 12 se muestran los resultados de la anotación morfológica y sintáctica automáticas de una frase simple, obtenidas mediante las herramientas disponibles en las páginas del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP) de la Universidad Politécnica de Cataluña. Puede observarse en la figura 11 que un paso previo es la llamada “lematización”, es decir, la búsqueda de la palabra en su forma básica: “gato” es el lema de “gatos” y “comer” el de “comen”; también se aprecia aquí que la información morfológica está codificada: así, por ejemplo, “NCMP” corresponde a “nombre común masculino plural”. Utilizando recursos como WordNet, mencionado anteriormente, es factible llevar a cabo la anotación semántica de un corpus. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 13 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Figura 11: Anotación morfológica automática de la frase “Los gatos sabios comen atunes frescos” obtenida el línea con las herramientas del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP) de la Universidad Politécnica de Cataluña. Figura 12: Anotación sintáctica automática de la frase “Los gatos sabios comen pescados frescos” obtenida en línea con las herramientas del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP) de la Universidad Politécnica de Cataluña. En el caso específico de los corpus consistentes en transcripciones de lengua hablada (Leech et al., 1995; Pino – Sánchez, 1999), se emplean sistemas de anotación especialmente pensados para reflejar los fenómenos propios del discurso oral o de la conversación (Payrató, 1995); en otras ocasiones, las grabaciones originales se transcriben fonéticamente tanto en el nivel segmental como en el suprasegmental, recurriendo para ello a herramientas informáticas que permiten visualizar la onda sonora y relacionarla con la transcripción (Llisterri, 1999). Finalmente, a la hora de plantearse la creación de un corpus, es preciso no olvidar la selección de las herramientas informáticas y de los formatos más adecuados para Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 14 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf almacenar los materiales y poder después recuperar fácilmente la información. Consorcios internacionales como la Text Encoding Initiative (TEI) han definido con todo detalle estos aspectos, proponiendo, por ejemplo, el uso del lenguaje SGML (Standard Generalized Mark-up Language) – del que deriva el HTML en el que se escriben las páginas web – para introducir en los textos las marcas que definen su estructura (Arrarte, 1999); por ejemplo, corpus como el Corpus de Referencia del Español Actual de la Real Academia española están codificados utilizando este lenguaje. 2.2.1.- CORPUS EN CD-ROM No son especialmente abundantes los corpus sincrónicos en español fácilmente accesibles en CD-ROM y concebidos inicialmente del modo en que hemos definido un corpus. Podríamos citar, por ejemplo, el Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico (MC-NLCH) que distribuye la Universidad de Las Palmas de Gran Canaria. El MC-NLCH ofrece la transcripción ortográfica de ochenta y cuatro horas de grabación, en las que se recogen entrevistas realizadas en nueve capitales americanas y tres ciudades españolas; para cada ciudad se incluyen catorce entrevistas individuales de aproximadamente media hora, cuyas transcripciones se encuentran en documentos de Word, con y sin codificación estructural. Existe también el corpus CUMBRE (Sánchez et al., 1995), una versión reducida del cual se ofrece gratuitamente en CD-ROM a los compradores del Gran Diccionario de Uso del Español Actual de la editorial SGEL. Puede mencionarse también en este apartado una base de datos léxica, LEXESP, editada en CD-ROM por la Universidad de Barcelona (Sebastián et al., 2000) y basada en el corpus del mismo nombre, que permite búsquedas de apariciones de palabras y de categorías de palabras en contexto. No debe olvidarse, sin embargo, que cualquier CD-ROM con textos puede constituir un corpus de datos para el estudio de la lengua. En este sentido, los anuarios de los periódicos, que suelen encontrarse en este formato como en el caso de El País en CDROM, son una excelente herramienta. 2.2.2.- CORPUS EN INTERNET Algunos corpus en español pueden obtenerse a través de Internet para trabajar con ellos en los propios ordenadores personales – el Corpus Oral de Referencia del Español Contemporáneo, el Corpus de Referencia de la Lengua Española en Argentina y el Corpus de Referencia de la Lengua Española en Chile del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid, o parte del corpus LEXESP accesible desde la Universidad de Oviedo -, mientras que otros pueden únicamente consultarse. Entre los segundos, se encuentran, por ejemplo, los corpus LEXESP y Pirápides del Centre de Lingüística i Computació (CliC) de la Universidad de Barcelona. Centraremos nuestra atención, a modo de ejemplo, en el Corpus de Referencia del Español Actual (CREA) de la Real Academia Española, accesible desde las páginas en Internet de esta entidad. La consulta del CREA se realiza, al igual que en los diccionarios, a través de una ventana como la que se muestra en la figura 13. En ella puede seleccionarse, además, el Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 15 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf autor de los textos en los que se buscará la palabra, la obra, el medio, el país de procedencia de las obras y los temas, así como también es posible delimitar la búsqueda a un determinado período en el tiempo. Figura 13: Ventana de consulta del CREA (Corpus de Referencia del Español Actual) de la Real Academia Española. La primera información que se obtiene es una estadística de la aparición de la palabra buscada en el corpus. En la figura 14 se reproducen los resultados para la forma verbal “hubiere”: en la primera columna se ordena su frecuencia de aparición por años, en la segunda por países y en la tercera por campos temáticos. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 16 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Figura 14: Estadística de la aparición de la forma verbal “hubiere” en el CREA (Corpus de Referencia del Español Actual) de la Real Academia Española. A continuación se podría solicitar un lista de todos los documentos en lo que aparece la palabra buscada, ordenados en función de los criterios de selección utilizados al principio, con el resultado que se recoge parcialmente en la figura 15. Figura 15: Listado parcial de documentos en los que aparece la forma verbal “hubiere” en el CREA (Corpus de Referencia del Español Actual) de la Real Academia Española. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 17 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf El último paso (figura 16) sería la consulta de los párrafos que contienen la palabra objeto de interés, ordenándolos, como en los casos anteriores, en función del año, del autor, de los países de procedencia de los textos o de los temas. Figura 16: Muestra de un párrafo en el que aparece la forma verbal “hubiere” en el CREA (Corpus de Referencia del Español Actual) de la Real Academia Española. Se hallan también en la red otros materiales más específicos, como la Base de Datos Sintácticos del Español Actual (BDS) de la Universidad de Santiago de Compostela, centrada en los aspectos sintácticos de la estructura de la oración, o los resultados del proyecto Varilex, un estudio sobre la variación léxica en los países hispanohablantes, coordinado por la Universidad de Tokio, que han sido adaptados para su consulta en la red por la empresa ecuatoriana Signum. Igualmente cabe destacar el Archivo Gramatical de Salvador Fernández Ramírez (AGLE), accesible desde el Centro Virtual Cervantes; en el Archivo, realizado bajo la dirección científica de I. Bosque, se encuentran los ejemplos reunidos por Fernández Ramírez adecuadamente clasificados y comentados. Al margen de los materiales específicamente considerados como tal, la red constituye en sí misma un enorme corpus. Los medios de comunicación, por ejemplo, proporcionan un valiosísimo recurso para el estudio del uso lingüístico y pueden constituir la base de un corpus de trabajo (Vera, 1998; Garrido, 2002). Con herramientas de trabajo sencillas como un navegador y un procesador de texto, y utilizando las opciones de “copiar” y “pegar” es factible construir un corpus para uso personal, cuyo tamaño dependerá del tiempo utilizado en localizar y seleccionar los materiales y en dar un formato final adecuado a los archivos de texto, homogeneizando el tipo de letra, el tamaño, los márgenes, etc. Otra alternativa es el empleo de los programas que permiten la descarga de sitios web; sin embargo, los documentos se guardan en este caso con todas las marcas de HTLM – que son necesarias para visualizarlos en un navegador, pero no para Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 18 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf trabajar con ellos con un procesador de textos – y, por otra parte, los portales de los periódicos presentan una complejidad de diseño que no siempre hace factible esta alternativa si no se cuenta con los conocimientos adecuados. Tampoco debe olvidarse la cuestión de los derechos de propiedad intelectual, por lo que antes de iniciar un proyecto de recopilación de corpus a gran escala es conveniente asesorarse sobre este aspecto. Un corpus oral puede crearse a partir de las numerosas radios que emiten en Internet o que mantienen archivos sonoros de sus programas. Muchas de ellas no organizan sus fonotecas de modo que los documentos sonoros puedan guardarse en el propio ordenador personal – sí lo hace, por ejemplo, Radio InterEconomía -, pero siempre existe la alternativa de conectar mediante un cable la salida de sonido del ordenador a la entrada de una grabadora de casetes y posteriormente digitalizar los fragmentos que interesen de las cintas. Utilizando buscadores es posible localizar documentos sonoros que pueden descargarse, como por ejemplo algunas conferencias o entrevistas a Vázquez Montalbán desde la página de vespino.net, fragmentos de “La rosa de los vientos”, recopilados en el portal dedicado a este programa radiofónico de Onda Cero o programas de radio relacionados con Rayados, el equipo de fútbol de la ciudad de Monterrey en México. 2.2.3.- HERRAMIENTAS PARA EL TRATAMIENTO DE CORPUS Una vez recogidos y organizados los textos que constituirán un corpus, es útil conocer algunas herramientas informáticas que ayudan a obtener de él un mejor provecho. Las más difundidas son los programas que se denominan a veces “concordancieros”, justamente porque permiten obtener concordancias, es decir, listados de palabras en contexto, que pueden ordenarse según la palabra que precede o sigue a la que nos interesa, de modo que se puedan estudiar de un modo sistemático los entornos en los que aparece en el corpus. Estos mismos programas facilitan también la creación de listados de todas las palabras del corpus por orden alfabético directo e inverso o, lo que es más interesante, en función de su frecuencia de aparición. Recogen información útil para el análisis de textos utilizando este tipo de herramientas manuales como Barnbrook (1996) y Hockey (2001) o trabajos más específicos como Sassi (1999), en el que se presenta el programa de concordancias DBT del Instituto de Lingüística Computacional de Pisa, incluido en el CD-ROM que acompaña la edición del Quijote del Instituto Cervantes publicada por Crítica. Dos de los programas de concordancias más conocidos son WordSmith, comercializado por Oxford University Press, y MonoConc, distribuido por Athelstan, del que existe una versión básica gratuita para Macintosh (Reppen, 2001). Desde las páginas del Summer Institute of Linguistics (SIL) y de la lista Linguist se puede acceder a otras herramientas para el tratamiento de corpus y el análisis textual, algunas de ellas de libre distribución. Las figuras 17 y 18 reproducen las concordancias de la palabra “bueno” en una de las entrevistas correspondientes a la ciudad de Sevilla del Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico anteriormente mencionado, obtenidas mediante la versión gratuita de MonoConc. El listado contiene todas las apariciones de “bueno”, en la figura 18 ordenadas según la primera palabra que aparece a la derecha y en la figura 17 según la primera palabra que aparece a la Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 19 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf izquierda; es habitual también disponer de la posibilidad de ordenar la palabra buscada según la penúltima o antepenúltima palabra que tiene en su contexto derecho o izquierdo. Fig. 17 Concordancias de la palabra “bueno” ordenadas según la primera palabra que aparece a la derecha en una entrevista del Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico obtenidas con el programa MonoConc (versión gratuita para Macintosh). Fig. 18 Concordancias de la palabra “bueno” ordenadas según la primera palabra que aparece a la izquierda en una entrevista del Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico obtenidas con el programa MonoConc (versión gratuita para Macintosh). La información sobre los contextos de aparición más frecuentes de la palabra buscada se sintetiza en las llamadas “colocaciones”, tal como se muestra en la figura 19. En ellas se observa cuáles son las palabras que más frecuentemente preceden y anteceden a “bueno”, de lo que pueden deducirse algunas especificidades de uso de este conector en la lengua oral. Debe aclararse aquí que “Enc” es la abreviatura usada en el corpus para referirse a las intervenciones del encuestador; tal como puede verse, es frecuente que éste inicie sus preguntas con “bueno”; la elevada aparición de secuencias “Sí, bueno” es también propia de las preguntas y de las respuestas en este tipo de corpus. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 20 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Fig. 19 Colocaciones de la palabra “bueno” en una entrevista del Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico obtenidas con el programa MonoConc (versión gratuita para Macintosh). Podrían, por ejemplo, compararse estos datos con los de la palabra “bien”, que se muestran en la figura 20, y con ello se observarían las diferencias y las similitudes de comportamiento entre ambos conectores. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 21 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Fig. 20 Colocaciones de la palabra “bien” en una entrevista del Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico obtenidas con el programa MonoConc (versión gratuita para Macintosh). Es también posible acceder a concordancias y colocaciones desde la web. Las páginas de consulta del CREA de la Real Academia Española ofrecen esta información, tal como se muestra, para la forma verbal “hubiere”, en las figuras 21 y 22. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 22 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Figura 21: Muestra de concordancias de la forma verbal “hubiere” en el CREA (Corpus de Referencia del Español Actual) de la Real Academia Española. Figura 22: Muestra de colocaciones – o agrupaciones - de la forma verbal “hubiere” en el CREA (Corpus de Referencia del Español Actual) de la Real Academia Española. También desde las páginas de la Universidad de Göteborg se accede a concordancias en español, basadas en dos corpus creados por D. Mighetto (SOL – Spanish On Line) y en el Corpus Oral de Referencia del Español Contemporáneo de la Universidad Autónoma de Madrid; en este caso, puede seleccionarse el corpus sobre el que se efectúan las búsquedas, el tamaño del contexto y la preponderancia del contexto a la izquierda o a la derecha. Parece evidente que este tipo de herramientas asociadas a corpus textuales representativos constituyen un poderoso método de investigación, así como un recurso didáctico útil en la enseñanza de la lengua. Existe una abundante bibliografía sobre el uso de recursos lingüísticos y programas de concordancias en el contexto docente (Battaner – López (Eds.), 2000; Aston (Ed.), 2001; Tribble – Barlow (Eds.), 2001) y páginas monográficas en la web como la de T. Johns de la Universidad de Birmingham. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 23 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Aunque se centren predominantemente en la enseñanza del inglés como lengua extranjera (Ghadessy, et al., 2001; McCullough, 2001) y, en algún caso, en el español, también desde la perspectiva de su enseñanza a extranjeros (Córdoba, 2001), las ideas que allí se exponen son, en muchas ocasiones, relativamente fáciles de adaptar a la enseñanza del español como primera lengua, campo en el que empiezan a aparecer trabajos como el de Martín (2001) sobre el uso de corpus en línea. 3.- Otros recursos en Internet Concluiremos este trabajo comentando sucintamente otros recursos relevantes para el estudio de la lengua española que pueden consultarse en Internet, refiriéndonos también a listas de difusión de información y a foros de discusión a los que puede acceder el profesor. Debemos señalar también aquí que, además de las páginas generales sobre la lengua española como las del Centro Virtual Cervantes o La Página del Idioma Español del periodista R. Soca, las dedicadas a la enseñanza del español como lengua extranjera constituyen también una interesante fuente de recursos (Arrarte – Sánchez de Villapadierna, 2001; Cruz, 2001 a, b). 3.1.- Materiales sobre lingüística y lengua españolas Evidentemente, dadas las características de la red, es del todo imposible presentar un listado completo de los materiales que por ella circulan sobre lingüística y lengua españolas. Por otra parte, cualquier lista de direcciones de páginas que proporcionáramos quedaría pronto inevitablemente obsoleta. Por ello, nos limitaremos a mencionar los tipos de recursos que nos parecen más útiles y a proporcionar algún ejemplo de cada uno de ellos. En Internet podemos emplear correctores ortográficos que permiten introducir una palabra o una frase y verificar su ortografía, como el que ofrece desde sus páginas la empresa Signum, que también facilita un silabificador, un guionizador y el denominado “motor de semejanza fonética”, que busca palabras con una pronunciación similar a la de la introducida en su forma ortográfica convencional. Pueden hallarse también páginas que proporcionan la conjugación de verbos, por ejemplo en el sitio de la Real Academia Española, en el de Signum, en las páginas del Grupo de Estructura de Datos y Lingüística Computacional (GEDLC) de la Universidad de las Palmas de Gran Canaria o en las de Daniel M. Germán, de la Universidad de Waterloo. Igualmente disponemos en Internet de herramientas que permiten obtener lemas a partir de formas flexionadas o flexionar palabras – por ejemplo en las demostraciones del Centre de Llenguatge i Computació (CLiC) de la Universidat de Barcelona o en el sitio revisado.com de la empresa Daedalus -, incluyendo, en algunos casos como en las herramientas desarrolladas por el GEDLC, prefijos y sufijos. También en las secciones dedicadas a demostraciones en los sitios web de CLiC y del Centre de Tecnologia i Aplicacions del Llenguatge i la Parla (TALP) de la Universidad Politécnica de Cataluña pueden utilizarse analizadores sintácticos en línea, con resultados como los que se han mostrado en la figura12. Estas herramientas, aunque no perfectas, tal vez ayuden a los estudiantes - al igual que la consulta de diccionarios y de corpus o el uso de concordancias -, a descubrir de forma Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 24 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf interactiva y en un medio que les es familiar, aspectos ortográficos, morfológicos y sintácticos de la lengua. La red es también rica en información, pues desde ella se accede a publicaciones en línea o a bibliografías que profesores e investigadores difunden por este medio. La consulta de buen un buscador mediante palabras clave ayuda a localizarlas con relativa facilidad. Puede obtenerse igualmente información sobre asociaciones profesionales como la Sociedad Española de Didáctica de la Lengua y la Literatura (SEDLL), la Sociedad Española de Lingüística (SEL) o la Asociación Internacional de Hispanistas (AIH), por citar únicamente algunas. También existen, como es lógico, revistas y colecciones como los Estudios de Lingüística Española (ELiEs), Círculo de Lingüística Aplicada a la Comunicación (CLAC), Tonos Digital, Cuadernos Cervantes de la Lengua Española, Especulo y otras muchas, tanto en España como en Hispanoamérica. Finalmente, en el contexto que ahora nos concierne, no faltan las páginas que ofrecen materiales útiles para la enseñanza de la lengua y la literatura españolas en la ESO y en el Bachillerato como, por ejemplo, las de E. Larequi o de L. Canós. 3.2.- Listas de difusión de información y foros de discusión Otra fuente de información son las listas de distribución y los foros de discusión sobre la lengua española. Entre las primeras, mencionaremos Infoling, coordinada por el Laboratorio de Lingüística Informática (LaLI) de la Universidad Autónoma de Barcelona, que distribuye casi diariamente a través del correo electrónico información sobre lingüística española referente a congresos, novedades editoriales, cursos, proyectos, tesis y ofertas de trabajo. Hispania es una lista dedicada a cuestiones más generales sobre la lengua española, en la que pueden encontrarse, por ejemplo, noticias sobre los artículos dedicados al español en los medios de comunicación, junto con discusiones e información sobre diversas facetas, tanto internas como externas, de la lengua. Apuntes constituye, en cambio, un foro de discusión sobre normativa y uso del español promovido desde 1997 por el Departamento de Español Urgente (DEU) de la Agencia EFE; en él se pueden leer las respuestas a las múltiples consultas realizadas por los participantes, así como debates sobre todos aquellos temas que afectan al uso del español en los medios de comunicación. Finalmente, el Foro del Español de Hoy y Mañana y el Foro del Hispanista recogen en las páginas web del Centro Virtual Cervantes una amplia variedad de informaciones y de consultas en el ámbito de la lengua, la literatura y la filología hispánicas. 4.- Conclusión En este trabajo se ha pretendido mostrar que existen una serie de recursos tanto en CDROM como en Internet que están en la actualidad a disposición de profesores y de alumnos. No todos tienen, seguramente, una aplicación directa e inmediata en el aula pero, en cualquier caso, constituyen herramientas que el profesor puede utilizar bien para su propia investigación, bien para introducir en la clase nuevos métodos y nuevas perspectivas. Las orientaciones ministeriales que citábamos al principio parece que Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 25 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf llevan inevitablemente por este camino. Sin embargo, más allá de la obligación administrativa, creemos que el uso de tecnologías que para los estudiantes no son nuevas a pesar de que los docentes sigamos denominándolas de este modo, no puede sino redundar en una mayor motivación de los alumnos y en una formación más actualizada y más rica de los profesores. 5.- Bibliografía ARRARTE, G. (1999) "Normas y estándares para la codificación de textos y para la ingeniería lingüística”, in BLECUA, J.M.- CLAVERÍA, G.- SÁNCHEZ, C.TORRUELLA, J. (Eds.) Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Seminario de Filología e Informática, Departamento de Filología Española, Universidad Autónoma de Barcelona - Editorial Milenio. pp. 17-44. ARRARTE, G.- SÁNCHEZ DE VILLAPADIERNA, J.I. (2001) Internet y la enseñanza del español. Madrid: Arco/Libros (Cuadernos de Didáctica del Español L/E). ASTON, G. (Ed.) (2001) Learning with corpora. Bologna: CLUEB (Biblioteca della Scuola superiore di linguemoderne per interpreti e traduttori, Forlì, 29) - Houston, TX; Athelstan. BARNBROOK, G. (1996) Language and Computers. A Practical Introduction to the Computer Analysis of Language. Edinburgh: Edinburgh University Press (Edinburgh Textbooks in Empirical Linguistics). BATTANER, M.P.- LÓPEZ, C. (Eds.) (2000) VI Jornada de Corpus Lingüístics. Corpus lingüístics i ensenyament de llengües. Barcelona: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra. BIBER, D.- CONRAD, S.- REPPEN, R. (1998) Corpus Linguistics. Investigating Language Structure and Use. Cambridge: Cambridge University Press (Cambridge Approaches to Linguistics). Biblioteca Multimedia Santillana. Edición en CD-ROM. Madrid: Santillana, 2000. BLECUA PERDICES, J.M. (2001) "Lengua española y tecnologías", Archipiélago 48: 100-197. BLECUA PERDICES, J.M. (2002) “Nuevos lenguajes de la tecnología para el futuro de la educación”, in Ministerio de Educación, Cultura y Deporte. En_clave de Calid@d: la dirección escolar. Madrid: Instituto Superior de Formación del Profesorado. BULLÓN, P. (2001) “Diccionarios online o cómo encontrar (y perder) las palabras”, PC World 178 (julio-agosto): 227-235. CAPANAGA, P. (1998) "Le enciclopedie e i dizionari elettronici in spagnolo: indicazioni didattiche", in ACCIETTO, T.- ZORZI, D. (Eds.) (1998) Nuove tecnologie e didattica delle lingue. Bologna: CLUEB, Cooperativa Libraria Universitaria Editrice Bologna. (Centro Linguistico Interfacoltà, Sezione del Centro di Coordinamento Forlì). pp. 87-94. CARBÓ, C. (2001) "Aplicaciones didácticas de la edición en CD-ROM del DRAE: la búsqueda por anagrama, por palabra al azar, por familia de palabras y con el diccionario inverso", EsEspasa, Revista de Profesores, Metodología. 27 de septiembre de 2001. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 26 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf http://www.esespasa.com/esespasa/sta/html/es/revistaprofeso res/investigacion/metodologiadidactica/historico/metod_01_2 7_09.zip CERVANTES, M. de. Don Quijote de la Mancha. Edición del Instituto Cervantes dirigida por Francisco Rico. Barcelona: Crítica (Biblioteca Clásica, 50), 1998. Clave. Diccionario de uso del español actual. Edición en CD-ROM. Madrid: Ediciones SM, 1997. CÓRDOBA RODRÍGUEZ, F. (2001) "El uso de los corpus lingüísticos en la enseñanza del español", Boletín de la Asociación de Profesores de Español de la República Checa, 2001. http://www.upol.cz/res/ssup/ape/boletin2001/cordoba.htm CRUZ PIÑOL, M. (2001 a) El español a través de Internet. Aprendizaje con un nuevo lenguaje. Tesis doctoral. Secció de Llengua Espanyola, Departament de Filologia Hispànica, Universitat de Barcelona. http://perso.wanadoo.es/mar_cruz/TESIS/BIBLIOGRAF.HTML CRUZ PIÑOL, M. (2001 b) "Recursos en Internet para la elaboración de actividades. Modelos de uso de la lengua española" Carabela 50: 163-176. http://www.ub.es/filhis/culturele/50MCruzP.html Diccionario de sinónimos. Edición en CD-ROM. Barcelona: Ediciones Nauta, 2002. Diccionario del estudiante de la lengua española. Edición en CD-ROM. Madrid: Larousse, 1999. Diccionario escolar de la lengua española. Edición en CD-ROM. Barcelona. VicensVives, 1998. Diccionario escolar de la lengua española. Edición en CD-ROM. León: Everest, 1997. Diccionario General de la Lengua Española Vox. Edición en CD-ROM. Barcelona: Biblograf, 1997. Diccionario interactivo Océano de sinónimos. Edición en CD-ROM. Barcelona: Océano Multimedia, 1999. E-diccion@rios Espasa. Edición en CD-ROM. Madrid: Espasa, 2000. El País en CD-ROM. Madrid: Diario El País SL, 2001. GARRIDO ALMIÑANA, J.M. (2002) “El uso de la prensa electrónica en la investigación lingüística", Filología en Internet. Curso de Doctorado del Departamento de Filología Española, Universitat Autònoma de Barcelona. http://seneca.uab.es/gould/cursoweb/sesiones/Ses4_tot/Princ ipal.html GARSIDE, R.- LEECH, G.- McENERY, T. (Eds.) (1997) Corpus Annotation: Linguistic Information from Computer Text Corpora. Harlow: Addison Wesley Longman. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 27 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf GELPÍ, C. (1999) “Diccionarios del español en Internet”, Biblio 3W. Revista Bigliográfica de Geografía y Ciencias Sociales (Universidad de Barcelona) 189. http://www.ub.es/geocrit/b3w-189.htm GHADESSY, M.- HENRY, A.- ROSEBERRY, R.L. (2001) Small Corpus Studies and ELT. Amsterdam: John Benjamins (Studies in Corpus Linguistics, 5). Gran Diccionario de la Lengua Española. Edición en CD-ROM. Barcelona: Larousse Planeta, 1996. HABERT, B.- NAZARENKO, A.- SALEM, A. (1997) Les linguistiques de corpus. Paris: Armand Colin (U Linguistique). HOCKEY, S. (2001) Electronic Texts in the Humanities. Principles and Practices. Oxford: Oxford University Press. KENNEDY, G. (1998) An Introduction to Corpus Linguistics. London: Longman (Studies in Language and Linguistics). LEECH, G.- MYERS, G.- THOMAS, J. (Eds.) (1995) Spoken English on Computer: Transcription, Markup and Applications. Harlow: Longman. Lengua castellana y literatura I y II. Real Decreto 3474/2000, de 29 de diciembre, por el que se modifican el Real Decreto 1700/1991, de 29 de noviembre, por el que se establece la estructura del Bachillerato, y el Real Decreto 1178/1992, de 2 de octubre, por el que se establecen las enseñanzas mínimas del Bachillerato. Boletín Oficial del Estado, 16 de enero de 2001. http://www.mec.es/gabipren/documentos/realdecreto/bac_lenyl it.pdf LLISTERRI, J. (1999) “Transcripción, etiquetado y codificación de corpus orales", in GÓMEZ GUINOVART, J.- LORENZO SUÁREZ, A.- PÉREZ GUERRA, J.ÁLVAREZ LUGRÍS, A. (Eds.) Panorama de la investigación en lingüística informática. RESLA, Revista Española de Lingüística Aplicada, Volumen monográfico. pp. 53-82. Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico (MC-NLCH). Preparado por José Antonio Samper Padilla, Clara Eugenia Hernández Cabrera y Magnolia Troya Déniz. Edición en CD-ROM. Las Palmas de Gran Canaria: Servicio de Publicaciones de la Universidad de Las Palmas de Gran Canaria, 1998. MARTÍN VEGAS, R.A. (2001) "La recreación y/o actualización de los temas de la literatura clásica en las TIC", in Congreso de la Educación en Internet e Internet en la Educación. Congreso virtual. 27 de noviembre - 12 de diciembre de 2001. Centro Nacional de Información y Comunicación Educativa, Ministerio de Educación, Cultura y Deporte. http://congreso.cnice.mecd.es/area3/documentacion/comunicac iones/html/3comunicacion03.html McCULLOUGH, J.L. (2001) "Los usos de los córpora de textos en la enseñanza de lenguas", in TRENCHS, M. (Ed.) Nuevas tecnologías para el autoaprendizaje y la didáctica de lenguas. Lleida: Milenio. pp. 125-140. Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 28 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf McENERY, T.- WILSON, A. (1996) Corpus Linguistics. Edinburgh: Edinburgh University Press (Edinburgh Textbooks in Empirical Linguistics) http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/contents .htm Microsoft Bookshelf en español. Edición en Cd-ROM. Microsoft,1997. MIGHETTO, D. (1998) “Notas sobre lingüística de corpus y técnicas de información por Internet”, in DELBECQUE, N.- DE PAEPE, C. (Eds.) Estudios en honor del profesor Josse de Kock. Leuven: Leuven University Press (Symbolae, Facultatis Litterarum Lovaniensie, Series A, Vol. 25). pp. 383-393. MOLINER, M. Diccionario de uso del español. Edición en CD-ROM. Segunda Edición. Versión 2.0. Madrid: Gredos, 2001. MORENO FERNÁNDEZ, F. (1999) "La formación de corpus-corpora de lengua hablada", in DE LAS CUEVAS, J.- FASLA, D. (Eds.) Contribuciones al estudio de la lingüística aplicada. Castellón: Asociación Española de Lingüística Aplicada. pp. 447464. Multidiccionario Everest de la lengua española. Edición en CD-ROM. León: Everest, 1996. PAJARES TOSCA, S. (1998) "Diccionarios de discurso en soporte digital", Cuadernos Cervantes 20: 81-85. PAYRATÓ, Ll. (1995) "Transcripción del discurso coloquial", in CORTÉS RODRÍGUEZ, L. (Ed.) El español coloquial. Actas del I Simposio sobre Análisis del Discurso Oral. Almería, 23-25 de noviembre de 1994. Almería: Universidad de Almería, Servicio de Publicaciones. pp. 43-70. PINO MORENO, M.- SÁNCHEZ SÁNCHEZ, M. (1999) "El subcorpus oral del banco de datos CREA-CORDE (Real Academia Española): Procedimientos de transcripción y codificación", Oralia 2: 83-138. RAFEL i FONTANALS, J.- SOLER i BOU, J. (2001) “El processament de corpus. La lingüística empírica", in MARTÍ, M.A. (Coord.) Les tecnologies del llenguatge. Barcelona: Edicions de la Universitat Oberta de Catalunya (Manuals, 53). pp. 27-59. REAL ACADEMIA ESPAÑOLA Diccionario de la lengua española. Edición en CDROM. Madrid: Espasa – Calpe, 1995. REAL ACADEMIA ESPAÑOLA Nuevo Tesoro Lexicográfico de la Lengua Española. Edición en DVD-ROM. Madrid: Espasa, 2001. REPPEN, R. (2001) "Review of MonoConc Pro and WordSmith Tools", Language Learning and Technology 5, 3: 32-36. http://llt.msu.edu/vol5num3/review4/default.html SÁNCHEZ, A. - SARMIENTO, R.- CANTOS, P.- SIMÓN, J. (1995) Cumbre. Corpus lingüístico del español contemporáneo. Fundamentos, metodología y aplicaciones. Madrid: SGEL. SASSI, M. (1999) "Concordancias para filólogos: en pos de la simplicidad”, in BLECUA, J.M.- CLAVERÍA, G.- SÁNCHEZ, C.- TORRUELLA, J. (Eds.) Filología e Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 29 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Seminario de Filología e Informática, Departamento de Filología Española, Universidad Autónoma de Barcelona - Editorial Milenio. pp. 165-182. SEBASTIÁN GALLÉS, N.- CUETOS VEGA, F.- MARTÍ ANTONIN, M.A.CARREIRAS VALIÑA, M.F. (2000) LEXESP: Léxico informatizado del español. Edición en CD-ROM. Barcelona: Edicions de la Universitat de Barcelona (Col.lecions Vàries, 14). STUBBS, M. (1996) Text and Corpus Analysis. Computer Assisted Studies of Language and Culture. Oxford: Basil Blackwell (Language in Society). TORRUELLA, J. (2002) "Los diccionarios en la Red", Filología en Internet. Curso de Doctorado del Departamento de Filología Española, Universitat Autònoma de Barcelona. http://seneca.uab.es/gould/cursoweb/sesiones/Ses2_M3.htm TORRUELLA, J.- LLISTERRI, J. (1999) “Diseño de corpus textuales y orales”, in BLECUA, J.M.- CLAVERÍA, G.- SÁNCHEZ, C.- TORRUELLA, J. (Eds.) Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Seminario de Filología e Informática, Departamento de Filología Española, Universidad Autónoma de Barcelona - Editorial Milenio. pp. 45-77. TRIBBLE, C.- BARLOW, M. (Eds.) (2001) Using Corpora in Language Teaching and Learning. Special Issue of Language Learning and Technology, 5. 3. http://llt.msu.edu/vol5num3/default.html VERA LUJÁN, A. (1998) "Los medios de comunicación como recurso lingüístico (proyecto de acopio y distribución de materiales lingüísticos. Instituto Cervantes, España)", in La lengua española y los medios de comunicación. México: Siglo XXI Editores en coedición con la Secretaría de Educación Pública (México) y el Instituto Cervantes (España). Vol 2. pp. 1331-1338. http://cvc.cervantes.es/obref/congresos/zacatecas/tecnologi as/proyectos/vera.htm 6.- Recursos en Internet citados en el texto Apuntes, Lista del Español Urgente, Agencia EFE http://majordomo.eunet.es/listserv/apuntes/ Archivo Gramatical de Salvador Fernández Ramírez (AGLE), Instituto Cervantes http://cvc.cervantes.es/obref/agle/ Asociación Internacional de Hispanistas (AIH) http://www.dartmouth.edu/~aih/ Base de Datos Sintácticos del Español Actual (BDS), Universidad de Santiago de Compostela http://www.bds.usc.es/ Canós, L., Esp@ñol-e, Español electrónico: proyecto para Lengua y Literatura de 3º de ESO, Departament de Castellà, IES Francesc Ribalta http://inicia.es/de/iesribalta/html/departaments/castella/h tml/espanyol-e.html Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 30 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf Centre de Llenguatge i Computació (CLiC), Universidad de Barcelona http://clic.fil.ub.es/ Centre de Tecnologia i Aplicacions del Llenguatge i la Parla (TALP), Universidad Politécnica de Cataluña http://www.talp.upc.es/ Centro Virtual Cervantes, Instituto Cervantes http://cvc.cervantes.es/ Círculo de Lingüística Aplicada a la Comunicación (CLAC), Universidad Complutense de Madrid http://www.ucm.es/info/circulo/ CompJugador, Daniel M. Germán, Universidad de Waterloo http://csgrs6k1.uwaterloo.ca/~dmg/lando/verbos/conjugador.html Corpus de Referencia del Español Actual (CREA), Real Academia Española http://cronos.rae.es/creanet.html Cuadernos Cervantes de la Lengua Española http://www.cuadernoscervantes.com/ Data-driven Learning Page, T. Johns, Universidad de Birmigham http://web.bham.ac.uk/johnstf/timconc.htm Departamento de Español Urgente (DEU), Agencia EFE http://www.efe.es/esurgente/lenguaes/ Diccionarios de variantes del español, J.R. Morala, Universidad de León http://www3.unileon.es/dp/dfh/jmr/dicci/0000.htm Diccionarios y correctores ortográficos, Lengua en secundaria, A.M. Larequi García http://www.terra.es/personal/elg00001/programa/prog-dic.htm Diccionarios.com, Vox http://www.diccionarios.com Especulo http://www.ucm.es/info/especulo/ Estudios de Lingüística Española (ELiEs) http://elies.rediris.es/ ForeignWord.com http://www.foreignword.com/ Foro del Español de Hoy y Mañana, Centro Virtual Cervantes http://cvc.cervantes.es/foros/ Foro del Hispanista, Centro Virtual Cervantes http://cvc.cervantes.es/foros/ Grupo de Estructura de Datos y Lingüística Computacional (GEDLC), Universidad de Las Palmas de Gran Canaria http://www.gedlc.ulpgc.es/ Hispania, Foro sobre la lengua española http://www.rediris.es/list/info/hispania.es.html Infoling, Lista de distribución de lingüística española http://elies.rediris.es/infoling/ La Página del Idioma Español http://www.el-castellano.com/ Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 31 Joaquim Llisterri, Universitat Autònoma de Barcelona Nuevas tecnologías y enseñanza de la lengua española http://liceu.uab.es/~joaquim/publicacions/UIMP01.pdf La Rosa de los Vientos http://rosavientos,host.sk/ Laboratorio de Lingüística Informática, Universidad Autónoma de Madrid http://www.lllf.uam.es/ Larequi García, E., Materiales Curriculares, Lengua y Literatura Españolas http://www.lenguaensecundaria.com/ LEXESP, Universidad de Oviedo http://www.uniovi.es/UniOvi/Apartados/Departamento/Psicolog ia/metodos/soft/corpus/ Linguist List http://www.linguistlist.org/ Manuel Vázquez Montalbán, Vespino.net http://www.vespino.net/mvm/ MonoConc, Athelstan http://www.athel.com/mono.html One Look Dictionaries http://www.onelook.com/ Radio InterEconomía http://www.intereconomia.com/ Rayados, Club de Fútbol de Monterrey http://www.rayados-mty.com/ Real Academia Española http://www.rae.es/ Revisado.com, Daedalus http://www.revisado.com/ Signum http://www.lenguaje.com/ Sociedad Española de Didáctica de la Lengua y la Literatura (SEDLL) http://sedll.org/ Sociedad Española de Lingüística (SEL) http://www.uned.es/sel/ SOL – Spanish On Line, Universidad de Göteborg http://spraakdata.gu.se/lb/konk/rom2/ Summer Institute of Linguistics (SIL) http://www.sil.org/ Text Encoding Initiative (TEI) http://www.tei-c.org/ Tonos Digital, Universidad de Murcia http://www.um.es/tonosdigital/ Varilex en Red, Signum http://www.lenguaje.com/herramientas/varilex/varilex.asp WordSmith, Mike Scott, Universidad de Liverpool http://www.liv.ac.uk/~ms2928/wordsmith/index.htm YourDictionary.com http://www.yourdictionary.com/ Curso de Formación del Profesorado de Enseñanza Secundaria “Conocimiento de la lengua española y estudios superiores” Universidad Internacional Menénde y Pelayo, Santander, septiembre de 2001 32