M ÁS TE R E S P AÑOL/ING LÉ S P AR A FINE S E S P E C ÍFIC O S “E spañol de la ciencia y la tecnología” Tema 5 R ecurs os ling üís ticos y terminológ icos en Internet Grupo E P A M ÁS TE R E S P AÑO L/ING LÉ S P AR A FINE S E S P E C ÍFIC O S “E s pañol de la ciencia y la tecnología” Tema 5: R ecursos lingüísticos y terminológicos en Internet D ra. Isabel S antamaría P érez mi.s antamaria@ ua.es D r. Jos é Joaquín M artínez E gido jj.martinez@ ua.es • “La web es un mundo de aplicaciones textuales… hay un gran conjunto de imágenes e incontables archivos de audio, pero el texto predomina no sólo en cantidad, sino en utilización… ” (M illán, 2001: pág. 35-36) OB JETIVOS • C ons ultar y localizar información de interés lingüístico y terminológico. • Localizar, ges tionar y evaluar especializados de una materia. textos • C ons tituir un corpus textual especializado, útil para la investigación lingüística y terminológica. • P resentar distintos recursos de lingüística y terminológica en Internet. consulta C ONTENIDOS • Internet como fuente de información especializada: obtención de corpus • Herramientas lingüísticas para el tratamiento de textos: Antconc • Internet como almacén de recursos lingüísticos y terminológicos ¿ Qué es Internet? • Internet es la red de redes que permite la interconexión de redes y ordenadores de todo tipo mediante ruteadores (dispositivos de conexión y distribución de datos en una red). ¿ Qué s e puede hacer en Internet? • • • • • • • • • E nviar mensajes O pinar sobre temas ‘C hatear’ C onsultar catálogos de bibliotecas Visitar museos C onseguir información O frecer información C onseguir programas informáticos C omprar/vender, etc. Internet para el ling üis ta • Fuente de comunicación (listas de discusión, correo electrónico, foros ) • Intercambio de datos (bases de datos, publicaciones, documentación, corpus, etc.) • Fuente de información terminológ ica y documental (catálogos, contextos, definiciones, términos, glos arios, bas es de datos). • C aptura de información para realizar un trabajo terminológico (término, contextos, textos, publicaciones, herramientas, etc.) Internet como fuente de información es pecializada: el corpus Internet fuente de información lingüística C orpus – información textual y discursiva – información sobre unidades concretas (variantes, definiciones, categoría gramatical) – ejemplos de coocurrencias, etc. Internet como fuente de información es pecializada: el corpus • Necesidad de información INFORMACIÓN EN LA WEB Criterios o estrategias de búsqueda para la recuperación de información Herramientas de búsqueda en Internet Internet como fuente de información es pecializada: el corpus • ¿ Q ué tipo de información recuperamos? – M aterial textual dis ponible en Internet que contiene información lingüística. – P roductos finales que contienen información lingüís tica (bas es de datos, glosarios, diccionarios en línea, corpus , etc.). Directorios vs . motores de bús queda BUSCADORES Índices o directorios Motores de búsqueda Metabuscadores Directorios vs. motores de búsqueda • Tendencia actual convertir a los buscadores en portales que ofrecen servicios , ventas y productos Imposibilidad de ubicar a los actuales buscadores en una sola des cripción (directorios, motores de búsquedad, etc.) Directorios vs . motores de bús queda D irectorios • B úsqueda dirigida M otores de bús queda • C onsulta libre • Funcionan por navegación • Funcionan por recuperación de información • Lista de recursos clasificados por temas • • R ecogen una pequeña parte de los recursos digitales de la WWW P rogramas automáticos que constituyen una BD con todas las páginas web exploradas • R ecogen la totalidad de recursos • O rganizan la información manualmente asignando los recursos a una o más clases • O rganizan la información por comparación automática y creación de índices • Actualización de la información lenta • Actualización automática y rápida Indices-directorios Ventajas D es ventajas -Información clasificada, precisa y de calidad -Resultados menores que con los motores de búsqueda -Suelen presentar comentados -Enlaces no siempre actualizados -Realizada por expertos sus enlaces calidad -Permiten buscar por una catalogación temática preexistente -Es posible navegar por una temática determinada sin concretar la palabra clave -Cada directorio tiene su propia clasificación -Sistema menos intuitivo que en los motores -En las clasificaciones priman los criterios comerciales M otores de búsqueda Ventajas D es ventajas -Abundante información -Exceso de información -Está todo -Los primeros resultados suelen ser páginas que enlazan con otras -Buscan en toda la red -Fáciles de usar e intuitivos -Actualización de los enlaces -Presencia de resultados que no interesan M otores de búsqueda • R ecurs os más utilizados para bus car en Internet • S e bas an en programas automáticos que saltan de una página a otra de la web, siguiendo los enlaces que encuentran en cada página para construir una gigantesca bas e de datos. • La búsqueda es por palabras clave. Ejemplos • D irectorios: – Yahoo http://es.yahoo.com/ – E xcite http://www.excite.es /directory – Lycos http://www.tripod.lycos.es • B uscadores: – Google http://www.google.com – AltaVista http://www.altavista.com – O zú http://www.ozu.es – Terra http://www.terra.es M etabuscadores • Buscador de bus cadores – R edirigen las consultas simultáneamente a bases de datos de varios motores y directorios – Útiles para consultar datos muy concretos. – Algunos permiten realizar una consulta simultánea a todos los buscadores indexados o bien determinar el buscador en concreto al que se desea enviar la interrogación. • E jemplos de metabuscadores – http://metacrawler.com – http://www.i-une.com – http://www.kartoo.com – O tros metabuscadores en: • http://www.cuervoblanco.com/metabuscadores.html • http://www.buscopio.net • http://www.internetinvisible.com B uscadores especializados • S e estructuran sobre la base de un directorio temático, aunque pueden ofrecer un motor de búsqueda. • S u atractivo reside en la especialización temática y en la calidad de los vínculos. • Los recursos que proporcionan son muy variados : portales temáticos , sitios web de asociaciones, páginas personales, etc. http://www.scirus.com R ecuperación de información: operadores booleanos • P ermiten expresar nuestras necesidades de información con la máxima precisión. • S irven para exigir o excluir conceptos en la búsqueda avanzada y en determinados motores de búsqueda. Tipos de operadores booleanos • AND (&): localiza documentos que contengan uno y otro términos expresados en la consulta. • O R (I): localiza documentos que contengan uno u otro de los términos es pecificados en la consulta. • NO T (!): recupera documentos que no contengan un término expres ado en la consulta. Tipos de operadores booleanos • Frase exacta: P ermite buscar ocurrencias de fragmentos textuales que coincidan exactamente con el contenido de un documento. – S e representan: • “transcripción genética” Tipos de operadores booleanos • Limitar idioma: P ermite limitar los resultados de la bús queda a los que se encuentren en una determinada lengua especificada previamente. • Limitar a un s ervidor (domain: host): E ncuentra las páginas con la palabra o frase especificada en el dominio del servidor Web donde se encuentre estas páginas . – D omain: .mx (limitamos la búsqueda a ese dominio: M éxico) Tipos de operadores booleanos • Limitar a título: E l motor de búsqueda encuentra las páginas que contienen la palabra o frase en el título. • Limitar a texto: el contenido de la página. • Limitar a período temporal. Tipos de operadores booleanos • Formatos de documentos en Internet – P áginas .html – D ocumentos de word .doc – Archivos .pdf – Imágenes .jpg, .gif – C omprensión y descomprens ión de ficheros .zip Internet como almacén de recursos lingüísticos y terminológicos • a. R ecursos lexicográficos • b. R ecursos terminológicos: catálogos de diccionarios especializados • c. R ecursos textuales • d. B ases de datos terminológicos y neológicos • e. C onsulta con otros especialistas: listas de discusión y foros… a) R ecursos lexicográficos • R ecurs os lingüís ticos generales: D iccionarios y enciclopedias – E spañol • http://www.rae.es • http://clavecorp.grupo-sm.com – C atalán • http://pdl.iecat.net – Inglés • • • • • http://www.m-w.com (M erriam Webster) http://www.ldoceonline.com (Longman) http://dictionary.cambridge.org http://www.hyperdictionary.com http://www.oed.com/ (O xford E nglis h D ictionary) – Francés • http://atilf.atilf.fr/tlfv3.htm – Alemán • http://www.dwds.de/ – AllWords .com: D iccionario inglés con traducción a s eis idiomas • http://www.allwords.com – D iccionario de sinónimos • http://tradu.scig.uniovi.es/sinon.html – E lM undo.es • http://www.elmundo.es/diccionarios a) R ecursos lexicográficos – P ortales • http://www.yourdictionary.com. P ortal con 2.500 diccionarios y gramáticas en 300 lenguas • http://www.onelook.com/browse.shtml. P ortal con cerca de 900 diccionarios • http://www.diccionarios.com. P ortal de Larousse. • http://www.lexicool.com. P ortal con más de 4.000 enlaces de diccionarios y glosarios bilingües y multilingües b) R ecursos terminológicos • P ortales – P ortalingua http://www.portalingua.info. P ortal dedicado a las lenguas neolatina. C onsulta de recurs os en línea. – TermS ciences http://www.terms ciences .fr/. P ortal terminológico multidis ciplinario. P ermite la cons ulta de términos en francés , inglés , es pañol y alemán – E ureka http://www.foreignword.com/eureka/default.as p. P ortal que recoge información s obre bancos de datos terminológicos , glos arios , diccionarios , traducción, etc. – Latinos apiens http://www.latinos apiens.info. P ortal de información científica en lenguas neolatina. C ontiene artículos , foros , revis tas . b) R ecursos terminológicos • C atálogo de glos arios y diccionarios especializados – Hiperenciclopèdia http://www.grec.net/home/cel/mainc.htm – Visual dictionary http://www.infovis ual.info/ – G los sarist http://www.glos s aris t.com/ – Terminology http://lipas .uwas a.fi/comm/termino/collect/ C ollection – Vademécum del traductor externo http://www.europarl.europa.eu/trans l_es/plataforma/pagina/celter/celu – Inventerm http://www.inventerm.com/ c) R ecursos textuales • C orpus – BwanaNet – BNC (British National C orpus) – C R E A (C orpus de R eferencia del español actual) – Internet (S cirus [científico], G oogle) d) B ancos de datos terminológicos y neológicos • • • • • • • • • TE R M ITE (Banco creado por la International Telecommunications Union) http://www.itu.int/terminology/index.html Terminología de la FAO http://www.fao.org/faoterm/index.as p? lang=E S IATE http://iate.europa.eu/ UP F_Term http://upfterm.upf.edu:8080/cat/index.htm TIS (Terminological Information S ystem) http://tis.consilium.eu.int/utfwebtis /frames /introfs E N.htm Termium http://www.termium.gc.ca/s ite/accueil_home_f.html C ercaterm http://www.termcat.es Neoloteca http://www.termcat.es Bobneo http://obneo.iula.upf.edu/bobneo/ f) Listas de discusión, foros y blogs • The Linguis t List. C onjunto de listas (corpora, E LE X , lexicography) http://www.linguistlis t.org/ • R elación temática de listas de distribución de R edIris (tecnotrad, traducción, tradumática) http://www.rediris.es /lis t/ E valuación de resultados • • • • • • • • Autoría Actualidad P recisión y corrección Tratamiento del contenido O riginalidad E nlaces a otros recursos E rgonomía C itación en otros sitios