Apuntes de documentación

Anuncio
DOCUMENTACIÃ N Y SISTEMAS DE INFORMACIÃ N
1.1. CONCEPTO DE DOCUMENTACIÃ N. NUESTRA DEFINICIÃ N DE DOCUMENTACIÃ N Y
DOCUMENTO
Documentación:Proceso de búsqueda, selección, clasificación, recopilación y recuperación de
información.
Documento:Todo tipo de información en un soporte determinado. Soportes: vÃ−deo, DVD, audio, internet.
Código o lenguaje: texto, audio, vÃ−deo, imagen.
DEFINICIONES DE DOCUMENTO
• 1490, Universal Vocabulario ( Alonso de PALENCIA): “Los documentos son exemplos para saber
e semeiança par que meior entiendan”.
• 1813, Diccionario de Autoridades (2º Acepción): “La escritura o instrumento en que se prueba o
confirma alguna cosa”.
• 1990, GUINCHAT y MENOLL: “Todo documento es básicamente información registrada”.
• 1997, LOPEZ YEPES: “Soporte que contiene una información potencialmente transmisible en el
espacio y en el tiempo y actualizable para alcanzar un nuevo conocimiento o una toma de decisión”.
DEFINICIONES DE DOCUMENTACIÃ N
• Final del siglo XIX, OTLET y LA FONTAINE: “Búsqueda de documentos para hacer el estudio o
la tesis”.
• 1948, BRADFORD: “El arte de recolectar, clasificar y hacer fácilmente accesibles los documentos
de todas las formas de actividades intelectuales”.
• 1959, Federación Internacional de Documentación: “Recolección, almacenamiento,
clasificación y selección, difusión y utilización de todos los tipos de información”.
• 1988, ÔLVARES OSSORIO:
• 1995, Là PEZ YEPES: “ Documentación como la ciencia general que tiene por el estudio del
proceso de adecuación y transmisión de las fuentes …
• Según PASTOR RUIZ hoy en dÃ−a se considera que:
• La documentación es una disciplina cientÃ−fica y por lo tanto, tiene su propio cuerpo doctrinal de
principios, metodológicas y técnicas básicas.
• Se aplica básicamente a la realización de la serie de actividades ejercitadas sobre la información
contenida en cualquier tipo de documento.
• Su finalidad principal consiste en el acto de informar, es decir, de comunicar de forma efectiva y eficiente
la información solicitada.
• Se considera que es una ciencia instrumental o auxiliar al servicio de los demás, en cuanto que es
susceptible de aplicarse en ámbitos especÃ−ficos del saber humano contribuyendo en todos ellos el
avance de sus conocimientos.
• Introducción de YEPES:
LA RELACIÃ N ENTRE DOCUMENTACIÃ N Y OTRAS CIENCIAS
Las disciplinas cientÃ−ficas generan información, la documentación la procesa y la devuelve. Podemos
1
decir que es auxiliar de las otras ciencias.
En España tenemos las Ciencias de la Información (Periodismo, Publicidad, Relaciones Publicas y
Audiovisuales) que tienen la asignatura de documentación y luego la Diplomatura de BiblioteconomÃ−a y
Documentación.
A la hora de leer sobre este tema debemos tener cuidado ya que:
• Documentación = Information science (inglés).
• Ciencias de la información = Informatika (ruso).
CLASIFICACIÃ N DE LAS CIENCIAS DE LA INFORMACIÃ N. MARQUÃ S DE MELO (1969)
RECUPERACIÃ N - Ciencias de las fuentes:
• Documentación.
• EstadÃ−stica.
• Cibernética.
Al observar el esquema podemos ver también la diferencia entre Documentación y las Ciencias de la
información. Pero debemos decir que la documentación informativa se divide en tres:
• Documentación periodÃ−stica: hay muchos estudios y trabajos que hablan de distintos soportes.
• Documentación de la publicidad: ámbitos poco estudiados. La documentación audiovisual entra más
en la periodÃ−stica.
• Documentación Audiovisual.
Cabe destacar que para algunos autores la documentación informativa es igual a la periodÃ−stica.
Para FUENTES/ PUYOL (1997): “La Documentación informativa es el nombre genérico que se utiliza
para designar la disciplina que se ocupa de aplicar la teorÃ−a, los métodos y las técnicas documentales a
la investigación de la comunicación de masas y a las distintas ciencias de la documentación
(Periodismo-documentación periodÃ−stica y documentación audiovisual; Comunicación
audiovisual-documentación audiovisual; Publiciadad-documentación publicitaria; Relaciones
Públicas-documentación en las relaciones públicas) con la finalidad de hacer más accesible y manejable
la información (independientemente de su soporte) generada por los distintos medios de comunicación
social-radio, prensa, TV- y también generada por el que hacer publicitario, o el ejercicio de las relaciones
públicas, de crear nuevas informaciones”.
Antes habÃ−a una redacción y una área de documentación, ahora gracias a los sistemas informáticos
que facilitan la búsqueda (distintos campos a la vez) la labor del periodista y del documentalista se han ido
difuminando y se deben redefinir. Además, debemos tener en cuenta que hoy en dÃ−a se difunde mucha
información generada por periódicos.
1.2. BREVE HISTORIA DE LA DOCUMENTACIÃ N
•
- Siglo XVIII: los periódicos no tenÃ−an servicio documental, sólo almacenaban sus periódicos sin
criterio alguno como archivo histórico.
- Siglo XIX: sobre todo en los medios de comunicación anglosajones hay tres hechos que se acercan al
servicio documental:
2
· Se almacenan sus periódicos.
· Coleccionar otros periódicos internacionales.
· Crean la morque: un sistema de documentación básico, son carpetas que contienen información y
fotografÃ−a (caras) sobre personalidades, asÃ− cuando murieran tenÃ−an la información para publicarla.
Otros factores que ayudaron a que se crearan los servicios documentales:
· Desarrollo económico de la prensa.
· Transmisión rápida gracias al telégrafo y luego al teléfono, consiguen más información del
extranjero.
Surgen los primeros Ã−ndices básicos (1862 Times) sobre las noticias que publicaban. Normalmente sobre
autores, más tarde temáticos y geográficos. Se acerca al servicio porque una clasificación.
- Siglo XX: a partir de la 1º Guerra Mundial se crean los Dossieres de prensa. Hay un cambio de criterio: se
deben interpretar los hechos. Para ello necesitaban una base de información anterior. Era un desarrollo
sofisticado de la morgue, carpetas de temas determinados.
Ahora a principios del siglo XX podemos hablar de servicio documental: selección, clasificación e
intención de recuperar.
Además de los dossieres e Ã−ndices estaban las bibliotecas de referencia, obras que servÃ−an para crear
noticias o de apoyo (Biblia, diccionario, citas, enciclopedia).
En el 1º cuarto de siglo se unifican los tres y se crean los servicios documentales.
En 1929 hay un auge del periodismo interpretativo y empiezan a surgir las revistas de información general
(Nwesmagazine, Newsweek, New York Time) que analizan con profundidad diversos temas. Estos necesitan
que les suministren información de forma rápida.
En los años 50 habÃ−a mucha información y papel en un almacén enorme, con una clasificación
excelente pero habÃ−a un problema, se colapsaba. Gracias a los desarrollos tecnológicos que empiezan a
mecanizarse:
·Microfilmación de los fondos: el volumen es menor, se maneja más fácil, aunque no es tecnologÃ−a
barata. Los Ã−ndices ayudaron a clasificarlos. En 1970, el 90% d e la prensa tenÃ−a sus fondos en
microfilms.
- Los primeros sistemas de información para recuperar la información fueron COM (Computer
Output Microfilm) en los que introdujeron todos los Ã−ndices y asÃ− agilizaron el proceso.
A principios de los 60 el New York Times creó la Information Bank. Es el 1º servicio documental basado
en un sistema carÃ−simo en el que insertaron los resúmenes de las noticias que habÃ−an publicado y una
selección de otros medios.
En los 70-80 los ordenadores se hicieron más rápidos y con más capacidad de albergar datos. Las
redacciones ya funcionan con ordenadores y empiezan a guardar las noticias o los textos completos.
Según el desarrollo de los ordenadores y de los sistemas multimedia, además de las noticias se guardan los
3
facsÃ−miles, noticias maquetadas con fotografÃ−as, gráficos.. Otros soportes utilizados son los ópticos o
los CD-ROM.
Toda la tecnologÃ−a supone una inversión cara por eso empezaron a vender las bases de datos a otras
personas, universidades ... y asÃ− hacerlo más rentable.
Pero no todos los medios utilizan las tecnologÃ−as ya que no tienen medios para volcar la información.
AsÃ− surgen los convenios entre periódicos y empresas informáticas. Estos crean las bases de datos con
cuota como Dialog o Nexis. Con estos convenios los informáticos comercializan los datos y los periódicos
consiguiendo sus datos y los de otros medios.
Hoy en dÃ−a estas bases son accesibles por internet. Hay dos tipos de servicios básicos:
• Hemeroteca digital: noticias que han aparecido en internet en la edición digital. Es una información
limitada.
• Base de datos históricos: se encargan las empresas informáticas. Están mejor organizadas y hay más
información.
2. PROCESO DOCUMENTAL
2.1. INTRODUCCIÃ N
No es lo mismo montar un servicio documental de un medio de comunicación o una biblioteca.
Los aspectos que se deben tener en cuenta son:
• Forma de clasificar para logra mayor rapidez.
• El soporte según el medio en el que estemos.
• La lÃ−nea editorial que tratará unos temas y otros no.
• El ámbito territorial.
• La accesibilidad de las fuentes.
• Tener obras de referencia, sobre todo, para prensa especializada.
• Los distintos tipos de información:
General:
· Sucesos previsibles.
· Agendas setting: ruedas de prensa ...
Especializada: tienen más tiempo. No se permite meter la pata, verifican toda la información que tienen.
Se da importancia a la forma en la que se da la información.
Investigación:
· Temas de los que la información está oculta o no quieren sacar a la luz. AsÃ−, no se puede hacer nada.
La propuesta es que un documentalista ayude a almacenar la información; esta información se clasificará
según si es verdadero o falso.
· Aguesdo (1995): investigación sobre datos públicos que no están analizados. Ejemplo: Eustat, INE,
CIS. El documentalista debe conseguir esas bases de datos para ofrecer al redactor.
4
Según Benito Amat & Castillo Blasco hay 10 factores condicionantes:
• Coincidencias episódicas: que la misma noticia aparezca en diversos medios el mismo dÃ−a. Esto
depende de las agencias. Influye en que debemos tener un criterio de selección y además que debemos
responder a las expectativas de los lectores tratando temas que les gusten para conseguir asÃ− su atención
(lÃ−nea editorial).
• Redundancia cÃ−clica: temas que se repiten cÃ−clicamente. Ejemplo: rebajas, vacaciones ...
• “Efecto Mateo”: la persona o hecho determinado que aparece una vez en prensa volverá a aparecer.
Cuanto más aparezca, más información.
• Multiplicidad de soportes: interesa saber toda la información que tenemos en diversos soportes. Ahora
todo está digitalizado pero tiene una desventaja; no se puede n leer todos los formatos: informáticos y se
deben cambiar siempre a los nuevos formatos.
• Fragmentación del mensaje/noticia: obtienes la información en fragmentos, ¿Cómo lo guardas en
fragmentos o cómo noticia?
• Fenómeno de latencia: información que se genera sobre un tema pero no sabemos cuando. Va unido
con la redundancia cÃ−clica.
• Documentos compuestos: suelen ser textos más tablas, imágenes, infografÃ−as ... Interesa guardarlo
todo pero no de la misma forma.
• Ley del mÃ−nimo esfuerzo: prefieren poca información o resúmenes que se los des hechos.
• Estratificación de usuarios: los redactores pero también el público. Analizar la información que
piden y clasifican:
• Información básica.
• Información detallada.
• Público.
• Otros departamentos.
• La realidad del significado: según para quién o qué el significado de la información es diferente.
No se suele saber con que palabra clasificar.
FUNCIONES DE LOS SERVICIOS DE DOCUMENTACIÃ N EN LOS MEDIOS DE
COMUNICACIÃ N SEGÃ N DESMOND (1933)
• Evitar errores.
• Suministrar la presentación de la información local.
• Mejorar la presentación de la información local.
• Preparar material por adelante y sugerir información.
• Servir a los editoriales.
• Realizar campañas en beneficio de la comunidad.
• Hacer asequible el material especializado.
• Conservar la documentación valiosa.
• Dar buena imagen del medio.
• Servir al departamento de publicidad.
• Servir al departamento de difusión.
GALDà N, 1985 define las funciones con un enfoque más actual:
• Funciones mediatas: proceso o cadena documental. Selección, análisis ... de los documentos. Están
condicionados por los inmediatas.
• Funciones inmediatas: del servicio hacia el medio, son los principales.
* Ayudan a que el redactor conozca la realidad:
5
• Previsora: acontecimientos cÃ−clicos de los que se debe avisar.
• Preparatoria: recuperar, preparar, estructurar la información.
• CrÃ−tico-verificadora: verificar los datos.
• Completiva: completar los datos que faltan.
* Ayudan a que comunique la información:
• LingüÃ−stico-darificadora: dudas de cómo se escribe una palabra o un nombre extranjero.
• Modélico-narrativo: libros de estilo.
• Informativa: no es habitual. Se redacta un informe definitivo sobre la documentación que hay.
FUENTES, PUYOL, 1995. Las tres funciones principales:
• Proporcionar las fuentes correctas.
• Tener material suficiente acerca de temas.
• Actuar como fuente inspiración.
FUENTES, PUYOL, 1997. Las caracterÃ−sticas de los servicios de documentación de Medios de
Comunicación:
• Dualidad de las fuentes. Normalmente son sólo externas pero en los medios hay fuentes
externas e internas.
• Multiplicación de la información heterogénea, temas diversos. Antes habÃ−a problemas
con los soportes, ahora gracias a la digitalización no. Es importante:
· Gestionar la información, más fácil con ordenadores.
· Estudiar los hábitos de los usuarios.
· Identificar las necesidades no resueltas.
· Valorar la calidad de las fuentes.
· Adaptarse al medio. La redacción y el SD cada vez están más unidos.
• Obsolescencia de la información. La información tiende a envejecer muy rápido. Los SD
tienen un fondo de documentos (información que no se utiliza mucho) y fondo de diario. Esta
división tiende a ir desapareciendo:
· Rapidez de respuesta.
· DicotomÃ−a texto-imagen.
· Diversificación de usuarios.
• PROCESO O CADENA DOCUMENTAL
Tiene varias fases:
• Entrada:
· Selección: según un criterio.
6
· Adquisición: libros; información que no generamos nosotros.
· Registro: nº de identificación único.
• Análisis. Tiene dos niveles:
· Documental:
< Descriptivo: caracterÃ−sticas del documento.
< De contenido (esto va directo a salida):
Indización: datos para crear un vÃ−nculo.
Clasificación.
Resumen.
· Técnico:
< Ordenamiento.
< Almacenamiento.
< Conservación.
• Salida:
· Recuperación de información.
· Operadores.
· Estrategias.
Hay una fase previa que es la de conceptualización. Antes de coger la información, hay que pensar
que tipo de información vamos a recoger, como la vamos a clasificar, como va a esta montado (un
ordenador, varios correctores ...).
ENTRADA
Debemos tener una serie de criterios para escoger las noticias. Pero si no son muy estrictos puede que
nos encontremos con mucho ruido documental (la información que no interesa) y si son muy estrictos
con un silencio documental y ningún documento para ofrecer.
• SELECCIà N: Toda acción documental que tiene por objeto evaluar, discriminar y, en
consecuencia, filtrar (escoger y/o eliminar) un documento, es decir, un soporte material
perdurable en el que por medio del sistema de escritura, la imagen y/o el sonido se fija
intencionadamente una información, testimonios de la actividad del ser humano.
Según el medio los criterios serán diferentes. Debemos tener en cuenta, además, las tres entradas
posibles:
7
· Producción propia: El fondo más abundante.
· Producción externa: menos documentos por los criterios de selección pero serán diferentes.
Normalmente tenemos un archivo donde están todos los documentos, pero los autores dicen que es
mejor hacer un archivo temporal en el que los documentos estarán un año y luego, hacer una
------------, con criterios más estrictos para el archivo definitivo. AsÃ− permitimos que al comienzo del
proceso entren varios documentos y al cabo del año puedes realizar otra selección, los que valen o no
para el archivo definitivo. Con la información del archivo temporal se pueden hacer armarios.
Cabe destacar que hay dos tipos de selección:
· Básico: independiente al valor de la información, interesa su utilidad.
· Intermedio: contenido pero no excluye por calidad.
· Profundo: calidad. Es muy difÃ−cil valorarlo, por eso hay que marcar unos criterios de valoración.
• Muestreo: se realiza cuando hay mucha información. Son técnicas estadÃ−sticas, no hay
criterios. Ejemplo: Hoy hay 200 noticias de polÃ−tica, pues eliges un 10%.
Al principio del proceso no convienen unos criterios estrictos, ya que luego no puedes volver a
recuperar ese documento.
CRITERIOS DE SELECCIÃ N DE INFORMACIÃ N PERIODÃ STICA EN GENERAL
• Seleccionar los documentos que interesa tener, al margen de su tipologÃ−a.
• Disponer de información actualizada al máximo y también retrospectiva.
• Dar preferencia a las noticias de tratamiento profundo sobre las superficiales, y a las objetivas y
partidistas.
• Asegurarse de que la fuentes y los datos almacenados son de la máxima fiabilidad.
• Evitar repeticiones y redundancias.
• Revisar periódicamente la colección documental y desechar la información que no interesa.
OBRAS DE CONSULTA:
• Primarias: se puede encontrar directamente la respuesta a la duda.
· Diccionarios:
< Definiciones.
< Sinónimos.
< Etimológicos: de donde vienen las palabras.
< Acrónimos: siglas.
< Equivalencias:Euskara-Castellano, Inglés-Castellano ...
· Enciclopedias: generales y especializadas.
8
· Repertorios biográficos: biografÃ−as de personajes importantes.
· CronologÃ−as: anuarios.
· EstadÃ−sticas.
· Legislación: BOE, BOPV, BOG.
• Secundarias: hacen referencia a las fuentes, no dan información.
· Catálogo de libros: de artÃ−culos (resúmenes), de tesis y de base de datos.
• Adquisición: hay diferentes modalidades:
· Compra.
· Donaciones: alguien dona una colección, esta va en bloque y suele estar guardada a parte.
· Intercambio.
· Material cogida de internet o algún medio: cuidado con los derechos de autor y de reproducción,
mejor si citas las fuentes.
• Registro: es un número único para cada documento, se va asignando en el orden de llegada.
No sirve para hacer búsquedas, pero sÃ− para hacer inventario. Ejemplo: R48680
ANÔLISIS
Extraer datos del contenido para luego hacer bases de datos.
· Descriptivo (fÃ−sico): nº de tomos, páginas ... Es interesante si se trabaja con otro tipo de
soportes. En el caso de una colección se pone también el tomo y la obra.
· Temático: analizar el contenido:
< Clasificación: suele hacerse por materias: se utiliza el CDCI, lenguaje documental que reparte en
grandes temas y le da un número. Ese número sirve para ordenarlos.
< Indización: se sacan una serie de datos, ya no es solo la materia sino también un tema secundario.
< Resumen: se utiliza sobre todo en libros (no noticias) en las que hay un pequeño resumen de la obra.
En el caso de las noticias en vez de resumir lo que se ha posibilitado con el ordenador, se guarda la
noticia entera. Es lo que se conoce como TEXTO COMPLETO.
· Mantenimiento: depende de la gente que accede a esos libros. Depende también del sistema que se
tenga, ya que se hará de una forma u otra.
Lo que se quiere hacer es sacar los datos de unos documentos desde la BASE DE DATOS.
Hay una serie de cuestiones que no se pueden analizar a la vez (texto y fotografÃ−as). Lo que se hace es
elaborar una tabla.
9
El diccionario de datos es la ficha que tu has establecido con una serie de datos pero sin que esos datos
estén extraÃ−dos del texto. Es la ficha vacÃ−a. Cuantos más datos se recojan, habrá más
posibilidad para logra una mayor búsqueda.
Una vez elaborado el diccionario se rellena convirtiéndose en el REGISTRO. En el registro se
guardan los datos considerados más importantes para la búsqueda de un libro. Primero hay que
elaborar el diccionario de datos que se rellenará de una forma concreta.
Ahora ya se pueden analizar los documentos, las unidades documentales. Se extraen los datos y se va
configurando el registro (representación de la unidad documental) que consiste en el diccionario de
datos de cada documento rellenado. Para cada unidad hay que hacer una ficha que se va almacenando
en lo que se conoce como TABLA (en el caso de los ordenadores). Por cada unidad documental hay una
referencia documental.
Si hay un texto como imagen, hay dos opciones a la hora de clasificar y analizar:
• Considerar todo como una unidad.
• Considerar como separado.
En el 2º caso habrÃ−a que hacer un diccionario de datos del texto y otro de la fotografÃ−a que serán
diferentes entre ellas ya que la foto tiene unas caracterÃ−sticas propias de su técnica.
AsÃ−, habrÃ−a dos tablas de texto y fotografÃ−a basadas en dos diccionarios de datos y en las que se
irÃ−an añadiendo los datos correspondientes.
Para buscar en un directorio:
Cada una de estas personas serÃ−a una ENTIDAD. Cada una de estas entidades tienen cosas en
común y cosas que no, caracterÃ−sticas y atributos.
Como estamos haciendo un directorio para comunicarnos con ellos: la altura, color de ojos ... Habrá
campos que no interesen.
La ETIQUETA serÃ−a el nombre de cada CAMPO. El DOMINIO serÃ−a el conjunto de valores que
pueden aparecer. Por ejemplo, si pusiéramos la fecha de nacimiento desglosada, la etiqueta del mes
deberÃ−a decir si va a ir en números o en letras.
El dato concreto que metemos, por ejemplo Harri, serÃ−a el VALOR. El tipo de dato puede ser
numérico o alfabético (texto).
Existen tablas en las que por ejemplo te pregunta si estás casado. Tu tienes que responder SI o NO.
Si pinchas SI se activará otras opciones. Si pulsas no, no se activará nada.
Un control de identidad es cuando define si un campo es obligatorio. Otra condición que se puede dar
es que sólo haga un valor. Por ejemplo, no puede haber 2 edades.
Puedes definirlo de tal manera en que los valores, por ejemplo de nombre y apellido, no puedan
aparecer en más de un registro.
10
Siempre tiene que haber un campo que no se repita en ningún otro lugar. En el caso de que por mucha
casualidad suceda que coinciden (Ejem. Miguel Pérez), tendrÃ−amos que poner (Miguel Pérez 1 Miguel Pérez 2) o poner lo dos apellidos.
La primero que tenemos que hacer es seleccionar las caracterÃ−sticas que nos interesa y darle un
CAMPO. No todos los campos van a ser iguales, por eso pensaremos que tipo de valor o de dato vamos
a meter (si de texto o numérico).
Una caracterÃ−stica que podemos elegir es el FORMATO ARCHIVO, que tendrá algunos opciones
desplegables.
Uno mismo diseñará la base de datos, pero luego quien lo vaya a utilizar tiene que saber que formato
tiene el archivo.
El campo nombre-apellido podemos definir de tal forma que primero aparezca el apellido y luego el
nombre, o al revés.
En el campo edad, por ejemplo, podemos definir que vaya de 0-100 o en el de la fecha de nacimiento, el
dÃ−a del 1-31, y el mes del 1-12. El año desde 1900 a 2100. Siempre tienen que estar de la misma
forma 1-11-2002, 10-XI-2002, 10-11-02, 02-11-10 etc.
Lo que tenemos que hacer es unificar y clasificar todos esos conceptos a través de lenguajes
documentales.
Hay dos tipos de lenguajes documentales:
• Los que sirven para clasificar: estamos diciendo cual es el tema principal. Solo uno.
• Los de indización: permiten que en un mismo campo podamos meter más de un tema.
LENGUAJES DE CLASIFICACIÃ N
• Monoserfirovios: CDV (Verificación Décimas Universales). Es como los esquemas 2.1., 2.1.1.
... Dentro de cada punto tienes más puntos, que a su vez recoge otros. AsÃ−, especificamos
poco a poco el tema que buscamos. Normalmente solo se utilizan seis niveles (hasta 2.1.1.1.1) y
dentro de cada uno 10 puntos o temas. Si asÃ− queremos definir aún más, por ejemplo,
buscar dos temas relacionados ponemos los dos temas con 2 puntos (por ejemplo: buscar
minerÃ−a en Alemania):
• : 6.2.1.7.8
(minerÃ−a) Alemania)
♦ Facetados: son más prácticos pero más difÃ−cil de elaborar. ¿Por qué tienen
que tener 10 puntos? ¿No puede ser que unos temas estén más especializados que
otros? Ejemplo: la quÃ−mica coge los productos, otra faceta será materiales de base,
otra agentes y otra reacciones. AquÃ− se utiliza un código alfanumérico.
LENGUAJES DE INDIZACIÃ N
♦ Libre: optaremos términos que están en el texto. Directamente los sacamos del texto.
♦ Palabras claves.
♦ Descriptores libres.
♦ Controladores: lo preparamos con anterioridad.
♦
11
Ejemplo: si tengo en un texto varios sinónimos (diócesis y obispado). De estos dos elegimos
uno y el otro lo desechamos. El que cogemos serÃ−a descriptor. Es que descartamos será
no-descriptor.
Entre los descriptores puede haber:
• Las relaciones de equivalencia.
• Relaciones de jerarquÃ−a.
• Relaciones de asociación (RT)
Unitérminos (economÃ−a, Alemania).
Lo más útil es utilizar una base documental ya creada por otro. El problema es que hay veces
que no te sirve.
EN INFOGRAFIAS
♦ Autor
♦ Tema
♦ TÃ−tulo
♦ Tamaño/ubicación
♦ Color
♦ Formato; si está generado en algún programa antiguo.
· Formato de mapa electorial; jpg.
· Programas electoriales: cdr, frihand, ai.
♦ Elementos que tenemos:
· FotografÃ−a
· Texto
· Puede ser que una infografÃ−a tenga más de una parte.
· Imágenes que no son fotografÃ−a.
· Iconos (los que se parecen a la realidad) y sÃ−mbolos (los más abstractos: se alejan de la
realidad).
· LÃ−neas: su función es la de separar 2 partes.
♦ ¿Qué información extraeremos?
· Las lÃ−neas: no es importante.
· Texto: nombres, datos; separar de los iconos.
· Foto: no hay que analizar la foto tan detalladamente. ¿Cómo recogerÃ−amos que hay dos
partes? ¿Es interesante decir si tiene varias partes? Cuantas más partes tenga, tendrá más
información. Esto hay que especificarlo. Hay un autor que llama a cada parte infograma.
De los textos e imágenes obtenemos información: 2 autores:
12
• VALERO, SANCHO; 3 partes:
• Elementos básicos de una infografÃ−a:
♦ Texto.
♦ InfografÃ−as.
♦ LÃ−nea de conducción: enlazar el texto con la imagen. Unen partes de texto con partes
de la imagen.
♦ Números: no se interpretarán como texto. Normalmente son datos de cantidades.
♦ Iconos: siluetas (son más simbólicas).
♦ Leyendas: textos; titulitos: identifican textos de unas partes.
· Explicativo: texto
· Leyendas:
♦ Imagen decorativa: no interesa recoger.
♦ InfografÃ−as:
a) Colectivas: más de una.
b) Individuales:
1. Comparativas:
Espaciales:
· Circulares:
· Barra/columna:
· Ortogonales o fiebre:
· Ciclistas: aunque Valero sitúa este tipo de grafico en los posicionales, MADINA no. à ste
último lo sitúa aquÃ−.
Posicionales:
· Ôrboles: relación entre diversos elementos.
· Encuentros: normalmente los vemos en deporte.
· LÃ−neas:programación; que posición ocupan.
2. Documentales:
Artefactos: como funciona algo.
Panoramas: se ve el lugar.
Secciones: seccionar algo en partes.
Sujetos: leyendas relacionados con el sujeto.
3. Escénicas: enseñan el lugar, escena del acontecimiento. En atentados.
13
4. Ubicativas: responde a ¿dónde? Mapas/planos.
4.1. Mapas:
♦ Ver: normal
♦ Leer: marca lugares. Ejemplo: El caso del francotirador. Se marcarán los puntos de
los lugares donde se asesinó a la gente.
4.2. Planos:
♦ Recinto.
PARA ANALIZAR AUDIO:
Si estamos en una radio; vamos a organizar el archivo: ¿Qué recogemos? ¿Qué datos
sacaremos?
• TÃ−tulo: se lo inventará el documentalista. No habrá que cogerlo sino inventarlo.
• Locutor: el que trasmite la información.
• Nombre del programa.
• Tipo de programa/género.
• Emisor.
• Fecha de emisión.
• Hora de emisión/equivalente a la página.
• Directo/grabado.
• Duración.
• Temas tratados.
• Calidad original.
• Formato: digital/analógico.
• Idioma.
• Cortes de voz: personas.
¿El corte de voz se analiza junto a la noticia? o no?
Si extraemos el corte la noticia se quedará incompleta. Si se analiza por separado habrá que
analizarlo con la noticia.
En radio hay otro tipo de unidades (audio) que no se pueden analizar de esa forma:
♦ Música/sintonÃ−as.
♦ Intérprete(s).
♦ Compositor(es).
♦ TÃ−tulo.
♦ Derechos de reproducción.
♦ Duración.
♦ Tipo/género.
♦ Idioma
♦ Disco/canciones
♦ Ã poca.
♦ Fecha de publicación.
♦ DiscografÃ−a.
♦ Fecha de grabación.
♦ Elementos de audio; efectos sonoros: los podemos ver en Crónicas Marcianas o
Sorginen Laratza. Estos sonidos se meten mientras las personas hablan. Ejem: PAPA
14
LLAMA!!
♦ Tipo de efecto.
♦ Duración.
♦ Fecha de grabación: no se suele hablar mucho, ya que no se utilizan mucho.
ANÔLISIS AUDIOVISUAL (TV):
♦ Imágenes: planos, si son de color o blanco-negro. Será una sucesión de planos.
¿Cómo recogemos esa información?
Se hace un minutaje:
Ejemplo:
Del 21 al 22; el presentador habla.
Del 22 al 25; corte. Habla Juan.
Se recogerá todo. También se puede recoger si hay un cambio de plano.
EN FORMATO DE VIDEO/CINE:
♦ Movimiento de cámara.
La publicidad es algo que se puede analizar en radio, prensa y televisión.
Serra, 2001: Gestión de los documentos digitales: estrategias para su conservación. El
profesional de la información.
Sección
Análisis
Con las unidades documentales crearemos una referencia documental.
En la entrada tendremos unidades documentales, después de analizarlo, tendremos referencias
documentales. Con estas referencias estructuraremos la información.
Guardaremos las unidades documentales originales.
Sobre el almacenamiento siempre se ordenarán según un criterio. Ejemplo: Tema. Hay más
formas de almacenar: en televisión se hace con los códigos de barra. Todos los videos tienen su
código de barras. Es mucho más rápido pero también es más caro.
La conservación de los documentos originales. Hay que tener en cuenta:
♦ La temperatura.
♦ Humedad.
(...)
Un problema que se da; ¿Cómo conservar los formatos digitales? Hoy en dÃ−a se usa mucho.
Aunque tengan muchas ventajas, hay que tener en cuenta que dentro de 20 años no se podrán
abrir. Ejemplo: hace 15 años se utilizaba World perfect 5.1. Hoy World.
15
Se pueden hacer cosas para tener menos problemas:
• Preservar tecnologÃ−a original: habrá que tener el Hardware y el Software y también habrá
que guardar el ordenador. Es bastante costoso, además si surgen problemas será muy difÃ−cil de
arreglar, ya que puede que no haya repuestos.
• Migración de la información digital:
♦ Cambio de soporte: cuando se hayan hechos los cambios, se pasará a otro soporte.
♦ Compatibidad retroactiva.
♦ Interoperabilidad: cuando se intenta utilizar formatos viejos en formatos nuevos.
♦ Conversión a formatos estándar. Hay 2 tipos:
• Los que tienen propietarios: doc, qxd, phq, psd. Si se usan hay que pagar.
• Los que no tiene propietarios: jpg, q:f, txt, html. Son gratuitos.
• Emulación de tecnologÃ−a digital: cuando dentro de una tecnologÃ−a se puede copiar “un juego”.
Hay dos emuladores.
A partir de ahora, todo lo hacemos sobre la referencia documentales. Todas las operaciones de
búsqueda se harán de la referencia documental.
CaracterÃ−sticas:
♦ Recuperación de datos: cuando se quiere saber algo concreto.
♦ Recuperación de información: cuando se quiere saber algo sobre un tema.
RECUPERACIÃ N DE DATOS
RECUPERACIÃ N DE INFORMACIÃ N
Criterios
Forma de realizar la pregunta
Requerimiento del sistema
Criterio de éxito
Rapidez de respuesta
Recuperación de
información
Preguntas altamente
Preguntas oficiales de
formalizadas
formación
Determinista
ProbabilÃ−stica
Nivel de satisfacción del
Exactitud
usuario
Depende de las acciones del
Depende del soporte fÃ−sico y
usuario durante la
del algoritmo de búsqueda
interrogación
Recuperación de datos
OPERADORES DE BÃ SQUEDA
1. BOOLEANOS: And, Or, Xor, Not
La búsqueda se realizará en bases de datos. Habrá unos campos.
La búsqueda más sencilla es la siguiente:
- Poner el “TÃ−tulo”: por ejemplo Bush.
En biblioteca no se pueden preguntar dos cosas a la vez. Ejemplo: autor/editor. Es imposible,
hay que preguntarlo por separado. Sin embargo, en internet es posible realizar este tipo de
búsquedas.
16
Si queremos extraer todas las noticias del último mes donde en el titular aparezca por ejemplo
Bush, se utilizarán los operadores boodeanos:
1. Bush AND Irac
Se pide que estén estas dos palabras.
Bush
ORG
V
V
F
F
Nos enseña la lógica que sigue el ordenador.
Irac
V
F
V
F
V
V
V
F
Irac
V
F
V
F
V
F
F
F
2. Bush OR Irac
Una palabra u otra.
Bush
V
V
F
F
3. XOR
AND
4. NOT: es unario, sólo afecta a un término.
Ejemplo: NOTBUSH
Es importante saber que operador se quiere realizar. Este tipo de operadores se utilizan con
datos textuales y numéricos.
Si se quieren buscar más de dos términos, lo más normal es agruparlos de dos en dos. Si se
buscan más términos en un campo, la búsqueda será menos eficaz.
Ejemplo. Bush Bush OR Saddam) AND Aznar
Sanddam
Aznar Bush AND (Saddam OR Aznar)
Aunque se utilicen los mismos términos, los resultados serán diferentes, ya que el operador
utilizado está puesto de diferente manera.
Estos operadores se utilizarán en las búsquedas avanzadas.
2. ARITMÃ TICOS: >, > =, <, < =, < >, =
- Mayor que > (después que ...)
17
- Mayor o igual que > =
- Menor < (antes que .......... x fecha)
- Menor o igual que < =
- Distinto < >
- Igual =
Se usarán si tenemos un campo con números. Ejemplo: recuperar documentos del último
mes.
Fecha actual: 9 de noviembre del 2002-12-13
EntrarÃ−an a partir del 10. Si queremos que entre el 9, habrá que poner:
> = 9/11/02
Saber que juguetes cuestan más de 50 euros:
> 50e
Si no se especifica nada serÃ−a =
3. ARITMÃ TICOS: >, > =, <, < =, < >, =
Campos alfanuméricos donde pueden aparecer más de un valor. Se utilizan en los llamados
textos completos.
Estos operadores también se utilizan con dos términos. Nos dirá cual es la relación entre
los dos términos.
Tipos:
- Fase exacta: Perro caniche
- Todas las palabras: todos los documentos donde aparezcan los dos términos. Da igual si van
juntas o no, o si un está arriba y la otra abajo. Si se quieren ver las dos palabras juntas se
pondrán comillas.
- Near (within):
Si se ponen dos palabras:Ejemplo: Perro caniche
Perro w/5 caniche.
Puede haber 5 palabras entre las dos términos.
Se suele utilizar mucho en investigaciones.
- Adj (Preceed): Perro p/10 caniche.
18
EJEMPLO GOOGLE: 4 operadores (3 booleanos y 1 posicional).
ESTRATEGIAS DE BÃ SQUEDA
Si queremos recuperar los datos:
- Son datos concretos:
• Un término en campo.
• Más de un término en un campo.
• Más de un término en más de un campo.
Ejemplo: aplicación de la nanotecnologÃ−a en la medicina.
Si utilizamos la frase exacta en un buscador, seguramente que el resultado será 0. AsÃ−,
utilizaremos estrategias de busqueda. ¿Qué hacemos si no encontramos nada?
1. Utilizar sinónimos.
2. Realizar la misa pregunta o frase en inglés. (En el caso de internet, ya que hay más
información en Inglés).
Se puede utilizar nanotec* Lograremos todos los documentos donde aparezcan términos que
comiencen por nanotec. Si hay duda con que si se escribe con v o b, o de género, se pondrá
un interrogante (?).
Ejemplo: palabra gato. Gat?
Dubblia Core recoge datos de etiqueta:
Autor
Tema
Fuente
Derechos de reproducción (...)
No son tan especÃ−ficos como seguramente necesitemos. De momento, hay pocos buscadores
que entran a este diseño. Es importante para saber donde estamos.
14
1
Información
desordenada
Buscar
Seleccionar
19
Clasificar
Recopilar
Ordenar Recuperar
Individual
Grupal
TRANSMISIÃ N
Colectiva
(masas)
♦ LingüÃ−stica:analiza la transmisión de información.
♦ Educación: analiza la transmisión de valores.
♦ Semiótica/SemiologÃ−a: analiza la transmisión de signos no lingüÃ−sticos/ códigos
diferentes.
♦ Periodismo
♦ Propaganda
♦ Relaciones Públicas
Unidad Documental Referencia Documental
(Libro o documental) (Información sobre el libro
o documental. Base de datos).
Criterios de selección
ANÔLISIS DEL CONTENIDO
Diccionario
de datos
Lenguajes
documentales
Base
de
datos
Titularra
Fklajfakldfjakldjfalkfjajl
Adlf dofjkd ddldjoj lsjld Adlf dofjkd ddldjoj lsjld Adlf dofjkd ddldjoj lsjld Adlf Adlf dofj lsjld Adlf
20
dofjkd ddldjoj lsjld Adlf dofjkd ddldjoj lsjld Adlf dofjkd ddldjoj lsjld Adlf dofjkd ddldjoj lsjld Adlf
dofjkd ddldjoj lsjld Adlf dofjkd ddldjoj lsjld Adlf dofjkd ddldjoj lsjld Adlf jodll
Kdlf
Dlfk
Aero
Eojd
Dleo
Dore
Dllej
Eorj
Ooen
Ojeo
Doje
Eojo
doer
LLJ
Dddd ddddd
Eono doneon
Oneo onoens
Oneo oneooo
Onow ppkpm
Wpm oneow
Onne onopw
Onow opqnee
Poneq pqonod oneso ondeosa Poneq pqonod ondso ondeosa Poneq pqonod onedd ondeosa Poneq
pqonod onedd ondeosa Poneq pqonod onedd ovdeosa Poneq pqonod onedd ondeosa Poneq pqonod
onedd ondeosa Poneq pqonod onedd ondeosa Poneq pqonod onedd ondeosa Poneq pqonod onedd
ondeosa Poneq pqonod oneddso ondeosa
21
Dof
à lajdlñfjdldd
Lñññññññññ
Dferamer,oco
Oemo,cerueiu
Eo ooeuro,cor
Coro,coe.
Ldfjañddlfjdl
Dlfjldfjlfjdlld dljojon odnoek Dlfjldfjlfjdlld dljojon odnoek Dlfjldfjlfjdlld dljojon odnoek
Dlfjldfjlfjdlld dljojon odnoek Dlfjldfjlfjdlld dljojon odnoek Dlfjldfjlfjdlld dljojon odnoek
Dlfjldfjlfjdlld dljojon odnoek Dlfjldfjlfjdlld dljojon odnoek Dlfjldfjlfjdlld dljojon odnoek
Dlfjldfjlfjdlld dljojon odnoek
A
B
C
Extraer conceptos
Traducir
Nombre/Apellido
Dirección
Teléfono
Móvil
E-mail
Estado
TABLA: todos los campos con algún tipo de unidad se proyectará en una tabla.
Harri
Formato
archivo
pps
22
...
Lista de autoridades: un listado con ideas relevantes en las que aparece cómo hay que escribir esos
nombres.
Lista de materias.
Tesauros: el que nos puede reunir. Son lenguajes documentales. Vamos a utilizar una serie de
términos que no están en el texto, que lo preparemos con antelación.
· Descriptores: los términos que vamos a utilizar para realizar la indización.
· No descriptores: los que no vamos a utilizar.
♦ 29 m
♦ 24 m
Cada una de las partes se llama leyenda
De
Género a
+
concreto
(especÃ−fico)
23
Descargar