Anexo 1 CATALOGO DE CALIDAD El propósito de este catálogo es mostrar los resultados que se obtienen con el proceso de digitalización, y lo que se puede lograr al producir con calidad. Los ejemplos ilustran el tipo de trabajo y esfuerzo por llevar a los usuarios la información requerida en las mejores condiciones. 1. Limpieza de la imagen Imagen Editada Imagen Original Una correcta limpieza puede hacer la diferencia en la información que se presenta. Módulo IV - Digitalización de información impresa 30 2. Cambiar el tamaño de la imagen (re-sizing) Cuando se utilizan las funciones de aumento o disminución de la imagen, se corre el riesgo de perder nitidez, si no se maneja correctamente la resolución de la imagen. Módulo IV - Digitalización de información impresa 31 3. Minimizar el tamaño de un archivo a color Imagen Sin Recortar Imagen Recortada Cuando se trabaja con hojas a color existe el problema de que el tamaño del archivo es muy grande, 2MB aproximadamente. Si la imagen se recorta y se pega en una hoja blanca, el tamaño se reduce hasta en un 90%. Solo hay que tener el cuidado de no empobrecer demasiado la resolución de ésta. Módulo IV - Digitalización de información impresa 32 4. Reconstrucción del texto En algunos casos donde el materia se encuentra dañado pero el texto en documento original se puede leer, se puede reconstruir la parte dañada, con un editor de texto. Módulo IV - Digitalización de información impresa 33 Este es otro ejemplo de reconstrucción de imágenes Módulo IV - Digitalización de información impresa 34 5. Ampliación del texto en la fotocopia Durante el proceso de fotocopiado, también se puede contribuir al mejoramiento de la imágenes digitalizadas, el texto pequeño puede ampliarse para hacer mas legible el texto o detalles de la fotografía o figura. Módulo IV - Digitalización de información impresa 35 6. Efecto de ampliación y opciones de tipo de imagen en el software del escáner En algunas ocasiones las decisiones que se tomen en cuanto a las opciones que se utilicen el software de escaneo, pueden hacer una gran diferencia. A la izquierda una fotocopia en tamaño natural, a la derecha la misma imagen ampliada y escaneada a color. Módulo IV - Digitalización de información impresa 36 Anexo 2: Factores para el análisis de costo - beneficio Otros rubros, como la compra de software, se toman como una inversión a largo plazo. Si fuera necesario invertir en alquiler de oficinas evidentemente el costo unitario sería mayor. Cuando se hace necesario tomar una decisión en cuanto a realizar internamente la digitalización o contratar servicios externos para ello, hay que valorar diversos factores que son decisivos en lo concerniente a inversiones en equipos, contrataciones de personal, adquisición de materiales. Entre otros: En promedio, los proveedores externos cobran por el servicio de digitalización, incluyendo PDF pero no las fotocopias y la organización de la información, entre $0,50 y $1,00 por página. La producción mensual proyectada (número de páginas), así como el tiempo total en que se desarrollará el proyecto Los recursos requeridos: El proceso de digitalización demanda al menos 2 personas - un digitalizador y un encargado del control de calidad - y la creación de paginas HTML. Se consumirá una cantidad considerable en materiales como: CDS, papelería, fotocopias, entre otros. Tendrá que contarse con un espacio físico apto para acondicionar al menos dos puestos de trabajo. Las características del equipo de cómputo con que se cuenta (escaner y software, principalmente). El espacio para almacenar los documentos electrónicos. El material digitalizado es acumulativo y ocupará un espacio considerable al menos en una de las computadoras disponibles y en el servidor Web. El perfil del personal a contratar, considerando todos los factores anteriores. Análisis de caso: Desglose general de los costos de operación en un proceso de digitalización. Condiciones: Se utiliza un escáner promedio, tipo Fujitsu 3092DC, cuya vida útil, antes de requerir reparaciones, es de aproximadamente 50.000 páginas. Meta de producción mensual: 4.000 páginas mensuales con una sola persona a cargo de su manejo. Concepto Costo Producción (en US. $) Costo unitario aproximado (en US. $) Escáner Mano de obra Otros mínimos (CDs, electricidad, etc.) Total 1000 50000 0,02 1000 4000 0,25 50 4000 0,01 2.050 Módulo IV - Digitalización de información impresa 0,28 38 7. Combinación en escala de grises y texto A la izquierda una imagen escaneada en texto blanco y negro, a la derecha la misma imagen escaneada con una combinación de escala de grises y texto blanco y negro Módulo IV - Digitalización de información impresa 37 Anexo 3 Recomendaciones generales para la recepción de documentos en formato electrónico. Definir la estructura básica bajo la cuál se almacenará la información digital, así como las reglas de nomenclatura utilizadas en los archivos generados. La forma como se almacenen los archivos dentro de carpetas electrónicas, así como la forma de nombrarlos, revisten mucha importancia para facilitar la ubicación y acceso a estos nuevos documentos electrónicos. Definir el formato de archivo electrónico requerido. La definición de este formato depende del uso que se le vaya a dar a la información. Se recomiendan archivos en formato PDF, porque: - Para abrirlos sólo se necesita tener el software gratuito Adobe Readerâ. - Los archivos PDF son compactos, permiten la realización de búsquedas y puede accederse a ellos en cualquier momento - Es un formato estándar, que se prefiere para imprimir y ver documentos de páginas múltiples. Refiérase, a la tarea #2 del proceso "D", para detallar más sobre este aspecto. Definir los criterios de calidad mínimos para la aprobación de material recibido. Además de las características funcionales de calidad de un documento electrónico, también son importantes en este sentido las que se relacionan con sus cualidades "estéticas", es decir, aquellas que permitirán llevarlo al usuario con una presentación aceptable: legibilidad, nitidez, contenido completo, entre otras. Definir restricciones de tamaño para los archivos generados. Se recomienda definir un tamaño máximo para cada archivo, tomando en cuenta la manipulación de las imágenes, en los procesos de almacenamiento, procesamiento y sobre todo en los procesos de transmisión de información, que determinará la velocidad de acceso a la información por parte de los usuarios. Se propone un tamaño máximo de 1.2MB por archivo. Para mayor información sobre los tiempos de descarga de archivos con un tamaño aproximado a 1MB, refiérase a la tarea D.2 del proceso de escaneado (proceso D). Definir cómo se deberá desagregar el contenido de un documento, en caso de que éste sobrepase el tamaño de archivo permitido En muchos casos, habrá que seccionar el contenido del documento electrónico en varios archivos, debido a que su tamaño supera el que se ha establecido como óptimo. Muchas veces podrá tomarse como referencia, para dicho propósito, la estructura formal que normalmente incorporan los documentos editados (separación por partes, capítulos, apartados subtitulados y/o numerados correlativamente, etc.). Si no se dispone de una definición clara, bastará con tomar en cuenta la finalización de un párrafo para concluir la sección. En términos generales, será necesario cuidar que estas desagregaciones no provoquen interrupciones inconvenientes en el contenido expuesto por el documento. Módulo IV - Digitalización de información impresa 39 b) Abrir, en el programa de edición de imágenes, el archivo con el nombre: texto200 PRACTICA A continuación, se presenta una guía práctica para digitalizar documentos, con el objetivo de que el lector de este módulo aprenda-haciendo. Utilice las imágenes para guiarse con el software que se utilizará. c) Aplicar a dicho archivo todas las técnicas de edición estudiadas (limpieza de manchas, enderezado, etc.) a fin de mejorar la imagen digitalizada. d) Exportar el nuevo archivo a la carpeta de digitalización con el nombre de: texto200 INSTRUCCIONES: Observe las páginas que se adjuntan. Se le pide seguir, con base en ellas, los siguientes pasos: e) Abrir el programa Adobe Acrobat para guardar el archivo llamado texto200, como PDF, con el nombre: parte 1. 1) Crear una carpeta llamada digitalización 2) Escanear las especificaciones: páginas con las siguientes a) Escanear la página de color a 75 dpi b) Guardar la imagen en formato tiff con el nombre: color75 c) Escanear la página de color a 300 dpi d) Guardar la imagen en formato tiff con el nombre: color300 e) Escanear la página en blanco y negro de texto a 75dpi f) Guardar la imagen en formato tiff comprimido con el nombre: texto75 g) Escanear la página en blanco y negro de texto a 200 dpi h) Guardar la imagen en formato tiff comprimido con el nombre: texto200 i) Escanear la página en blanco y negro combinada (texto escala de grises) a 200 dpi. Una vez en escala de grises y otra vez en texto Blanco y Negro. j) Guardar las imágenes escaneadas, en formato tiff comprimido y multipagina, con el nombre: mixto_g (escala de grises) y mixto_bn (blanco y negro). 3) Desarrollar las siguientes actividades con la página a color 5) Desarrollar las siguientes actividades con los archivos llamados: mixto_g y mixto_bn: a) Visualizar cada una de las imágenes del archivo, aplicando el zooming (en el visor de imágenes) para notar las diferencias de acabado. b) Abrir, en el programa de edición de imágenes, el archivo con el nombre: mixto_bn c) Aplicarle las técnicas de edición (limpieza de manchas, enderezado, etc.) que permitan mejorar la imagen digitalizada en la página escaneada en blanco y negro d) Observar el efecto que causa este tratamiento, en la fotografía de esta página. e) Borrar la fotografía de la página editada f) Cortar la fotografía de la página escaneada a escala de grises (mixto_g) y pegarla en la página editada anteriormente g) Eliminar la página de la cual fue cortada la fotografía. a) Visualizar cada una de las imágenes (color75 y color300) aplicando el zooming (en el visor de imágenes) para notar las diferencias de acabado. h) Observar el acabado final de la página resultante b) Abrir en el programa de edición de imágenes, el archivo con el nombre: color300 i) Exportar el nuevo archivo a la carpeta de digitalización con . el nombre de: mixto c) Cortar la imagen y pegarla en una hoja en blanco j) Abrir el programa Adobe Acrobat para guardar como PDF el archivo llamado mixto, con el nombre: parte 2. d) Exportar el nuevo archivo a la carpeta de digitalización con el nombre de: color e) Abrir el programa Adobe Acrobat para guardar el archivo llamado color, como PDF con el nombre: portada. f) Comparar el tamaño del archivo, color300 con el archivo llamado portada, con formato pdf 6) Hacer página HTML, utilizando el software Dreamweaver a) Diseñar en el editor de paginas HTML, una página que contenga la información de un documento electrónico compuesto por tres archivos con formato pdf: portada, parte 1 y parte 2. 4) Desarrollar las siguientes actividades con la página de texto: b) Incorporar un enlace para el archivo portada y otro para cada uno de los otros dos archivos, llamados parte 1 y parte 2. a) Visualizar cada una de las imágenes (texto75 y texto200) aplicando el zooming (en el visor de imágenes) para notar las diferencias de acabado. c) Ejecutar la página maestra para probar los enlaces. d) Guardar el archivo html, con el nombre: final. Módulo IV - Digitalización de información impresa 40 Color Módulo IV - Digitalización de información impresa 41 Mixto Módulo IV - Digitalización de información impresa 42 Texto Módulo IV - Digitalización de información impresa 43 Bibliografía consultada: Cornell University Library (2000-2003). Llevando la teoría a la práctica. Tutorial de de digitalización de imágenes (Tutorial en Línea). Consultado el día 18 de octubre de 2003 de la World Wide Web: http://www.library.cornell.edu/preservation/tutorial CRID (Agosto, 2002). Manual de digitalización (Manual en Línea). Consultado el día 01 de octubre de 2003 de la World Wide Web: http://www.crid.or.cr/crid/PDF/MODCRID/ Manual%20de%20Digitalizacion.pdf Autores ; Lara Juan Luis, tr (Enero, 2000). ¿Qué es XHTML?.Consultado el día 25 de octubre de 2003 de la World Wide Web: http://home.worldonline.es/jlgranad/xhtml/xhtml1.htm#xhtml Muñiz, Stefan; Krumbacher, Virgilio, tr (2002).Convenciones para nombres de archivos. Consultado el día 26 de octubre de 2003 de la World Wide Web: http://www.selfhtml.com.ar/html/general/nombres archivos.htm Williams, Eastman, (Julio, 2000). Selecting a Scanner. Consultado el día 15 de noviembre de 2003 de la World Wide Web: http://www.rlg.org/visguides/visguide2.html Servicios Bibliotecarios (2003).. Consultado el día 10 de enero de 2004 de la World Wide Web: http://mx.geocities.com/serviciosbibliotecarios/ digitalizacion.htm003 DR © Universidad Universidad Nacional Autónoma de México (Septiembre, 2003). El Escáner. Consultado el día 05 de diciembre de 2003 de la World Wide Web: http://biblioweb.dgsca.unam.mx/bd/dig/scaner.html Ministerio de educación, cultura y deporte (Sin Fecha). Recursos y materiales para la autoformación. El formato PDF de Adobe. Consultado el día 05 de diciembre de 2003 de la World Wide Web: http://iris.cnice.mecd.es/fomentolectura/recursos/ bibliovirtual/autoformacion/ficha3.html Centro Regional de Investigación y Desarrollo, CERIDE (Sin Fecha). MicroISIS. Consultado el día 19 de diciembre de 2003 de la World Wide Web: http://www.arcride.edu.ar/servicios/isis/misis.htm BIREME, (Sin Fecha). Manual de Instalación de la interface de consultas iAH. Consultado el día 19 de diciembre de 2003 de la Wo Digitalización de Documentos (Libros, Publicaciones periódicas, fotografías, etc.)rld Wide Web: http://law.bvs.br/E/metodocument/iah2E.htm#item01 Módulo IV - Digitalización de información impresa 44 41