Digitalización de documentos de la Biblioteca de Koldo Mitxelena Kulturunea Pliego de prescripciones técnicas 1. 2. DATOS GENERALES ..................................................................................................................2 1.1 CUSTODIA ...............................................................................................................................2 1.2 DIGITALIZACIÓN: DESCRIPCIÓN DE LA DOCUMENTACIÓN .............................................................3 DESARROLLO DEL TRABAJO ...................................................................................................4 2.1 TRABAJO PREVIO .....................................................................................................................4 2.2 TRABAJO DE DIGITALIZACIÓN. REQUERIMIENTOS........................................................................5 2.2.1 Condiciones generales ...................................................................................................5 2.2.2 Condiciones técnicas específicas ...................................................................................5 2.2.2.1 Libros ..........................................................................................................................5 2.2.2.1.1 Estructura de directorios .........................................................................................5 2.2.2.1.2 Formato de digitalización ........................................................................................8 2.2.2.2 Publicaciones periódicas .............................................................................................8 2.2.2.2.1 Estructura de directorios .........................................................................................8 2.2.2.2.2 Formato de digitalización ......................................................................................11 2.2.2.3 Reconocimiento óptico de caracteres (OCR) ............................................................12 2.2.3 Entrega de imágenes para control de calidad ...............................................................12 2.2.4 Prototipo de muestra ....................................................................................................12 2.3 TRABAJO POSTERIOR Y CONTROL DE CALIDAD ........................................................................13 3. DERECHOS SOBRE LAS IMÁGENES ......................................................................................15 4. OBTENCION DE INFORMACIÓN ............................................................................................15 5. COMITÉ DEL PROYECTO .......................................................................................................15 2015/11/13 1 / 15 1. DATOS GENERALES 1.1 Custodia La empresa adjudicataria deberá transportar, ubicar y custodiar el fondo susceptible de digitalización (unos 50.000 documentos) en dependencias propias. El local donde se custodien los documentos debe contar con condiciones ambientales de temperatura y humedad idóneas, y es indispensable que las instalaciones estén en un estado óptimo de limpieza. Además, deberá contar con medidas de seguridad (armarios ignífugos, sistema de detección de incendios, alarmas, etc.), que aseguren la custodia de la documentación. La empresa deberá tener suscrita una póliza de seguros que cubra posibles daños del material por incendios, robos, inundaciones, etc., así como un seguro de responsabilidad civil que cubra el posible daño causado por el trabajo defectuosamente realizado. En caso de pérdida o deterioro del material la Diputación Foral de Gipuzkoa podrá exigir indemnizaciones económicas a la empresa adjudicataria. Asimismo, puede requerirse que, esporádicamente, se habilite una zona de trabajo para realizar tareas puntuales de tratamiento de la documentación como inventarios, expurgos, etc. La empresa adjudicataria deberá hacer constar las siguientes características del local: Superficie disponible (se requiere un mínimo de 280 m2). Condiciones ambientales (incluyendo plan/frecuencia de labores de limpieza y mantenimiento de las instalaciones) y de seguridad. Organización del espacio: plano y fotografías del local, zonas de almacenaje, metros lineales de baldas disponibles, etc. Plan de gestión de la documentación, con especial atención a la trazabilidad del proceso de custodia (control de la documentación en todos los pasos del proceso) y la accesibilidad a los documentos. Ubicación exacta del local y distancia a la que se encuentra de la sede central de la biblioteca Koldo Mitxelena Kulturunea. 2 / 15 Además de las labores de manipulación, traslado, ordenación y archivo de la documentación que se soliciten, la empresa deberá contemplar la recogida y entrega periódicas de documentos entre su sede de custodia y trabajo y la biblioteca de Koldo Mitxelena Kulturunea. 1.2 Digitalización: descripción de la documentación Documentos de interés de los fondos de reserva de las Bibliotecas Forales de Gipuzkoa: libros, manuscritos, publicaciones periódicas, carteles, fotografías, etc., en diferentes soportes (papel, negativos de fotografía y otros). Los documentos pueden tener dimensiones variables, y se pueden presentar como hojas sueltas, publicaciones encuadernadas, etc. El estado de conservación de la documentación es delicado. 3 / 15 2. DESARROLLO DEL TRABAJO 2.1 Trabajo previo La Diputación Foral de Gipuzkoa seleccionará los documentos a digitalizar. La empresa se encargará de la recogida y traslado de los documentos desde la ubicación original hasta sus locales en las fechas indicadas. El traslado se efectuará en condiciones que aseguren la integridad de los documentos. La Diputación Foral de Gipuzkoa establecerá el ritmo de trabajo y marcará los plazos de envíos y entregas. La Diputación Foral de Gipuzkoa entregará con cada envío de documentos una relación con la siguiente información: Número de copia de cada ejemplar Signatura Título Fecha de publicación Periodicidad (publicaciones periódicas) Observaciones. En este campo se detallarán las peculiaridades de cada ejemplar, por ejemplo, volúmenes, encuadernados con otras obras, ilustraciones, material anejo... Cualquier discrepancia de la relación de entrega con el material recibido debe ser comunicado inmediatamente al responsable del proyecto. La Diputación Foral de Gipuzkoa controlará el estado de conservación de los documentos entregados, a fin de comprobar dicho estado tras su devolución. 4 / 15 2.2 Trabajo de digitalización. Requerimientos 2.2.1 Condiciones generales La empresa adjudicataria debe prestar especial atención a las cuestiones que se señalan a continuación: Nombre del directorio. El número de copia que identifica al libro debe ser el correcto. Orden de paginación. Es inalterable. Páginas en blanco. No se digitalizan a no ser que se encuentren numeradas o que formen parte de la secuencia numerada de paginación sin estar físicamente numeradas. Elementos sueltos que aparecen entre las páginas del libro (pequeños folletos, hojas sueltas conteniendo anotaciones...). Se digitalizarán tras la última página del texto, antes de la contracubierta. Calidad de la imagen: La imagen debe ser lo más parecida posible al original. En el proceso de escaneado, debe colocarse correctamente el original para que la imagen no aparezca inclinada o rotada. También es importante que aparezca la zona interior de la encuadernación, por lo cual hay que abrir bien el ejemplar cuidando al mismo tiempo que éste no se deteriore. 2.2.2 Condiciones técnicas específicas A continuación se detallan la estructura de directorios y formato de digitalización de los tipos de documentación predominantes en la biblioteca: libros y publicaciones seriadas. En caso de abordar otros soportes, como carteles o fotografías, se determinarán los requerimientos técnicos adecuados a cada tipo de material. 2.2.2.1 Libros 2.2.2.1.1 Estructura de directorios CLAVE VOLÚMENES S IMÁGENES 5 / 15 Primer nivel - Clave Se grabará un directorio por cada número de copia diferente. La estructura de este nivel estará compuesta por: BBBPxxxxxxxxxx donde BBBP Valor fijo xxxxxxxxxx Número de copia de 10 dígitos. Se rellenará significativos por la izquierda. con ceros no Ejemplo: El número de copia BBBP0000025468. 25.468 se grabará en un directorio denominado Segundo nivel - Volúmenes El formato de este nivel estará compuesto por: xxxxxxxxxxTvvv donde xxxxxxxxxx Clave de diez caracteres alfanuméricos tal y como se recoge en el primer nivel. T Carácter que nos dice el tipo de volumen de que se trata, con los siguientes posibles valores: V - Cuando se trata de una obra en varios volúmenes E - Cuando tenemos diferentes obras encuadernadas juntas (encuadernado con...) S - Cuando se trata de una obra en un único volumen, que es el caso habitual vvv Nº de volumen dentro de una obra o el número de orden del encuadernado con en la publicación. Se rellenará con ceros no significativos por la izquierda. En el caso mencionado de una obra en un único volumen este campo tomará el valor “000”. Ejemplos: 1. Una obra en un único volumen, cuyo número de copia es el 241003: 0000241003S000. 2. Una obra compuesta por 120 volúmenes, cuyo número de copia es el 6824: grabaríamos 120 subdirectorios de nombres 0000006824V001 al 0000006824V120. 6 / 15 3. Una obra encuadernada en cuarto lugar junto con otras, cuyo número de copia es el 50803: 0000050803E004. Tercer nivel - Imágenes El formato de este nivel estará compuesto por: nnnnSppppx donde nnnn S Número de la imagen dentro del directorio. Número secuencial de cuatro dígitos con ceros no significativos por la izquierda comenzando con el “1” (0001) Este carácter estará asociado al sistema de numeración existente o ausente en cada imagen, siguiendo las siguientes reglas: A) Páginas numeradas. A.1) Una única secuencia de numeración. Se incluirá el valor fijo “A” seguido de los números de página. A.2) Más de una secuencia de numeración. Se identificará cada secuencia con una letra diferente, en orden alfabético empezando por la “A”, seguida de los números de página correspondientes dentro de cada numeración. Por ejemplo, A0001, A0002, A0003... B0001, B0002... B) Páginas sin numerar. Se incluirán la cubierta, portada, contraportada, hojas en blanco, últimas páginas... Se grabarán con la letra S seguida de un número secuencial de cuatro dígitos con ceros por la izquierda empezando por “1”. Si en el mismo documento hay más de una imagen o grupo de imágenes sin numerar intercaladas con imágenes numeradas, las imágenes sin numerar se numerarán correlativamente Cuando haya páginas sin numerar pero que lleven una numeración encubierta, se tratarán como páginas numeradas normales y se numerarán como si tuviesen escrito el número que les corresponde. Es el caso típico en el que no aparece la numeración por incluir una ilustración. Cuando haya hojas impresas por ambas caras -es decir, el número de página sólo aparece en el anverso de cada hoja-, renumeraremos las páginas, con lo cual una posible búsqueda por número de hoja no dará resultados. pppp Nº de página dentro de cada documento siguiendo las siguientes reglas: A) Las páginas numeradas en números árabes irán con su propia numeración rellenando el valor con ceros por la izquierda. Por ejemplo, 0003. B) Las páginas numeradas en números romanos irán con una R por delante seguida por el número convertido de romano a árabe. Por ejemplo, la página XXXVII la grabaremos como R037. ¡Atención! Si en un mismo documento se dan las dos secuencias de 7 / 15 paginación, arábiga y romana, ambas se tratarán como dos secuencias de paginación diferentes y ambas irán precedidas por la letra que identifica dicha secuencia. Ejemplo. Un libro con tres páginas en romanos y el resto en arábigos: 0001AR001, 0002AR002, 0003AR003, 0004B0001, 0005B0002... x Se utiliza este carácter para definir distintos conceptos: i - Identifica si la imagen pertenece a un índice. Puede haber más de un índice. p - Identifica la imagen de la portada o en su defecto, de la página que contiene más información sobre la obra (autor, título, editorial, fecha de edición, etc.). Cuando el ejemplar no tiene portada se considerará como tal la primera hoja con texto. Espacio - Si ni es índice ni portada. 2.2.2.1.2 Formato de digitalización Se obtendrá partiendo de una imagen inicial escaneada a 24 bits de profundidad de color en el formato que se detalla a continuación: Formato TIFF sin compresión Modo de color 8 bits de profundidad de color Resolución 300 ppp Tamaño de imagen Dimensiones del original 2.2.2.2 Publicaciones periódicas 2.2.2.2.1 Estructura de directorios CLAVE AÑO EJEMPLARES IMÁGENES 8 / 15 Primer nivel - Clave Se grabará un directorio por cada número de copia diferente. La estructura de este nivel estará compuesta por: BBHTxxxxxxxxxx donde BBHT Valor fijo xxxxxxxxxx Número de copia de 10 dígitos. Se rellenará significativos por la izquierda. con ceros no Ejemplo: El número de copia BBHT0000025468. 25.468 se grabará en un directorio denominado Segundo nivel – Años aaaa donde aaaa Año del ejemplar Tercer nivel – Ejemplares Habrá un directorio por cada ejemplar de la misma publicación compuesto por la siguiente estructura: aaaammddp-nnnnnn donde aaaammdd Fecha del ejemplar. La parte que no se conozca (el día, el mes o toda la fecha) se rellenará con ceros. p Periodicidad, con los siguientes valores posibles en minúsculas: d diario, s semanal, q quincenal, m mensual, b bimestral, t trimestral, c cuatrimestral, x semestral, a anual, y bianual, z trianual, i irregular y o otros. nnnnnn Número del ejemplar con ceros no significativos por la izquierda. Si carece de dicho número se rellenará con ceros. 9 / 15 Cuarto nivel - Imágenes El formato de este nivel estará compuesto por: nnnnSpppp donde Nnnn Número de la imagen dentro del directorio. Número secuencial de cuatro dígitos con ceros no significativos por la izquierda comenzando con el “1” (0001) S Este carácter estará asociado al sistema de numeración existente en cada imagen, siguiendo la siguiente regla: Una única secuencia de numeración. Se incluirá el valor fijo “A” seguido de los números de página. Más de una secuencia de numeración (suplementos). Suplementos con paginación distintiva: se identificará cada secuencia con una letra diferente, en orden alfabético empezando por la “A”, seguida de los números de página correspondientes dentro de cada numeración. Por ejemplo, A0001, A0002, A0003... B0001, B0002.. Si finalizado el suplemento vuelve a la numeración anterior, se seguirá la paginación que en esa secuencia anterior le corresponda. Por ejemplo: A0001 A0002 B0001 B0002 A0003 Suplementos sin paginación distintiva: Se identificará cada secuencia con una letra diferente pero los números de página serán correlativos siguiendo una única secuencia: A00001 --------A00010 B00011 --------B00020 A00021 10 / 15 pppp Nº de página dentro de cada documento. Siempre se reflejará la paginación real, que a veces aparece alterada por errores de encuadernación o tipográficos. Casos en los que NO se corrige: Si a un periódico le faltan hojas y hay un salto en la paginación, se respeta tal y como está. Siempre reflejaremos la paginación real. Casos en los que SI se corrige: Errores de encuadernación (aparecen páginas de un ejemplar intercaladas en otro) Errores tipográficos: Fecha: día 4-día 6-día 6, pero en realidad corresponden a los días 4-5 y 6. (Siempre comprobar números anteriores y posteriores). Numeración: Páginas mal numeradas: la página 3 aparece numerada como 8 (pero es la 3) Dos páginas con el mismo número Otros casos: Cuando un periódico está repetido, no digitalizamos el duplicado. Páginas recortadas: al escanear se pondrá una imagen de fondo para que se distinga de la página siguiente. 2.2.2.2.2 Formato de digitalización Se obtendrá partiendo de una imagen inicial escaneada a 24 bits de profundidad de color en el formato que se detalla a continuación: Formato TIFF con compresión LZW Modo de color 8 bits de profundidad de color Resolución 300 ppp Tamaño de imagen Dimensiones del original 11 / 15 2.2.2.3 Reconocimiento óptico de caracteres (OCR) El resultado del OCR se proporcionará en objetos normalizados XML según el esquema METS/ALTO. Se incluirá cada ejemplar en formato PDF de imagen con el texto oculto. Los ficheros anteriores se entregarán con una estructura de niveles similar a las descritas previamente. En cualquier caso, los requerimientos técnicos detallados se abordarán con la empresa adjudicataria. 2.2.3 Entrega de imágenes para control de calidad Mientras dure el proyecto, con el fin de realizar un control de calidad óptimo y gestionar con fluidez cualquier incidencia, se pondrá en marcha una aplicación mediante la cual la empresa digitalizadora subirá a una dirección ftp las imágenes digitalizadas. 2.2.4 Prototipo de muestra La Diputación Foral de Gipuzkoa pedirá a las empresas licitantes la realización de una prueba de digitalización y reconocimiento óptico de caracteres (OCR) de un lote de documentos que se elegirá por ser representativo del material a digitalizar. Los gastos de la prueba correrán por cuenta de las empresas licitantes. Los documentos para la realización de la prueba se recogerán en Koldo Mitxelena, firmándose una relación de entrega junto con el compromiso de devolución en el mismo estado en el plazo máximo de una semana. Cada empresa licitante entregará a la Diputación Foral de Gipuzkoa (en el sobre B) un DVD conteniendo el resultado de la digitalización de los documentos señalados. Para ello, se seguirán las pautas técnicas señaladas en este documento (estructura de directorios, formato y OCR). 12 / 15 Los resultados de la prueba servirán para evaluar la calidad de las imágenes y el grado de cumplimiento de los requerimientos técnicos solicitados y se utilizarán como uno de los criterios de valoración de la oferta. El licitador puede proponer la modificación de algunos de los requerimientos técnicos propuestos siempre que supongan un beneficio para el proyecto y queden totalmente justificados y explicados por escrito. En caso de existir esta propuesta alternativa justificada el licitador puede presentar dos ofertas (una con la propuesta original y otra con la alternativa) para el proyecto. 13 / 15 2.3 Trabajo posterior y control de calidad La empresa digitalizadora devolverá el material original acompañado de una relación de entrega y debidamente embalado en el mismo lugar donde lo recogió. La Diputación Foral de Gipuzkoa controlará el estado de conservación de los documentos entregados, a fin de comprobar dicho estado tras su devolución. Control de calidad exhaustivo. A realizar por la empresa digitalizadora. La empresa deberá llevar a cabo un control de calidad que verifique la corrección del trabajo a todos los niveles. Este control deberá ser realizado página a página, comparando el original con las imágenes digitalizadas. La empresa ofrecerá un interlocutor cualificado que, conociendo perfectamente todas las fases de ejecución del proyecto, estará disponible en todo momento para solucionar las dudas e incidencias que puedan surgir en esta fase. La Diputación Foral de Gipuzkoa evaluará mediante una aplicación creada a tal efecto la calidad del trabajo. En caso de ser detectados niveles de calidad por debajo del contratado el contratista deberá reelaborar por su cuenta los lotes entregados en malas condiciones sin alterar el precio y los plazos de entrega del contrato. El plazo de garantía de este contrato de servicios será de seis meses, a contar desde la recepción formal del mismo. Si durante este periodo apareciese algún defecto, el adjudicatario, a requerimiento de la Diputación Foral de Gipuzkoa, deberá subsanarlo inmediatamente. 14 / 15 3. DERECHOS SOBRE LAS IMÁGENES El adjudicatario se compromete a no utilizar las imágenes ni los datos resultantes de este proyecto en ningún otro proyecto o iniciativa diferente al que se refieren estos pliegos de prescripciones técnicas. 4. OBTENCION DE INFORMACIÓN Con carácter previo a la formulación de las ofertas, las empresas interesadas podrán evaluar la dedicación y complejidad de las tareas a abordar, poniendo la Diputación Foral de Gipuzkoa a su disposición la información necesaria para realizar las comprobaciones que estimen convenientes, como complemento de lo que se describe en este pliego. 5. COMITÉ del PROYECTO La Diputación Foral de Gipuzkoa, la Sociedad Foral de Servicios Informáticos y la empresa adjudicataria designarán respectivamente uno o varios responsables que se constituirán en “Comité del proyecto” con las funciones y atribuciones que se determinen en el contrato de ejecución del mismo. Serán funciones de este comité la definición, seguimiento y adopción de cuantas decisiones afecten a una correcta ejecución de los trabajos, con relación a las previsiones iniciales y a la planificación de los trabajos. Dicho comité se reunirá tantas veces como sea necesario durante la ejecución de los trabajos. 15 / 15