ANÁLISIS DE APLICACIONES

Anuncio
Digitalización de documentos de la Biblioteca de Koldo
Mitxelena Kulturunea
Pliego de prescripciones técnicas
1.
2.
DATOS GENERALES ..................................................................................................................2
1.1
CUSTODIA ...............................................................................................................................2
1.2
DIGITALIZACIÓN: DESCRIPCIÓN DE LA DOCUMENTACIÓN .............................................................3
DESARROLLO DEL TRABAJO ...................................................................................................4
2.1
TRABAJO PREVIO .....................................................................................................................4
2.2
TRABAJO DE DIGITALIZACIÓN. REQUERIMIENTOS........................................................................5
2.2.1
Condiciones generales ...................................................................................................5
2.2.2
Condiciones técnicas específicas ...................................................................................5
2.2.2.1 Libros ..........................................................................................................................5
2.2.2.1.1 Estructura de directorios .........................................................................................5
2.2.2.1.2 Formato de digitalización ........................................................................................8
2.2.2.2 Publicaciones periódicas .............................................................................................8
2.2.2.2.1 Estructura de directorios .........................................................................................8
2.2.2.2.2 Formato de digitalización ......................................................................................11
2.2.2.3 Reconocimiento óptico de caracteres (OCR) ............................................................12
2.2.3
Entrega de imágenes para control de calidad ...............................................................12
2.2.4
Prototipo de muestra ....................................................................................................12
2.3
TRABAJO POSTERIOR Y CONTROL DE CALIDAD ........................................................................13
3.
DERECHOS SOBRE LAS IMÁGENES ......................................................................................15
4.
OBTENCION DE INFORMACIÓN ............................................................................................15
5.
COMITÉ DEL PROYECTO .......................................................................................................15
2015/11/13
1 / 15
1. DATOS GENERALES
1.1 Custodia
La empresa adjudicataria deberá transportar, ubicar y custodiar el fondo susceptible de
digitalización (unos 50.000 documentos) en dependencias propias.
El local donde se custodien los documentos debe contar con condiciones ambientales de
temperatura y humedad idóneas, y es indispensable que las instalaciones estén en un
estado óptimo de limpieza. Además, deberá contar con medidas de seguridad (armarios
ignífugos, sistema de detección de incendios, alarmas, etc.), que aseguren la custodia de la
documentación. La empresa deberá tener suscrita una póliza de seguros que cubra posibles
daños del material por incendios, robos, inundaciones, etc., así como un seguro de
responsabilidad civil que cubra el posible daño causado por el trabajo defectuosamente
realizado. En caso de pérdida o deterioro del material la Diputación Foral de Gipuzkoa podrá
exigir indemnizaciones económicas a la empresa adjudicataria.
Asimismo, puede requerirse que, esporádicamente, se habilite una zona de trabajo para
realizar tareas puntuales de tratamiento de la documentación como inventarios, expurgos,
etc.
La empresa adjudicataria deberá hacer constar las siguientes características del local:

Superficie disponible (se requiere un mínimo de 280 m2).

Condiciones ambientales (incluyendo plan/frecuencia de labores de limpieza y
mantenimiento de las instalaciones) y de seguridad.

Organización del espacio: plano y fotografías del local, zonas de almacenaje, metros
lineales de baldas disponibles, etc.

Plan de gestión de la documentación, con especial atención a la trazabilidad del
proceso de custodia (control de la documentación en todos los pasos del proceso) y
la accesibilidad a los documentos.

Ubicación exacta del local y distancia a la que se encuentra de la sede central de la
biblioteca Koldo Mitxelena Kulturunea.
2 / 15
Además de las labores de manipulación, traslado, ordenación y archivo de la
documentación que se soliciten, la empresa deberá contemplar la recogida y entrega
periódicas de documentos entre su sede de custodia y trabajo y la biblioteca de Koldo
Mitxelena Kulturunea.
1.2 Digitalización: descripción de la documentación
Documentos de interés de los fondos de reserva de las Bibliotecas Forales de Gipuzkoa:
libros, manuscritos, publicaciones periódicas, carteles, fotografías, etc., en diferentes
soportes (papel, negativos de fotografía y otros).
Los documentos pueden tener dimensiones variables, y se pueden presentar como hojas
sueltas, publicaciones encuadernadas, etc.
El estado de conservación de la documentación es delicado.
3 / 15
2. DESARROLLO DEL TRABAJO
2.1 Trabajo previo

La Diputación Foral de Gipuzkoa seleccionará los documentos a digitalizar.

La empresa se encargará de la recogida y traslado de los documentos desde la
ubicación original hasta sus locales en las fechas indicadas. El traslado se efectuará en
condiciones que aseguren la integridad de los documentos.

La Diputación Foral de Gipuzkoa establecerá el ritmo de trabajo y marcará los plazos de
envíos y entregas.

La Diputación Foral de Gipuzkoa entregará con cada envío de documentos una relación
con la siguiente información:
 Número de copia de cada ejemplar
 Signatura
 Título
 Fecha de publicación
 Periodicidad (publicaciones periódicas)
 Observaciones. En este campo se detallarán las peculiaridades de cada ejemplar,
por ejemplo, volúmenes, encuadernados con otras obras, ilustraciones, material
anejo...

Cualquier discrepancia de la relación de entrega con el material recibido debe ser
comunicado inmediatamente al responsable del proyecto.

La Diputación Foral de Gipuzkoa controlará el estado de conservación de los
documentos entregados, a fin de comprobar dicho estado tras su devolución.
4 / 15
2.2 Trabajo de digitalización. Requerimientos
2.2.1 Condiciones generales
La empresa adjudicataria debe prestar especial atención a las cuestiones que se señalan a
continuación:

Nombre del directorio. El número de copia que identifica al libro debe ser el correcto.

Orden de paginación. Es inalterable.

Páginas en blanco. No se digitalizan a no ser que se encuentren numeradas o que formen
parte de la secuencia numerada de paginación sin estar físicamente numeradas.

Elementos sueltos que aparecen entre las páginas del libro (pequeños folletos, hojas
sueltas conteniendo anotaciones...). Se digitalizarán tras la última página del texto, antes
de la contracubierta.

Calidad de la imagen:

La imagen debe ser lo más parecida posible al original.

En el proceso de escaneado, debe colocarse correctamente el original para que la
imagen no aparezca inclinada o rotada. También es importante que aparezca la zona
interior de la encuadernación, por lo cual hay que abrir bien el ejemplar cuidando al
mismo tiempo que éste no se deteriore.
2.2.2 Condiciones técnicas específicas
A continuación se detallan la estructura de directorios y formato de digitalización de los tipos
de documentación predominantes en la biblioteca: libros y publicaciones seriadas. En caso
de abordar otros soportes, como carteles o fotografías, se determinarán los requerimientos
técnicos adecuados a cada tipo de material.
2.2.2.1
Libros
2.2.2.1.1
Estructura de directorios
CLAVE
VOLÚMENES
S
IMÁGENES
5 / 15
Primer nivel - Clave
Se grabará un directorio por cada número de copia diferente.
La estructura de este nivel estará compuesta por:
BBBPxxxxxxxxxx
donde
BBBP
Valor fijo
xxxxxxxxxx
Número de copia de 10 dígitos. Se rellenará
significativos por la izquierda.
con ceros no
Ejemplo:
El número de copia
BBBP0000025468.
25.468
se
grabará
en
un
directorio
denominado
Segundo nivel - Volúmenes
El formato de este nivel estará compuesto por:
xxxxxxxxxxTvvv
donde
xxxxxxxxxx
Clave de diez caracteres alfanuméricos tal y como se recoge en el
primer nivel.
T
Carácter que nos dice el tipo de volumen de que se trata, con los
siguientes posibles valores:
V - Cuando se trata de una obra en varios volúmenes
E - Cuando tenemos diferentes obras encuadernadas juntas
(encuadernado con...)
S - Cuando se trata de una obra en un único volumen, que es el
caso habitual
vvv
Nº de volumen dentro de una obra o el número de orden del
encuadernado con en la publicación. Se rellenará con ceros no
significativos por la izquierda.
En el caso mencionado de una obra en un único volumen este
campo tomará el valor “000”.
Ejemplos:
1.
Una obra en un único volumen, cuyo número de copia es el 241003:
0000241003S000.
2.
Una obra compuesta por 120 volúmenes, cuyo número de copia es el 6824:
grabaríamos
120
subdirectorios
de
nombres
0000006824V001
al
0000006824V120.
6 / 15
3.
Una obra encuadernada en cuarto lugar junto con otras, cuyo número de copia es
el 50803: 0000050803E004.
Tercer nivel - Imágenes
El formato de este nivel estará compuesto por:
nnnnSppppx
donde
nnnn
S
Número de la imagen dentro del directorio. Número secuencial de cuatro
dígitos con ceros no significativos por la izquierda comenzando con el “1”
(0001)
Este carácter estará asociado al sistema de numeración existente o ausente
en cada imagen, siguiendo las siguientes reglas:
A) Páginas numeradas.
A.1) Una única secuencia de numeración. Se incluirá el valor fijo “A” seguido
de los números de página.
A.2) Más de una secuencia de numeración. Se identificará cada secuencia
con una letra diferente, en orden alfabético empezando por la “A”,
seguida de los números de página correspondientes dentro de cada
numeración. Por ejemplo, A0001, A0002, A0003... B0001, B0002...
B) Páginas sin numerar.
Se incluirán la cubierta, portada, contraportada, hojas en blanco, últimas
páginas... Se grabarán con la letra S seguida de un número secuencial
de cuatro dígitos con ceros por la izquierda empezando por “1”.
Si en el mismo documento hay más de una imagen o grupo de imágenes
sin numerar intercaladas con imágenes numeradas, las imágenes sin
numerar se numerarán correlativamente
Cuando haya páginas sin numerar pero que lleven una numeración
encubierta, se tratarán como páginas numeradas normales y se
numerarán como si tuviesen escrito el número que les corresponde. Es
el caso típico en el que no aparece la numeración por incluir una
ilustración.
Cuando haya hojas impresas por ambas caras -es decir, el número de
página sólo aparece en el anverso de cada hoja-, renumeraremos las
páginas, con lo cual una posible búsqueda por número de hoja no dará
resultados.
pppp
Nº de página dentro de cada documento siguiendo las siguientes reglas:
A) Las páginas numeradas en números árabes irán con su propia
numeración rellenando el valor con ceros por la izquierda. Por ejemplo,
0003.
B) Las páginas numeradas en números romanos irán con una R por
delante seguida por el número convertido de romano a árabe. Por
ejemplo, la página XXXVII la grabaremos como R037.
¡Atención! Si en un mismo documento se dan las dos secuencias de
7 / 15
paginación, arábiga y romana, ambas se tratarán como dos secuencias
de paginación diferentes y ambas irán precedidas por la letra que
identifica dicha secuencia.
Ejemplo. Un libro con tres páginas en romanos y el resto en arábigos:
0001AR001, 0002AR002, 0003AR003, 0004B0001, 0005B0002...
x
Se utiliza este carácter para definir distintos conceptos:
i - Identifica si la imagen pertenece a un índice. Puede haber más de un
índice.
p - Identifica la imagen de la portada o en su defecto, de la página que
contiene más información sobre la obra (autor, título, editorial, fecha de
edición, etc.). Cuando el ejemplar no tiene portada se considerará como tal
la primera hoja con texto.
Espacio - Si ni es índice ni portada.
2.2.2.1.2
Formato de digitalización
Se obtendrá partiendo de una imagen inicial escaneada a 24 bits de profundidad de
color en el formato que se detalla a continuación:
Formato
TIFF sin compresión
Modo de color
8 bits de profundidad de color
Resolución
300 ppp
Tamaño de imagen
Dimensiones del original
2.2.2.2
Publicaciones periódicas
2.2.2.2.1
Estructura de directorios
CLAVE
AÑO
EJEMPLARES
IMÁGENES
8 / 15
Primer nivel - Clave
Se grabará un directorio por cada número de copia diferente.
La estructura de este nivel estará compuesta por:
BBHTxxxxxxxxxx
donde
BBHT
Valor fijo
xxxxxxxxxx
Número de copia de 10 dígitos. Se rellenará
significativos por la izquierda.
con ceros no
Ejemplo:
El número de copia
BBHT0000025468.
25.468
se
grabará
en
un
directorio
denominado
Segundo nivel – Años
aaaa
donde
aaaa
Año del ejemplar
Tercer nivel – Ejemplares
Habrá un directorio por cada ejemplar de la misma publicación compuesto por la
siguiente estructura:
aaaammddp-nnnnnn
donde
aaaammdd
Fecha del ejemplar. La parte que no se conozca (el día, el mes o
toda la fecha) se rellenará con ceros.
p
Periodicidad, con los siguientes valores posibles en minúsculas:
d diario, s semanal, q quincenal, m mensual, b bimestral, t trimestral,
c cuatrimestral, x semestral, a anual, y bianual, z trianual, i irregular y
o otros.
nnnnnn
Número del ejemplar con ceros no significativos por la izquierda. Si
carece de dicho número se rellenará con ceros.
9 / 15
Cuarto nivel - Imágenes
El formato de este nivel estará compuesto por:
nnnnSpppp
donde
Nnnn
Número de la imagen dentro del directorio. Número secuencial de
cuatro dígitos con ceros no significativos por la izquierda
comenzando con el “1” (0001)
S
Este carácter estará asociado al sistema de numeración existente en
cada imagen, siguiendo la siguiente regla:
Una única secuencia de numeración. Se incluirá el valor fijo “A”
seguido de los números de página.
Más de una secuencia de numeración (suplementos).
Suplementos con paginación distintiva: se identificará cada
secuencia con una letra diferente, en orden alfabético empezando
por la “A”, seguida de los números de página correspondientes
dentro de cada numeración. Por ejemplo, A0001, A0002, A0003...
B0001, B0002..
Si finalizado el suplemento vuelve a la numeración anterior, se
seguirá la paginación que en esa secuencia anterior le corresponda.
Por ejemplo:
A0001
A0002
B0001
B0002
A0003
Suplementos sin paginación distintiva: Se identificará cada secuencia
con una letra diferente pero los números de página serán correlativos
siguiendo una única secuencia:
A00001
--------A00010
B00011
--------B00020
A00021
10 / 15
pppp
Nº de página dentro de cada documento.
Siempre se reflejará la paginación real, que a veces aparece alterada
por errores de encuadernación o tipográficos.
Casos en los que NO se corrige:
Si a un periódico le faltan hojas y hay un salto en la paginación, se
respeta tal y como está. Siempre reflejaremos la paginación real.
Casos en los que SI se corrige:

Errores de encuadernación (aparecen páginas de un
ejemplar intercaladas en otro)

Errores tipográficos:
Fecha: día 4-día 6-día 6, pero en realidad corresponden a los
días 4-5 y 6. (Siempre comprobar números anteriores y
posteriores).
Numeración:
Páginas mal numeradas: la página 3 aparece numerada como
8 (pero es la 3)
Dos páginas con el mismo número
Otros casos:
Cuando un periódico está repetido, no digitalizamos el duplicado.
Páginas recortadas: al escanear se pondrá una imagen de fondo
para que se distinga de la página siguiente.
2.2.2.2.2
Formato de digitalización
Se obtendrá partiendo de una imagen inicial escaneada a 24 bits de profundidad de
color en el formato que se detalla a continuación:
Formato
TIFF con compresión LZW
Modo de color
8 bits de profundidad de color
Resolución
300 ppp
Tamaño de imagen Dimensiones del original
11 / 15
2.2.2.3

Reconocimiento óptico de caracteres (OCR)
El resultado del OCR se proporcionará en objetos normalizados XML según el
esquema METS/ALTO.

Se incluirá cada ejemplar en formato PDF de imagen con el texto oculto.

Los ficheros anteriores se entregarán con una estructura de niveles similar a las
descritas previamente.

En cualquier caso, los requerimientos técnicos detallados se abordarán con la
empresa adjudicataria.

2.2.3 Entrega de imágenes para control de calidad
Mientras dure el proyecto, con el fin de realizar un control de calidad óptimo y gestionar con
fluidez cualquier incidencia, se pondrá en marcha una aplicación mediante la cual la empresa
digitalizadora subirá a una dirección ftp las imágenes digitalizadas.
2.2.4 Prototipo de muestra
 La Diputación Foral de Gipuzkoa pedirá a las empresas licitantes la realización de una
prueba de digitalización y reconocimiento óptico de caracteres (OCR) de un lote de
documentos que se elegirá por ser representativo del material a digitalizar. Los gastos de la
prueba correrán por cuenta de las empresas licitantes.
 Los documentos para la realización de la prueba se recogerán en Koldo Mitxelena,
firmándose una relación de entrega junto con el compromiso de devolución en el mismo
estado en el plazo máximo de una semana.
 Cada empresa licitante entregará a la Diputación Foral de Gipuzkoa (en el sobre B) un DVD
conteniendo el resultado de la digitalización de los documentos señalados. Para ello, se
seguirán las pautas técnicas señaladas en este documento (estructura de directorios,
formato y OCR).
12 / 15
 Los resultados de la prueba servirán para evaluar la calidad de las imágenes y el grado de
cumplimiento de los requerimientos técnicos solicitados y se utilizarán como uno de los
criterios de valoración de la oferta.
 El licitador puede proponer la modificación de algunos de los requerimientos técnicos
propuestos siempre que supongan un beneficio para el proyecto y queden totalmente
justificados y explicados por escrito. En caso de existir esta propuesta alternativa justificada
el licitador puede presentar dos ofertas (una con la propuesta original y otra con la
alternativa) para el proyecto.
13 / 15
2.3 Trabajo posterior y control de calidad

La empresa digitalizadora devolverá el material original acompañado de una relación de
entrega y debidamente embalado en el mismo lugar donde lo recogió.

La Diputación Foral de Gipuzkoa controlará el estado de conservación de los documentos
entregados, a fin de comprobar dicho estado tras su devolución.

Control de calidad exhaustivo. A realizar por la empresa digitalizadora.

La empresa deberá llevar a cabo un control de calidad que verifique la corrección del
trabajo a todos los niveles. Este control deberá ser realizado página a página, comparando
el original con las imágenes digitalizadas.

La empresa ofrecerá un interlocutor cualificado que, conociendo perfectamente todas las
fases de ejecución del proyecto, estará disponible en todo momento para solucionar las
dudas e incidencias que puedan surgir en esta fase.

La Diputación Foral de Gipuzkoa evaluará mediante una aplicación creada a tal efecto la
calidad del trabajo.

En caso de ser detectados niveles de calidad por debajo del contratado el contratista
deberá reelaborar por su cuenta los lotes entregados en malas condiciones sin alterar el
precio y los plazos de entrega del contrato.

El plazo de garantía de este contrato de servicios será de seis meses, a contar desde la
recepción formal del mismo. Si durante este periodo apareciese algún defecto, el
adjudicatario, a requerimiento de la Diputación Foral de Gipuzkoa, deberá subsanarlo
inmediatamente.
14 / 15
3. DERECHOS SOBRE LAS IMÁGENES
El adjudicatario se compromete a no utilizar las imágenes ni los datos resultantes de este
proyecto en ningún otro proyecto o iniciativa diferente al que se refieren estos pliegos de
prescripciones técnicas.
4. OBTENCION DE INFORMACIÓN
Con carácter previo a la formulación de las ofertas, las empresas interesadas podrán evaluar la
dedicación y complejidad de las tareas a abordar, poniendo la Diputación Foral de Gipuzkoa a
su disposición la información necesaria para realizar las comprobaciones que estimen
convenientes, como complemento de lo que se describe en este pliego.
5. COMITÉ del PROYECTO
La Diputación Foral de Gipuzkoa, la Sociedad Foral de Servicios Informáticos y la empresa
adjudicataria designarán respectivamente uno o varios responsables que se constituirán en
“Comité del proyecto” con las funciones y atribuciones que se determinen en el contrato de
ejecución del mismo.
Serán funciones de este comité la definición, seguimiento y adopción de cuantas decisiones
afecten a una correcta ejecución de los trabajos, con relación a las previsiones iniciales y a la
planificación de los trabajos.
Dicho comité se reunirá tantas veces como sea necesario durante la ejecución de los
trabajos.
15 / 15
Descargar