Guía rápida de cargas CSV paso a paso

Anuncio
Distribuidor de información
del libro español en venta
Cargas de datos con CSV paso a paso
V6 12/2015
Distribuidor de información del libro español en venta
Contenido
La calidad de los datos 3
La carga de datos 5
Plantillas para una carga paso a paso 5
Hojas de trabajo 6
Instrucciones 6
Archivo_Datos 6
Archivo_Datos_Desplegables 7
Resto de hojas 7
Cómo se usan 7
1 Rellenar los datos. 7
2 Limpiar filas y columnas 8
3 Preparar el archivo para la carga 8
4 Cargar el archivo 9
5 Verificar el resultado 10
Qué campos contienen 10
Trabajar con archivos .XLS y .CSV 19
Preparar archivos Excel para CSV 19
Última celda vacía 20
Limpiar filas 20
Limpiar columnas 21
Libros Públicos 22
Cargas de archivos parciales para corregir datos 22
Para saber más sobre CSV 24
DILVE es un proyecto de
Promovido por
Cargas de datos con CSV paso a paso
2
Con el patrocinio de
Distribuidor de información del libro español en venta
La calidad de los datos
Uno de los objetivos de la iniciativa DILVE es aumentar la calidad de los
datos que se distribuyen en la cadena de suministro del libro.
ISBN ANELE SINLI
Nivel_0. Inicial
Identificación
La calidad de los datos se puede evaluar, entre otros, en los tres aspectos
siguientes:
-
la riqueza de contenidos o número de campos
-
la adecuada identificación de los contenidos, es decir, que cada dato vaya
en su campo, codificado de acuerdo con estándares aceptados, y
la corrección ortográfica; adecuado uso de mayúsculas, minúsculas,
acentos, etc.
-
Para ayudar a la mejora progresiva de la calidad de los datos, en DILVE,
se establecen cuatro niveles respecto a la riqueza de contenidos o número de campos:
-
Nivel 0 Inicial: datos de identificación del libro.
-
Nivel 1 Básico: datos sobre autorías, idiomas, edición, colecciones,
características físicas, otras menciones de responsabilidad, libro de texto y
obras completas.
-
Nivel 2 Rico: datos sobre cubiertas, resúmenes, títulos, edición, materias,
características físicas y destinatarios.
-
Nivel 3 Avanzado: datos sobre contenidos, índice, reseña, comentarios,
primer capítulo, etc.
isbn13
titulo
autor
fecha_public
precio_con_iva
iva
situ_catalogo_editorial
disponibilidad
fecha_disponibilidad
libro_publico
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
Nivel_1. Básico
Colecciones
Autorías
Edición
Caract. físicas
A continuación se detallan los campos que comprende cada nivel así como
la utilización que de ellos se hacen en algunos de los principales consumidores o canales de información (ISBN, ANELE, SINLI, Casa del Libro):
Cargas de datos con CSV paso a paso
3
subtitulo
idioma
idioma_orig
idioma_traduccion
codigo_isbn_materia
coleccion
num_en_colec
coleccion2
num_en_colec2
traductor
ilustrador
num_edicion
tipo_edic_isbn
isbn13_edicion_anterior
num_impresion
fecha_impresion
publico_objetivo
ancho
alto
peso
num_pags
descripcion_fisica
num_ilustr
CL
Distribuidor de información del libro español en venta
ISBN ANELE SINLI
Libro electrónico
Otras menciones
responsabilidad
Libro de texto
Obras Completas
Nivel_2. Rico
Cubiertas
Resúmenes (3)
num_ilustr_color
material_anejo
url_descarga_producto
web_descarga_producto
formato_edicion_digital
peso_archivo_edicion_digital
isbn13_edicion_impresa
num_pags_edicion_impresa
DRM_edicion_digital
restricc_uso_edicion_digital1
ilustrador_cubierta
autor_prologo
autor_notas
editor_literario
otras_menciones1
otras_menciones2
otras_menciones3
precio (si precio libre)
material_educ
tipo_material_educ
tipo_enseñanza
nivel
ciclo
curso
com_autonoma
etapa_ciclo_curso
codigo_asignatura
obra_completa
num_volumenes
titulo_volumen
num_volumen
titulo_obra_completa
isbn13_obra_completa
CL
ISBN ANELE SINLI
Títulos
Edición
Materias
Caract. físicas
Destinatarios
idioma_resumen
titulo_orig
titulo_distribuidor
ciudad_public
pais_public
coment_edicion
codigo_eci_materia
términos_clave_materia
grueso_cm
nivel_lectura
edad_interes
Nivel_3. Avanzado
Textos
indice
reseña
cita_de_reseña
titular_promocional
comentario_autor
descripcion_lector
descripcion_medios
descripcion_libreria
texto_solapa
extracto
primer_capiltulo
· Datos obligatorios
·
·
·
·
·
CL
·
·
CL: Casa del Libro
Para la correcta identificación de los contenidos se ofrecen una serie de
plantillas Excel que facilitarán la carga del catálogo de forma rigurosa y
eficaz.
DILVE realiza permanentemente acciones de dinamización para la mejora
de la calidad de datos, en forma de documentación específica, revisiones
sobre aspectos puntuales e informes anuales a las editoriales, entre otros.
imagen_cubierta
imagen_cubierta2
texto_resumen
Cargas de datos con CSV paso a paso
4
Distribuidor de información del libro español en venta
-
-
La carga de datos
Plantillas para una carga paso a paso
La carga de datos en DILVE puede realizarse de 3 formas distintas:
mediante pasarelas informáticas que envían los datos desde su programa
de gestión (administrativa o web) a DILVE automáticamente (consulte a su
proveedor de software),
mediante el formulario web, libro a libro, o bien
mediante archivos CSV que permiten cargas masivas de datos.
Las plantillas le permitirán ir ampliando la información de sus libros, en
función del tipo de material editado por su editorial.
Para aquellas editoriales que no dispongan de pasarelas automatizadas,
DILVE propone cargas de datos de forma gradual a partir de una serie
de plantillas. De esta forma el responsable DILVE de la editorial se familiarizará progresivamente con las características de la aplicación y los procedimientos de carga.
Con un esfuerzo moderado, la editorial pondrá su catálogo completo a
disposición de todos los agentes del libro. Una vez realizada la carga inicial solo restará mantenerlo actualizado mediante un sencillo proceso.
Estas plantillas se encuentran disponibles en la sección de documentación
de la web.
DESCRIPCIÓN
ARCHIVO
Nivel_0_Inicial.xls
Identificación y estado
Autorías
Idiomas
Nivel_1A_Campos_Basicos.xls
Edición
Colecciones
Características físicas
Nivel_1B_Menciones_Responsabilidad.xls
Otras menciones de responsabilidad
Nivel_1C_Libro_de_Texto.xls
Libro de texto
Nivel_1D_Obras_Completas.xls
Obras Completas
Nivel_1E_Libros_Digitales.xls
Formatos de obra digital
Nivel_2A_Cubiertas.xls
Cubiertas
Nivel_2B_Resumenes.xls
Resúmenes
Títulos
Edición
Nivel_2C_Completar_Informacion.xls
Materias
Características físicas
Destinatarios
Nivel_3_Textos.xls
Cargas de datos con CSV paso a paso
5
Textos
Distribuidor de información del libro español en venta
Por ejemplo, la plantilla Nivel_1C.xls, sólo la utilizarán aquellas editoriales
que editen material educativo.
Instrucciones
Las plantillas están en formato .xls para ser utilizadas con el programa
Excel y constan de una serie de hojas de trabajo: Instrucciones (cómo
aprovechar la plantilla), Archivo_Datos y Archivo_Datos_Desplegable (hojas para insertar los datos), otras hojas con valores que pueden tomar
determinados campos.
A continuación se describen las plantillas con mayor detalle, así como su
uso y la descripción de los campos que contienen (hoja Instrucciones de
cada archivo).
El proceso a seguir con cada plantilla es el siguiente:
1
Rellenar los datos.
2
Guardar el archivo en formato CSV.
3
Simular la carga en DILVE
4
Comprobar el Informe de resultados. Corregir errores (si es necesario).
5
Cargar los datos en DILVE.
En la primera hoja se explican los campos empleados, sus posibles valores y características principales.
Archivo_Datos
Hojas de trabajo
Las plantillas presentan una estructura similar de varias hojas Excel:
Hoja con las cabeceras (nombres de campos) preparadas para rellenar los
datos. Cada fila corresponderá a un libro.
Cargas de datos con CSV paso a paso
6
Distribuidor de información del libro español en venta
Archivo_Datos_Desplegables
Cómo se usan
El manejo de las plantillas para la carga de datos no es complejo y, con la
práctica, el posterior mantenimiento y actualización de catálogo será una
tarea sencilla.
El programa Excel permite agilizar determinadas tareas (rellenar una o
varias columnas con los mismos valores, hacer filtrados, ordenaciones,
etc.) por lo que es muy aconsejable disponer de algún manual o libro de
ayuda en el manejo de este programa.
Hoja con las mismas columnas que la hoja anterior pero con listas desplegables (columnas “DESCRIPCIÓN”), en aquellos valores que lo permiten,
para facilitar la selección de los datos.
1
Rellenar los datos.
Es importante tener en cuenta que en aquellos casos en los que pueden
enviarse varios valores (por ejemplo, idiomas) el desplegable sólo permitirá
seleccionar uno (pudiéndose introducir varios valores separados por “;”).
Resto de hojas
Para las plantillas 1A, 1C, 2A, 2B, 2C o 3 elija el tipo de hoja en la que le
interesa rellenar los datos: Archivo_Datos (introducción manual) o Archivo_Datos_Desplegables (en aquellos campos en que los valores lo permiten, se seleccionan por medio de listas desplegables).
Contienen los valores que pueden tomar algunos de los campos de las
hojas anteriores. Estas hojas son necesarias para que funcionen los desplegables y también sirven para que el usuario pueda consultar los valores
que puede tomar cada campo, por lo que es muy importante no modificarlas.
Cargas de datos con CSV paso a paso
7
Distribuidor de información del libro español en venta
2
Limpiar filas y columnas
3
Preparar el archivo para la carga
En Excel y con la hoja de datos activada, seleccionar la opción de menú
“Archivo>Guardar como…” seleccionar (en el desplegable de formato) la
opción “CSV (separado por comas)” y guardar el archivo en local.
Eliminar las filas y las columnas que hayan quedado vacías o sin datos.
Para más información puede consultar Preparar archivos Excel para CSV
en la página 19.
Importante: no se deben enviar celdas vacías de un dato ya existente en
DILVE, el resultado sería su borrado.
Importante: si utiliza MACOS X deberá seleccionar la Opción “CSV (Windows)”, la opción “CSV (delimitado por comas)” no es válida.
Cargas de datos con CSV paso a paso
8
Distribuidor de información del libro español en venta
Plantillas 2ª, 2B y 3. Si se va a realizar la carga de los archivos de textos o
de las imágenes de cubierta, deberá crear una carpeta comprimida (formato .ZIP) que contenga el archivo .CSV y los archivos de texto y/o imagen.
4
Cargar el archivo
Cargar el archivo CSV o ZIP en DILVE en el menú Altas > Carga de
archivo.
Durante las primeras pruebas no es necesario cargar los datos, se recomienda utilizar la opción Simular carga que genera el mismo informe de
resultados.
Cargas de datos con CSV paso a paso
9
Distribuidor de información del libro español en venta
5
Verificar el resultado
Qué campos contienen
Tras la carga de cada uno de los archivos de datos, es fundamental verificar el resultado:
-
En estas plantillas se relacionan los campos de uso más frecuente, para
características especiales (CD, libro electrónico, productos combinados,
otros formatos, etc. deberá consultar el documento Manual de campos
CSV en el que se detallan todos y cada uno de los campos existentes.
Nivel_0. Datos de identificación
Comprobar, en el Informe de resultados de la carga, si se han producido
errores o avisos. (Si fuera necesario cambiar algún dato, deben realizarse
los cambios en el archivo .XLS (el original en Excel) y volver a guardarlo
como CSV).
isbn13 Con o sin guiones
titulo Primera letra en mayúsculas y resto en minúsculas. (obligatorio)
autor Apellidos, Nombre (en todas las palabras, primera letra en
mayúscula y resto en minúscula) (obligatorio)
Si hay varios autores, se separan cada uno de ellos con
punto y coma
Ejemplo: Mercado, Jesús; Moya, Mª Jesús; Herrera,
Antonio
Si se ha usado la hoja con desplegables, la columna “Descripción” dará un
error en el informe que deberá ser ignorado pues no afecta a los datos
cargados.
-
-En caso de ser anónimo deberá enviarse la palabra
"Anónimo".
Entrar en la ficha de alguno de los libros cargados para comprobar que
todos los datos se han cargado correctamente.
-En caso de ser desconocido deberá enviarse la palabra
"desconocido".
-En caso de tener varios autores puede enviarse el valor
"VV.AA."
-En caso de "y otros" deberá incluirse este texto al final
como si se tratara de un autor más (Ejemplo: Mercado,
Jesús; y otros)
precio_con_iva Utilizar la coma como separador de decimales
iva Número entero. Únicamente admite 4 (papel) y 18 (digital).
fecha_public Campo fecha con el siguiente formato: AAAAMMDD (por
ejemplo: 20070510).
situ_catalogo_editorial Ver valores posibles en la hoja Situacion_Catalogo.
disponibilidad Ver posibles valores en la hoja Disponibilidad.
fecha_disponibilidad Campo fecha. Formato: AAAAMMDD (por ejemplo:
20070510).
Cargas de datos con CSV paso a paso
10
Distribuidor de información del libro español en venta
formato_libro Formato del producto según codificación ONIX.
El campo debe contener al menos 1 código de formato (ver
listado en la hoja formato) y puede detallarse con uno o
más códigos de detalle de formato (ver listado en detalle_formato) separados por ; (punto y coma)
codigo_bic_materia Materia según adaptación de IBIC a España.
Ver valores posibles en las hojas Materias_IBIC y Calificadores_IBIC de este mismo archivo. (Deberá incluirse al
menos un código de materia y opcionalmente más códigos
de materia y/o calificadores, todos separados por “;”)
libro_publico Posibles valores: Si / No. Los libros no públicos únicamente podrá consultarlos la editorial propietaria, los libros
públicos pueden ser consultados por cualquier usuario de
DILVE.
Nivel_1A. Datos básicos
isbn13 Con o sin guiones (obligatorio)
subtitulo Primera letra en mayúsculas y resto en minúsculas.
idioma, idioma_orig, Códigos de idioma, idioma original e idioma de traducción
idioma_traduccion (se asignará por orden a el/los traductor/es).
Ver valores posibles en la hoja Idiomas de este mismo
archivo. (Podrán incluirse todos los códigos que sean
necesario separándolos por ";")
codigo_isbn_materia Materia según ISBN.
Ver valores posibles en la hoja CDU_ISBN de este mismo
archivo. (Podrán incluirse todos los códigos que sean
necesario separándolos por ";")
coleccion Primera letra en mayúsculas y resto en minúsculas.
num_en_coleccion Campo numérico en números arábigos.
coleccion2 Subcolección. Primera letra en mayúsculas y resto en
minúsculas.
num_en_coleccion2 Campo numérico en números arábigos.
traductor, Apellidos, Nombre (en todas las palabras, primera letra en
ilustrador mayúscula y resto en minúscula)
Ver formato autor
num_edic Numero entero
fecha_puesta_venta Campo fecha con el siguiente formato: AAAAMMDD (por
ejemplo: 20070510)
tipo_edic Únicamente si no se trata de la primera edición, indicar el
tipo de edición.
Ver valores posibles en la hoja Tipo_Edición de este mismo archivo.
isbn10_edicion_anterior, Únicamente si no se trata de la primera edición
isbn13_edicion_anterior
numero_impresion Numero entero
fecha_impresion Campo fecha con el siguiente formato: AAAAMMDD (por
ejemplo: 20070510).
Cargas de datos con CSV paso a paso
11
Distribuidor de información del libro español en venta
publico_objetivo Ver valores posibles en la hoja Publico_Objetivo de este
mismo archivo.
Nivel_1B. Menciones de responsabilidad
isbn13 Con o sin guiones (obligatorio)
ancho_cm cm, utilizando la coma como separador de decimales
alto_cm cm, utilizando la coma como separador de decimales
peso Número entero (en gramos)
num_pags Numérico sin separador de miles
ilustrador_cubierta, Apellidos, Nombre (en todas las palabras, primera letra en
autor_prologo, mayúscula y resto en minúscula)
autor_notas, Ver formato autor
editor_literario
otras_menciones1, En estos campos podrán enviarse hasta tres menciones de
otras_menciones2, responsabilidad (una en cada campo) que no tengan un camotras_menciones3 po específico (las dos filas anteriores).
descripcion_fisica Campo texto
num_ilustr, Numero entero
num_ilustr_color
El formato de los campos será:
Código_ONIX_autoría;Apellidos, Nombre
material_anejo Campo texto
URL_descarga_producto URL de descarga de una publicación en formato electrónico. Debe apuntar directamente a la ubicación del producto.
web_descarga_producto URL de acceso a una página web que incluye algún tipo
de enlace o acceso para la descarga de una publicación
en formato electrónico. No debe apuntar directamente a la
ubicación del producto.
Algunos de los siguientes campos pueden eliminarse ya que son complementarios, es decir, si se envía uno de ellos no es necesario enviar el otro
y, por tanto, podría eliminarse de la plantilla de datos:
- isbn13_edicion_anterior e isbn10_edicion_anterior
Cargas de datos con CSV paso a paso
12
-Los valores de los códigos ONIX válidos se pueden consultar
en la hoja Autorias_ONIX
Distribuidor de información del libro español en venta
- etapa_ciclo_curso incluye tipo_enseñanza, nivel, ciclo, curso
y com_autonom
Nivel_1C. Libro de texto
isbn13 Con o sin guiones (obligatorio si no envía el campo
isbn10)
precio Para indicar que se trata de un libro de precio Libre deberá
enviarse el valor: 9999,99
material_educ Posibles valores: Si / No
tipo_material_educ Ver posibles valores en la hoja Tipo_material_educativo
del archivo.
tipo_enseñanza_anele Ver posibles valores en la hoja Tipo_enseñanza_anele del
archivo.
nivel_educ Ver posibles valores en la hoja Nivel_educativo del archivo.
ciclo_educ Ver posibles valores en la hoja Ciclo_educativo del archivo.
curso_educ Ver posibles valores en la hoja Curso_educativo del archivo.
com_autonom Ver posibles valores en la hoja Comunidad_autonoma del
archivo. Si son varias deberán ir separadas por ";"
etapa_ciclo_curso Agrupa toda la información de tipo de enseñanza, nivel,
ciclo, curso y comunidad autónoma. (ATENCIÓN: Si utiliza
este campo puede eliminar de la hoja de datos las columnas de los datos mencionados).
Ver valores posibles en la hoja Etapa_ciclo_curso del
archivo.
codigo_asignatura Asignatura
Ver posibles valores en la hoja Asignaturas del archivo.
precio_cesion_sin_iva Utilizar coma como separador de decimales
precio_cesion_con_iva Si el IVA no es del 4% es necesario incluir ambos precios
y DILVE calculará el IVA que corresponda
Algunos de los siguientes campos pueden eliminarse ya que son complementarios, es decir, si se envía uno de ellos no es necesario enviar el otro
y, por tanto, podría eliminarse de la plantilla de datos:
Cargas de datos con CSV paso a paso
13
Distribuidor de información del libro español en venta
Nivel_1D. Obras completas
Nivel_1E. Libros digitales
isbn13 Con o sin guiones (obligatorio si no envía el campo
isbn10)
isbn13 Con o sin guiones (obligatorio)
obra_completa Posibles valores: Si / No (Si es obra completa, deberá
rellanar el campo num_volumenes, en caso contrario, el
resto de campos)
num_volumenes Número entero (solo si se trata de una obra completa)
formato_libro Para libros digitales deberá enviarse el valor "DG"
(sin comillas).
formato_edicion_digital Códigos ONIX de formato de libros digitales.
titulo_volumen Título del volumen dentro de la obra completa (solo si se
trata de una obra completa)
num_volumen Número del volumen dentro de la obra completa (solo si
se trata del un volumen de una obra completa)
titulo_obra_completa Título de la de la obra completa (solo si se trata del un
volumen de una obra completa)
Ver valores posibles en la hoja formato_edicion_digital de este mismo archivo.
pe- Tamaño del archivo de la edición digital.
so_archivo_edicion_digital
Deben indicarse el tamaño (número decimal separado por comas y separador de miles) seguido de las
unidades (MB o KB).
isbn10_obra completa ISBN10 de la de la obra completa (solo si se trata del un
volumen de una obra completa)
isbn13_obra completa ISBN13 de la de la obra completa (solo si se trata del un
volumen de una obra completa)
Algunos de los siguientes campos pueden eliminarse ya que son complementarios, es decir, si se envía uno de ellos no es necesario enviar el otro
y, por tanto, podría eliminarse de la plantilla de datos:
- isbn13_obra_completa e isbn10_obra_completa
isbn13_edicion_impresa Cuando se trata de un libro digital basado en un libro
impreso.
num_pags_edicion_impres 'Número de páginas de la edición impresa si existe.
a
web_descarga_producto URL de la página web desde la que se pueda acceder al entorno de descarga
url_hojeo_producto Si existe un "widget" de hojeo del producto, se indicará mediante su URL en este campo. El campo deberé empezar por http:// o https://
DRM_edicion_digital Códigos ONIX de los tipos de protección (DRM) para
libros digitales.
Ver valores posibles en la hoja DRM_edicion_digital
de este mismo archivo (pueden enviarse varios
valores separados por ;).
Cargas de datos con CSV paso a paso
14
Distribuidor de información del libro español en venta
restricc_uso_edicion_digital1,
restricc_uso_edicion_digital2,
restricc_uso_edicion_digital3
'Permite indicar las restricciones de uso del libro
digital.
La cadena de descripción del detalle de restricción
tiene la siguiente estructura:
v145;v146([;nn;v147]...)
Dónde:
v145 un valor de la Lista 145 (ver hoja L145)
v146 un valor de la Lista 146 (ver hoja L146)
nn valor numérico
v147 un valor de la lista 147 (ver hoja L147)
Nivel_2A. Cubiertas
En las hojas de datos se incluyen todos los campos de tipo texto que pueden cargarse desde un archivo CSV, sin embargo, le recomendamos que
cargue cada tipo de texto (resúmenes, extracto, etc.) en un archivo diferente para hacer la carga más manejable.
isbn13 Con o sin guiones (obligatorio)
imagen_cubierta La información puede cargarse de las siguientes formas:
1.- Incluir una referencia (URL) a un archivo jpg público en una
dirección Web. (http://…)
El bloque ";nn;v147" es opcional y repetible. Todos
los valores estarán separados por punto y coma.
2.- Adjuntar a la carga el archivo físico jpg que contenga la
imagen, en cuyo caso deberá incluir en la celda correspondiente el nombre que deberá seguir el siguiente convenio:
Por ejemplo, para indicar que un libro se puede
imprimir pero no copiar debería enviar: restricc_uso_edicion_digital1="02;01" y restricc_uso_edicion_digital2="03;03"
Los nombres de archivos deberán tener la siguiente estructura: nnnnnnnnnnnnn_04_X.jpg
nnnnnnnnnnnnn será el ISBN10 o el ISBN13 de la publicación. En todo caso, sin guiones ni otros separadores.
Nota: Si reutilizó los datos de un libro impreso para crear el registro
de la versión digital no olvide eliminar algunos datos como el alto, el
ancho o el peso y actualizar otros como la fecha y número de redición y/o reimpresión. Para ello, añada las columnas correspondientes dejando su contenido vacío si desea borrar su valor.
04 Indica el tipo de archivo. Debe ser 04 para la cubierta.
X Es un código propio, de uso interno, que facilita más detalles sobre el tipo de archivo (ver más adelante).
jpg Es la extensión del archivo. Este debe estar en formato
JPEG.
Se utilizarán los siguientes códigos para x, en función del
tamaño aproximado de la imagen (en píxeles):
x mayor de 1500 x 1500
g entre 1500 x 1500 y 675 x 675
h entre 675 x 675 y 450 x 450
l entre 450 x 450 y 300 x 300 (es una letra "L" minúscula)
m entre 300 x 300 y 200 x 200
n entre 200 x 200 y 135 x 135
s entre 135 x 135 y 90 x 90
t 90 x 90 o menos
imagen_cubierta2 Ver imagen_cubierta
Cargas de datos con CSV paso a paso
15
Distribuidor de información del libro español en venta
Nivel_2B. Resúmenes
Nivel_2C. Completar información
En las hojas de datos se incluyen todos los campos de tipo texto que pueden cargarse en DILVE desde un archivo CSV, sin embargo, le recomendamos que cargue cada tipo de texto (resúmenes, extracto, etc.) en un
archivo diferente para hacer la carga más manejable.
isbn13 Con o sin guiones (obligatorio)
titulo_orig Campo de texto.
titulo_distribuidor Campo de texto. Título + información adicional para distribuidores
ciudad_public Campo de texto.
isbn13 Con o sin guiones (obligatorio)
pais_public Ver posibles valores en la hoja Países del archivo.
texto_resumen La información puede cargarse de las siguientes formas:
1.- Incluir el texto en la celda: no podrá contener salto de
línea ni formatos como negrita, subrayado, etc.
2.- Crear un archivo de texto (.txt) para poder incluir saltos
de línea: en la plantilla deberá escribir: "file://" y el nombre
del archivo (extensión txt). El nombre del archivo debe
empezar por el ISBN.
3.- Crear un archivo en formato PDF para poder dar formato al texto: en la plantilla deberá escribir: "file://" y el
nombre del archivo (extensión .pdf). El nombre del archivo
debe empezar por el ISBN.
4.- Incluir una referencia (URL) a un archivo pdf público en
una dirección Web. (http://…)
idioma_resumen Códigos de idioma en que está el texto (en este caso no
admite múltiple valores). Si no se indica se toma Castellano por defecto.
texto_resumen2 Ver texto_resumen
idioma_resumen2 Códigos de idioma en que está el texto (en este caso no
admite múltiple valores). Si no se indica se toma Castellano por defecto.
coment_edicion Campo de texto.
terminos_clave_materia Campos de texto. Descripción de materia propia de la
editorial.
grueso_cm Número decimal (utilizar coma como separador decimal).
nivel_lectura Rango en formato "XX:YY" donde XX="Edad desde" e
YY="Edad hasta"
edad_interes Rango en formato "XX:YY" donde XX="Edad desde" e
YY="Edad hasta"
territoObligatorio. Territorios o países en los que está permitida
rios_derecho_venta_incl
la venta (Todo el mundo = WOELD; España = ES…) Se
uidos
podrán incluir tanto códigos de país como de territorios
separados por “;”.
Ver valores posibles en las hojas Países y Territorios.
premio_nombre Si el libro ha recibido un premio, o ha sido finalista, seleccionado, etc. en algún concurso o certamen, se indicará el
nombre correspondiente en este campo.
premio_año Año del premio, valor numérico de cuatro cifras (AAAA).
Solo debe enviarse si se manda el campo premio_nombre.
texto_resumen3 Ver texto_resumen
idioma_resumen3 Códigos de idioma en que está el texto (en este caso no
admite múltiple valores). Si no se indica se toma Castellano por defecto.
premio_pais País del premio codificado según ONIX (España = ES).
Solo debe enviarse si se manda algo en el campo premio_nombre.
Ver valores posibles en la hoja Países.
premio_posicion Posición alcanzada en el premio (Ganador = 01; Finalista
= 02). Solo debe enviarse si se manda algo en el campo
Cargas de datos con CSV paso a paso
16
Distribuidor de información del libro español en venta
premio_nombre.
Nivel_3. Textos
Ver valores posibles en la hoja Premio_Posiciones.
índice, índice2, indice3 Ver texto_resumen
premio_jurado Composición del jurado del premio.
idioma_indice, Códigos de idioma en que está el texto (en este caso no
idioma_indice2, admite múltiple valores). Si no se indica se toma Casteidioma_indice3 llano por defecto.
productos_relacionados ISBN de productos relacionados. Formato: “tipo_relacion_1, ISBN13_1;tipo_relacion_2,ISBN13_2;…”
Ver valores posibles relación en la hoja Relaciones_Productos.
reseña, reseña2, reseña3 Ver texto_resumen
idioma_reseña, Códigos de idioma en que está el texto (en este caso no
idioma_reseña2, admite múltiple valores). Si no se indica se toma Casteidioma_reseña llano por defecto.
cita_de_reseña, Ver texto_resumen
cita_de_reseña2,
cita_de_reseña3
idioma_cita_de_reseña, Códigos de idioma en que está el texto (en este caso no
idioma_cita_de_reseña2, admite múltiple valores). Si no se indica se toma Casteidioma_cita_de_reseña3 llano por defecto.
titular_promocional, Ver texto_resumen
titular_promocional2,
titular_promocional3
idioma_titular_promocional, Códigos de idioma en que está el texto (en este caso no
idioma_titular_promocional2, admite múltiple valores). Si no se indica se toma Casteidioma_titular_promocional3 llano por defecto.
comentario_autor, Ver texto_resumen
comentario_autor2,
comentario_autor3
idioma_comentario_autor, Códigos de idioma en que está el texto (en este caso no
idioma_comentario_autor2, admite múltiple valores). Si no se indica se toma Casteidioma_comentario_autor3 llano por defecto.
descripcion_lector, Ver texto_resumen
descripcion_lector2,
descripcion_lector3
idioma_descripcion_lector, Códigos de idioma en que está el texto (en este caso no
idioma_descripcion_lector2, admite múltiple valores). Si no se indica se toma Casteidioma_descripcion_lector3 llano por defecto.
Cargas de datos con CSV paso a paso
17
Distribuidor de información del libro español en venta
descripcion_medios, Ver texto_resumen
descripcion_medios2,
descripcion_medios3
idioma_descripcion_medios, Códigos de idioma en que está el texto (en este caso no
idioma_descripcion_medios2, admite múltiple valores). Si no se indica se toma Casteidioma_descripcion_medios3 llano por defecto.
descripcion_libreria, Ver texto_resumen
descripcion_libreria2,
descripcion_libreria3
idioma_descripcion_libreria, Códigos de idioma en que está el texto (en este caso no
idioma_descripcion_libreria2, admite múltiple valores). Si no se indica se toma Casteidioma_descripcion_libreria3 llano por defecto.
texto_solapa, Ver texto_resumen
texto_solapa2,
texto_solapa3
idioma_texto_solapa, Códigos de idioma en que está el texto (en este caso no
idioma_texto_solapa2, admite múltiple valores). Si no se indica se toma Casteidioma_texto_solapa3 llano por defecto.
extracto, extracto2, extracto3 Ver texto_resumen
idioma_extracto, Códigos de idioma en que está el texto (en este caso no
idioma_extracto2, admite múltiple valores). Si no se indica se toma Casteidioma_extracto3 llano por defecto.
primer_capitulo, Ver texto_resumen
primer_capitulo2,
primer_capitulo3
idioma_primer_capitulo Códigos de idioma en que está el texto (en este caso no
idioma_primer_capitulo2 admite múltiple valores). Si no se indica se toma Casteidioma_primer_capitulo llano por defecto.
Cargas de datos con CSV paso a paso
18
Distribuidor de información del libro español en venta
Trabajar con archivos .XLS y .CSV
Preparar archivos Excel para CSV
Durante el proceso de creación de las hojas de datos es recomendable
trabajar con archivos nativos de Excel que utilizan la extensión .xls, estos
archivos permiten mantener diferentes hojas de trabajo en un solo archivo.
Así mismo Excel puede ser también el origen de algunos problemas con
los formatos de archivos CSV en su carga en DILVE.
Un problema frecuente es la introducción de caracteres separadores extra
al final de algunas líneas, o incluso añadir líneas completas compuestas
exclusivamente por caracteres separadores, al final del archivo. Estos
elementos "extraños" pueden no ser visibles y pueden dificultar o imposibilitar la carga en DILVE.
Pero para la carga en DILVE es necesario convertir los datos a formato
CSV y este tipo de archivo (que también maneja Excel) solo permite una
hoja de trabajo.
En este sentido, a la hora de Guardar como... Excel se comporta de forma
un tanto confusa porque aunque estemos trabajando con un archivo CSV
nos muestra varias hojas del archivo .XLS anterior.
Siempre es aconsejable tener los datos originales en formato XLS y trabajar sobre ese archivo maestro, del que saldrán los CSV para la carga en
DILVE. Para evitar dificultades se recomienda:
1
Guardar siempre los datos (en XLS) antes de Guardar como... CSV.
2
Dar un nombre distinto al archivo CSV, por ejemplo carga_01.csv, o
indicando su contenido carga_cubiertas.csv, o cualquier otro nombre que
permita diferenciar si estamos trabajando en el archivo maestro (xls) o en
el archivo CSV.
En concreto es fundamental evitar:
columnas con nombres no estándar en la primera fila.
celdas vacías la final de la fila
celdas combinadas.
saltos de línea (retornos de carro) dentro de una celda.
-
Por ejemplo, al cargar un archivo CSV generado por Excel, en el Bloc de
Notas se podría ver algo similar a lo siguiente:
isbn13;autor;titulo;coleccion
9788488015037;Cela Trulock, Jorge;Blanquito, peón de brega
9788488015068;Garoz Moreno, Rafael;El solitario y su multitud; Colección A;
9788488015181;Gurruchaga, Joaquín;Últimos poemas (1983-1992);Colección B;
9788488015266;Gurruchaga, Joaquín;El tiempo, el humo, el pasado; Colección B;
9788488015327;Otero, Blas de;Mediobiografía (selección de poemas biográficos);Colección C;
;;;
;;;
;;;
;;;
;;;
Cargas de datos con CSV paso a paso
19
Distribuidor de información del libro español en venta
Se observa que en la primera línea falta un punto y coma porque el libro
no pertenece a ninguna colección, que hay un carácter punto y coma extra, al final de cada línea y que hay cinco líneas adicionales al final del
archivo, sólo con puntos y comas. Esos problemas no se verían en Excel,
ya que en ese entorno no se muestra el carácter separador, pero sí se ven
(y se podrían corregir) en un editor de texto, como el Bloc de Notas.
Limpiar filas
Una forma de evitar las líneas adicionales al final del archivo, sólo con
puntos y comas, es Eliminar las filas fuera de la zona que contenga los
datos, antes de Guardar el archivo.
-
En nuestro ejemplo, para eliminar las filas pinchamos en el número de fila
siguiente a la última línea con datos válidos. En el ejemplo es la fila 7. Al
pinchar en el 7 se selecciona toda la fila completa.
-
Luego, manteniendo apretada la tecla de mayúsculas, se pulsa la tecla Fin
y luego la flecha abajo (las tres teclas al tiempo) hasta que se vea la fila
65536 (en ocasiones puede ser necesario repetir la secuencia de teclas
anterior Mayúsculas+Fin+Abajo más de una vez).
Aunque los caracteres incorrectos se podrían añadir y/o eliminar en el
Bloc de notas, a continuación se explica el proceso a seguir en Excel para
evitar que se introduzcan.
Última celda vacía
Para evitar que la última celda de la primera fila quede vacía, copiaremos
al final del archivo una columna que siempre tenga un valor, por ejemplo,
el isbn13:
Con esto se seleccionan todas las filas por debajo de nuestra área de
trabajo.
En general, Excel introduce estos caracteres adicionales porque existen
celdas con espacios en blanco, o algún otro carácter no visible; para Excel
no es lo mismo una celda vacía, que una que contenga espacios en blanco.
Cargas de datos con CSV paso a paso
20
Distribuidor de información del libro español en venta
-
A continuación elegimos Eliminar, del menú Edición.
Limpiar columnas
-
Ahora repetimos el proceso para las columnas. En el ejemplo pinchamos
en la E, de la cabecera de la primera columna sin datos.
-
A continuación, pulsamos la tecla Fin, manteniendo pulsada la tecla de
mayúsculas y luego la flecha derecha (las tres teclas al tiempo).
Llegaremos a la columna IV con lo que quedan seleccionadas todas las
columnas a la derecha del área de trabajo.
Así, se ha eliminado cualquier dato, incluso espacios en blanco, que existiera en esas celdas.
Finalmente, se eliminan con la opción Eliminar del menú Editar, igual que
el caso de la filas.
Después de estas operaciones, ya no deberían aparecer caracteres separadores extra en el archivo CSV.
Cargas de datos con CSV paso a paso
21
Distribuidor de información del libro español en venta
Libros Públicos
Cargas de archivos parciales para corregir datos
Después de estos procesos de carga y corrección, la editorial decide que
la información de estos libros ya puede hacerse pública (recuérdese que,
por defecto, los nuevos libros cargados son no públicos, solo visibles por
la propia editorial).
El siguiente archivo CSV daría de alta a cinco títulos en DILVE, con la
información mínima necesaria para que se creen las fichas correspondientes:
Para ello se enviaría a DILVE el siguiente archivo:
Isbn13
9788488015037
9788488015068
9788488015181
9788488015327
; libro_público
;S
;S
;S
;S
Una vez procesado este archivo, los títulos referenciados son visibles por
todos los usuarios de DILVE.
Supongamos que la editorial hace una carga inicial de este archivo. Dado
que incluye los campos mínimos obligatorios, se darán de alta los correspondientes libros en DILVE. Estos títulos, sin embargo, están es estado no
público, por lo que solo la editorial que los ha cargado puede verlos y manejarlos.
Posteriormente, la editorial podría añadir información respecto al año de
edición y la colección de cada libro cargando el siguiente archivo en DILVE:
isbn13
; fecha_public
9788488015037; 1991
9788488015068; 1991
9788488015181; 1992
9788488015327; 1995
Cargas de datos con CSV paso a paso
22
; coleccion
; Test Narrativa
; Primera Estampa
; Primera Estampa
; Test Poesía
; num_en_colec
; 30
;1
;3
;3
Distribuidor de información del libro español en venta
-
Después, se podría añadir el número de páginas y las dimensiones con el
siguiente archivo:
Si se quisiera utilizar un solo archivo para corregir, al mismo tiempo, el
número en la colección y el número de páginas, este sería su contenido:
isbn13
9788488015037
9788488015068
9788488015181
9788488015327
Isbn13
9788488015037
9788488015327
; num_pags
; 96
; 112
; 144
; 1040
; alto
; 210
; 225
; 210
; 210
; ancho
; 140
; 140
; 140
; 140
Una vez cargada esa información, se observa que existen algunos valores
erróneos en la base de datos:
El libro 9788488015037 corresponde al nº 3 de la colección "Test Narrativa" y no al 30
El libro 9788488015327 tiene 104 páginas en lugar de 1040.
Para corregir estos errores se podrían generar y enviar los siguientes archivos CSV:
Isbn13
9788488015037
; num_en_colec
;3
; num_pags
; 96
; 104
Obsérvese que se han añadido dos datos correctos que ya existían (por
ejemplo, 96 páginas en el primer título), para poder mantener la homogeneidad de la estructura del fichero, ya que todas las líneas deben contener
los mismos campos.
Si se enviara el siguiente archivo:
isbn
9788488015037
9788488015327
; num_en_colec
;3
;
; num_pags
;
; 104
en el que sólo se incluyen los datos que estaban incorrectos corregidos,
se estarían borrando el número de páginas del primer libro y el número en
la colección del segundo título, ya que estos campos están en blanco en el
archivo enviado.
Y
isbn13
9788488015327
; num_en_colec
;3
;3
; num_pags
; 104
Cargas de datos con CSV paso a paso
23
Distribuidor de información del libro español en venta
Obsérvese que este archivo es una simple trascripción de los campos, separando los distintos datos mediante punto y coma dentro de cada línea.
Para saber más sobre CSV
Las letras CSV significan Comma Separated Values o Valores Separados
por Comas. Estos archivos son, básicamente, archivos de texto en los que
los distintos datos están separados por comas. Este es uno de los formatos más habituales para intercambio de información.
Aunque en su nombre figure el término coma, en realidad no siempre se
utiliza esta para separar los valores, admitiéndose otros caracteres para
esta función, también se puede emplear el punto, el tabulador, la barra
vertical, etc. En el caso de DILVE se permiten la coma, el punto y coma y la
barra vertical. En los manuales y documentos de DILVE se utilizará el punto
y coma, en general. Al carácter utilizado para separar los distintos datos
dentro de un archivo CSV se le llama carácter separador o, simplemente,
separador.
Como ejemplo inicial del formato CSV veamos cómo se representaría la
información de dos títulos en ese formato para su carga en DILVE. Supongamos que tenemos los siguientes libros:
ISBN
Título
Autores
Precio (sin IVA)
Libro 1
978-84-1234567-8
El primer libro
José Pérez Martínez
14,42
Libro 2
978-84-8765432-1
Mi segundo título
Antonio López García
15,38
Para cargar estos libros en DILVE, mediante CSV, bastaría con preparar un
archivo de texto con las siguientes líneas:
ISBN13;
978-84-1234567-8;
97884-8765432-1;
título;
El primer libro;
Mi segundo título;
De forma más precisa, un archivo CSV tiene las siguientes características:
-
Es un archivo de texto.
-
Cada línea del archivo representa un "registro"; en nuestro caso una ficha
bibliográfica, o parte de la misma. No pueden existir líneas en blanco.
-
La primera línea del archivo es especial y describe la estructura de los
registros, mediante la enumeración (separada por el carácter separador)
de los nombres estándar los campos incluidos. Esta línea también define,
de forma implícita, el separador utilizado en el resto del archivo.
-
En cada línea, los distintos campos de información están separados por el
separador. Si un campo no tiene valor (está vacío), aparecerán dos separadores seguidos.
-
Todas las líneas del archivo deben tener la misma estructura; es decir, los
mismos campos en el mismo orden, aunque alguno de ellos esté vacío,
así como el mismo separador.
-
Aquellos campos que incluyan, o puedan incluir, en su contenido el carácter
separador (;) deberán encerrarse entre comillas dobles (carácter “). En este
caso Excel lo hace automáticamente.
Si las comillas también aparecen en el contenido del campo, se sustituirán
por dos comillas seguidas. En general, se recomienda incluir entre comillas todos los campos de texto.
autor;
precio
José Pérez Martínez;
11,42
Antonio López García; 15,38
Cargas de datos con CSV paso a paso
24

Descargar