Identificadores únicos para libros y contenidos diferentes

Anuncio
Centro Regional para el Fomento del Libro en América Latina, el Caribe,
España y Portugal (Cerlalc)
Identificadores
únicos para libros
y contenidos
diferentes del ISBN
DOI, ISTC y RFID
Subdirección de Libro y Desarrollo
Diana Cifuentes
Octubre de 2008
2
Identificadores únicos para libros y contenidos diferentes del ISB
Documento preparado para la Subdirección de Libro y Desarrollo del CERLALC
por Diana Cifuentes
En el mundo del libro el identificador único más reconocido y de mayor uso es el International
Standard Book Number (ISBN), que actualmente utiliza trece dígitos. Mediante esta cadena
numérica se puede identificar la zona geográfica o país de donde proviene el libro y el
registrador al cual le pertenece. Además, se compone de un número que identifica a un libro
particular de dicho registrador y un dígito de verificación (entre 0 y 9) generado a través de un
algoritmo. Adicionalmente contiene metadatos asociados. Se usa en más 166 países y ha sido un
elemento de gran éxito para facilitar el comercio del libro a nivel mundial, el manejo de bases de
datos e inventarios. No obstante, el advenimiento de las nuevas tecnologías ha propiciado
cambios en el sector del libro y en el manejo de los contenidos. La necesidad de identificar
contenidos en la Red, la aparición de libros en diferentes formatos digitales, el desarrollo de
nuevos dispositivos electrónicos de lectura y las nuevas formas de comercio y distribución
posibles a través de la Internet han generado la necesidad de desarrollar nuevos tipos de
identificadores.
En general, un identificador es un medio para referenciar un objeto o parte de él. Se caracteriza
por su unicidad, por tener una finalidad específica, por su interoperabilidad y su permanencia1.
Un identificador es una cadena de números, letras o signos, o una combinación de los tres, que
garantiza ser único entre todos los identificadores usados para un grupo de objetos, además de
tener un objetivo específico de identificación. Existen muchos tipos de identificadores únicos
que son creados a partir de diferentes estrategias de generación tales como los números seriales,
que se asignan de manera incremental; los números aleatorios, que se seleccionan de un espacio
numérico más grande que el número esperado de objetos a identificarse; o los nombres o códigos
asignados por escogencia que son únicos gracias a que se mantiene un registro central. Todos
estos métodos pueden ser combinados de forma jerárquica o individual, de manera que se puedan
crear otros sistemas de generación que garanticen su unicidad2. En muchos casos, un mismo
objeto puede tener más de un identificador único, cada uno de ellos para un propósito diferente.
Por ejemplo, en el caso del los libros, cada uno de ellos, además de ser identificado a través un
ISBN, puede tener otro identificador que permita identificar el texto del libro (ISTC).
La finalidad específica se refiere al proceso mediante el cual el identificador es el input a un
servicio que permite recibir a cambio un output específico con una o más piezas de información
relacionadas a la entidad identificada. Por ejemplo, en el caso del ISBN, cuando se escanea el
código de barras asociado al número, se obtiene información acerca del título, el autor, etc.
1
International DOI Foundation. Digital Object Identifier (DOI) System, 2008.
Wikipedia. Definición de identificador único. Consulta realizada el 22 de octubre de 2008 en:
http://en.wikipedia.org/wiki/Unique_identifier
2
3
Identificadores únicos para libros y contenidos diferentes del ISB
La interoperabilidad es la habilidad de usar un identificador para servicios fuera del control
directo de quien asignó el número. Por ejemplo, un cliente puede ordenar la compra de un libro
en una librería citando su ISBN, sin tener que consultar al editor que le asignó el número.
Por último, la permanencia es la exigencia de que, una vez asignado el identificador, éste denote
siempre al mismo objeto. Un identificador que ya ha sido asignado no puede asignarse de nuevo
a otro objeto, así la entidad que éste designe haya dejado de existir.
Hasta ahora, el ISBN tiene características que permiten el hallazgo, el comercio y el reporte de
libros físicos y digitales a través de la cadena de oferta del libro. Sin embargo, se podría
considerar la asignación de otro tipo de identificadores en el caso de que exista alguno que
permita manejar cierto tipo de información asociada al libro impreso cuando se comercializa o
asociar al archivo digital con características particulares de identificación. Por ejemplo, si el libro
se vende a través de un tercero podría desearse poder manejar un identificador a través del cual
se pueda generar un reporte de las ventas de este distribuidor.
Según Michael Holdsworth en el informe presentado al Book Industry Study Group acerca de la
identificación de contenido de libros digitales3, otro aspecto controversial que ha de tenerse en
cuenta es el manejo del Digital Rights Management (DRM). Para los textos digitales es posible
manejar una gran variedad de modelos de consumo. Se puede permitir la compra de un texto a
perpetuidad, una venta que limite el uso del contenido a días, semanas o meses, o usar modelos
de pagar por ver. Dentro de estos modelos puede existir un amplio rango de derechos de uso
conferidos o negados al usuario. A través de los DRM se puede constreñir o permitir el derecho a
mover el contenido entre diferentes dispositivos (por ejemplo de un computador a un dispositivo
electrónico de lectura, o entre diferentes dispositivos), el derecho a imprimir páginas o copias
enteras del texto, o el derecho a usar la opción de copy-paste. Las combinaciones son infinitas,
afirma el autor, y todas ellas implican problemas de identificación tanto para el comercio como
para el mantenimiento de sistemas y bases de datos por parte de los editores.
En este documento hacemos referencia a tres identificadores que se han ido desarrollando en los
últimos años y que permiten ampliar las posibilidades de manejo de los contenidos de los libros
físicos y digitales en las diferentes etapas de producción y distribución. A continuación nos
referiremos al Digital Object Identifier (DOI), el International Standard Text Code (ISTC) y el
Radio Frequency Identifier (RFID).
3
Holdsworth, Michael. The Identification of Digital Book Content. Book Industry Study Group and Book Industry
Communication, 2008.
4
Identificadores únicos para libros y contenidos diferentes del ISB
Digital Object Identifier (DOI)4
El DOI es un sistema administrado que permite la identificación continua de contenido en redes
digitales. Se puede usar para identificar entidades físicas, digitales o abstractas. Estos nombres
contienen información especificada por el registrador y usan un modelo de metadatos extensibles
para asociar elementos descriptivos y otros datos con el nombre DOI. El sistema DOI se
implementa a través de una federación de agencias de registro que se rigen bajo políticas e
infraestructuras comunes provistas por la Fundación DOI Internacional que desarrolla y controla
el sistema. El sistema DOI ha sido desarrollado e implementado en un rango de aplicaciones de
publicación desde el año 2000. Para mediados del 2008 habían sido asignados más de 40
millones de números DOI.
La sintaxis del DOI tiene dos componentes, un sufijo y un prefijo separados por un slash. El DOI
no tiene un límite definido en cuanto a su extensión o la cantidad de elementos que deben tener
el sufijo o el prefijo. Es sensible al uso de mayúsculas y minúsculas y puede incorporar cualquier
carácter del Estándar Unicode. La combinación es un prefijo único que se le asigna a un
registrador particular y un sufijo único asignado por ese registrador, lo cual permite la asignación
descentralizada de números DOI.
El prefijo del DOI tiene dos componentes: un indicador de directorio seguido por un código de
registrador, separados por un punto (por ejemplo 10.1000). El indicador de directorio siempre es
10 e identifica la cadena como un código DOI. El código de registrador es una cadena
alfanumérica que identifica al registrador, aunque un registrador puede tener múltiples códigos.
El sufijo puede ser un número secuencial, o puede incorporar un identificador generado en otro
sistema usado por el registrador como el ISBN, ISSN el ISTC. En estos casos, el sistema
existente especificará la construcción del sufijo. Por ejemplo la sintaxis de un DOI que use un
ISSN sería: 10.1038/issn.0028-0836.
Los nombres DOI pueden ser representados en otras formas en ciertos contextos. Por ejemplo,
cuando se visualizan en un browser de Internet, el nombre DOI puede estar vinculado a la
dirección de un servidor proxi. Por ejemplo el DOI 10.1006/jmbi.1998.2354 se puede convertir
en un vínculo activo como http://dx.doi.org/10.1006/jmbi.1998.2354
International Text Code Identifier (ISTC) (En construcción)5
El ISTC se puede aplicar a cualquier obra textual, siempre que haya intención de producirla en
forma de una o más manifestaciones. En lo que se refiere a la norma, por obra textual se entiende
una creación abstracta determinada de contenido intelectual o artístico, compuesta por una
4
El contenido de este apartado es extraído del documento Digital Object Identifier (DOI) System publicado por la
International DOI Foundation en el año 2008.
5
El contenido de este apartado corresponde a la definición que se da del ISTC en el Manual del Usuario ISBN en su
versión en español del año 2007.
5
Identificadores únicos para libros y contenidos diferentes del ISB
combinación de palabras. Obras textuales son, por ejemplo, los artículos, los ensayos, las
novelas, los guiones de cine y los relatos breves.
A los productos físicos u otras manifestaciones de una obra no se les asignará un ISTC. A tales
productos (es decir, un libro impreso, un audiolibro o la versión electrónica de ellos) se les
asignará otro tipo de identificadores. El ISTC permite la identificación y la administración
eficaces de las obras textuales, no de las publicaciones; aun así, puede vincularse a
identificadores de productos, como el ISBN, con objeto de relacionar las diversas manifestaciones
de una obra textual con sus aplicaciones.
Es un número «mudo», es decir, que no contendrá códigos ni otros elementos con significado, y
no indicará ni el autor ni el propietario de la obra. Está compuesto por 16 dígitos hexadecimales,
en los que se usarán los números del 0 al 9 y las letras de la A a la F. Consta de cuatro elementos
en el siguiente orden: agencia de registro, año, obra y dígito de comprobación. Un ejemplo de un
código ISTC sería: ISTC 0A9-2002-12B4A105-7.
Se ha seleccionado al consorcio compuesto por CISAC, Nielsen BookData y R.R. Bowker para que
cumpla las funciones de autoridad de registro del ISTC una vez se haya aprobado la publicación
de la norma ISO 21047, que todavía se encuentra en su fase de desarrollo.
Radio Frequency Identifier RFID
La radioidentificación por frecuencia para libros proviene de un sistema remoto multiuso de
almacenamiento y recuperación de datos. Con este tipo de tecnología se puede transmitir la
identidad de un objeto mediante ondas de radio. Este tipo de tecnología hace parte de las
denominadas Auto ID (Automatic Indentification).
Un sistema RFID tiene tres componentes: el primero de ellos es la etiqueta RFID, que consiste
en un dispositivo pequeño que está compuesto por una antena, un transductor de radio y un chip,
en donde la antena permite al chip transmitir la información de identificación de la etiqueta. El
segundo es un lector de RFID que está compuesto por una antena, un transceptor y un
decodificador. El lector envía periódicamente señales para identificar etiquetas en un
determinado radio, cuando capta una señal de la etiqueta extrae la información y la pasa a un
sistema de procesamiento de datos, que es el tercer componente del sistema, el cual proporciona
los medios para procesar y almacenar los datos6.
En relación con la identificación de libros y otros productos, EPCGlobal7, perteneciente a GS1,
está liderando el desarrollo de estándares industriales para el Electronic Product Code (EPC).
6
7
Wikipedia. Definición de RFID. Consulta realizada el 22 de octubre de 2008 en: http://es.wikipedia.org/wiki/RFID
http://www.epcglobalinc.org/home
6
Identificadores únicos para libros y contenidos diferentes del ISB
Esto con el objeto de respaldar el uso de la radio identificación por frecuencias. Para libros el
RFID sólo se ha implementado en las librerías de Holanda y Portugal.
Actualmente, se están evaluando varias opciones para la construcción de un identificador que se
asocie al sistema de radiofrecuencias, todas ellas haciendo uso de una manera u otra del ISBN.
Se utilizará un identificador SGTIN-96 (Serialised Global Trade Item Number de 96 bits) que
incorpora el ISBN (los doce primeros números sin el dígito de identificación), un dígito
indicador y un número serial. Varias opciones están siendo evaluadas para la estructuración del
SGTIN. En una de ellas la capacidad total del identificador sería de 274,877,906,944 números.
Existe otra propuesta que usa la misma estructura, pero incorpora al número de registrador que
hace parte del ISBN, un elemento de publicación y un número serial.
El propósito del SGTIN 96 es identificar separadamente cada copia de un libro. Esto es necesario
para usar la RFID de manera que copias múltiples de un mismo título se muestren por separado
cuando son escaneadas. Esto de acuerdo a las especificaciones brindadas por Brian Green,
director de la Agencia Internacional del ISBN. La especificación de datos de la etiqueta del
SGTIN-96 requiere establecer seis campos y la combinación de estos seis campos asegura la
unicidad de cada etiqueta. Estos seis campos son:
Cabezote: es de 8 bits y es común para todas las etiquetas GTIN 96.
• Filtro: es de 3 bits y especifica si el objeto etiquetado es un ítem, una caja, o un contenedor.
• Partición: es de 3 bits e indica cómo se dividen los siguientes campos y permite obtener
correctamente los datos de estos.
• Prefijo de la compañía: es de 20 a 40 bits dependiendo de la partición. Contiene el prefijo
EAN.UCC (European Article Number-Uniform Code Council) de la compañía.
• Ítem de referencia: es de 4 a 24 bits dependiendo de la partición y contiene el número GTIN
del ítem de referencia.
• Número Serial: es de 38 bits y contiene el número serial único correspondiente al ítem.
•
En el comercio de libros se usará una combinación del prefijo de la compañía y el ítem de
referencia para proveer el ISBN y posiblemente, un número separado para identificar la
organización que realmente introduce las etiquetas RFID, puesto que éste puede ser el mayorista
o el librero, más no el editor8.
8
Consulta personal a Brian Green. Director de la Agencia internacional ISBN.
7
Identificadores únicos para libros y contenidos diferentes del ISB
Imagen 1. Ejemplo de propuesta de construcción del SGTIN
Fuente: “Encoding ISBN in EPC”. Draft proposals for discussion. Presentación realizada por Henri Barthel en
Frankfurt el 15 de Octubre de 2008.
Imagen 2. Ejemplo de propuesta de estructuración del código SGTIN
Fuente: “Encoding ISBN in EPC”. Draft proposals for discussion. Presentación realizada por Henri Barthel en
Frankfurt el 15 de Octubre de 2008.
Descargar