Centro Regional para el Fomento del Libro en América Latina, el Caribe, España y Portugal (Cerlalc) Identificadores únicos para libros y contenidos diferentes del ISBN DOI, ISTC y RFID Subdirección de Libro y Desarrollo Diana Cifuentes Octubre de 2008 2 Identificadores únicos para libros y contenidos diferentes del ISB Documento preparado para la Subdirección de Libro y Desarrollo del CERLALC por Diana Cifuentes En el mundo del libro el identificador único más reconocido y de mayor uso es el International Standard Book Number (ISBN), que actualmente utiliza trece dígitos. Mediante esta cadena numérica se puede identificar la zona geográfica o país de donde proviene el libro y el registrador al cual le pertenece. Además, se compone de un número que identifica a un libro particular de dicho registrador y un dígito de verificación (entre 0 y 9) generado a través de un algoritmo. Adicionalmente contiene metadatos asociados. Se usa en más 166 países y ha sido un elemento de gran éxito para facilitar el comercio del libro a nivel mundial, el manejo de bases de datos e inventarios. No obstante, el advenimiento de las nuevas tecnologías ha propiciado cambios en el sector del libro y en el manejo de los contenidos. La necesidad de identificar contenidos en la Red, la aparición de libros en diferentes formatos digitales, el desarrollo de nuevos dispositivos electrónicos de lectura y las nuevas formas de comercio y distribución posibles a través de la Internet han generado la necesidad de desarrollar nuevos tipos de identificadores. En general, un identificador es un medio para referenciar un objeto o parte de él. Se caracteriza por su unicidad, por tener una finalidad específica, por su interoperabilidad y su permanencia1. Un identificador es una cadena de números, letras o signos, o una combinación de los tres, que garantiza ser único entre todos los identificadores usados para un grupo de objetos, además de tener un objetivo específico de identificación. Existen muchos tipos de identificadores únicos que son creados a partir de diferentes estrategias de generación tales como los números seriales, que se asignan de manera incremental; los números aleatorios, que se seleccionan de un espacio numérico más grande que el número esperado de objetos a identificarse; o los nombres o códigos asignados por escogencia que son únicos gracias a que se mantiene un registro central. Todos estos métodos pueden ser combinados de forma jerárquica o individual, de manera que se puedan crear otros sistemas de generación que garanticen su unicidad2. En muchos casos, un mismo objeto puede tener más de un identificador único, cada uno de ellos para un propósito diferente. Por ejemplo, en el caso del los libros, cada uno de ellos, además de ser identificado a través un ISBN, puede tener otro identificador que permita identificar el texto del libro (ISTC). La finalidad específica se refiere al proceso mediante el cual el identificador es el input a un servicio que permite recibir a cambio un output específico con una o más piezas de información relacionadas a la entidad identificada. Por ejemplo, en el caso del ISBN, cuando se escanea el código de barras asociado al número, se obtiene información acerca del título, el autor, etc. 1 International DOI Foundation. Digital Object Identifier (DOI) System, 2008. Wikipedia. Definición de identificador único. Consulta realizada el 22 de octubre de 2008 en: http://en.wikipedia.org/wiki/Unique_identifier 2 3 Identificadores únicos para libros y contenidos diferentes del ISB La interoperabilidad es la habilidad de usar un identificador para servicios fuera del control directo de quien asignó el número. Por ejemplo, un cliente puede ordenar la compra de un libro en una librería citando su ISBN, sin tener que consultar al editor que le asignó el número. Por último, la permanencia es la exigencia de que, una vez asignado el identificador, éste denote siempre al mismo objeto. Un identificador que ya ha sido asignado no puede asignarse de nuevo a otro objeto, así la entidad que éste designe haya dejado de existir. Hasta ahora, el ISBN tiene características que permiten el hallazgo, el comercio y el reporte de libros físicos y digitales a través de la cadena de oferta del libro. Sin embargo, se podría considerar la asignación de otro tipo de identificadores en el caso de que exista alguno que permita manejar cierto tipo de información asociada al libro impreso cuando se comercializa o asociar al archivo digital con características particulares de identificación. Por ejemplo, si el libro se vende a través de un tercero podría desearse poder manejar un identificador a través del cual se pueda generar un reporte de las ventas de este distribuidor. Según Michael Holdsworth en el informe presentado al Book Industry Study Group acerca de la identificación de contenido de libros digitales3, otro aspecto controversial que ha de tenerse en cuenta es el manejo del Digital Rights Management (DRM). Para los textos digitales es posible manejar una gran variedad de modelos de consumo. Se puede permitir la compra de un texto a perpetuidad, una venta que limite el uso del contenido a días, semanas o meses, o usar modelos de pagar por ver. Dentro de estos modelos puede existir un amplio rango de derechos de uso conferidos o negados al usuario. A través de los DRM se puede constreñir o permitir el derecho a mover el contenido entre diferentes dispositivos (por ejemplo de un computador a un dispositivo electrónico de lectura, o entre diferentes dispositivos), el derecho a imprimir páginas o copias enteras del texto, o el derecho a usar la opción de copy-paste. Las combinaciones son infinitas, afirma el autor, y todas ellas implican problemas de identificación tanto para el comercio como para el mantenimiento de sistemas y bases de datos por parte de los editores. En este documento hacemos referencia a tres identificadores que se han ido desarrollando en los últimos años y que permiten ampliar las posibilidades de manejo de los contenidos de los libros físicos y digitales en las diferentes etapas de producción y distribución. A continuación nos referiremos al Digital Object Identifier (DOI), el International Standard Text Code (ISTC) y el Radio Frequency Identifier (RFID). 3 Holdsworth, Michael. The Identification of Digital Book Content. Book Industry Study Group and Book Industry Communication, 2008. 4 Identificadores únicos para libros y contenidos diferentes del ISB Digital Object Identifier (DOI)4 El DOI es un sistema administrado que permite la identificación continua de contenido en redes digitales. Se puede usar para identificar entidades físicas, digitales o abstractas. Estos nombres contienen información especificada por el registrador y usan un modelo de metadatos extensibles para asociar elementos descriptivos y otros datos con el nombre DOI. El sistema DOI se implementa a través de una federación de agencias de registro que se rigen bajo políticas e infraestructuras comunes provistas por la Fundación DOI Internacional que desarrolla y controla el sistema. El sistema DOI ha sido desarrollado e implementado en un rango de aplicaciones de publicación desde el año 2000. Para mediados del 2008 habían sido asignados más de 40 millones de números DOI. La sintaxis del DOI tiene dos componentes, un sufijo y un prefijo separados por un slash. El DOI no tiene un límite definido en cuanto a su extensión o la cantidad de elementos que deben tener el sufijo o el prefijo. Es sensible al uso de mayúsculas y minúsculas y puede incorporar cualquier carácter del Estándar Unicode. La combinación es un prefijo único que se le asigna a un registrador particular y un sufijo único asignado por ese registrador, lo cual permite la asignación descentralizada de números DOI. El prefijo del DOI tiene dos componentes: un indicador de directorio seguido por un código de registrador, separados por un punto (por ejemplo 10.1000). El indicador de directorio siempre es 10 e identifica la cadena como un código DOI. El código de registrador es una cadena alfanumérica que identifica al registrador, aunque un registrador puede tener múltiples códigos. El sufijo puede ser un número secuencial, o puede incorporar un identificador generado en otro sistema usado por el registrador como el ISBN, ISSN el ISTC. En estos casos, el sistema existente especificará la construcción del sufijo. Por ejemplo la sintaxis de un DOI que use un ISSN sería: 10.1038/issn.0028-0836. Los nombres DOI pueden ser representados en otras formas en ciertos contextos. Por ejemplo, cuando se visualizan en un browser de Internet, el nombre DOI puede estar vinculado a la dirección de un servidor proxi. Por ejemplo el DOI 10.1006/jmbi.1998.2354 se puede convertir en un vínculo activo como http://dx.doi.org/10.1006/jmbi.1998.2354 International Text Code Identifier (ISTC) (En construcción)5 El ISTC se puede aplicar a cualquier obra textual, siempre que haya intención de producirla en forma de una o más manifestaciones. En lo que se refiere a la norma, por obra textual se entiende una creación abstracta determinada de contenido intelectual o artístico, compuesta por una 4 El contenido de este apartado es extraído del documento Digital Object Identifier (DOI) System publicado por la International DOI Foundation en el año 2008. 5 El contenido de este apartado corresponde a la definición que se da del ISTC en el Manual del Usuario ISBN en su versión en español del año 2007. 5 Identificadores únicos para libros y contenidos diferentes del ISB combinación de palabras. Obras textuales son, por ejemplo, los artículos, los ensayos, las novelas, los guiones de cine y los relatos breves. A los productos físicos u otras manifestaciones de una obra no se les asignará un ISTC. A tales productos (es decir, un libro impreso, un audiolibro o la versión electrónica de ellos) se les asignará otro tipo de identificadores. El ISTC permite la identificación y la administración eficaces de las obras textuales, no de las publicaciones; aun así, puede vincularse a identificadores de productos, como el ISBN, con objeto de relacionar las diversas manifestaciones de una obra textual con sus aplicaciones. Es un número «mudo», es decir, que no contendrá códigos ni otros elementos con significado, y no indicará ni el autor ni el propietario de la obra. Está compuesto por 16 dígitos hexadecimales, en los que se usarán los números del 0 al 9 y las letras de la A a la F. Consta de cuatro elementos en el siguiente orden: agencia de registro, año, obra y dígito de comprobación. Un ejemplo de un código ISTC sería: ISTC 0A9-2002-12B4A105-7. Se ha seleccionado al consorcio compuesto por CISAC, Nielsen BookData y R.R. Bowker para que cumpla las funciones de autoridad de registro del ISTC una vez se haya aprobado la publicación de la norma ISO 21047, que todavía se encuentra en su fase de desarrollo. Radio Frequency Identifier RFID La radioidentificación por frecuencia para libros proviene de un sistema remoto multiuso de almacenamiento y recuperación de datos. Con este tipo de tecnología se puede transmitir la identidad de un objeto mediante ondas de radio. Este tipo de tecnología hace parte de las denominadas Auto ID (Automatic Indentification). Un sistema RFID tiene tres componentes: el primero de ellos es la etiqueta RFID, que consiste en un dispositivo pequeño que está compuesto por una antena, un transductor de radio y un chip, en donde la antena permite al chip transmitir la información de identificación de la etiqueta. El segundo es un lector de RFID que está compuesto por una antena, un transceptor y un decodificador. El lector envía periódicamente señales para identificar etiquetas en un determinado radio, cuando capta una señal de la etiqueta extrae la información y la pasa a un sistema de procesamiento de datos, que es el tercer componente del sistema, el cual proporciona los medios para procesar y almacenar los datos6. En relación con la identificación de libros y otros productos, EPCGlobal7, perteneciente a GS1, está liderando el desarrollo de estándares industriales para el Electronic Product Code (EPC). 6 7 Wikipedia. Definición de RFID. Consulta realizada el 22 de octubre de 2008 en: http://es.wikipedia.org/wiki/RFID http://www.epcglobalinc.org/home 6 Identificadores únicos para libros y contenidos diferentes del ISB Esto con el objeto de respaldar el uso de la radio identificación por frecuencias. Para libros el RFID sólo se ha implementado en las librerías de Holanda y Portugal. Actualmente, se están evaluando varias opciones para la construcción de un identificador que se asocie al sistema de radiofrecuencias, todas ellas haciendo uso de una manera u otra del ISBN. Se utilizará un identificador SGTIN-96 (Serialised Global Trade Item Number de 96 bits) que incorpora el ISBN (los doce primeros números sin el dígito de identificación), un dígito indicador y un número serial. Varias opciones están siendo evaluadas para la estructuración del SGTIN. En una de ellas la capacidad total del identificador sería de 274,877,906,944 números. Existe otra propuesta que usa la misma estructura, pero incorpora al número de registrador que hace parte del ISBN, un elemento de publicación y un número serial. El propósito del SGTIN 96 es identificar separadamente cada copia de un libro. Esto es necesario para usar la RFID de manera que copias múltiples de un mismo título se muestren por separado cuando son escaneadas. Esto de acuerdo a las especificaciones brindadas por Brian Green, director de la Agencia Internacional del ISBN. La especificación de datos de la etiqueta del SGTIN-96 requiere establecer seis campos y la combinación de estos seis campos asegura la unicidad de cada etiqueta. Estos seis campos son: Cabezote: es de 8 bits y es común para todas las etiquetas GTIN 96. • Filtro: es de 3 bits y especifica si el objeto etiquetado es un ítem, una caja, o un contenedor. • Partición: es de 3 bits e indica cómo se dividen los siguientes campos y permite obtener correctamente los datos de estos. • Prefijo de la compañía: es de 20 a 40 bits dependiendo de la partición. Contiene el prefijo EAN.UCC (European Article Number-Uniform Code Council) de la compañía. • Ítem de referencia: es de 4 a 24 bits dependiendo de la partición y contiene el número GTIN del ítem de referencia. • Número Serial: es de 38 bits y contiene el número serial único correspondiente al ítem. • En el comercio de libros se usará una combinación del prefijo de la compañía y el ítem de referencia para proveer el ISBN y posiblemente, un número separado para identificar la organización que realmente introduce las etiquetas RFID, puesto que éste puede ser el mayorista o el librero, más no el editor8. 8 Consulta personal a Brian Green. Director de la Agencia internacional ISBN. 7 Identificadores únicos para libros y contenidos diferentes del ISB Imagen 1. Ejemplo de propuesta de construcción del SGTIN Fuente: “Encoding ISBN in EPC”. Draft proposals for discussion. Presentación realizada por Henri Barthel en Frankfurt el 15 de Octubre de 2008. Imagen 2. Ejemplo de propuesta de estructuración del código SGTIN Fuente: “Encoding ISBN in EPC”. Draft proposals for discussion. Presentación realizada por Henri Barthel en Frankfurt el 15 de Octubre de 2008.