Indización sistemática

Anuncio
Tema 1 : Operaciones de tratamiento documental. Indización Sistemática
1. Operaciones de tratamiento documental
1.1 El proceso de análisis, representación y organización de la información
1.2 La Indización
1.2.1 Definición
1.2.2 Fases del Proceso
1.2.3 Tipos y sistemas de indización
2. Los lenguajes documentales
2.1 Características
2.2 Tipología
3. La indización Sistemática
3.1 Definición
3.2 Características de los sistemas de clasificación bibliográfica
3.3 Aplicaciones de los sistemas de clasificación
1.1 El proceso de análisis, representación y organización de la información
La función de los archivos es principalmente organizar y tratar la documentación para conseguir que sea
accesible a los usuarios. Así, esos documentos son objeto de procesos ( físicos / intelectuales ). Intelectuales (
después de la adquisición )− un análisis documental, que es un conjunto de operaciones cuya finalidad es
crear representaciones de los documentos primarios y organizarlos para que sea posible la recuperación de la
información.
Esta representación permite crear índices y bases de datos. El análisis documental consta de dos partes, el
análisis formal y el análisis de contenido o semántico.
• Análisis formal : es el que realizaremos sobre el soporte de la información. Con él trataremos de
resolver el problema de identificación precisa de los documentos. Se consigue mediante un proceso de
representación, la descripción bibliográfica y los puntos de acceso, los encabezamientos para
organizar y recuperar información, el conjunto de la operación resultante se llama catalogación
descriptiva.
• Análisis de contenido : Incluye todas las operaciones que permiten descubrir el tema de un documento
y extraer los conceptos que van a representarlo. Consta de 2 procesos, la representación, dónde se
realiza un resumen para asignar puntos de acceso temáticos seleccionando aquellos términos que
representen mejor el contenido, permitiendo así la recuperación del documento según su contenido; y
la asignación de los puntos de acceso, llamados descriptores, encabezamientos de materia o códigos
de clasificación, mediante dos operaciones la indización y el resumen.
1
1.2.1 Definición
Según la norma UNE 50−121−1991 se define como acción de describir o identificar un documento en
relación con su contenido. La UNESCO la define como un proceso que consiste en describir y caracterizar un
documento con la ayuda de representaciones de los conceptos contenidos en dicho documento, y como una
finalidad mediante un proceso destinado a permitir una búsqueda eficaz de la información contenida en un
fondo documental. Slype la define como operación que consiste en enumerar los conceptos de los que trata un
documento y representarlos mediante un lenguaje documental.
1.2.2 Fases del Proceso
Según la UNE 50−121−1991 consta de tres fases :
• Examen del documento y definición de su contenido : Reducir su contenido a un resumen breve o a
una única frase.
• Identificación y selección de las nociones principales del contenido : Seleccionando conceptos porque
sean los que estén tratados con más profundidad en el documento o porque sean los que más puedan
interesar a nuestros usuarios.
• Selección de los términos de indización, que van a representar a esos conceptos : Utilizando
sinónimos ( científicos o populares ), ... según la topología de los usuarios, esta selección se facilita se
utilizamos un lenguaje documental.
1.2.3 Tipos y sistemas de indización
Según el sistema que empleemos dentro de los diferentes tipos de indización, podremos aplicar unos criterios
u otros, obteniendo diferentes tipos :
• Control terminológico : Hay dos variantes la indización en lenguaje libre o en lenguaje controlado (
normalizando los términos de indización ).
• Fuente de obtención de la documentación : También hay dos variantes la indización por extracción (
derivada ), dónde los términos se sacan del texto de los documentos ( no hay control terminológico ),
que se suele utilizar en sistemas automatizados; y la indización por asignación, dónde los términos
son asignados por los indizadores que suelen tomarlos de un lenguaje documental.
• Coordinación de conceptos : Los conceptos se pueden combinar en el momento del almacenamiento,
indización precoordinada, o en el momento de la recuperación, indización postcoordinada, debiendo
el usuario relacionar los términos con operadores boléanos.
• Método de organización de los conceptos en el sistema : Indización Alfabética, dónde los términos
que representan los conceptos se ordenan alfabéticamente ( listas de materias, lista de los tesauros, ... )
o la Indización Sistemática, dónde los conceptos se organizan por familias semánticas , por
proximidad temática. Así materias afines aparecen juntas ( sistema de clasificación y presentación
jerárquica de los tesauros )
2.1 Características
Con la aparición de los ordenadores y la automatización se pensó que el lenguaje natural iba a solventar
muchos de los problemas existentes, ahora se sabe que provoca muchos problemas porque es demasiado
ambiguo. Para eliminarla se utilizan los lenguajes documentales sirviendo de puente entre la terminología de
los autores y la de los usuarios.
Lenguaje documental : Sistema de signos normalizados ( lingüísticos, numéricos, ... ) que permiten la
representación del contenido de los documentos y la organización de estas representaciones con el objetivo de
facilitar la recuperación de la información.
2
Según García Gutiérrez tienen doble finalidad :
• Organizar datos de un campo científico.
• Unificar criterios de análisis de la información tanto en la fase de entrada como en la fase de salida.
Para la consecución de estos fines en cualquier lenguaje documental se realiza una normalización que afecta a
3 niveles:
• Morfológico : Control de signos que van a utilizar como descriptores ( número [ p o s ], género [ m o f
], grafía y códigos [ reflejan estructura del sistema de clasificación ] )
• Sintáctico : 2 objetivos, controlar amplitud del significado de los términos, consiguiendo lo que
expresa Maniez, que denomina el lenguaje biunívoco, en el que cada término representa un solo
concepto y cada concepto un solo termino, controlando la sinonimia, para ello se elige un descriptor y
se establece un sistema de reenvios que lo relacionan con los sinónimos ( relación de equivalencia ) y
también la polisemia, especificando el campo semántico o la clase a la que pertenece ( va entre
paréntesis al lado del descriptor y se llama identificador ). El segundo objetivo es establecer una red
de relaciones entre los términos que forman parte del lenguaje documental : con relaciones jerárquicas
( entre una clase y sus miembros, o entre una clase y partes de la misma, Ej. Bibliotecas−bibliotecas
escolares−bibliotecas universitarias; aparato locomotor−esqueleto−articulaciones−huesos ) y
relaciones asociativas ( entre descriptores que representan conceptos que evocan términos−conceptos
que nosotros relacionamos pero que no pertenecen a la misma jerarquía Ej. Metales−plasticidad ).
• Semántico : Establece el orden en el que deben aparecer los diferentes conceptos que forman un punto
de acceso temático. Se especifican los signos que representan relaciones entre los conceptos, a veces.
2.2 Tipología
Según:
• Vocabulario : − lenguajes codificados
− términos del lenguaje natural codificados o vocabularios controlados
• Estructura : − lenguajes combinatorios ( 1 )
− lenguajes de estructura jerárquica ( 2 )
− lenguajes de estructura sintáctica ( 3 )
1 .− Lenguajes organizados sistemáticamente o alfabéticamente y que se coordinan entre sí en el momento de
la indización, al almacenarlos ( precoordinados ), Ej. encabezamientos de materia y algunos sistemas de
clasificación; o al recuperarlos ( postcoordinados ) Ej. tesauros.
2 .− Orden lógico que agrupa conceptos más específicos dentro de los más generales. También llamado
enumerativo, ya que dentro de la jerarquía se enumera todos los temas posibles. En su origen todos los
sistemas de clasificación tenían estructura jerárquica.
3 .− Son los modelos más elaborados, formados por un conjunto de descriptores y una sintaxis muy precisa
para especificar las relaciones entre conceptos, lo más importante en la sintaxis, Ej. Sistema Precis utilizado
hasta mediados de los 90 en la British Library, en desuso por su complejidad.
3.1 Definición
3
La indización sistemática o clasificación documental es la operación mediante la cuál se describe el contenido
de un documento de forma sintética determinando su materia principal, ésta se representa utilizando un
lenguaje documental codificado y precoordinado. El resultado es la agrupación de los documentos que tienen
una temática común.
Este proceso se asienta sobre unas bases :
• El contenido se representa de forma sintética, después de haber realizado un análisis de los conceptos
y sus relaciones, el resultado se sintetiza en un solo código, el punto de acceso. Si no se puede en un
solo código se usan como mucho tres, pero en muy pocas ocasiones.
• La asignación del código, sitúa al documento por su contenido dentro de un sistema general o
especializado, este sistema consiste en una estructura metódica de clases conceptualmente
relacionadas entre sí. Las clases de este sistema agrupan temas o conceptos que tienen características
comunes, por eso se llama indización sistemática, al situar los conceptos en un sistema agrupándolos
según su afinidad temática. Esto se consigue porque se utiliza un código que refleja la estructura del
sistema de clasificación. Una herramienta muy utilizada en las clasificaciones bibliográficas.
3.2 Características de los sistemas de clasificación bibliográfica
• Lenguajes codificados desde el punto de vista del vocabulario.
• Desde el punto de vista estructural, los lenguajes son de estructura jerárquica ( origen común del
documento ) o de estructura combinatoria.
• Son lenguajes precoordinados, ya que se estructuran al almacenar los datos.
• Estos lenguajes normalizan en 3 niveles, morfológico ( 1 ), sintáctico ( 2 ) y semántico ( 3 ) :
1.− Es necesario normalizar las notaciones ( códigos numéricos, alfabéticos, alfanuméricos, ... ), ya que la
notación refleja la estructura del sistema, la jerárquica y también tiene que permitir identificar los distintos
elementos cuando el sistema tiene estructura combinatoria.
2.− Es necesario evitar la ambigüedad ( sinonimia, apenas existente, y polisemia, controlada por la propia
estructura del sistema ). En la red de relaciones, predominan las jerárquicas y las asociativas apenas aparecen
en las clasificaciones documentales.
3.− Es necesario establecer el orden de sucesión de los elementos que componen un código y también
determinar los signos que van determinar relaciones entre conceptos en caso de que se representen, toda esta
información se presenta en una estructura bipartita :
• Tablas del sistema de clasificación : muestran sistemáticamente las materias y sus relaciones,
mediante la notación ( código que representa materia ) y la rúbrica ( expresión verbal del significado
de ese código )
• Índice alfabético : Se enumeran todas las materias que contienen las tablas sistemáticas remitiéndonos
al código que representa esa materia en las tablas principales.
3.3 Aplicaciones de los sistemas de clasificación
Las clasificaciones documentales se utilizan con 2 objetivos :
• Organizar fondos : A diferencia de otros lenguajes documentales que sólo nos permiten referencias de
los documentos, los sistemas de clasificación nos permiten acceder al documento. Teniendo en cuenta
que los usuarios finales no conocen el sistema, se debe utilizar códigos sencillos y un sistema de
señalización que permita al usuario orientarse dentro de la colección.
4
A pesar de todos estos recursos, las dificultades de acceso a los fondos organizados con clasificaciones
documentales provocaron la búsqueda de sistemas alternativos especialmente en las bibliotecas públicas. Las
primeras iniciativas se dieron en el área anglosajona en la década de los años 40, empezaron a utilizar los
sistemas del centro de interés ( intenta simplificar clasificación estableciendo categorías más afines a los
criterios de los usuarios finales que las categorías empleadas en los sistemas tradicionales ) tradicionalmente
las disciplinas dividen, en los centros de interés materias que agrupan.
• Organizar índices, catálogos, bibliografías : Sirven para sintetizar herramientas que tradicionalmente
se han empleado en las unidades de información para organizar el conocimiento y para facilitar la
recuperación de la información.
El resultado del uso de las clasificaciones documentales son los índices, catálogos y bibliografías sistemáticas.
Hace un par de décadas nadie apostaba mucho por el futuro de las clasificaciones bibliográficas como
herramientas para la recuperación de la información, el desarrollo de las tecnologías de la información ha
ampliado el ámbito de uso de estos sistemas.
Los sistemas de clasificación se han revalorizado, en la década de los 80 se inicia el proceso de los catálogos
en línea, y se demuestra que los sistemas de clasificación son útiles como herramientas de clasificación
sistemática en línea porque facilitan las búsquedas explorativas ( Browsing ) y porque permiten visualizar en
la pantalla documentos afines temáticamente. También es posible ampliar o limitar la búsqueda a términos o
materias más genéricos o específicos, gracias a las posibilidades de navegación de la estructura jerárquica (
directorios de recursos de Internet, ... )
Además permiten contextualizar la búsqueda dentro de una disciplina, eliminando así la ambigüedad del
lenguaje natural. Y los códigos de clasificación pueden funcionar como un lenguaje−puente para salvar las
barreras lingüísticas.
Tema 2 : Tipología de los sistemas de clasificación
2.1 Criterios para establecer una tipología.
2.1.1 El ámbito temático
2.1.2 La Estructura
2.2 Los sistemas de clasificación desde el punto de vista del ámbito temático
2.2.1 Clasificaciones universales
2.2.2 Clasificaciones especializadas
2.3 Sistemas de clasificación desde el punto de vista estructural
2.3.1 El modelo jerárquico
2.3.1.1 Características
2.3.1.2 Ventajas e inconvenientes
2.3.2 El modelo facetado
5
2.3.2.1 Características
2.3.2.2 Ventajas e inconvenientes
2.3.3 El modelo híbrido
2.3.3.1 Características
2.3.3.2 Ventajas e inconvenientes
A lo largo de la historia, las colecciones de documentos son organizadas mediante una clasificación temática
porque los grandes sistemas de clasificación bibliográfica no aparecen hasta el siglo XIX. Antes bibliotecas y
librerías utilizaban adaptaciones de la clasificaciones de las ciencias ya que los documentos recogen el saber
científico.
En la Edad Media, las colecciones de libros en los monasterios se organizaban con el sistema del
Trivium−Quatrivium que pasaría a las bibliotecas de las universidades. El grupo del Trivium recogía las
ciencias de las palabras y textos ( gramática, retórica y dialéctica ), el grupo del Quatrivium recogía las
ciencias de las cosas ( música, astronomía, geometría y aritmética ). Esta forma de organización reflejaba el
sistema de clasificación de las ciencias de Aristóteles.
En la Edad Moderna ( fines del siglo XVIII − principios del siglo XIX ) el filósofo Auguste Compte establece
una nueva clasificación del conocimiento, la clasificación positivista de las ciencias, la división en disciplinas
es la siguiente, matemáticas, astronomía, física, química, biología y sociología.
A pesar de que la historia ha tratado la organización del conocimiento y de los documentos utilizando
sistemas universales para cualquier lugar y conocimiento, esto tiene serias limitaciones porque cualquier
sistematización de la ciencia significa estructurar la realidad, desde un punto de vista que refleja la concepción
del mundo de quien realiza la clasificación. En consecuencia, un campo común a toda clasificación es su
carácter caduco y provisional, a pesar de lo cuál perdura a lo largo del tiempo, a veces demasiado, y se utiliza
en lugares con una cultura, tradiciones, ... muy diferentes a los lugares de origen de las tradicionales. La
mayoría de los grandes sistemas de clasificación bibliográfica surgen en el ámbito anglosajón, cristiano,
capitalista, blanco, ... y su uso se ha trasladado a culturas completamente diferentes.
2.1.1 El ámbito temático
Temáticamente podemos distinguir entre de ámbito general ( universal ) y especializado.
2.1.2 La estructura
Estructuralmente pueden ser jerárquicas o monojerárquicas, facetadas o híbridas.
2.2.1 Clasificaciones universales
Abarcan todos los ámbitos del conocimiento de carácter generalista, su principal problema es la limitación de
un sistema que intenta organizar información buscando una validez universal y un carácter permanente. Esto
se contradice con el carácter dinámico de la producción científica y la variedad de centros en los que se puede
utilizar una clasificación. A pesar de esto, las clasificaciones universales ( Dewey, Congreso, ... ) han
demostrado su utilidad para organizar colecciones de carácter generalista ( de las bibliotecas nacionales,
públicas, en Internet, ... )
2.2.2 Clasificaciones especializadas
6
Se limitan a un campo especifico del conocimiento, su principal ventaja es que se adaptan perfectamente a la
disciplina para la que han sido creados como al fondo al que se aplican. El gran inconveniente es la falta de
compatibilidad entre clasificaciones creadas para un ámbito similar.
Tanto las generales como las específicas se pueden estructurar en jerárquicas, facetadas o híbridas.
2.3 Sistemas de clasificación desde el punto de vista estructural
Los sistemas de clasificación tienen que organizar sistemáticamente los campos del conocimiento
generalmente especializado. Por tanto deben ser capaces de representar y relacionar lógicamente los conceptos
y temas que pertenecen a ese campo del conocimiento.
Definición : Representación mental de una parte de la realidad física o intelectual que se construye a partir de
la abstracción de caracteres comunes a un conjunto de objetos o fenómenos individuales. Estos conceptos
sirven de nodos / redes por los que se forman las materias de las que trata cualquier área del conocimiento.
Normalmente es una combinación de conceptos que representan el asunto del que trata un documento.
2.3.1.1 Características
El modelo jerárquico utiliza un método de organización bastante simple inspirado en la lógica clásica, el
punto de partida es un campo del conocimiento que puede ser especializado o universal al que se aplica el
criterio de división que permite establecer clases distintas que sucesivamente serán más especificas gracias a
nuevas subdivisiones que surgen de la aplicación de nuevos criterios de división.
En estas clases y en sus epígrafes se enumeran todos los conceptos y todos las materias que se pueden
clasificar con ese sistema por eso también se llaman sistemas de clasificación enumerativos. Estos sistemas
tienen esquemas simples, pero que resultan repetitivos y poco funcionales. Para realizar una división lógica
del conocimiento hay que elegir criterios claros y concisos de manera que su aplicación dé cómo resultado
clases bien diferenciadas. El criterio principal o más importante dará origen a las clases principales del
sistema, tradicionalmente en un sistema de clasificación bibliográfica de carácter universal, el primer criterio
han sido las disciplinas como por ejemplo se aplican en la clasificación de Dewey o en la LC, que es el único
sistema jerárquico puro existente.
Cada vez que se desciende un nivel jerárquico se tiene que aplicar un nuevo criterio de división y puede ser el
mismo o diferentes para las clases de un mismo nivel.
El conjunto de clases que pertenecen a un mismo nivel, y por tanto son fruto de un mismo criterio de división,
se llama rango. Siguiendo un procedimiento de división continua hasta alcanzar el nivel de especificidad
necesario, para enumerar todos los conceptos y materias que se pueden clasificar con este sistema. Las
relaciones semánticas que se establecen son de tipo vertical o jerárquico. Y una clase sólo conecta con la raíz
de la arborescencia siguiendo un único camino. Por eso también se llamas sistemas monojerárquicos. La
notación de las clasificaciones jerárquicas tiene que reflejar obligatoriamente la estructura de la clasificación
de manera que se consiga agrupar los documentos temáticamente afines.
Por tanto el código nos tiene que permitir identificar la clase a la que pertenece y los sucesivos niveles de
división.
2.3.1.2 Ventajas e Inconvenientes
• Ventajas : Es de fácil uso, es clara y tiene una gran difusión ( muy implantada internacionalmente ).
• Inconvenientes : La rigidez del sistema, dónde solo están presentes relaciones semánticas de tipo
jerárquico / vertical, no permite la relación de conceptos de distintas clases. También es difícil
7
incorporar conceptos o nuevos temas ( o se deja previamente un hueco desde el principio o se
implantan ramas al final del sistema pero que quedan sin relación, rompiendo así la propia estructura
del sistema ), ya que la combinación de una estructura jerárquica y una división del conocimiento en
disciplinas plantea una dispersión de materias dependiendo del punto de vista o disciplina que las
estudia.
2.3.2.1 Características
Aparentemente esta estructura esa ligada a la insuficiencia del método jerárquico. Esta estructura surge por los
trabajos de Ranganathan ( matemático y bibliotecario hindú que trabajaba en la Universidad de Madrás, y al
cuál envían a Londres para que conozca los sistemas de clasificación que se están utilizando para las
organizaciones de las bibliotecas universitarias ). Trabaja allí con la CDU y con Sayer, ( estudioso y crítico de
la CDU ). A partir de este conocimiento de la estructura jerárquica, Ranganathan propondrá un sistema
alternativo, el modelo facetado, basado en el principio de que cualquier tema se puede descomponer en
conceptos simples. Este principio se aplica al ámbito del conocimiento que cubre el sistema de clasificación (
universal o especializado ). Así ese ámbito del conocimiento queda dividido en grupos de conceptos simples
que comparten un atributo o propiedad común. Cada uno de estos grupos, simples se denomina faceta.
Las facetas deben ser homogéneas y excluirse mutuamente gracias a las características de división, para que
un concepto pertenezca a una faceta, debe cumplir una de estas 2 condiciones lógicas, respecto al criterio que
define la faceta.
• Todo B es un A
• Todo B es parte de A ( dónde B es un concepto y A una característica / faceta )
Dentro de cada faceta del sistema se pueden hacer subdivisiones aplicando nuevos criterios lógicos que dan
origen a las subfacetas. Dentro de cada grupo, los conceptos se pueden organizar jerárquicamente y
alfabéticamente o aplicando cualquier criterio clasificatorio.
Mediante esta estructura conseguimos que cualquier materia quede dividida en sus elementos básicos
constituidos, que se combinan entre sí, en el momento de la clasificación , de manera que cuando clasificamos
con un sistema facetado, no le asignamos al documento una notación previamente establecida en el sistema
sino que creamos el código en el momento de la clasificación para hacerlo primero tendremos que analizar la
materia para asignarle los códigos que le corresponden a los diferentes conceptos sobre los que trata y
posteriormente realizaremos una operación de síntesis para construir el código que represente el tema del
documento. Ej.
• Fisiología ( F ) Hábitat ( H )
Respiración ( FA ) Animales acuáticos ( HA )
Reproducción ( FB ) Animales terrestres ( HB )
• Respiración de los animales terrestres = FAHB
La notación es fundamental, ya que en este sistema es muy necesario una identificación clara y concisa de
cada una de las facetas que se utilizan para crear un código. Estos sistemas deben tener una sintaxis clara y
precisa que establezca el orden de citación de los diferentes elementos que forman el código para evitar que
haya varios códigos iguales para una materia.
2.3.2.2 Ventajas e Inconvenientes
• Ventajas : La clasificación facetada rompe con las restricciones de las relaciones semánticas de tipo
8
vertical ( que predominan en el sistema jerárquico ), porque son sistemas combinatorios
precoordinados que permiten una clasificación precisa de los conceptos dentro de los campos del
conocimientos especializado. Además al tener una estructura muy clara y sencilla, se adapta mejor a
la renovación de las ciencias y a la incorporación de nuevos conceptos. Además de esto se puede
explotar mucho más respecto a la recuperación de la información porque con una adecuada
parametrización del sistema podríamos recuperar códigos por los conceptos.
• Inconvenientes : Es muy importante la escasa difusión de este sistema desde el punto de vista práctico
porque a nivel teórico ha tenido mucha trascendencia. Los sistemas facetados más importantes son la
clasificación colonada de Ranganathan y la clasificación de Bliss, estos dos sistemas se utilizan en
pocos sitios, el primero en la India y el segundo en el Reino Unido. A partir de estos sistemas se han
creado muchos sistemas de clasificación especializados.
2.3.3.1 Características
Surgen por los problemas de las clasificaciones jerárquicas enumerativas y por las dificultades que planteaban
para adaptarse a la evolución de la ciencia. En este caso se buscó una estructura interna entre la facetada y la
jerárquica aunque los principios de estas estructuras son tan diferentes que no se ha podido conseguir
totalmente la integración. Lo que se ha hecho, ha sido incorporar facetas a los sistemas jerárquicos en los que
sigue predominando esta estructura. La forma de incorporar facetas a esta jerárquica es añadir atribuciones :
• Generales : Son facetas que constituyen categorías universales ( espacio, tiempo, forma, ... ) que se
pueden aplicar a todas las divisiones principales del esquema de clasificación ( Ej. auxiliares comunes
de la CDU )
• Especiales : Son facetas que solamente se pueden aplicar a una parte ( a algunas materias ) de la
estructura jerárquica tradicional. Ej.
72.0334 Arquitectura Románica
75.0334 Pintura Románica
Este método de flexibilidad sistemática y hacerlo híbrido se ha utilizado en la DC en la que se han aplicado
los auxiliares comunes y se ha utilizado en la CDU.
2.3.3.2 Ventajas e Inconvenientes
• Ventajas : Con pocos recursos se amplía y flexibiliza el sistema de clasificación dando opción a que
se renueve fácilmente y aparezcan clasificadas materias más especializadas.
• Inconvenientes : Como las facetas se aplican a sistemas que en origen eran jerárquicos y que como
sistemas jerárquicos, no tenían sintaxis normalmente la sintaxis de los sistemas híbridos que sí la
necesitan, es muy débil y esto hace que podamos asignar diferentes códigos clasificatorios a una
misma materia.
Tema 3 : La clasificación Decimal Universal
3.1 Características
3.1.1 Elementos del sistema
3.1.1.1 Tablas principales
3.1.1.1.1 Estructura jerárquica
9
3.1.1.1.2 Facetas auxiliares ( auxiliares especiales )
3.1.1.2 Tablas auxiliares
3.1.1.2.1 Signos auxiliares
3.1.1.2.2 Códigos auxiliares
3.1.1.3 Índice alfabético
3.2 Proceso de clasificación con la CDU
3.3 Utilización del sistema
La CDU nace a principios del siglo XX como una adaptación del sistema de clasificación de Melvil Dewey,
concretamente de la 5º ed. Paul Otlet y Henry Lafontaine estaban elaborando el repertorio bibliográfico
universal, para organizar las referencias de un sistema generalista /universal. Hicieron un análisis de las
usadas en ese momento, y la que más les convenció para sus propósitos fue la DC. Aun y así no se adaptaba
del todo así que pidieron autorización a su creador para modificar el sistema, ampliándolo con nuevas
subdivisiones y clases más especiales. En 1905 se publicó la 1º ed. oficial y completa de la CDU ( llamado
Manuel du repertoire bibliographique universel ) Desde sus orígenes la CDU fue responsabilidad del Instituto
Internacional de Bibliografía, esta responsabilidad fue pasando a las diversas instituciones en las que se
transformó este instituto. Dentro de la FID, se elaboraron diferentes organismos para que gestionaran el
sistema, su puesta al día y adaptación a las nuevas tecnologías. Ninguno de estos organismos fue muy
operativo hasta que en 1988 la FID encargó una evaluación del sistema de clasificación a un grupo de
evaluadores externos y las conclusiones de su informe impulsaron la creación de una nueva entidad para la
gestión del sistema, el Consorcio para la CDU, que se crea en 1992 y que hasta ahora se encarga de la edición
y actualización de la CDU. Sus miembros son la FID y los editores de la CDU ( holandés, inglés, francés,
japonés y castellano ) en igualdad de condiciones.
3.1 Características
Es de carácter universal porque tiene una estructura jerárquica enumerativa, organizada en función de las
disciplinas, que hereda de la DC. A lo largo de sucesivas ediciones ha ido evolucionando e incorporando cada
vez más facetas hasta convertirse en el sistema híbrido que es en la actualidad. La notación es numérica y
ordenada según el principio de los números decimales, cualquier código de la CDU puede ser subdividido
indefinidamente, se podría ampliar indefinidamente el sistema. Además los signos numéricos son
comprensibles en todo el mundo aunque se trate de países dónde el sistema de escritura es totalmente
diferente, este factor facilita el uso del sistema en un ámbito internacional. Consta de 3 elementos básicos : las
tablas principales, las auxiliares y el índice alfabético.
3.1.1.1.1 Estructura Jerárquica
El conocimiento se halla repartido en 10 clases estructuradas siguiendo el criterio de disciplinas y organizadas
de forma jerárquica, como consecuencia del uso del criterio de las disciplinas, una misma materia puede
aparecer con distintos códigos dependiendo del punto de vista con el que se trate. Muchas veces en el sistema
se recurre a indicar el clasificador que se puede usar en jerarquías de otras partes de las tablas.
3.1.1.1.2 Facetas auxiliares ( auxiliares especiales )
Son facetas aplicables sólo a algunas materias y que se refieren a acciones, procesos, operaciones, propiedades
y otros aspectos de las materias bajo las que aparecen. No tienen significado por si mismos, sólo en función
10
del código al que acompañen.
3.1.1.2.1 Signos auxiliares
Sirven para expresar la relación existente entre diversos códigos de las tablas principales o auxiliares, para
clasificar una materia compuesta o compleja, el uso de estos signos amplia el carácter combinatorio del
sistema, lo flexibiliza y contribuye a ampliar la estructura facetada.
• Dos puntos o colon ( : ) Sirve para unir 2 o más conceptos formando con ellos una nueva notación que
añade más detalle a las materias de las tablas principales o expresa relaciones entre 2 conceptos.
Consta de tantos puntos de acceso como códigos simples lo formen.
• Doble dos puntos o doble colon ( :: ) Signo de relación fija. Se una se caso de conexión indisoluble de
2 conceptos, que no existe en las tablas de forma unidireccional.
• Adicción ( + ) Une 2 o más códigos de la CDU no consecutivos normalmente que expresan diversos
conceptos contenidos en el documento que aparecen por separado.
• Extensión ( / ) Une la primera y la ultima subdivisión consecutiva de un mismo concepto.
3.1.1.2.2 Códigos auxiliares comunes
Son facetas que sirven para representar conceptos universales y por tanto se pueden usar junto con cualquier
código de las tablas principales. Sirven para concretar aspectos de la lengua, forma, tiempo, ... de los
documentos. Cada auxiliar tiene una morfología propia que permite diferenciarlos entre si y de las tablas
principales.
3.1.1.3 Índice Alfabético
Permite acceder por orden alfabético a todas las materias y temas recogidos en las tablas principales. También
llamado índice relativo porque reúne en una sola entrada los diferentes códigos asignados a una materia según
la disciplina que lo estudia. No amplia posibilidades del sistema de clasificación porque no incluye sinónimos
que aparezcan en las tablas o no.
3.2 Proceso de la clasificación con la CDU
La existencia de auxiliares y signos de relación en el proceso de asignación de código CDU hace que sea un
proceso analítico−sintético, primero se realiza la operación de análisis de contenido identificando conceptos
que se correspondan con las partes del sistema ( tiempo, lugar, forma, ... ) hecho esto se sintetizan
representándolos en un solo código. Algunas veces la síntesis no es necesaria puesto que trata sobre una
materia muy genérica. Casi siempre para unir varios códigos necesitamos un orden sintáctico de los
elementos, pero como sistema híbrido su sintaxis es muy débil y se admiten diferentes maneras de combinar
los códigos. A pesar de esto existe una manera más habitual y aceptada de ordenación de los elementos
[ código ] [ auxiliares especiales ] −1/−9 .01/.09 `01/'09 [ auxiliares comunes dependientes ] .00 −03 −05 [
auxiliares comunes independientes ] ( 1/9 ) __ ( 0_ ) ( = __ ) =__
3.3 Utilización del sistema
El uso de la CDU se ha extendido especialmente en el ámbito de países francófonos, habla castellana y en la
Europa del Este. Debido a su capacidad de síntesis y especificidad que pueden alcanzar sus códigos se ha
usado no solo para la ordenación física de colecciones sino que también en centros especializados para crear
perfiles de DSI ( Difusión Selectiva de la Información ) e indización de documentación científica. A pesar de
la difusión de este sistema su estancamiento actual se debe a la falta de impulso editorial y a su falta de
adaptación a entornos automatizados, esto resulta paradójico ya que la CDU fue el sistema clasificatorio con
11
el que se realizaron las primeras investigaciones que analizaban las posibilidades que ofrecían los sistemas de
clasificación para la recuperación de la información en entornos on−line. El primero, en la década de los 60,
llevado a cabo por Robert Freeman y Pauline Atherton fue el proyecto AUDACIOUS. Que puso de manifiesto
la ventaja de usar un sistema codificado para mostrar al usuario como esta organizada la información y para
superar las barreras lingüísticas de redes de información de ámbito internacional. Muchas conclusiones de este
proyecto no tuvieron consecuencias prácticas y ahora las clasificaciones esta infrautilizadas en catálogos en
línea y empiezan a emplearse en algunas pasarelas especializadas de Internet. A mediados de los 90 Buxton
propuso una serie de requisitos que debería seguir un sistema de información que explotará totalmente los
recursos de la CDU :
• Búsquedas por código completo
• Equivalencia entre rúbrica y notación
• Archivación de símbolos para identificar la notación
• Búsquedas por códigos truncados
• Búsquedas por separado de cada parte de un código
• Búsquedas por los auxiliares independientes
• Truncamiento dentro de un código o que podamos utilizar operadores boléanos
Hasta ahora solo se ha tratado de forma experimental.
12
Descargar