Contenido

Anuncio
Tema 2:
BASES PARA EL
DESARROLLO DE ADC.
MODELOS Y ANÁLISIS
Á
DEL CONTEXTO
© María Pinto
Sumario
i
1.
2.
3
3.
4.
5.
6.
7.
8.
9.
10.
Objetivos.
Obj
ti
Competencias.
Introducción
Introducción.
Bases para el Análisis de Contenido
z
Representación
p
del conocimiento y arquitectura
q
de
los contenidos.
z
Convergencia de paradigmas y modelos.
z
Si t
Sistemas
d
de representación
t ió de
d la
l iinformación.
f
ió
Contexto y complejidad de ADC
z
Diversidad de dominios discursivos
discursivos.
z
Diversidad estructural de los documentos.
Conclusiones.
Bibliografía.
Frase reflexiva.
Evaluación.
Recursos de apoyo.
© María Pinto
OBJETIVOS
Objetivos
bj i
‰
‰
‰
Conocer las diferentes formas de representación
p
de
información.
Explicar algunos paradigmas y modelos empleados en la
fundamentación del análisis de contenido
contenido.
Repasar los diferentes sistemas de representación de la
información.
© María Pinto
Objetivos
bj i
‰
‰
Presentar los principales dominios discursivos:
científico, literario y periodístico
Exponer
p
la diversidad de estructuras
documentales: argumentativa, narrativa…
© María Pinto
COMPETENCIAS
Competencias
i
‰
Conocer las diferentes formas de representación
p
y
arquitecturas de contenido.
‰
Establecer convergencias entre los diferentes
paradigmas y modelos de análisis de contenido
contenido.
‰
Diferenciar
Dif
i llos sistemas
i t
d
de representación
t ió d
de
información.
© María Pinto
Competencias
i
‰
Conocer los principales dominios
discursivos.
‰
Entender la diversidad estructural de
los documentos y su uso.
© María Pinto
INTRODUCCIÓN
Introducción
d
ió
‰
Para el estudio de ADC es fundamental saber que es
un concepto dual:
¾ Un
U proceso y un producto.
d t
¾ Una metodología y un objeto documental.
‰
Para entender esta característica hay que tener en
cuenta:
¾ El contexto.
¾ La diversidad de dominios.
dominios
¾ La diversidad estructural.
‰
En este tema se abordarán algunos paradigmas y
modelos que influyen en el análisis de contenido y en
l sistemas
los
i t
d
de representación
t ió d
de iinformación.
f
ió
© María Pinto
Parte 1:
Bases p
para ADC
REPRESENTACIÓN
Ó
DEL CONOCIMIENTO
Y ARQUITECTURA
DE LOS
CONTENIDOS
Representación del
conocimiento y arquitectura de
los contenidos
REPRESENTACIÓN
DEL
CONOCIMIENTO
O O
O
‰
Manifiesta las especificaciones
de los objetos contenedores de
conocimiento y sus
correspondientes relaciones.
Representación del conocimiento es un término
usado en muchos contextos:
¾
¾
¾
Informático.
Psicológico.
Ló i
Lógico,
etc.
t
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
‰
Su extensión en el contexto automatizado permite:
p
¾ Reconfigurar y reutilizar la información
almacenada.
¾ De un modo abierto e indeterminado.
‰
Se usa para:
¾ Representar información.
¾ Recuperar información.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
‰
S objetivos
Sus
bj ti
son:
¾
Establecer correspondencia sistemática
entre:
ƒ Dominio informativo-documental destino y el
dominio modelo.
¾
Representar por medio del dominio
modelo el objeto en el domino meta.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
‰
El producto de modelización puede adoptar
diferentes niveles de formalización:
¾ Mapas conceptuales.
conceptuales
¾ Redes semánticas.
¾ Hipertexto.
Hi t t
¾ Tesauros conceptuales.
¾ Ontologías, etc.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
‰
Los documentos electrónicos son:
¾
Bloques textuales.
¾
Datos con atributos.
¾
Imágenes fijas o en movimiento.
¾
Sonido.
‰
Las partes del documento electrónico pueden enlazarse a
otros documentos.
‰
Los documentos hipertextuales
p
tienen dos niveles de
representación:
¾
El documento en si.
¾
Ab t
Abstracción
ió en una red
d semántica.
á ti
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Formas de representación:
‰
Las unidades con significado usadas en la
representación documental son:
¾
La palabra.
¾
La frase.
frase
‰
Las fórmulas humanas de representación del
conocimiento son:
1
1.
Conceptos
Conceptos.
2. Categorías.
3
3.
Proposiciones
Proposiciones.
4. Redes semánticas.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Formas de representación:
1.- CONCEPTOS
CONCEPTOS
‰
Expresa ell contenido
E
t id d
de lla
realidad.
Los conceptos
p
humanos tienen relación con el
conjunto de propiedades que constituyen la
estructura correlacional del mundo.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Formas de representación:
1.- CONCEPTOS
‰
Diferenciar
Dif
i entre
t conceptos:
t
¾
Generales: polisémicos y semánticamente subjetivos.
¾
Especializados: precisos y denotativos
denotativos.
‰
Para representar
p
la estructura de los conceptos
p
se p
puede usar:
¾
Representaciones dimensionales.
¾
A rasgos o atributos cualitativos.
¾
Proposiciones o representaciones reticulares.
¾
Plantillas.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Formas de representación:
2.- CATEGORÍAS:
Í
CATEGORÍAS
‰
Entramados conceptuales
p
q
que
determinan la posición respecto
a otro objeto
Son muyy importantes
p
en los sistemas de
organización del conocimiento:
¾
Clasificaciones.
¾
Ontologías.
¾
Tesauros,, etc.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Formas de representación:
3.- PROPOSICIONES:
PROPOSICIONES
Unidades lógicas de inferencia
sujetas a valores de verdad
‰
Se definen p
por reglas
g
de formación explícitas.
p
‰
Se representan en forma de redes o árboles
árboles.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Formas de representación:
4.- REDES SEMÁNTICAS:
Á
‰
Organizan el conocimiento mediante nodos
conceptuales y enlaces.
‰
Representan las interrelaciones de manera
asociativa.
asociativa
‰
Existen aplicaciones informáticas como:
¾
ATLAS/ti.
¾
Thenetsys
Thenetsys.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Arquitectura de los contenidos:
‰
‰
‰
El contenido de un documento científico se distingue por:
¾
Carácter informativo.
¾
C á t cognitivo.
Carácter
iti
Las estructuras retóricas son fundamentales en los
procesos de análisis del contenido.
Distinguimos
Di
ti
i
estos
t componentes
t en ell contenido:
t id
¾
General.
¾
Lógico.
¾
Gramatical.
¾
Filosófico.
¾
P i ló i
Psicológico.
¾
Documental.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Arquitectura de los contenidos:
‰
Además hay que resaltar los siguientes componentes:
¾
Teórico y práctico.
¾
O t ló i e instrumental.
Ontológico
i t
t l
¾
Intrínseco y extrínseco.
¾
Semántico y pragmático.
‰
El concepto de “contenido” está vinculado al de
“significado”
significado .
‰
Para definir “contenido”
contenido hay que tener en cuenta:
¾
Los canales de información.
¾
Los procesos de comunicación.
¾
L flflujos
Los
j d
de iinformación.
f
ió
¾
Las funciones y efectos sociales.
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Arquitectura de los contenidos:
‰
También se encuentra relacionado con:
TEMA
Conjunto de aspectos
contextuales que se reflejan
en el texto y son necesarios
para interpretarlos
© María Pinto
Representación del
conocimiento y arquitectura de
los contenidos
Arquitectura de los contenidos:
‰
Emerge con fuerza el concepto de “HIPERCONTENIDO”
¾
Localizado en un espacio infinito (la red).
¾
I t
Interactivo.
ti
¾
Multidireccionable.
¾
Modificable.
¾
Ergonómico.
‰
Los nuevos contenidos
L
t id electrónicos
l tó i
permiten
it converger:
¾
Textos.
¾
Sonidos
Sonidos.
¾
Imágenes.
‰
El contenido tradicional interactivado en la Red es ahora
“hipercontenido”
© María Pinto
CONVERGENCIA
DE PARADIGMAS
Y MODELOS
Convergencia de
paradigmas
p
g
y modelos
ANÁLISIS
SS
DE
CONTENIDO
‰
Red de ideas interconectadas y
tramas de intenciones elaboradas por
los comunicantes en función de los
esquemas cognitivos compartidos
El análisis de contenido es una representación
multinivel en función de:
¾
Las necesidades informativas
informativas.
¾
Los contenidos documentales.
¾
Los dominios científicos procesados.
¾
La sofisticación de los productos.
p
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
‰
Estos niveles se materializan en:
¾
Té i
Términos.
¾
Imágenes.
¾
Enlaces.
¾
Redes de p
proposiciones,
p
, etc.
‰
Un análisis de contenido se basa en:
¾
Análisis bidireccional de contenidos y demandas
documentales.
documentales
¾
Representación tridimensional de espacio
i f
informativo,
ti
iinterés
t é y necesidades
id d d
de
información.
© María Pinto
Convergencia de
paradigmas y modelos
‰
Desde una perspectiva documental apostamos
por el modelo “multiparadigmático”:
multiparadigmático :
¾
¾
‰
Integrar los puntos fuertes de los paradigmas
convergentes.
Enfoque de los procesos de información y sus
g
estados como modelo sistémico de organización.
Los distintos paradigmas son:
¾
¾
¾
¾
¾
Sociocognitivo.
Lógico
Lógico.
Comunicacional.
Fí i
Físico.
Sistémico.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
1 Paradigma sociocognitivo:
1.‰
‰
‰
La aplicación de este paradigma a ADC facilita la
elaboración de métodos para el análisis.
Destacan los procesos cognitivos de:
¾
P
Percepción.
ió
¾
Introspección.
¾
Memoria.
Se obtiene conocimiento o comprensión conceptual.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
1 Paradigma sociocognitivo:
1.‰
Las principales premisas ontológicas y epistemológicas de
este p
paradigma
g
son:
¾
¾
¾
¾
¾
¾
‰
Análisis de la información mediante reglas y algoritmos.
Los procesos cognitivos se basan en el pensamiento lógico.
La comprensión es una categoría clásica dentro de la teoría de
conjuntos.
El proceso cognitivo se articula en etapas.
El sistema lingüístico es un mecanismo formal para la trasmisión
de información.
Comparación errónea entre la capacidad de análisis de la mente
humana y el ordenador.
Intenta integrar el desarrollo de la inteligencia artificial y las
necesidades y habilidades de los usuarios
usuarios.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
1 Paradigma sociocognitivo:
1.‰
‰
Debilidades:
¾
Falta de comprensión de la integración de los conceptos
humanos y sus semánticas.
¾
N titiene en cuenta
No
t las
l iinfluencias
fl
i d
dell medio
di social,
i l cultural
lt l
e histórico.
¾
Todo esto limita el desarrollo de proyectos de inteligencia
artificial.
El conocimiento es adaptativo, se forma por la relación
dialéctica entre una comunidad y sus miembros.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
2 Paradigma lógico:
2.‰
Tanto la lógica formal como difusa ofrecen
grandes posibilidades de aplicación al
análisis de contenido:
¾ Lógica formal: asigna una categoría
sintáctica específica
específica.
¾ Lógica difusa: proporciona un entramado
computable para la representación e
inferencia del conocimiento en un entorno
de incertidumbre e imprecisión.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
3 - Paradigma comunicacional:
3.
COMUNICACIÓN
‰
Transmisión de información
mediante la emisión
emisión, conducción y
recepción de un mensaje.
Los modelos de comunicación se apoyan en
disciplinas ya constituidas:
¾
Matemáticas.
¾
S i l í
Sociología.
¾
Psicología, etc.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
3 - Paradigma comunicacional:
3.
‰
El modelo de comunicación sociosemiótico
distingue tres procesos en la comunicación:
¾
Producción.
¾
Circulación
Circulación.
¾
Consumo.
‰
La aportación de este paradigma al análisis esta en
las variables implicadas en los procesos físicos de:
¾
Transformación.
¾
T
Transferencia.
f
i
¾
Descarga de información.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
4 - Paradigma físico:
4.
‰
Parte de los experimentos de Cranfield sobre la
evaluación empírica de los sistemas de indización y
recuperación.
‰
Este paradigma es un referente en los actuales
sistemas de procesamiento de información.
‰
Considera la información como:
¾
Entidad física.
¾
Cuantificable
Cuantificable.
¾
Mensurable.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
4 - Paradigma físico:
4.
‰
Trata de desarrollar métodos automáticos de
categorización y recuperación de la información
información.
‰
Su repercusión
S
ió en lla representación
t ió se concreta
t en
dos aspectos:
¾
Diseño de métodos automáticos de extracción
de información (descriptores, resúmenes, etc.)
mediante
di t estadísticas
t dí ti
de
d ponderación.
d
ió
¾
Elaboración de índices y sumarios, etc., para la
recuperación de información.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
5 - Paradigma sistémico:
5.
‰
La información es dinámica, en crecimiento y evolución.
‰
La información se entiende como un “sistema” con el fin de
modificar
difi
ell conocimiento
i i t de
d llos iindividuos.
di id
‰
Dicho sistema permite: diseñar
diseñar, planificar
planificar, evaluar y
controlar todas las variables que intervienen en el proceso:
¾
Entrada de información.
¾
Procesamiento de información
¾
Salida de un producto informativo.
¾
Creación de conocimiento
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
5 - Paradigma sistémico:
5.
‰
Presta especial atención a la calidad de los sistemas de
i f
información.
ió
‰
La calidad ha ido en aumento en los últimos años desde las
diferentes perspectivas:
¾
Sistema de información.
¾
P i t por lla organización.
Prevista
i
ió
¾
Percibida por el usuario.
¾
Diseñada p
por el analista.
‰
La calidad de la información puede ser considerada:
¾
T
Tangible.
ibl
¾
Mensurable.
© María Pinto
Convergencia de
paradigmas
p
g
y modelos
PARADIGMAS:
5 - Paradigma sistémico:
5.
‰
La calidad en la representación de información dependerá
d l
del:
¾
¾
‰
Conocimiento base del analista.
Técnicas de representación
p
adoptadas.
p
La calidad aplicada en los procesos de representación
documental pretende conseguir:
¾
¾
¾
¾
¾
¾
¾
Satisfacción del analista.
Satisfacción de los gestores de información.
Satisfacción de los usuarios
usuarios.
Calidad en diseño de productos (tesauros, resúmenes, etc.)
Calidad en la producción.
Calidad en los procedimientos de control.
Calidad del servicio que acompaña al producto.
© María Pinto
Convergencia de
paradigmas y modelos
PARADIGMAS:
5 - Paradigma sistémico:
5.
‰
Tres principios claves para la calidad total:
¾
¾
¾
‰
Seis elementos de apoyo para conseguir la calidad total:
¾
¾
¾
¾
¾
¾
‰
Acercamiento al usuario.
Mejora de los procesos.
Implicación de todos los participantes.
Liderazgo.
Educación / aprendizaje.
Soporte estructural.
Comunicaciones.
Reconocimiento.
Medición
La gestión de la calidad total supone la aproximación a los
problemas de representación de información.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
1 - Modelos lingüísticos:
1.
‰
Los factores lingüísticos afectan a la:
¾
¾
¾
‰
Se centra en el estudio del lenguaje natural en sus niveles:
¾
¾
¾
¾
¾
‰
Forma.
Estructura.
Significado.
g
Fonológico.
Fonológico
Morfológico.
Léxico.
Si tá ti
Sintáctico.
Pragmático.
Su principal limitación es la no representación plena del
sentido de las unidades del discurso analizadas.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
1 - Modelos lingüísticos:
1.
‰
El modelo estructural de Thorndyke se basa en tres
estructuras
t t
documentales:
d
t l
¾
¾
¾
‰
Natural.
Lógica o conceptual.
Física.
En el modelo reticular de Rumelhart la representación de la
información esta estrechamente relacionada con las
estructuras del conocimiento.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
1 - Modelos lingüísticos:
1.
‰
El modelo discursivo de Kintsch-Van Dijk esta
basado en proposiciones para la comprensión y
representación del significado.
‰
Las proposiciones se ordenan en los diferentes
niveles jerárquicos de las ideas.
‰
Está condicionado por el conocimiento externo.
‰
El análisis de contenido debe ser:
¾
D
Descripción
i ió d
de llos significados
i ifi d explícitos.
lí it
¾
Descripción de los modelos mentales.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
1 - Modelos lingüísticos:
1.
‰
‰
En el marco del Procesamiento del Lenguaje
Natural (PLN) se sitúan los modelos modulares
modulares.
Afecta a todos los niveles del texto:
¾
Fonológico.
¾
Morfológico.
¾
Sintáctico.
¾
Semántico.
¾
Pragmático.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
2 - Modelos estadísticos:
2.
‰
Basados en técnicas de coincidencia parcial o en vectores.
‰
Las técnicas estadísticas se aplican en sistemas de dominio
específico con un gran resultado.
‰
Estas técnicas se combinan con modelos cognitivos.
‰
El modelo vectorial es un método estadístico usado en los
entornos informativo-documental basado en la representación
y recuperación por vectores en sistemas de ponderación de
pesos.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
2 - Modelos estadísticos:
2.
‰
Las palabras de mayor frecuencia no suelen ser
significativas debido a:
¾
La importancia de un término es proporcional a la
frecuencia de ocurrencia en el documento e inversamente
proporcional al número de documentos en que aparece
aparece.
¾
El peso de un término corresponde a la ecuación:
P = TF * IDF
(Frecuencia * frecuencia inversa)
‰
El sistema se ha enriquecido con otros métodos
complementarios basados en:
ƒ
ƒ
Aspectos formales de la estructura
estructura.
Algorítmos de agrupación de clases
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
2 - Modelos estadísticos:
2.
‰
Los modelos “lingüístico” y “estadístico” se
corresponde con el orden natural: sentido-valor
¾
Lingüístico:
ƒ Connotación de inferencia.
ƒ Interpretación.
ƒ Coherencia.
¾
Estadístico:
ƒ Valores cuantitativos.
ƒ Análisis de coocurrencia.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
3 - Modelos cognitivos:
3.
‰
Agrupan y definen procesos y representaciones mentales
que explican el análisis del contenido.
contenido
‰
La comprensión
p
cognitivo
g
q
que transforma lo semántico en
conceptual y se rige por conocimientos estructurados.
‰
Requiere la intervención de:
¾
¾
¾
¾
Sistemas de memoria.
Procesos de codificación de información.
Operaciones inferenciales.
Factores estratégico-contextual.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
3 - Modelos cognitivos:
3.
‰
La inferencia es el núcleo del proceso de interpretación,
actuando
t
d como mecanismo
i
d
de cohesión:
h ió
¾
¾
‰
Eliminando la ambigüedad.
Ayudando al establecimiento del contexto.
El desarrollo
d
ll de
d métodos
ét d d
de representación
t ió b
basados
d en
modelos cognitivos supone la aplicación de:
¾
¾
¾
¾
Técnicas de representación semántica.
Modelos de discurso centrado en las estructuras.
P
Procesamiento
i t d
dell llenguaje
j natural.
t l
Teorías o conocimientos del mundo (inferencias).
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
3 - Modelos cognitivos:
3.
‰
Dos modelos emergentes son:
¾
Modelo de Red Semántica: identifica conexiones
internas entre las ideas de un documento.
¾
Procesamiento del lenguaje
g j natural.
‰
Modelo de red semántica: identifica conexiones
internas entre las ideas de un documento. Su uso
acentúa:
¾
Identificación y representación de jerarquías
jerarquías.
¾
Cadenas.
¾
Clases
Clases.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
3 - Modelos cognitivos:
3.
‰
Procesamiento del lenguaje natural: relacionado
con la comprensión del lenguaje natural y los
procesos de análisis implicados.
¾
Morfológico.
¾
Semántico.
¾
Pragmático.
‰
Actualmente solo consiguen procesar
sintácticamente los documentos
documentos.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
4 - Modelos integradores:
4.
‰
Actualmente se combina el uso de varios modelos
dependiendo de:
¾
Necesidades.
¾
Contextos.
¾
Objetivos
j
documentales.
‰
Se pueden combinar:
¾
Técnicas lingüístico-estadísticas.
¾
C
Cognitivo-lingüísticas.
iti li üí ti
¾
Estadística-cognitivas.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
4 - Modelos integradores:
4.
‰
Se sugiere la aplicación de un modelo integrador que entienda
la “multirepresentación” considerando:
¾
Estructuras textuales y de conocimiento.
¾
Objetivos y meta de los servicios.
¾
Intenciones e intereses de los usuarios
usuarios.
¾
Medidas e indicadores de satisfacción.
¾
Contextos de análisis.
¾
Recepción de información.
‰
Para el análisis de información electrónica se propone el uso
de un modelo conceptual integrado unificando espacios
relacionados:
¾
Espacio de indización y resumen
resumen.
¾
Espacio documental.
© María Pinto
Convergencia de
paradigmas y modelos
MODELOS:
‰
Características de cada modelo:
LINGÜÍSTICO:
ESTADÍSTICO:
basado en el análisis
temático y semánticoestructural
estructural.
Centrado en el análisis
estadístico, cálculo de
relevancia, técnicas de
coocurrencia,
i etc.
t
COGNITIVO:
Orientado al procesamiento
estratégico de la información
SISTÉMICO:
Usa la Teoría General de
Sistema y de la Gestión de
Calidad Total
© María Pinto
SISTEMAS DE
REPRESENTACIÓN
DE INFORMACIÓN
Sistemas de representación
de la información
‰
La convivencia entre distintos sistemas para la
organización y representación es un hecho
acentuado en el entorno electrónico. Se usan:
¾
Clasificaciones de ontologías virtuales.
¾
Modelo jerárquico de organización.
¾
Sistemas asociativos.
asociativos
‰
La implementación de modelos automáticos ha
llevado al desarrollo de otras modalidades más
avanzadas:
¾
Hiperíndices.
¾
Metatesauros
Metatesauros.
¾
Hiperresúmenes.
© María Pinto
Sistemas de representación
de la información
Sistemas jerárquicos:
CLASIFICACIÓN
CLASIFICACIÓN
DOCUMENTAL
Se ocupa de principios, leyes y
aplicaciones de distribución de los
conceptos.
Técnica intelectual que categoriza
el contenido significativo de los
documentos a priori y las
demandas de los usuarios a
posteriori, asignando símbolos o
notaciones para su recuperación
© María Pinto
Sistemas de representación
de la información
Sistemas jerárquicos:
‰
‰
‰
Clasificar manualmente exige un gran esfuerzo
cognitivo de síntesis para detectar y aislar las ideas.
Los niveles de clasificación son múltiples:
¾
Genérica.
¾
Analítica.
¾
Conceptual, etc.
La gran cantidad de información creada ha llevado a
realizar clasificaciones automáticas.
© María Pinto
Sistemas de representación
de la información
Sistemas jerárquicos:
‰
‰
Las clasificaciones automáticas pueden ser:
¾
Facetadas: ej.
j Directorio de Yahoo.
¾
Jerárquicas: ej. BUBL Subject Tree.
¾
Clasificación de la biblioteca del congreso:
g
ej.
j
Cyberstacks.
Las clasificaciones automáticas sirven de base para
la elaboración de ontologías conceptuales
especializadas.
© María Pinto
Sistemas de representación
de la información
Sistemas asociativos:
‰
Permiten representar la información por medio de conceptos
y sus interrelaciones lógicas.
‰
A pesar de su facilidad de representación son insuficientes
en los entornos electrónicos:
¾
¾
‰
Por falta
P
f lt de
d estructuración
t t
ió de
d páginas
á i
web.
b
No obedecen a una lógica “universal”.
En los entornos “ciberdocumentales” se han desarrollado
técnicas automáticas de indización según:
¾
¾
¾
¾
Multifuncionalidad representativa.
Palabra simple o compuesta.
Análisis sintáctico de párrafos.
Análisis semántico
semántico-pragmático
pragmático de los documentos.
documentos
© María Pinto
Sistemas de representación
de la información
Sistemas asociativos:
‰
Herramientas para indizar páginas web:
¾
Motores de búsqueda:
ƒ Google
ƒ Altavista,
Altavista etc.
etc
¾
Índices y repertorios temáticos:
ƒ Yahoo
ƒ Megallan, etc.
© María Pinto
Sistemas de representación
de la información
Sistemas asociativos:
MOTORES
DE
BÚSQUEDA
‰
Obtienen la información mediante:
¾
¾
¾
‰
Conjunto de bases de datos
de registros con la URL e
información relacionada con el
contenido del registro
Etiquetas metadatos.
Tí l del
Título
d ld
documento.
Primeros párrafos.
Métodos empleados:
¾
¾
Probabilísticos.
Estadísticos (clusterización)
© María Pinto
Sistemas de representación
de la información
Sistemas asociativos:
ÍNDICES
O
REPERTORIOS
‰
‰
Conjunto de recursos organizados
en función del esquema de clases
y relaciones establecido por el
administrador
Recopilación de recursos por el administrador del repertorio.
Son p
plantillas con los datos imprescindibles
p
del documento:
¾
¾
¾
¾
¾
¾
¾
Título.
URL.
Clasificación
Clasificación.
Breve descripción.
Palabras clave.
Localización.
Idioma, etc
© María Pinto
Sistemas de representación
de la información
Sistemas lógico-proposicionales:
RESUMEN
Un breve texto
representativo,
p
, intencional,,
no unívoco y con vocación
de sinónimo.
‰
La técnica de resumir es la más importante en los
p
sistemas de representación.
‰
La tarea resumidora es un p
proceso de
abstracción:
¾
¾
De lo específico a lo general.
Eliminando lo que no es esencial
esencial.
© María Pinto
Sistemas de representación
de la información
Sistemas lógico-proposicionales:
‰
‰
‰
El producto “resumen” ha sido muy estudiado, pero pocos
profundizan en el proceso de resumir.
Escasa precisión léxica con el término resumen:
¾
Designa la actividad y el resultado
resultado.
¾
Uso de la misma palabra para traducir términos en ingles
similares pero no idénticos (summary, extract, abstract,
etc.)
La clave funcional es la transformación de un determinado
texto en otro de tamaño reducido y representativo.
© María Pinto
Sistemas de representación
de la información
Sistemas lógico-proposicionales:
‰
Características del resumen:
¾
Es un proceso de reducción cognitiva
cognitiva.
¾
Una difícil y compleja operación de
reconstrucción textual en modelo reducido
reducido.
¾
Obtención de un documento representativo del
original.
i i l
¾
Conserva la información sustancial.
¾
Difiere en modo de expresión, estructura y
extensión.
© María Pinto
Sistemas de representación
de la información
Sistemas lógico-proposicionales:
‰
Factores determinantes para la elaboración:
¾
Operación analítico
analítico-sintético.
sintético.
¾
Diversidad tipológica-documental.
¾
Personalización de las demandas
demandas.
¾
Variabilidad de las condiciones de producción.
‰
Sus diversas aplicaciones lo convierten en el más
importante vehículo de información referencial
referencial.
‰
El resumen es un instrumento eficaz en los sistemas
de recuperación automatizados.
© María Pinto
Sistemas de representación
de la información
Sistemas lógico-proposicionales:
‰
Los procesos de resumir tienen por objeto la transformación
de unidades discursivas.
‰
La operación de resumir es una realidad emergente en la
encrucijada de múltiples paradigmas y modelos.
‰
Actualmente hay un cambio de enfoque sobre el resumen:
¾
¾
¾
¾
‰
Desde el resumen como reproducción textual
textual.
Al resumen como sistema estratégico de producción textual.
No se deduce unívocamente desde el texto fuente.
D
Depende
d d
de llas expectativas
t ti
y necesidades
id d d
de os usuarios.
i
El funcionalismo establece q
que no hay
y un resumen
absolutamente correcto.
© María Pinto
Sistemas de representación
de la información
Sistemas mixtos:
‰
Los sistemas híbridos pueden ser los de más futuro porque
reúnen:
¾
¾
¾
‰
Las ventajas de las taxonomías y clasificaciones del
conocimiento.
Los puntos fuertes de la organización reticular
Representación gráfica de la información (mapas conceptuales)
conceptuales).
El uso de los mapas conceptuales para representar el
conocimiento
i i t es una aplicación
li
ió recomendable
d bl para ttodo
d
científico, al ser una técnica de:
¾
¾
¾
¾
¾
Aprendizaje significativo.
Constructivo.
Acumulativo.
Comprensión de nuevos conocimientos.
Inclusión en el conocimiento existente.
© María Pinto
Sistemas de representación
de la información
Sistemas mixtos:
MAPA
CONCEPTUAL
‰
Los conceptos son los nodos, cada uno con su:
¾
¾
¾
‰
Consiste en un despliegue
espacial de representaciones
gráficas de conceptos y relaciones.
Tipo.
Nombre.
Contenido.
Las relaciones son los enlaces:
¾
¾
¾
No direccionales.
Direccionales.
Bidireccionales.
© María Pinto
Sistemas de representación
de la información
Mapas conceptuales
‰
Son una herramienta eficaz para organizar la nueva
información e integrarla en el conocimiento existente.
‰
Su construcción permite:
¾
¾
Describir nuevas relaciones entre conceptos.
p
Refinar las relaciones ya establecidas.
‰
La calidad y fiabilidad del mapa manual es mayor,
mayor pero
existe software especializados (VisiMap, Atlas.ti, etc.)
‰
Los softwares especializados permiten convertir un conjunto
disperso de textos en una exposición gráfica de ideas
principales.
© María Pinto
Sistemas de representación
de la información
Mapas conceptuales:
‰
Etapas en la construcción del mapa conceptual:
1
1.
Selección automática de los conceptos
conceptos.
2. Listado del términos, del más abstracto al más
concreto.
concreto
3. Agrupación de los conceptos relacionados e
incorporación de otros.
4. Ordenación en trama bidimensional o
tridimensional.
5. Enlace de conceptos con líneas en modo
preposiconal
p
p
op
proposicional.
p
© María Pinto
Sistemas de representación
de la información
Tipos:
‰
Categorías de los mapas conceptuales:
¾ Mapa araña: tema principal en el centro y hacia
fuera los subtemas.
¾ Mapa jerárquico: orden decreciente.
decreciente
¾ Mapas diagramáticos: información en formato
lineal.
¾ Mapas sistemáticos: similar al anterior, pero con
entradas y salidas.
¾ Mapas paisajísticos: a modo de cuadro.
¾ Mapa multidimensional: representación
bidimensional.
© María Pinto
Sistemas de representación
de la información
Ventajas
‰
Ventajas del entorno informático:
¾
Facilidad de edición y de revisión.
¾
Personalización.
¾
Ergonomía visual.
¾
Consistente uso el color
color.
‰
La activación informática del mapa conceptual es la base de
l sistemas
los
i t
hi
hipertextuales.
t t l
‰
El hipertexto multiplica las prestaciones del mapa:
¾
Estructura dinámica e interactiva.
¾
Representación y organización de la información de modo
reticular.
reticular
¾
Múltiples itinerarios de exploración.
© María Pinto
Sistemas de representación
de la información
Sistemas estratégicos:
‰
Centrados en la información científica.
‰
El usuario de estos sistemas posee necesidades informativas,
motivaciones y hábitos científicos.
‰
Como usuario especializado necesita la información en el
momento preciso. Se necesitan técnicas ágiles y fiables.
‰
La calidad del servicio supone el ajuste de:
¾
Necesidades.
¾
Expectativas.
¾
Deseos de los usuarios.
© María Pinto
Sistemas de representación
de la información
Sistemas estratégicos:
‰
Los analistas de información deben ser:
¾
Competentes en sus tareas técnicas y aspectos
comunicativos.
i ti
¾
Previsivos en las necesidades del usuario.
‰
Cualquier proceso de comunicación tiene dos aspectos
importantes:
¾
El contenido: en el marco cognitivo
cognitivo.
¾
La relación: en el dominio emocional.
‰
Estos dos aspectos se dan siempre y simultáneamente con el
agravante de que a veces el interlocutor es una máquina.
© María Pinto
Parte 2:
2
Contexto y
complejidad de ADC
DIVERSIDAD DE
DOMINIOS
DISCURSIVOS
Diversidad de
dominios discursivos
‰
En nuestra sociedad hay una gran diversidad de
d i i discursivos.
dominios
di
i
‰
Simplificando la gran cantidad existente nos
centraremos en los cuatro más reconocidos y
usados:
¾ Publicaciones científicas.
¾ Documentos literarios.
¾ Información periodística.
periodística
¾ Documentación electrónica.
© María Pinto
Documentos
¾
¾
¾
¾
¾
¾
¾
¾
¾
Libros, artículos de revista.
Actas de congresos, patentes, normas.
Carteles,, folletos.
Imágenes, fotografías, diapositivas, gráficos, mapas.
Sonoros
Sonoros.
Videos.
Web 2.0
2 0 (Blogs,
(Blogs webquest,
webquest wikipedia
wikipedia, podcast
podcast...))
Páginas webs.
Simulaciones
Simulaciones.
© María Pinto
Documento textual
¾
Un texto es una colección de signos
g
q
que se organizan
g
para conducir un mensaje intencionado.
¾
Hay textos argumentativos, narrativos, enunciativos,
descriptivos expositivos
descriptivos,
expositivos...
¾
Cada
C
d uno d
de ellos
ll presenta
t una serie
i d
de d
dominios
i i
sociales de comunicación y utiliza unos géneros
determinados
© María Pinto
Tipologia
DOMINIOS SOCIALES DE
COMUNICACIÓN
TIPOS DE
TEXTO
Cultura literaria y de ficción
NARRATIVO
Documentación y
memorización
i
ió d
de acciones
i
RELATO
Discusión de problemas
Transmisión y construcción
de conocimientos
Instrucciones y
prescripciones
GÉNEROS ORALES Y
ESCRITOS
Cuentos, fabulas,
leyendas, novelas
Experiencias, curriculum
vitae,
it
di
diarios,
i
anécdotas...
é d t
ARGUMENTATI Artículos de opinión,
VO
cartas al director
director...
EXPOSITIVO
Conferencias, entrevistas
a un experto
experto, notas
notas...
DESCRIPTIVO
Recetas, instrucciones de
uso, reglamentos...
© María Pinto
Diversidad de
dominios discursivos
‰
PUBLICACIONES CIENTÍFICAS:
¾
Características que las distinguen:
•
•
•
•
•
•
Contenido lógico, claro y conciso.
Informativo: transmite nuevo conocimiento
Conceptos y terminología especializada.
El uso de lo implícito (se presupone gran cantidad de
información).
Intención objetiva, analítica o descriptiva.
Retórica específica OMRC.
© María Pinto
Diversidad de
dominios discursivos
‰
PUBLICACIONES CIENTÍFICAS:
¾
E t t
Estructura
•
•
•
•
Objetivos.
Metodología.
Resultados.
Conclusiones.
© María Pinto
Estructura
© María Pinto
Estructura
© María Pinto
Estructura
© María Pinto
Estructura
© María Pinto
Diversidad de
dominios discursivos
Estructura
OBJETIVOS
Justificación de la investigación, formulación de hipótesis,
marco teórico,
t ói
etc.
t
METODOS
Sujetos,
j
elección de los métodos, diseño y p
procedimiento
de la investigación, etc.
RESULTADOS
CONCLUSIONES
Hallazgos más importantes
importantes, etc
etc.
Consecuencias de la investigación, etc.
© María Pinto
Diversidad de
dominios discursivos
‰
PUBLICACIONES CIENTÍFICAS:
¾
La tipología documental
publicaciones
bli
i
científicas
i tífi
son:
• Artículos.
• Informes.
I f
• Memorias.
• Tesis.
• Monografías.
• Etc.
dentro
de
las
© María Pinto
Diversidad de
dominios discursivos
‰
DOCUMENTOS LITERARIOS:
¾
Características:
•
•
•
•
¾
Muy vinculados a su autor
autor.
Importancia a la función expresiva.
Uso de un lenguaje complejo significativamente
(polisémico y ambiguo)
ambiguo).
Alto componente emocional o afectivo.
Tipología documental:
•
•
•
•
•
Cuento.
N
Novela.
l
Teatro.
Poesía.
Poesía
Etc.
© María Pinto
Diversidad de
dominios discursivos
‰
DOCUMENTOS LITERARIOS:
Resumir textos literarios implica usar:
• Ideas universales.
• Sensaciones,
Sensaciones percepciones o sentimientos
subjetivos.
Debido a las características innatas del documento
literario, el resumidor se encuentra al filo de lo
imposible.
© María Pinto
Diversidad de
dominios discursivos
‰ DOCUMENTO PERIODÍSTICO
¾
Características:
• El fundamento es la noticia.
noticia
• Los temas principales se expresan en los titulares y
encabezamientos.
• Tratamiento similar al tema principal y los temas
relacionados.
¾
Estructura:
• E
Esquemática.
áti
• Estereotipada (que se repite sin variación en todas las
noticias).
© María Pinto
Diversidad de
dominios discursivos
‰ DOCUMENTO PERIODÍSTICO
¾
Componentes:
• Titular y encabezamiento
encabezamiento.
• Episodio: contextualizar los hechos.
• Consecuencias:
C
i
exposición
i ió d
de llos h
hechos.
h
• Reacciones verbales: opiniones objetivas, etc.
• Comentario: evaluación y expectativas.
¾
Tipología documental:
• Resumen – proceso: parte significativa de la
información original.
© María Pinto
Diversidad de
dominios discursivos
‰ DOCUMENTO ELECTRÓNICO:
¾
Características:
•
•
•
•
•
•
¾
Contenidos multimedia: sonido
sonido, texto
texto, imagen
imagen.
Soportes informáticos.
Redes de comunicación.
Rápido procesamiento de la información.
f
Mayor capacidad de almacenamiento.
Interactividad.
Interactividad
Elementos fundamentales:
• Contenido informativo.
• Medio de conservación.
• Medio de comuniación
comuniación.
© María Pinto
Diversidad de
dominios discursivos
‰ DOCUMENTO ELECTRÓNICO:
Revolución del documento electrónico:
• Paso
P
del
d l ttexto
t iimpreso all multimedia
lti di
• Nuevos sistemas de almacenamiento y transferencia
‰
Convivencia entre la información clásica y el
documento
docu
e to electrónico.
e ect ó co
‰
Sentido y uso del documento electrónico según
necesidades y preferencias del usuario.
© María Pinto
DIVERSIDAD
ESTRUCTURAL
Diversidad estructural de
los documentos
TEXTO
Elementos significativos
g
con relaciones
jerárquicas y secuenciales.
ESTRUCTURA
ESQUEMÁTICA
NARRATIVA
ARGUMENTATIVA
• Complicación
• Hipótesis
• Resolución
Conclusión
•Conclusión
© María Pinto
Diversidad de
dominios discursivos
‰
La estructura esquemática narrativa es usada
en los textos literarios.
‰
La estructura esquemática argumentativa es
usada en las publicaciones científicas
científicas.
‰
Los esquemas reflejan funciones:
¾ Cognitivas.
g
¾ Pragmáticas.
¾ Sociales.
Sociales
© María Pinto
CONCLUSIONES
Conclusiones
‰
El gran reto es encontrar los mejores métodos y técnicas para extraer y
representar el contenido documental
documental.
‰
La mente humana es un procesador bidirediccional en los procesos de
transformación y representación de la información.
‰
Se están estableciendo paralelismos con otros sistemas artificiales de
procesamiento dotados de destrezas inferenciales y contextuales.
‰
La mente humana es un sistema especializado en el procesamiento de
datos sociales y estratégicos en los que confluyen:
¾ Intereses personales.
¾ Objetivos documentales.
¾ Contextos.
¾ Circunstancias.
Circunstancias
© María Pinto
Conclusiones
‰
El usuario necesita en cada caso distintas representaciones
documentales.
documentales
‰
Los sistemas deben ser intuitivos, simples, ergonómicos, diligentes y
selectivos.
‰
Un sistema de procesamiento y representación documental debe delimitar
sus grupos de usuarios definiendo:
¾ Preferencias.
¾ Hábitos de información
información.
¾ Necesidades y demandas.
¾ Grado de satisfacción.
¾ Expectativas.
‰
Se prefieren los procesos de representación espacial (mapas
conceptuales)
© María Pinto
Conclusiones
‰
El valor del usuario es la variable principal del sistema.
‰
La información documental es un bien con un alto
componente “inmaterial”, cognitivo y consiguientemente
“difuso”
‰
Se requiere la participación de los analistas y de los usuarios
del servicio.
‰
Para el tratamiento de la información hay que tener muy en
cuenta la diversidad y estructura de los dominios discursivos
con que nos encontramos.
t
© María Pinto
BIBLIOGRAFÍA
Bibliografía
ibli
fí
Portales Educativos:
| Pinto,
Pinto M
M. Aprender a analizar,
analizar sintetizar y
comunicar. Portal ALFIN-EEES: Habilidades y
competencias de gestión de la información para
aprender a aprender en el marco del Espacio
Europeo de Enseñanza Superior
Superior. Disponible en:
http://www.mariapinto.es/alfineees/analizar.htm
| Pinto,
Pinto M
M. Cyberabstracts
Cyberabstracts. Portal sobre recursos e
información sobre las herramientas documentales.
http://www mariapinto es/ciberabstracts/
http://www.mariapinto.es/ciberabstracts/
© María Pinto
Bibliografía
ibli
fí
|
|
Lancaster,, F.W.;; Pinto,, M. Bases para
p
el
procesamiento de información. En:
Procesamiento de la Información Científica
Científica.
Madrid: Arco/libros, 2001 p. 41-67
Pi t M
Pinto,
M, Gál
Gálvez, C
C. A
Análisis
áli i d
documental
t ld
de
contenido. Madrid, Síntesis, 1999
© María Pinto
Reflexiona…
“Nuestros
Nuestros sentidos nos permiten
percibir sólo una pequeña
p
p q
porción
p
del mundo exterior.”
Nikola Testla
Reflexiona…
Reflexiona
“Los maestros del
universo... los dueños
de la información”
Anónimo
Descargar