LAS VARIABLES CONTADAS INICIALMENTE

Anuncio
Capítulo V : Las Variables contadas inicialmente
LAS VARIABLES CONTADAS INICIALMENTE
5.0 Introducción.
Después de realizarse el preprocesado del texto y antes de empezar a
ejecutar las diferentes instrucciones contenidas en el fichero de control, el
programa contará sobre el texto una serie de variables que posteriormente nos
serán necesarias.
Estas variables no podrán ser modificadas por el usuarios. El usuario
tampoco podrá modificar ni los nombres las variables, ni las “reglas” para
obtener sus contenidos. Es indiferente que el nombre de las variables venga en
mayúscula o minúscula.
5.1 Descripción de las diferentes variables.
 palabras
Variable que va a contener el número de palabras del texto. Una palabra
está delimitada por espacios en blanco y por signos de puntuación.
23
Capítulo V : Las Variables contadas inicialmente
 palabras_polisilabicas
Variable que va a contener el número de palabras del texto cuyo número
de sílabas sea mayor o igual a 3.
Las sílabas de una palabra son obtenidas buscando la palabra en el
diccionario. Si ocurriese que la palabra buscada no se encuentra en el
diccionario se hace una aproximación : si la palabra tiene más de 7 caracteres se
le asignan 3 sílabas (luego, es polisilábica) y si tiene menos de 7 caracteres se le
asigna una sola sílaba( no es polisilábica). Una palabra está delimitada por
espacios en blanco y por signos de puntuación.
 oraciones_cortas
Oración será todo aquello que está contenido entre dos puntos. O lo que
tenemos entre el comienzo del texto y el primer punto. Una oración corta es
aquella que tiene un número de palabras menor o igual a 19.
 oraciones_medias
Oración será todo aquello que está contenido entre dos puntos. O lo que
tenemos entre el comienzo del texto y el primer punto. Una oración media es
aquella que tiene un número de palabras mayor o igual a 20 y menor o igual
que 28.
 oraciones_largas
24
Capítulo V : Las Variables contadas inicialmente
Oración será todo aquello que está contenido entre dos puntos. O lo que
tenemos entre el comienzo del texto y el primer punto. Una oración larga es
aquella que tiene un número de palabras mayor o igual a 29.
 total_oraciones
Se obtiene sumando las variables : oraciones_cortas, oraciones_medias y
oraciones_largas.
 longitud_media_oracion
Se calcula dividiento el la variable palabras entre la variable
total_oraciones.
 parrafos_cortos
Párrafo será todo lo que se encuentre entre un punto y el siguiente, si
entre ambos puntos hay dos retornos de carro seguidos. En el caso del párrafo
inicial, se contará todo lo que haya entre el comienzo del texto y el primer
punto que vaya seguido de dos retornos de carro. Párrafos cortos son los que
tienen menos de 75 palabras.
 parrafos_medios
25
Capítulo V : Las Variables contadas inicialmente
Párrafo será todo lo que se encuentre entre un punto y el siguiente, si
entre ambos puntos hay dos retornos de carro seguidos. En el caso del párrafo
inicial, se contará todo lo que haya entre el comienzo del texto y el primer
punto que vaya seguido de dos retornos de carro. Párrafos medios son los que
tienen un número de palabras mayor o igual a 75 palabras y menor o igual a
130.
 parrafos_largos
Párrafo será todo lo que se encuentre entre un punto y el siguiente, si
entre ambos puntos hay dos retornos de carro seguidos. En el caso del párrafo
inicial, se contará todo lo que haya entre el comienzo del texto y el primer
punto que vaya seguido de dos retornos de carro. Párrafos largos son los que
tienen un número de palabras mayor o igual a 131.
 total_parrafos
Se
obtiene
sumando
las
variables
anteriores
sobre
párrafos :
parrafos_cortos, parrafos_medios y parrafos_largos.
 longitud_media_parrafo
Se calcula dividiento el la variable palabras entre la variable
total_parrafos.
 silabas
26
Capítulo V : Las Variables contadas inicialmente
Se calcula sumando las sílabas de todas las palabras del texto.
Las sílabas de una palabra son obtenidas buscando la palabra en el
diccionario. Si ocurriese que la palabra buscada no se encuentra en el
diccionario se hace una aproximación : si la palabra tiene más de 7 caracteres se
le asignan 3 sílabas (luego, es polisilábica) y si tiene menos de 7 caracteres se le
asigna una sola sílaba( no es polisilábica). Una palabra está delimitada por
espacios en blanco y por signos de puntuación.
 gunning
Es el índice de “nebulosidad” de Gunning. Cuya expresión es :
gunning=(longitud_media_oracion+contador_gunning)*0.4
Siendo contador_gunning una variable interna que utilizamos para
calcular gunning, su contenido es el tanto por ciento de palabras polisilábicas
que no correspondan a nombre propio, sobre el total de palabras del texto.
Consideramos un nombre propio aquella palabra que no encontramos en el
diccionario y que va en mayúscula sin ir precedida de punto.
El resultado será una escala de 1 a 21, de más claro a menos.
 flesch
27
Capítulo V : Las Variables contadas inicialmente
Es el índice de legibilidad de Gunning. Cuya expresión es :
flesch= 206.835((longitud_media_oracion*1.015)+((palabras/silabas)*86.6))
El resultado es una escala de legibilidad de 0 a 100, el texto será más
difícil cuanto más baja es la puntuación en la escala.
28
Descargar