analisis espectrografico de los sonidos vocalicos de

Anuncio
ANALISIS ESPECTROGRAFICO DE LOS SONIDOS VOCALICOS DE
LA LENGUA CASTELLANA EN INDIVIDUOS CON VOZ NORMAL
FRANCESCA FRAZZETTO H.
“UNIVERSIDAD CENTROCCIDENTAL "LISANDRO ALVARADO"
BARQUISIMET0,2000
ANALISIS ESPECTROGRAFICO DE LOS SONIDOS VOCALICOS DE
LA LENGUA CASTELLANA EN INDIVIDUOS CON VOZ NORMAL
Autor: Dra. Francesca Frazzetto H.
Palabras Claves: Formantes, Análisis Espectrográfico, vocales.
RESUMEN
En el presente estudio se evaluaron 50 individuos con voz normal, que fueron explorados
clínica e instrumentalmente, para descartar patologías orgánicas o funcionales que pudieran
perturbar las cualidades de la voz. Se grabaron sus voces, emitiendo los sonidos vocálicos y
se realizó el análisis espectrográfico de cada vocal. En el estudio se evidenció que los
valores de la primera y segunda formante estuvieron por encima de los parámetros
obtenidos en el castellano hablado en España.. De igual manera los valores resultantes para
las formantes de las voces femeninas fueron. mas altas que en las voces masculinas.
Además el análisis espectrográfico mostró la variación de los sonidos vocálicos emitidos
por hablantes de la región estudiada con respecto a los hablantes de la lengua castellana en
España.
SPECTROGRAPHICAL ANALYSIS OF VOWEL SOUNDS OF SPANISH
LANGUAGE IN INDIVIDUALS WITHS NORMAL VOICE
Author: Dra. Francesca Frazzetto. H.
Key words: Formants, spectrographical analysis, vowels.
SUMMARY
In this study, 50 individuals with normal voice were clinically and instrumentally explored
so as to discard organic or functional pathologies which might disturb the qualities of voice.
Their voices were recorded while they were emitting vowel sounds and the
spectrographical analysis of each vowel was made. The study showed that the values for
the first and second formant were higher than the parameters obtained in the Spanish
spoken in Spain. Also, the values obtained for the formants of feminine voices were higher
than those of masculine voices. Besides, spectrographical analysis showed the variation
between vowel sounds emitted by speakers of the region under study and by speakers of
Spanish language in Spain.
1. INTRODUCCION
Desde la publicación en 1822 del Teorema de Fourier, según el cual "Toda onda
compleja se descompone en los elementos senoidales simples", se comenzó a idear el
mecanismo que podía llevar a cabo el análisis de cualquier sonido. A partir del siglo XX, es
cuando científicos Alemanes de la Casa Siemens, realizan los primeros intentos en la
descomposición de ondas complejas; a través de un analizador o espectrómetro.
Posteriormente en, el transcurso de los años 30, en pleno desarrollo de la Segunda Guerra
Mundial se perfecciona en Estados Unidos, hasta conseguir hoy en día, el análisis del
sonido a partir de equipo de computación comandados por programas especiales o
software(4)
El análisis espectrográfico vocal es una representación gráfica de los sonidos, emitidos
por la voz humana, en la cual se puede estudiar los componentes de un sonido complejo, lo
cual es característico de la voz y viene dado por la sumatoria de varios sonidos puros, es
decir que las ondas sonoras generadas por la vibración de los repliegues vocales y el
aparato resonador se suman y dan como resultado el tono fundamental que es el primer
armónico y una serie de armónicos que son múltiplos del tono fundamental (8). Esta
información que proporciona con respecto a la conformación de frecuencias que tiene un
sonido, y a la intensidad de cada una de estas frecuencias, esta siempre referida a un
instante concreto de la evolución del sonido en el tiempo; es un corte transversal del suceso
sonoro, donde muestra con detalle el contenido, ignorando el resto(10)espectrograma se
conforma de un sistema de coordenadas, en el eje de las abscisas se representan las
frecuencias expresadas en Hertz (Hz) y en las ordenadas la amplitud de la onda expresada
en deciBell (Db), sobre este sistema se obtiene las medidas de las formantes, que son
resonancias que se generan a través del tracto vocal y producen amplificación en el
espectro de los sonidos complejos originados en la glotis(5).
La fuente primaria del sonido de la voz humana, proviene de la vibración de los
repliegues vocales y a su vez la intervención de su musculatura e innervación, se relacionan
o tienen influencia de los procesos vegetativos, endocrinos y emocionales que lo regulan(2).
Este sonido inicial se amplifica y enriquece a través del Sistema, Resonador, que esta
conformado por la faringe, paladar, cavidad nasal y bucal(7) .
Estas cavidades de resonancia poseen propiedades vibratorias que le confieren la
capacidad de filtro, que dejan frecuencias afines y debilitan las que no le son afines(4) . En
dichas cavidades la amplitud de los armónicos de las ondas sonoras procedentes de la glotis
queda alterada en función de la posición adoptada para la articulación de cada sonido,
especialmente en el caso de los sonidos periódicos complejos, se refuerza la amplitud
situados alrededor de una determinada frecuencia configurándose así las formantes(3) .
Por lo general las cavidades pequeñas refuerzan la amplitud de los armónicos de frecuencia
alta y las cavidades grandes refuerzan la amplitud de los armónicos de frecuencias bajas.
Desde el punto de vista acústico las vocales se diferencian por la frecuencia a la que se
encuentran esas zonas de armónicos de amplitud reforzada por acción de las cavidades de
resonancia (5).
De acuerdo al lugar en donde se produzcan los sonidos vocálicos se1 clasifican en tres
categorías: Tomando en cuenta la posición de la lengua y los labios para la producción del
sonido vocálico:
♦ Delanteros o palatales |ie|
♦ Medios |a|
♦ Posteriores o velares |ou|
En la vocal |a| , lengua reposa en el piso de la boca, en la |i| y la |e| el movimiento se
acentúa hacia delante y en las velares |o| y |u | la lengua se retrae y el velo del paladar se
eleva; en la articulación o producción de los sonidos también intervienen los labios, en las
vocales |o| y |u| estan protruidos, en las vocales |i | y la |e| se retraen y en la |a| queda en
posición neutra. La distancia o abertura que se forma entre el paladar y la lengua es
importante, donde el sonido de la vocal |a| es la mas abierta, esto va disminuyendo en los
demás sonidos vocálicos. En todas las vocales, la glotis produce el tono fundamental por
eso se denominan sonoras y el velo del paladar se eleva para impedir que el aire salga por
la cavidad nasal (7).
La representación de los distintos sonidos vocálicos se lleva a cabo a través de cartas de
formantes y permite graficar en un punto coordenado por medio de los valores formánticos
llevados sobre el eje de las abscisas y ordenados se utiliza para tal fin papel milimetrado
logarítmicamente (Ixl peníodo) y está adaptado a las medidas frecuenciales que
necesitarnos (4 y 9), sobre este eje de coordenadas se representa en el eje de las abscisas
los valores
de los segundos formantes (F2) Y sobre el eje de las ordenadas los valores
de los primeros formantes (F1) (9).
Según lo expuesto, y de acuerdo a la posición de la lengua y los labios y la sonoridad
de cada vocal al llevar los valores de las formantes sobre las cartas de formantes, se
disponen de tal forma que se obtiene la figura clásica del triángulo citada por Perello (8), y
Quilis (9), todos hacen referencia a los valores del castellano hablado en España. En la
literatura revisada, Martínez Celdrán hace referencia a los valores de las formantes de los
sonidos vocálicas propuestos por el estudio de E. Alarcos Llorach, en su obra sobre
Fonología Española (4).
Debido a las diferencias existentes entre el castellano hablado en España y el hablado
en Venezuela, se decide llevar a cabo esta investigación, que tiene como finalidad
establecer valores propios; que proporcionaran posteriormente un manejo adecuado de los
problemas de voz, ya sea en la evaluación de pacientes disfónicos así como en la técnica
vocal de los cantantes.
II. OBJETIVOS
General:
Establecer un patrón espectrográfico de normalidad de los sonidos vocálicos del
habla castellana en individuos con voz normal.
Específicos:
Determinar los valores promedios de las formantes de las vocales en individuos con
voz normal.
Analizar la relación de los valores formánticos de las vocales en las voces
masculinas en comparación con los valores formánticos de las vocales en las voces
femeninas.
Comparar el rasgo acústico en relación con los rasgos articulatorios de las vocales a
través de las cartas de formantes.
III. MARCO METODOLOGICO
Población y Muestra
La muestra estuvo constituida por 50 individuos sanos que fueron elegidos al azar, de
institutos educativos tales como el Decanato de Medicina, colegios y escuelas adyacentes al
Hospital Central "Antonio María Pineda" y acompañantes de los pacientes que acuden al
Servicio de Foniatría; cuyas edades oscilaron entre 18 y 56 años, de los cuales 25 fueron
del sexo femenino y 25 del sexo masculino, la evaluación de dicha muestra fue realizada
entre Diciembre de 1.999 y Enero del 2.000. Se tomaron como criterio de exclusión en la
muestra, los siguientes antecedentes: Infecciones Crónicas Otorrinolaringológicas,
Tabaquismo y Afecciones Crónicas del Aparato Respiratorio como asma o bronquitis.
Método
A cada individuo, se le realizó evaluación clínica que consistió en una historia clínica,
evaluación instrumental a través de videolaringoscopia en la cual se determinaba si el
individuo presentaba alteraciones orgánicas ó funcionales que pudieran excluirlo del
estudio.
Posteriormente, cada individuo fue grabado para realizar el análisis espectrográfico; el
cual se realizó en todos los individuos bajo las mismas condiciones, el ambiente debe estar
silencioso y en el estudio se le indicaba la manera en que debía emitir los sonidos, mantener
la boca a una distancia de 10 cm del micrófono; y emitir los sonidos vocálicos
| a,e,i,o,u | en forma sucesiva pero con pausas entre un sonido y otro, con voz hablada
durante 30 segundos, se hizo la grabación en 3 oportunidades hasta obtener la mejor
emisión, luego se analizó la voz a través de la sección Speech Analysis contenido en el
Programa de Análisis Acústico del Dr. Speech Science versión 3.2, instalado en una
computadora 486 Dx2 320 Mb de Memoria RAM.
Análisis Espectrográfico
Para realizar el análisis de cada uno de los sonidos vocálicos grabados en cada
individuo, se utilizó el programa Dr. Speech Sciense, el cual contiene el Speceb Analysis
en el cual las vocales emitidas y grabadas eran digitalizadas a 44. 100 Hz.
Se procedió al análisis por separado de los sonidos vocálicos a través del análisis
espectrográfico en el cual proporciono los tres primeros formantes para cada sonido.
Los resultados obtenidos fueron analizados estadísticamente utilizando porcentajes y
desviación estándar.
CuadroNª 1
En el cuadro y gráfico N° 1, se observa la población en estudio, en el cual se aprecia que el
grupo etario de 20 a 39 años predomina un 56% en la población femenina y un grupo etario
de 30 a 39 años predomina un 36% sobre la población masculina.
Cuadro Nª 2
En el cuadro N° 2 muestra el desempeño de la población estudiada, se observa el
predominio de estudiantes en un 24 %, sobre la diversidad de la muestra tomada.
En el cuadro N°3 y gráfico N° 2, se observa que en el promedio de cada una de las
formantes de las vocales, predominan los valores más altos para el sexo femenino, tanto
para la F1 como F2, solo se aprecia una ligera diferencia para el sexo masculino con la vocal
|i| , la F1 es un poco más alta, igualmente con la vocal |u| la F2 está ligeramente más alta
para el sexo masculino que el femenino.
En el cuadro N°4 se observa que en el promedio en el grupo etario de 18 a 19 años, del
nivel màs alto para F1 de la vocal │a│y el el grupo de 20 a 39 años para la F2 . Para las
vocales │e│y │o│el predominio de valores mayores para F1 y F2 se encuentra entre los
grupos de edades extremas de 18 a 19 años y de 50 a 59 años. En el caso de la vocal │i│el
predominio sobre F1 se encuentra en el grupo etario de 30 a 39 años y F2 en el grupo de 18
a 19 años y de 30 a 39 años. En la vocal │u│se observa un nivel más alto para F1 en el
grupo etario de 30 a 39 años y de 50 a 59 años, con la F2 predominan valores mayores en el
grupo de 40 a 49 años y de 50 a 59 años. Se evidencia que los valores de la desviación
estandar son altos en todos los grupos etarios.
En el cuadro N° 5 llama la atención que el grupo de 40 a 49 años presenta el promedio más
bajo para F1 de la vocal |a| y el valor más alta para F2 en el grupo etario de 50 a 59 años, los
demás grupos se mantienen muy semejantes. En el caso de la |e| el valor mayor encontrado
para F1 entre los grupos de 20 a 29 años y 18 a 19 años y la F2 más alta en el grupo de 40 a
49 años. Para la |i| la F1 , es mayor entre los grupos de 50 a 59 años y 30 a 39 años
quedando la F2 más alta en el grupo mas joven de 18 a 19 años. En la vocal |o| existe un
promedio llamativo sobre el grupo de 30 a 39 años que mantienen los valores más altos
para F1, y comparte con el grupo de 40 a 49 años valores semejantes para F2. La vocal, |u|
tienen valores mayores para F1, en el grupo de 20 a 29 años al igual que F2 observando los
valores más bajos en el grupo de 50 a 59 años. Llama la atención que los valores de
desviación estándar son altos.
En el cuadro N° 6, se observan los valores obtenidos de la sumatoria tanto del sexo
masculino como femenino, de todos los grupos etarios comparados con los valores dados
por E. Alarcón Llorach, citados por Martínez Celdràn (4) en donde se evidencia que la
sumatoria de los valores promedios obtenidos en este trabajo son superiores a los de
Alarcón Llorach, en el caso de la vocal | i | , el valor de la primera está por debajo del valor
comparado; llama la atención los valore de F2 en la vocal | o | y |u| se presentan al valor de
Alarcón.
En el cuadro N° 7, se observan que los valores de las formantes obtenidas en este
estudio al compararlos con una muestra del sexo masculino, citada en la obra de Martínez
Celdràn (4), en este cuadro se evidencia que todos los valores obtenidos en este estudio son
superiores a los valores citado, a excepción de la vocal | e | en al que se aprecia que los
resultados están ligeramente a los valores citados, se evidencia los valores
significativamente superiores en la F2 de | o | y |u| con respecto a Martínez Celdràn (4
En los gráficos 3.1 a 3.5, denominados cartas de formantes en personas del sexo
femenino, se evidencia la relación de F1, sobre F2 en las coordenadas, lo cual permite
visualizar en cada grupo etario diversas figuras que semejan la forma de pentágono.
En los gráficos 4.1 y 4.5, denominados cartas de formantes para el sexo masculino, se
observa la relación de los valores promedios de F1 y F2 para cada grupo etario, se evidencia
una figura geométrica similar a un pentágono, con sus variantes para cada grupo; sólo en el
grupo de 18 a 19 años se observa una figura más delgada, que se aleja de las figuras
conformadas para los otros grupos.
Se observa en el gráfico 5.1 denominado carta de formantes en individuos femeninos, se
observa relación de F1, sobre F2 de los promedios totales del sexo femenino, tomando la
configuración de un pentágono.
En el gráfico 5.2 denominado carta de formantes en individuos masculino, se observa
la relación de los promedios de los formantes, tanto F1, como F2 en el sexo masculino, en
este caso la figura es semejante a un pentágono.
V. DISCUSIÓN
Se evaluaron 50 individuos sanos, sin alteraciones de la voz, siendo 25 hombres y 25
mujeres, cuyas edades oscilaron entre 18 y 56 años. A cada uno se les realizó una historia
clínica, evaluación instrumental con videolaringoscopia para descartar cualquier alteración
funcional u orgánica. que pudiera perturbar las cualidades de la voz. Además se obtuvo una
muestra heterogénea en cuanto a la ocupación para el uso de la voz, en el que predominaron
los estudiantes. Posteriormente se emitieron los sonidos vocálicos para luego analizarlos a
través del programa Speech Science Analysis contenido en el programa Dr. Speech Science
instalado en la computadora del Servicio de Foniatría del HCAMP.
En general se pudo observar que los valores promedios de las formantes (F1 y F2)
arrojados en la muestra del sexo femenino, estaban por encima de los valores del sexo
masculino, así como lo demuestra Martínez Celdrán (5), aunque en el presente estudio
existe una ligera diferencia para la F1 en la vocal |i| la cual permanece por encima en el sexo
masculino, al igual que la F2 de la vocal |U| esta ligeramente mas alta que en el sexo
femenino.
En cuanto a los valores presentados en ambos sexos, llama la atención, que las
desviaciones estandar fueron grandes; debido a que los promedios obtenidos para F1, y F2
tuvieron un amplio margen; esto pudiera explicarse a la gran variación anatómica entre los
individuos, que explicaría este amplio margen; Además A. Quilis (9) refiere que los valores
para F1, guardan relación con la abertura bucal y F2 con la posición de la lengua y la forma
abocinada de los labios; por otra parte Martínez Celdrán (5) apunta que la importancia
articulatoria no esta a favor de los puntos de articulación, sino de la forma y el volumen de
la cavidad de resonancia.
Se observó en forma global que la variación obtenida en los promedios de las
formantes de los vocales no hubo predominio absoluto de algún grupo etario, sino el
predominio de los valores ya sea F1, y/o F2 de algún sonido vocálico entre los grupos
etarios para los dos sexos.
En general se pudo observar que los valores promedios tanto de F1 y F2 en la mayoría
de los individuos femeninos y masculinos estuvo por encima de los valores obtenidos por
E. Alarcos Llorach, citado por Martínez Celdrán, para el idioma castellano hablado en
España, es necesario tomar en cuenta que los valores citados por E. Alarcos Llorach, no
hacen distinción entre el sexo femenino y masculino por lo cual se promediaron los valores
obtenidos de ambos sexos en el presente estudio para así poderlos comparar con el estudio
de E. Alarcos; en este caso se evidencio que los valores de E. Alarcos son inferiores al
presente estudio, y solo se observó que los valores promedio para la primera formante de la
vocal |i| de este estudio es inferior a los valores de E. Alarcos Llorach.
Se compararon los resultados obtenidos en este trabajo para el sexo masculino con los
resultados citados por Martínez Celdrán (4), en donde se evidencia nuevamente que los
valores arrojados por el presente estudio son mayores que los citados por Martínez C, en
este caso se debe mencionar que los datos aportados por Martínez C, pertenece a un solo
individuo.
Es importante hacer mención que los resultados del presente trabajo son comparados
con el castellano hablado en España, por lo cual se infiere que por las variaciones
anatómicas de los resonadores de cada individuo, también se debe tener presente, las
diferencias en cuanto a las características particulares del habla en España y de la Región
en donde se realizó el presente estudio.
En la conformación de las cartas de formantes, se observan variantes del modelo
clásico mencionado por A. Quilis (9), y Martínez Celdrán (4) denominado triángulo
vocálico, en el cual se representan los sonidos vocálicos a través de los valores de las
formantes F1 y F2 sobre un sistema de ambos sexos en el presente estudio para así poderlos
comparar con el estudio de E. Alarcos; en este caso se evidenció que los valores de E.
Alarcos son inferiores al presente estudio, y solo se observó que los valores promedio para
la primera formante de la vocal |i| de este estudio es inferior a los valores de E. Alarcos
Lloracli.
Se compararon los resultados obtenidos en este trabajo, para el sexo masculino con los
resultados citados por Martínez Celdrán (4), en donde se evidencia nuevamente que los
valores arrojados por el presente estudio son mayores que los citados por Martínez C, en
este caso se debe mencionar que los datos aportados por Martínez C, pertenece a un solo
individuo.
Es importante hacer mención que los resultados del presente trabajo son comparados
con el castellano hablado en España, por lo cual se infiere que por las variaciones
anatómicas de los resonadores de cada individuo, también se debe tener presente, las
diferencias en cuanto a las características particulares del habla en España y de la Región
en donde se realizó el presente estudio.
En la conformación de las cartas de formantes, se observan variantes del modelo
clásico mencionado por A. Quilis (9), y Martínez Celdrán (4) denominado triángulo
vocálico, en el cual se representan los sonidos vocálicos a través de los valores de las
formantes F1 y F2 sobre un sistema de coordenadas, bajo una escala logarítmica, lo que
permite visualizar la representación acústica de los sonidos vocálicos en este caso de la
lengua castellana hablada en España. En este estudio se observó que las cartas de formantes
obtenidas de los valores promedio por sexo y grupo etarios, son variaciones de las forma
clásica descrita, se observó en todos los casos la tendencia de los sonidos vocálicos a ser
mas difusos o seas que los valores de F1, y F2 tienden a separarse mas, solo en el caso del
grupo etario de 18 a 19 años del sexo masculino se observó aun más denso que lo descrito
por A. Quilis (9), por lo que se evidencia que el castellano hablado en la Región donde se
obtuvo la muestra del estudio tiende a ser más difuso que el castellano hablado en España.
VI. CONCLUSIONES
1.
Evidenciamos la Variabilidad de los resultados obtenidos, los cuales fueron más
altos tanto para la primera como la segunda formante de los sonidos vocálicos con
respecto a los valores citados por los trabajos realizados en el idioma Castellano
hablado en España.
2.
El sistema vocálico en la Región donde se realizó el estudio, se evidencia aún más
difuso que los patrones encontrados por otros autores, para el mismo idioma pero
hablado en otro país.
3.
Se deduce que las variaciones de los resultados pueden estar influenciadas por la
diversidad anatómica de los resonadores en cada individuo y a las características
propias del habla de los individuos de la región donde se realizó este estudio.
VII. RECOMENDACIONES
1. El estudio de las formantes de los sonidos vocálicos debe ser ampliado en cuanto al
número de la muestra y al manejo de otras variables como la ocupación o
desempeño laboral, ampliar los márgenes de edad, que incluya niños y ancianos y la
procedencia de los individuos, con el fin de establecer valores de referencia mucho
más específicos para cada región del país.
2. Se debe implementar el estudio sistemático de los sonidos vocálicos en el análisis
acústico de la voz, en todo paciente que acuda a la clínica de voz, para establecer
comparaciones con los valores obtenidos en individuos normales. Elaborar la carta
de formantes en cada paciente evaluado y anexarlo a su historia clínica de voz, lo
cual serviría para el monitoreo de las diferentes patologías de voz.
BIBLIOGRAFÍA
1. JACKSON-MENALDI, MARIA C. 1992. La Voz Normal. Buenos Aires.
Editorial Médica Panamericana.
2. LE HUCHE, FRANCOISE. 1993. La Voz Tomo II. Barcelona.
Editorial Masson.
3. LLISTERRI, JOAQUIN. 1998. Universidad Autónoma de Barcelona.
España. Internet.
4. MARTINEZ CELDRAN, EUGENIO. 1993. Fonética. Editorial Teide.
4ta Edición.
5. MARTINEZ CELDRAN, EUGENIO. 1998. Análisis Espectrográfico de
los Sonidos del Habla. Editorial Ariel. Febrero.
6. MORRISON, MURRAY. 1996. Tratamiento de los Trastornos de la
Voz Editorial Masson.
7. NIETO BERRERA,. MARGARITA. 1992. Evolución del Lenguaje en
el Niño. Editorial Pomia. México.
8. PERELLO, JORGE. 1997. Fisiología de la Comunidad Oral. Editorial
Científico Médico Barcelona.
9. QUILIS, ANTONIO. 1991. El Comentario Fonológico y Fonético de
Textos, Teoría y Práctica. Editorial Arco. España.
10. RODRÍGUEZ, ANGEL. 1998. La Dimensión Sonora del Lenguaje
Audiovisual. Editorial Paidos.
DEFINICION DE TERMINOS
Onda Sonora: Resultado de la vibración de las moléculas del aire, y puede definirse en
función de su amplitud, su frecuencia y del tiempo durante el cual se lleva a cabo el
movimiento(3) .
Onda Sonora Compleja: Onda sonora producida en la glotis, corresponde al tipo de
sonido compuesto, consistente en la superposición de varias ondas simples (3)
Resonancia: Consiste en la modificación de la amplitud de los armónicos de un sonido
complejo ejercida por la cavidad en la que se produce la vibración de las moléculas de aire
(3).
Formantes: Resonancia del tracto vocal que producen amplificaciones en el espectro
especialmente en los sonidos a periódicos complejos (5) .
Frecuencia Fundamental: Onda sonora simple de frecuencia más baja entre los que se
forma a una onda sonora compleja, y esta corresponde a la frecuencia de cierre y abertura
de las cuerdas vocales(3)
Armónicos: Componentes secundarios o múltiplos de la frecuencia fundamental de una
onda compleja(3) .
Descargar