ANALISIS ESPECTROGRAFICO DE LOS SONIDOS VOCALICOS DE LA LENGUA CASTELLANA EN INDIVIDUOS CON VOZ NORMAL FRANCESCA FRAZZETTO H. “UNIVERSIDAD CENTROCCIDENTAL "LISANDRO ALVARADO" BARQUISIMET0,2000 ANALISIS ESPECTROGRAFICO DE LOS SONIDOS VOCALICOS DE LA LENGUA CASTELLANA EN INDIVIDUOS CON VOZ NORMAL Autor: Dra. Francesca Frazzetto H. Palabras Claves: Formantes, Análisis Espectrográfico, vocales. RESUMEN En el presente estudio se evaluaron 50 individuos con voz normal, que fueron explorados clínica e instrumentalmente, para descartar patologías orgánicas o funcionales que pudieran perturbar las cualidades de la voz. Se grabaron sus voces, emitiendo los sonidos vocálicos y se realizó el análisis espectrográfico de cada vocal. En el estudio se evidenció que los valores de la primera y segunda formante estuvieron por encima de los parámetros obtenidos en el castellano hablado en España.. De igual manera los valores resultantes para las formantes de las voces femeninas fueron. mas altas que en las voces masculinas. Además el análisis espectrográfico mostró la variación de los sonidos vocálicos emitidos por hablantes de la región estudiada con respecto a los hablantes de la lengua castellana en España. SPECTROGRAPHICAL ANALYSIS OF VOWEL SOUNDS OF SPANISH LANGUAGE IN INDIVIDUALS WITHS NORMAL VOICE Author: Dra. Francesca Frazzetto. H. Key words: Formants, spectrographical analysis, vowels. SUMMARY In this study, 50 individuals with normal voice were clinically and instrumentally explored so as to discard organic or functional pathologies which might disturb the qualities of voice. Their voices were recorded while they were emitting vowel sounds and the spectrographical analysis of each vowel was made. The study showed that the values for the first and second formant were higher than the parameters obtained in the Spanish spoken in Spain. Also, the values obtained for the formants of feminine voices were higher than those of masculine voices. Besides, spectrographical analysis showed the variation between vowel sounds emitted by speakers of the region under study and by speakers of Spanish language in Spain. 1. INTRODUCCION Desde la publicación en 1822 del Teorema de Fourier, según el cual "Toda onda compleja se descompone en los elementos senoidales simples", se comenzó a idear el mecanismo que podía llevar a cabo el análisis de cualquier sonido. A partir del siglo XX, es cuando científicos Alemanes de la Casa Siemens, realizan los primeros intentos en la descomposición de ondas complejas; a través de un analizador o espectrómetro. Posteriormente en, el transcurso de los años 30, en pleno desarrollo de la Segunda Guerra Mundial se perfecciona en Estados Unidos, hasta conseguir hoy en día, el análisis del sonido a partir de equipo de computación comandados por programas especiales o software(4) El análisis espectrográfico vocal es una representación gráfica de los sonidos, emitidos por la voz humana, en la cual se puede estudiar los componentes de un sonido complejo, lo cual es característico de la voz y viene dado por la sumatoria de varios sonidos puros, es decir que las ondas sonoras generadas por la vibración de los repliegues vocales y el aparato resonador se suman y dan como resultado el tono fundamental que es el primer armónico y una serie de armónicos que son múltiplos del tono fundamental (8). Esta información que proporciona con respecto a la conformación de frecuencias que tiene un sonido, y a la intensidad de cada una de estas frecuencias, esta siempre referida a un instante concreto de la evolución del sonido en el tiempo; es un corte transversal del suceso sonoro, donde muestra con detalle el contenido, ignorando el resto(10)espectrograma se conforma de un sistema de coordenadas, en el eje de las abscisas se representan las frecuencias expresadas en Hertz (Hz) y en las ordenadas la amplitud de la onda expresada en deciBell (Db), sobre este sistema se obtiene las medidas de las formantes, que son resonancias que se generan a través del tracto vocal y producen amplificación en el espectro de los sonidos complejos originados en la glotis(5). La fuente primaria del sonido de la voz humana, proviene de la vibración de los repliegues vocales y a su vez la intervención de su musculatura e innervación, se relacionan o tienen influencia de los procesos vegetativos, endocrinos y emocionales que lo regulan(2). Este sonido inicial se amplifica y enriquece a través del Sistema, Resonador, que esta conformado por la faringe, paladar, cavidad nasal y bucal(7) . Estas cavidades de resonancia poseen propiedades vibratorias que le confieren la capacidad de filtro, que dejan frecuencias afines y debilitan las que no le son afines(4) . En dichas cavidades la amplitud de los armónicos de las ondas sonoras procedentes de la glotis queda alterada en función de la posición adoptada para la articulación de cada sonido, especialmente en el caso de los sonidos periódicos complejos, se refuerza la amplitud situados alrededor de una determinada frecuencia configurándose así las formantes(3) . Por lo general las cavidades pequeñas refuerzan la amplitud de los armónicos de frecuencia alta y las cavidades grandes refuerzan la amplitud de los armónicos de frecuencias bajas. Desde el punto de vista acústico las vocales se diferencian por la frecuencia a la que se encuentran esas zonas de armónicos de amplitud reforzada por acción de las cavidades de resonancia (5). De acuerdo al lugar en donde se produzcan los sonidos vocálicos se1 clasifican en tres categorías: Tomando en cuenta la posición de la lengua y los labios para la producción del sonido vocálico: ♦ Delanteros o palatales |ie| ♦ Medios |a| ♦ Posteriores o velares |ou| En la vocal |a| , lengua reposa en el piso de la boca, en la |i| y la |e| el movimiento se acentúa hacia delante y en las velares |o| y |u | la lengua se retrae y el velo del paladar se eleva; en la articulación o producción de los sonidos también intervienen los labios, en las vocales |o| y |u| estan protruidos, en las vocales |i | y la |e| se retraen y en la |a| queda en posición neutra. La distancia o abertura que se forma entre el paladar y la lengua es importante, donde el sonido de la vocal |a| es la mas abierta, esto va disminuyendo en los demás sonidos vocálicos. En todas las vocales, la glotis produce el tono fundamental por eso se denominan sonoras y el velo del paladar se eleva para impedir que el aire salga por la cavidad nasal (7). La representación de los distintos sonidos vocálicos se lleva a cabo a través de cartas de formantes y permite graficar en un punto coordenado por medio de los valores formánticos llevados sobre el eje de las abscisas y ordenados se utiliza para tal fin papel milimetrado logarítmicamente (Ixl peníodo) y está adaptado a las medidas frecuenciales que necesitarnos (4 y 9), sobre este eje de coordenadas se representa en el eje de las abscisas los valores de los segundos formantes (F2) Y sobre el eje de las ordenadas los valores de los primeros formantes (F1) (9). Según lo expuesto, y de acuerdo a la posición de la lengua y los labios y la sonoridad de cada vocal al llevar los valores de las formantes sobre las cartas de formantes, se disponen de tal forma que se obtiene la figura clásica del triángulo citada por Perello (8), y Quilis (9), todos hacen referencia a los valores del castellano hablado en España. En la literatura revisada, Martínez Celdrán hace referencia a los valores de las formantes de los sonidos vocálicas propuestos por el estudio de E. Alarcos Llorach, en su obra sobre Fonología Española (4). Debido a las diferencias existentes entre el castellano hablado en España y el hablado en Venezuela, se decide llevar a cabo esta investigación, que tiene como finalidad establecer valores propios; que proporcionaran posteriormente un manejo adecuado de los problemas de voz, ya sea en la evaluación de pacientes disfónicos así como en la técnica vocal de los cantantes. II. OBJETIVOS General: Establecer un patrón espectrográfico de normalidad de los sonidos vocálicos del habla castellana en individuos con voz normal. Específicos: Determinar los valores promedios de las formantes de las vocales en individuos con voz normal. Analizar la relación de los valores formánticos de las vocales en las voces masculinas en comparación con los valores formánticos de las vocales en las voces femeninas. Comparar el rasgo acústico en relación con los rasgos articulatorios de las vocales a través de las cartas de formantes. III. MARCO METODOLOGICO Población y Muestra La muestra estuvo constituida por 50 individuos sanos que fueron elegidos al azar, de institutos educativos tales como el Decanato de Medicina, colegios y escuelas adyacentes al Hospital Central "Antonio María Pineda" y acompañantes de los pacientes que acuden al Servicio de Foniatría; cuyas edades oscilaron entre 18 y 56 años, de los cuales 25 fueron del sexo femenino y 25 del sexo masculino, la evaluación de dicha muestra fue realizada entre Diciembre de 1.999 y Enero del 2.000. Se tomaron como criterio de exclusión en la muestra, los siguientes antecedentes: Infecciones Crónicas Otorrinolaringológicas, Tabaquismo y Afecciones Crónicas del Aparato Respiratorio como asma o bronquitis. Método A cada individuo, se le realizó evaluación clínica que consistió en una historia clínica, evaluación instrumental a través de videolaringoscopia en la cual se determinaba si el individuo presentaba alteraciones orgánicas ó funcionales que pudieran excluirlo del estudio. Posteriormente, cada individuo fue grabado para realizar el análisis espectrográfico; el cual se realizó en todos los individuos bajo las mismas condiciones, el ambiente debe estar silencioso y en el estudio se le indicaba la manera en que debía emitir los sonidos, mantener la boca a una distancia de 10 cm del micrófono; y emitir los sonidos vocálicos | a,e,i,o,u | en forma sucesiva pero con pausas entre un sonido y otro, con voz hablada durante 30 segundos, se hizo la grabación en 3 oportunidades hasta obtener la mejor emisión, luego se analizó la voz a través de la sección Speech Analysis contenido en el Programa de Análisis Acústico del Dr. Speech Science versión 3.2, instalado en una computadora 486 Dx2 320 Mb de Memoria RAM. Análisis Espectrográfico Para realizar el análisis de cada uno de los sonidos vocálicos grabados en cada individuo, se utilizó el programa Dr. Speech Sciense, el cual contiene el Speceb Analysis en el cual las vocales emitidas y grabadas eran digitalizadas a 44. 100 Hz. Se procedió al análisis por separado de los sonidos vocálicos a través del análisis espectrográfico en el cual proporciono los tres primeros formantes para cada sonido. Los resultados obtenidos fueron analizados estadísticamente utilizando porcentajes y desviación estándar. CuadroNª 1 En el cuadro y gráfico N° 1, se observa la población en estudio, en el cual se aprecia que el grupo etario de 20 a 39 años predomina un 56% en la población femenina y un grupo etario de 30 a 39 años predomina un 36% sobre la población masculina. Cuadro Nª 2 En el cuadro N° 2 muestra el desempeño de la población estudiada, se observa el predominio de estudiantes en un 24 %, sobre la diversidad de la muestra tomada. En el cuadro N°3 y gráfico N° 2, se observa que en el promedio de cada una de las formantes de las vocales, predominan los valores más altos para el sexo femenino, tanto para la F1 como F2, solo se aprecia una ligera diferencia para el sexo masculino con la vocal |i| , la F1 es un poco más alta, igualmente con la vocal |u| la F2 está ligeramente más alta para el sexo masculino que el femenino. En el cuadro N°4 se observa que en el promedio en el grupo etario de 18 a 19 años, del nivel màs alto para F1 de la vocal │a│y el el grupo de 20 a 39 años para la F2 . Para las vocales │e│y │o│el predominio de valores mayores para F1 y F2 se encuentra entre los grupos de edades extremas de 18 a 19 años y de 50 a 59 años. En el caso de la vocal │i│el predominio sobre F1 se encuentra en el grupo etario de 30 a 39 años y F2 en el grupo de 18 a 19 años y de 30 a 39 años. En la vocal │u│se observa un nivel más alto para F1 en el grupo etario de 30 a 39 años y de 50 a 59 años, con la F2 predominan valores mayores en el grupo de 40 a 49 años y de 50 a 59 años. Se evidencia que los valores de la desviación estandar son altos en todos los grupos etarios. En el cuadro N° 5 llama la atención que el grupo de 40 a 49 años presenta el promedio más bajo para F1 de la vocal |a| y el valor más alta para F2 en el grupo etario de 50 a 59 años, los demás grupos se mantienen muy semejantes. En el caso de la |e| el valor mayor encontrado para F1 entre los grupos de 20 a 29 años y 18 a 19 años y la F2 más alta en el grupo de 40 a 49 años. Para la |i| la F1 , es mayor entre los grupos de 50 a 59 años y 30 a 39 años quedando la F2 más alta en el grupo mas joven de 18 a 19 años. En la vocal |o| existe un promedio llamativo sobre el grupo de 30 a 39 años que mantienen los valores más altos para F1, y comparte con el grupo de 40 a 49 años valores semejantes para F2. La vocal, |u| tienen valores mayores para F1, en el grupo de 20 a 29 años al igual que F2 observando los valores más bajos en el grupo de 50 a 59 años. Llama la atención que los valores de desviación estándar son altos. En el cuadro N° 6, se observan los valores obtenidos de la sumatoria tanto del sexo masculino como femenino, de todos los grupos etarios comparados con los valores dados por E. Alarcón Llorach, citados por Martínez Celdràn (4) en donde se evidencia que la sumatoria de los valores promedios obtenidos en este trabajo son superiores a los de Alarcón Llorach, en el caso de la vocal | i | , el valor de la primera está por debajo del valor comparado; llama la atención los valore de F2 en la vocal | o | y |u| se presentan al valor de Alarcón. En el cuadro N° 7, se observan que los valores de las formantes obtenidas en este estudio al compararlos con una muestra del sexo masculino, citada en la obra de Martínez Celdràn (4), en este cuadro se evidencia que todos los valores obtenidos en este estudio son superiores a los valores citado, a excepción de la vocal | e | en al que se aprecia que los resultados están ligeramente a los valores citados, se evidencia los valores significativamente superiores en la F2 de | o | y |u| con respecto a Martínez Celdràn (4 En los gráficos 3.1 a 3.5, denominados cartas de formantes en personas del sexo femenino, se evidencia la relación de F1, sobre F2 en las coordenadas, lo cual permite visualizar en cada grupo etario diversas figuras que semejan la forma de pentágono. En los gráficos 4.1 y 4.5, denominados cartas de formantes para el sexo masculino, se observa la relación de los valores promedios de F1 y F2 para cada grupo etario, se evidencia una figura geométrica similar a un pentágono, con sus variantes para cada grupo; sólo en el grupo de 18 a 19 años se observa una figura más delgada, que se aleja de las figuras conformadas para los otros grupos. Se observa en el gráfico 5.1 denominado carta de formantes en individuos femeninos, se observa relación de F1, sobre F2 de los promedios totales del sexo femenino, tomando la configuración de un pentágono. En el gráfico 5.2 denominado carta de formantes en individuos masculino, se observa la relación de los promedios de los formantes, tanto F1, como F2 en el sexo masculino, en este caso la figura es semejante a un pentágono. V. DISCUSIÓN Se evaluaron 50 individuos sanos, sin alteraciones de la voz, siendo 25 hombres y 25 mujeres, cuyas edades oscilaron entre 18 y 56 años. A cada uno se les realizó una historia clínica, evaluación instrumental con videolaringoscopia para descartar cualquier alteración funcional u orgánica. que pudiera perturbar las cualidades de la voz. Además se obtuvo una muestra heterogénea en cuanto a la ocupación para el uso de la voz, en el que predominaron los estudiantes. Posteriormente se emitieron los sonidos vocálicos para luego analizarlos a través del programa Speech Science Analysis contenido en el programa Dr. Speech Science instalado en la computadora del Servicio de Foniatría del HCAMP. En general se pudo observar que los valores promedios de las formantes (F1 y F2) arrojados en la muestra del sexo femenino, estaban por encima de los valores del sexo masculino, así como lo demuestra Martínez Celdrán (5), aunque en el presente estudio existe una ligera diferencia para la F1 en la vocal |i| la cual permanece por encima en el sexo masculino, al igual que la F2 de la vocal |U| esta ligeramente mas alta que en el sexo femenino. En cuanto a los valores presentados en ambos sexos, llama la atención, que las desviaciones estandar fueron grandes; debido a que los promedios obtenidos para F1, y F2 tuvieron un amplio margen; esto pudiera explicarse a la gran variación anatómica entre los individuos, que explicaría este amplio margen; Además A. Quilis (9) refiere que los valores para F1, guardan relación con la abertura bucal y F2 con la posición de la lengua y la forma abocinada de los labios; por otra parte Martínez Celdrán (5) apunta que la importancia articulatoria no esta a favor de los puntos de articulación, sino de la forma y el volumen de la cavidad de resonancia. Se observó en forma global que la variación obtenida en los promedios de las formantes de los vocales no hubo predominio absoluto de algún grupo etario, sino el predominio de los valores ya sea F1, y/o F2 de algún sonido vocálico entre los grupos etarios para los dos sexos. En general se pudo observar que los valores promedios tanto de F1 y F2 en la mayoría de los individuos femeninos y masculinos estuvo por encima de los valores obtenidos por E. Alarcos Llorach, citado por Martínez Celdrán, para el idioma castellano hablado en España, es necesario tomar en cuenta que los valores citados por E. Alarcos Llorach, no hacen distinción entre el sexo femenino y masculino por lo cual se promediaron los valores obtenidos de ambos sexos en el presente estudio para así poderlos comparar con el estudio de E. Alarcos; en este caso se evidencio que los valores de E. Alarcos son inferiores al presente estudio, y solo se observó que los valores promedio para la primera formante de la vocal |i| de este estudio es inferior a los valores de E. Alarcos Llorach. Se compararon los resultados obtenidos en este trabajo para el sexo masculino con los resultados citados por Martínez Celdrán (4), en donde se evidencia nuevamente que los valores arrojados por el presente estudio son mayores que los citados por Martínez C, en este caso se debe mencionar que los datos aportados por Martínez C, pertenece a un solo individuo. Es importante hacer mención que los resultados del presente trabajo son comparados con el castellano hablado en España, por lo cual se infiere que por las variaciones anatómicas de los resonadores de cada individuo, también se debe tener presente, las diferencias en cuanto a las características particulares del habla en España y de la Región en donde se realizó el presente estudio. En la conformación de las cartas de formantes, se observan variantes del modelo clásico mencionado por A. Quilis (9), y Martínez Celdrán (4) denominado triángulo vocálico, en el cual se representan los sonidos vocálicos a través de los valores de las formantes F1 y F2 sobre un sistema de ambos sexos en el presente estudio para así poderlos comparar con el estudio de E. Alarcos; en este caso se evidenció que los valores de E. Alarcos son inferiores al presente estudio, y solo se observó que los valores promedio para la primera formante de la vocal |i| de este estudio es inferior a los valores de E. Alarcos Lloracli. Se compararon los resultados obtenidos en este trabajo, para el sexo masculino con los resultados citados por Martínez Celdrán (4), en donde se evidencia nuevamente que los valores arrojados por el presente estudio son mayores que los citados por Martínez C, en este caso se debe mencionar que los datos aportados por Martínez C, pertenece a un solo individuo. Es importante hacer mención que los resultados del presente trabajo son comparados con el castellano hablado en España, por lo cual se infiere que por las variaciones anatómicas de los resonadores de cada individuo, también se debe tener presente, las diferencias en cuanto a las características particulares del habla en España y de la Región en donde se realizó el presente estudio. En la conformación de las cartas de formantes, se observan variantes del modelo clásico mencionado por A. Quilis (9), y Martínez Celdrán (4) denominado triángulo vocálico, en el cual se representan los sonidos vocálicos a través de los valores de las formantes F1 y F2 sobre un sistema de coordenadas, bajo una escala logarítmica, lo que permite visualizar la representación acústica de los sonidos vocálicos en este caso de la lengua castellana hablada en España. En este estudio se observó que las cartas de formantes obtenidas de los valores promedio por sexo y grupo etarios, son variaciones de las forma clásica descrita, se observó en todos los casos la tendencia de los sonidos vocálicos a ser mas difusos o seas que los valores de F1, y F2 tienden a separarse mas, solo en el caso del grupo etario de 18 a 19 años del sexo masculino se observó aun más denso que lo descrito por A. Quilis (9), por lo que se evidencia que el castellano hablado en la Región donde se obtuvo la muestra del estudio tiende a ser más difuso que el castellano hablado en España. VI. CONCLUSIONES 1. Evidenciamos la Variabilidad de los resultados obtenidos, los cuales fueron más altos tanto para la primera como la segunda formante de los sonidos vocálicos con respecto a los valores citados por los trabajos realizados en el idioma Castellano hablado en España. 2. El sistema vocálico en la Región donde se realizó el estudio, se evidencia aún más difuso que los patrones encontrados por otros autores, para el mismo idioma pero hablado en otro país. 3. Se deduce que las variaciones de los resultados pueden estar influenciadas por la diversidad anatómica de los resonadores en cada individuo y a las características propias del habla de los individuos de la región donde se realizó este estudio. VII. RECOMENDACIONES 1. El estudio de las formantes de los sonidos vocálicos debe ser ampliado en cuanto al número de la muestra y al manejo de otras variables como la ocupación o desempeño laboral, ampliar los márgenes de edad, que incluya niños y ancianos y la procedencia de los individuos, con el fin de establecer valores de referencia mucho más específicos para cada región del país. 2. Se debe implementar el estudio sistemático de los sonidos vocálicos en el análisis acústico de la voz, en todo paciente que acuda a la clínica de voz, para establecer comparaciones con los valores obtenidos en individuos normales. Elaborar la carta de formantes en cada paciente evaluado y anexarlo a su historia clínica de voz, lo cual serviría para el monitoreo de las diferentes patologías de voz. BIBLIOGRAFÍA 1. JACKSON-MENALDI, MARIA C. 1992. La Voz Normal. Buenos Aires. Editorial Médica Panamericana. 2. LE HUCHE, FRANCOISE. 1993. La Voz Tomo II. Barcelona. Editorial Masson. 3. LLISTERRI, JOAQUIN. 1998. Universidad Autónoma de Barcelona. España. Internet. 4. MARTINEZ CELDRAN, EUGENIO. 1993. Fonética. Editorial Teide. 4ta Edición. 5. MARTINEZ CELDRAN, EUGENIO. 1998. Análisis Espectrográfico de los Sonidos del Habla. Editorial Ariel. Febrero. 6. MORRISON, MURRAY. 1996. Tratamiento de los Trastornos de la Voz Editorial Masson. 7. NIETO BERRERA,. MARGARITA. 1992. Evolución del Lenguaje en el Niño. Editorial Pomia. México. 8. PERELLO, JORGE. 1997. Fisiología de la Comunidad Oral. Editorial Científico Médico Barcelona. 9. QUILIS, ANTONIO. 1991. El Comentario Fonológico y Fonético de Textos, Teoría y Práctica. Editorial Arco. España. 10. RODRÍGUEZ, ANGEL. 1998. La Dimensión Sonora del Lenguaje Audiovisual. Editorial Paidos. DEFINICION DE TERMINOS Onda Sonora: Resultado de la vibración de las moléculas del aire, y puede definirse en función de su amplitud, su frecuencia y del tiempo durante el cual se lleva a cabo el movimiento(3) . Onda Sonora Compleja: Onda sonora producida en la glotis, corresponde al tipo de sonido compuesto, consistente en la superposición de varias ondas simples (3) Resonancia: Consiste en la modificación de la amplitud de los armónicos de un sonido complejo ejercida por la cavidad en la que se produce la vibración de las moléculas de aire (3). Formantes: Resonancia del tracto vocal que producen amplificaciones en el espectro especialmente en los sonidos a periódicos complejos (5) . Frecuencia Fundamental: Onda sonora simple de frecuencia más baja entre los que se forma a una onda sonora compleja, y esta corresponde a la frecuencia de cierre y abertura de las cuerdas vocales(3) Armónicos: Componentes secundarios o múltiplos de la frecuencia fundamental de una onda compleja(3) .