sumario Acta Otorrinolaringol Esp 2001; 52: 476-482 INVESTIGACIÓN CLÍNICA APLICADA ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL Y EN LA DISFONÍA POR NÓDULOS Y PÓLIPOS VOCALES J. C. CASADO MORENTE *, J. A. ADRIÁN TORRES **, M. CONDE JIMÉNEZ *, D. PIÉDROLA MAROTO *, V. POVEDANO RODRÍGUEZ *, E. MUÑOZ GOMARIZ ***, E. CANTILLO BAÑOS ****, A. JURADO RAMOS **** *SERVICIO DE OTORRINOLARINGOLOGÍA, HOSPITAL “COSTAL DEL SOL”, MARBELLA **DIPLOMATURA DE LOGOPEDIA, FACULTAD DE PSICOLOGÍA, UNIVERSIDAD DE MÁLAGA. ***DEP. BIOESTADÍSTICA, FACULTAD DE MEDICINA, UNIVERSIDAD DE CÓRDOBA ****SERVICIO DE OTORRINOLARINGOLOGÍA, HOSPITAL UNIVERSITARIO “REINA SOFÍA”, CÓRDOBA RESUMEN P resentamos un estudio sobre la evaluación objetiva de la voz en 100 adultos sanos y en 60 sujetos con disfonía por nódulos o pólipos vocales. A todos se les realizó una laringoestroboscopia y un análisis acústico vocal. Se registró y digitalizó la vocal “a” con el programa Dr. Speech Science. Se estimaron los parámetros: frecuencia fundamental (Fo, expresada en función del sexo), jitter, shimmer y Ruido Glótico (NNE, HNR y SNR). La Fo en el grupo normal fue de 139.72 en varones y 267.33 en mujeres, jitter 0.24 y shimmer 2.10. En pacientes disfónicos por nódulos Fo fue 126.96 en varones y 240.72 en mujeres, jitter 0.35 y shimmer 3.25. En pacientes disfónicos por pólipos Fo fue 119.75 en varones y 218.26 en mujeres, jitter 0.50 y shimmer 4.34. Todas estas diferencias fueron estadísticamente significativas. El Ruido Glótico en población normal fue de: NNE –13.62, HNR 24.07 y SNR 24.49; en pacientes con nódulos: NNE –10.65, HNR 25.21 y SNR 25.55; en pacientes con pólipo vocal: NNE –8.24, HNR 29.63 y SNR 28.22. Sólo existió diferencia estadísticamente significativa en el parámetro NNE. Destacamos la importancia de la valoración objetiva de los trastornos de la voz. PALABRAS CLAVE: Análisis acústico. Voz. Disfonía (nódulos y pólipos) ABSTRACT STUDY OBJETIVE OF VOICE IN NORMAL POBLATION AND DISPHONIA FOR NODULES AND POLYPS A study of the objetive evaluation of voice was made of 100 voices of healthy adults and 60 with disphonia (nodules and polyps). A laryngostroboscopy and an acoustic analysis was made to everyone. A sustained vowel “a” was carried out and digitalized with Dr. Speech Science software. These parameters were estimated: fundamental frequency (Fo, accourding to gender), Jitter, Shimmer and glottic noise (NNE, HNR, SNR). In the healthy group Fo was 139.72 in men and 267.33 in women, jitter 0.24 and shimmer 2.10. In disphonic patiens (nodules) Fo was 126.96 in men and 240.72 in women, jitter 0.35 and shimmer 3.25. In disphonic patiens (polyps) Fo was 119.75 in men and 218.26 in women, jitter 0.50 and shimmer 4.34. These difference were statistically significant. Glottic Noise in healthy group was: NNE –13.62, HNR 24.07 and SNR 24.49; in disphonic patiens (nodules) was: NNE –10.65, HNR 25.21 and SNR 25.55; in disphonic patiens (polyps) was: NNE –8.24, HNR 29.63 and SNR 28.22. Only the difference in the NNE was statistically significant. We highlight the importance of objetive evaluation of voice disorders. KEY WORDS: Acoustic analysis. Voice. Disphonia (nodules, polyps). Correspondencia: Juan Carlos Casado Morente. Servicio de Otorrinolaringología. Hospital Costa del Sol. Ctra. Nacional 340, Km. 187. 29600 Marbella. E-mail: [email protected] Fecha de recepción: 17-1-2001 476 Acta Otorrinolaringol Esp 2001; 52: 476-482 ACTA OTORRINOLARINGOLÓGICA ESPAÑOLA INTRODUCCIÓN Sujetos A lo largo de la última década se ha producido un aumento por el interés de la voz humana y sus trastornos1. La preocupación por los problemas de la voz es un indicador fiable de la cultura de un pueblo. Así lo es en la medida en que pasa de considerarse una atención médica de lujo, para unos cuantos profesionales de la voz o cantantes de élite, a formar parte del concepto de salud en su sentido más amplio, al alcance de todos. Ya ha pasado el momento en que la patología de la voz se consideraba una consecuencia inevitable de una grave enfermedad de base, que era la importante, o un problema otorrinolaringológico menor, al que un individuo debía, en la mayor parte de los casos, acostumbrarse2. Los trastornos de la voz cobran su máxima importancia cuando el propio individuo los concibe como la alteración de un parámetro vital que le causa sufrimiento o incapacidad de adaptarse al medio (social o laboral). Esto es, en definitiva, lo que le hace acudir el médico otorrinolaringólogo, que es el profesional que debe valorar en primer lugar toda patología vocal3. Hasta hace relativamente poco tiempo la valoración objetiva y exacta de la voz era inexistente. Muchos otorrinolaringólogos opinaban que los únicos instrumentos que se requerían para el estudio de la voz son el propio oído y los espejos laríngeos y que la llamada valoración objetiva y los novedosos “juguetes informáticos” resultaban innecesarios. Sin embargo, los tiempos cambian y como cualquier función humana, la voz puede padecer alteraciones y su patología debe ser investigada. Al mismo tiempo esta investigación tiende a la objetivación de la alteración fonatoria con tres fines principales: a) para comparar resultados post-tratamiento (médico, logopédico o quirúrgico), b) para poder realizar comparaciones inter-institucionales y c), cada vez más frecuente, para solucionar conflictos médico-legales. La valoración objetiva de la voz se puede realizar mediante el estudio morfo-funcional (exploración física del órgano fonatorio con la laringoestroboscopia) y el análisis acústico vocal (estudio de los principales parámetros acústicos que componen la voz humana). El objetivo del presente trabajo es realizar un estudio objetivo de la voz en sujetos normales y en pacientes con disfonía por nódulos y pólipos, así como cuantificar las diferencias existentes entre ellos. Para el grupo control se ha utilizado a 100 adultos, 57 hombres y 43 mujeres. La edad media fue de 27 años (rango entre 20 y 40 años, desviación típica 5). Todos los sujetos eran voluntarios y no estaban familiarizados con la naturaleza de la investigación, tenían un lenguaje y una audición normal, sin historia previa de trastornos de la voz en los dos meses previos. Todos eran no fumadores, con buen estado general de salud, libres de alergia o cualquier problema respiratorio, congestión nasal o inflamación faringo-laríngea. Ninguno estaba tomando medicación alguna. Ninguno de los voluntarios tenía como profesión aquella que abusa de su voz, bien hablada o cantada. Para el grupo patológico hemos utilizado a 60 pacientes disfónicos distribuidos de la siguiente forma: • 30 disfonías por nódulos vocales (DN); 11 hombres y 19 mujeres, edad media 32 años (rango entre 38 y 25 años, desviación típica 3). • 30 disfonías por pólipo vocal (DP); 17 hombres y 13 mujeres, edad media 35 años (rango entre 42 y 19 años, desviación típica 5). Todos ellos remitidos al Laboratorio de Voz desde las consultas básicas de ORL. MATERIAL Y MÉTODOS Planteamos un estudio de prevalencia de las alteraciones morfofuncionales y acústicas en dos grupos de pacientes disfónicos (disfonía por nódulos vocales -DN- y disfonía por pólipo vocal –DP-) y en otro de controles sanos. Material instrumental o técnico Para la valoración de la onda vibratoria (exploración morfofuncional) hemos empleado: Telelaringoscopio Richard Wolf de 70º, Fibrolaringoscopio Machida ENT30P-III, Cámara Fiegert Endotech CCD en color CD5131, super-VHS y Estrobosocopio Richard Wolf 5012 con fuente de luz fría. Para el análisis acústico vocal se usó la aplicación “Voice Assessment” del programa Dr. Speech Science versión 3.0. La infraestructura necesaria fue: Ordenador personal Pentium, con 8 Mb de RAM y a 66 Mhz bajo entorno Windows (3.1 o superior), tarjeta de sonido (Sound Blaster-Pro) y altavoces y micrófono profesional de 600 ohmios de impedancia. Metodología De forma rutinaria se realizó en todos los individuos una laringoestroboscopia usando el Telelaringoscopio. En 18 pacientes (10 del grupo normal, 5 del grupo DN y 3 del DP) debido al excesivo reflejo nauseoso se sustituyó por el fibrolaringoscopio. En ambos casos empleamos un modelo de recogida de datos, tomado de Ford y Bless4. Posteriormente se realizó el análisis acústico vocal. Para ello hacemos fonar al sujeto la letra /a/ tras inspiración normal en su habitual y confortable tono e inten- Acta Otorrinolaringol Esp 2001; 52: 476-482 477 J. C. CASADO MORENTE ET AL. ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL Y DISFONÍA sidad, situando el micrófono a una distancia estándar de los labios del sujeto de unos 15 cm y apuntando hacia la boca con una cierta angulación (aproximadamente 45º). Cada sujeto fue grabado individualmente en la misma habitación insonorizada, de manera que las condiciones de ruido ambiental son similares. Se consiguen tres mediciones de cada vocal en el mismo sujeto, obteniéndose los valores medios. Escogemos un fragmento homogéneo de grabación (aproximadamente 50 ciclos vibratorios) que corresponde a un segundo de la porción media de cada registro vocal y procedemos a su análisis. La frecuencia de muestreo elegida fue de 44.1 KHz; los extremos para el cálculo de la frecuencia fundamental fueron entre 80-400 Hz. Una vez digitalizada la señal el programa calculó estos parámetros: a) jitter (variación de la frecuencia ciclo a ciclo). Fue calculado como la razón de la variabilidad absoluta ciclo a ciclo de la frecuencia dividido entre la frecuencia media; se expresa en porcentaje. b) shimmer (variación de la amplitud ciclo a ciclo). Fue determinado como la razón de la variabilidad absoluta ciclo a ciclo de la amplitud dividido entre la amplitud media; también es expresada en porcentaje. c) ruido glótico (representa el ruido laríngeo resultante del paso de aire durante la fonación a través de un cierre glótico imcompleto). Se obtiene mediante tres medidas distintas: • Energía del Ruido Normalizado que se conoce con las siglas NNE (Normalized Noise Energy): se obtiene al extraer la energía armónica de la señal de la energía acústica total. Se expresa en decibelios (dB). • Relación Armónicos-Ruido, se conoce como HNR (Harmonic-to-Noise Ratio): se obtiene mediante la relación entre la energía acústica de los armónicos y el ruido generado por la presencia de turbulencias del flujo aéreo. Se expresa en dB. • Relación Señal-Ruido que se conoce como SNR (Signal-to-Noise Ratio) : corresponde a la relación entre energía total de la señal hablada y la del ruido (señal aperiódica) Se expresa en dB. d) La media de la Fo (expresada como MEAN Fo, donde Fo es la frecuencia fundamental de vibración de las cuerdas vocales). Este parámetro se expresa en función del sexo y en Hz. intervalos de confianza al 95% de seguridad para cada uno de los tres grupos, así como sus desviaciones típicas y sus valores máximo y mínimo. Para las comparaciones entre las medias de los tres grupos para las distintas variables se utilizó análisis de varianza de un factor. Las comparaciones a posteriori se efectuaron con la prueba de Scheffé; se consideraron como significativos aquellos valores de “p” inferiores a 0.05 (error tipo I). RESULTADOS Estudio morfo-funcional (laringoestroboscopia) Son subjetivos y, obviamente sólo reflejan lo obtenido en los grupos patológicos. En el grupo de DN las imágenes morfológicas obtenidas mediante laringoestroboscopia revelaron la existencia de dos nódulos a nivel del tercio medio de la glotis membranosa. Unas veces de carácter edematoso (en 10 casos), que casi queda ocultado con la onda vibratoria al estar en la misma fase de frecuencia y otras, de aspecto queratinizado (en los 20 restantes) con diferencia de fase vibratoria con respecto al de la cuerda vocal (casos más evolucionados). Hay signos evidentes de hiperfunción: onda vocal de amplitud reducida, aperiódica con respecto a la otra, con hiato irregular o en cascanueces y mucosa espesa a nivel del segmento supraglótico y gloto-subglótico. Predominio de la fase de apertura sobre la de cierre. En el grupo de DP se obtuvieron imágenes polipoideas; todas fueron unilaterales. Los de carácter angiomatoso (sólo en 5 casos) se sitúan generalmente en la cara superior de la cuerda; si persisten en el tiempo han creado una zona de queratosis o edema fusiforme leve en la cuerda contralateral. La onda vocal se encuentra alterada en su amplitud (reducida) y frecuencia (aperiódica) con respecto a la opuesta. Aparece un hiato glótico irregular. Aquellos casos en los que el pólipo asienta en la cara superior o inferior de la cuerda vocal, no aparece hiato glótico o éste es mínimo, apreciándose perfectamente el acompañamiento que hace el pólipo (sobre todo sí es muy edematoso y algo sésil) de la onda vibrátil. Análisis acústico vocal Análisis estadístico Se crearon tres bases de datos mediante la hoja de cálculo Excel versión 5.0. El paquete estadístico utilizado fue SPSS para Windows versión 7.5. Para el estudio de los parámetros acústicos de los pacientes con disfonía se calcularon las medias con sus 478 Los valores del grupo control aparecen en la Tabla 1, los del grupo de DN en la Tabla 2 y los del grupo DP en la Tabla 3. Se expresan los valores correspondientes a la media aritmética, desviación típica, intervalos de confianza al 95% así como los valores máximo y mínimo de cada una de las variables. Acta Otorrinolaringol Esp 2001; 52: 476-482 ACTA OTORRINOLARINGOLÓGICA ESPAÑOLA Tabla 1: Valores de los parámetros acústicos del grupo normal Variables Jitter Shimmer Media 0,24 Desviación típica Intervalos Confianza (al 95%) Valores Máx/Mín 0,14 0,20 a 0,26 0,88/0,10 2,10 0,95 1,90 a 2,28 5,99/0,88 NNE –13,62 4,27 –14,47 a –12,78 –3,60/–23,09 HNR 24,07 3,30 23,41 a 24,72 33,02/13,82 SNR 24,49 5,44 23,40 a 25,56 67,69/14,05 Fo (varones) 139,72 19,14 Fo (mujeres) 267,33 25,32 Mean Fo 204,87 29,75 159,28 a 250,45 221,31/95,26 Tabla 2: Valores de los parámetros acústicos del grupo disfonía por nódulos Variables Media Desviación típica Intervalos Confianza (al 95%) Valores Máx/Mín Jitter 0,35 0,08 0,22 a 0,27 0,47/0,14 Shimmer 3,25 0,86 1,93 a 2,57 4,50/1,16 NNE –10,65 3,95 –13,12 a –10,18 –3,76/–17,84 HNR 25,21 3,04 24,07 a 26,34 30,21/17,33 24,33 a 26,76 30,21/17,44 171,14 a 196,07 291,35/127,65 SNR 25,55 3,26 Fo (varones) 126,96 23,63 Fo (mujeres) 240,72 20,32 Mean Fo 183,61 33,39 Tabla 3: Valores de los parámetros acústicos del grupo disfonía por pólipos Variables Media Desviación típica Intervalos Confianza (al 95%) Valores Máx/Mín Jitter 0,50 0,40 0,35 a 0,65 1,61/0,13 Shimmer 4,34 2,46 3,42 a 5,25 10,87/1,35 NNE –8,24 4,93 –10,08 a –6,37 –2,24/18,17 HNR 29,63 4,80 17,83 a 21,41 27,49/10,83 SNR 28,22 4,47 18,55 a 21,89 27,51/11,31 Fo (varones) 119,75 36,17 Fo (mujeres) 218,26 29,83 Mean Fo 167,10 34,53 154,20 a 180,00 222,31/110,51 En la Tabla 4 aparecen los valores de la media y desviación típica de cada una de las variables de los tres grupos de estudio así como las comparaciones entre los mismos y su grado de significación estadística (P). DISCUSIÓN El primer problema que nos encontramos al estudiar y comparar distintas voces es establecer qué se entiende por voz normal. Acta Otorrinolaringol Esp 2001; 52: 476-482 479 J. C. CASADO MORENTE ET AL. ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL Y DISFONÍA Tabla 4: Comparación entre los grupos normal, disfonía por nódulos y disfonía por pólipos Variables Normales (media y desv. típica) Disfonía por Nódulos (media y desv. típica) Disfonía por Pólipos (media y desv. típica) P Jitter 0,24-0,14 0,35-0,08a 0,50-0,40a,b <0,0001 Shimmer 2,10-0,95 3,25-0,86a 4,34-2,46a,b <0,0001 –8,24-4,93a,b <0,0001 <0,0001 <0,0001 NNE –13,62-4,27 –10,65-3,95a HNR 24,07-3,3 25,21-3,04 29,63-4,80 a,b SNR 24,49-5,44 25,55-3,26 28,22-4,47 a,b 204,87-29,75 183,61-33,39 Mean Fo a 167,10-34,53 a,b 0,035 : Indica diferencias significativas (p<0,05) con respecto al grupo NORMAL (test de Scheffe). b : Indica diferencias significativas (p<0,05) con respecto al grupo D.F.N. (test de Scheffe). a Según Aronson 5 “hay alteración de la voz cuando difiere de las voces de otras personas del mismo sexo y similar edad y grupo cultural en timbre, tono, volumen y flexibilidad en la dicción. El concepto de voz normal, con criterios objetivos y absolutos, no existe”. Tal y como está el problema planteado respecto al concepto de una voz normal, la siguiente cuestión sería averiguar de qué forma podemos obtener un grupo de control (con supuesta voz normal) con el que hacer las distintas comparaciones con grupos patológicos (por ejemplo, nódulos vocales, pólipos, edema de Reinke, parálisis recurrencial, etc.). Los distintos autores6,7 a lo largo de los últimos años consideran que un paciente no fumador, sin historia previa de trastorno vocal, sin problemas respiratorios, neurológicos, nasosinusales y faringolaríngeos previos, sin antecedentes de alergia, con una audición normal y sin uso profesional de la voz, es el que más se acerca a lo que se considera “voz normal”. En el presente trabajo hemos escogido como control a un grupo que reunía estas características. La laringoestroboscopia es el más importante avance tecnológico en el diagnóstico laríngeo con la posible excepción de la fibrolaringoscopia8. Esta técnica suministra en cualquier disfonía toda la información clínica necesaria; así nos permite detectar asimetrías vibratorias, anormalidades estructurales, pequeñas masas, cicatrices submucosas, y otras condiciones que son invisibles bajo luz ordinaria. También es extremadamente sensible para detectar fijación de las cuerdas ante mínimas neoplasias laríngeas, en pacientes que estamos controlando afectos de leucoplasia o post-radioterapia. Nuestro método maneja el telaringoscopio de 70º, ya que suministra una imagen de alta calidad, nitidez y tamaño. En el caso de pacientes con excesivo reflejo nauseoso, se prefiere el fibrolaringoscopio. El protocolo subjetivo de obtención de datos está basado en el empleado por Hirano y Bless. El análisis acústico proporciona información sobre la calidad de la voz; no sólo tiene la ventaja de ser una téc- 480 nica diagnóstica no invasiva, sino que también suministra una información cuantitativa para el estudio de la función vocal. Además todos los resultados y gráficos obtenidos pueden ser archivados y exportados a la mayor parte de los softwares existentes en el mercado. Dado que la función vocal es un fenómeno multidimensional, cualquier medida simple de la voz obtendría una información parcial de la función vocal. Por lo tanto, según las tendencias actuales9,10 el análisis multidimensional de varios parámetros acústicos es más fidedigno para describir voces patológicas. La frecuencia fundamental se define como el número de ciclos glóticos que se producen en la unidad de tiempo. Es una de las mediciones presentes en la mayoría de sistemas informáticos para el estudio de los parámetros acústicos de la voz; sin embargo, no todos ellos utilizan la misma estrategia de extracción de Fo, ni utilizan la misma señal (señal microfónica, señal laringográfica). En nuestro trabajo se obtienen unos valores absolutos medios de la Fo de 263.33 para mujeres y 139.72 para hombres. Las diferencias en la medida de la Fo entre los distintos estudios11 pueden ser debidas, al margen de la propia variabilidad de las mediciones, a cuestiones metodológicas. La tarea realizada para obtener el fragmento a analizar influye en la frecuencia fundamental. De igual forma, la Fo obtenida en la emisión de una vocal prolongada suele resultar algo más elevada que la promediada en lectura o voz conversacional. La frecuencia fundamental de la voz puede sufrir variaciones a lo largo de los años como consecuencia de los cambios tisulares que tienen lugar. Así, se ha visto que en los varones entre los veinte y cincuenta años la media de la Fo disminuye ligeramente, para a partir de la 5ª década incrementar progresivamente, siendo esto más marcado a partir de los sesenta y cinco años. Por esto se puede detectar una frecuencia más aguda entre los varones de mayor edad. Por el contrario, en las mujeres se suele asumir una caída gradual de la fre- Acta Otorrinolaringol Esp 2001; 52: 476-482 ACTA OTORRINOLARINGOLÓGICA ESPAÑOLA cuencia fundamental desde la juventud. En nuestro estudio, al estar limitado a sujetos cuya edad está comprendida entre 20 y 40 años, estas diferencias no influyen12. De cualquier forma la determinación de la frecuencia fundamental tiene un gran interés en la clínica diaria, ya que las variaciones de la misma pueden traducir el estado de las cuerdas vocales. Así un paciente con un nódulo o pólipo en sus cuerdas vocales experimentará un descenso de su Fo debido al aumento de la masa que se produce13. Esta tendencia es observada en nuestro estudio, principalmente en el grupo de las DP, que presentaba valores sensiblemente inferiores respecto al grupo de los normales y al de las DN. Durante la fonación normal se producen variaciones de carácter involuntario llamadas perturbaciones. Como ya sabemos, la perturbación de la frecuencia fundamental se denomina jitter y la de la intensidad, shimmer. Ambas expresan el grado de inestabilidad del sistema fonatorio durante la producción vocal. La laringe no es, por tanto, una máquina perfecta. Parece lógico pensar que unas cuerdas vocales en las que hubiera algún tipo de alteración estructural producirían un mayor número de ciclos erráticos. Varios investigadores14 han intentado usar las medidas de estas perturbaciones para discriminar varios tipos de patología laríngea. Desafortunadamente, parece haber demasiada diversidad entre ellos en la forma de definir y medir los distintos parámetros (diferentes instrumentos de grabación utilizados, diferencias en el proceso de conversión de la señal analógica a una señal digital, añadido a que cada autor utiliza un software diferente y algoritmos distintos en el análisis de la señal acústica). Todo esto dificulta en gran medida la comparación de nuestros resultados con los de otros autores15; incluso hoy en día siguen apareciendo programas que analizan la voz y que modifican en uno u otro sentido a los precedentes. Debi- do a esto los valores normales de jitter y shimmer varían de unos estudios a otros, como se puede apreciar en la Tabla 5. En general, se observa que las voces patológicas16 tienen valores más altos de jitter y shimmer que las voces normales. Nuestro estudio aporta un valor medio de jitter y shimmer en controles sanos de 0.24% y 2.10%, respectivamente y se confirma esta tendencia, apareciendo valores del jitter y shimmer más altos en el grupo de las DN, siendo estos estadísticamente significativos respecto, tanto con el grupo de los normales, como con el de las DP. El Ruido Glótico es el parámetro acústico que calcula la relativa magnitud de energía de ruido laríngeo resultante del cierre incompleto glótico durante la fonación. Es ampliamente conocido que el grado de percepción de voz aérea o espirante en una laringe patológica está fielmente relacionado con la cantidad de ruido glótico presente en la señal vocal. Las tres medidas más conocidas de este ruido glótico son: Signal to Noise ratio de Kojima (SNR la menos utilizada, aunque algunos trabajos destacan su utilidad en la detección del tipo y la severidad de la disfonía), Normalized Noise Energy (NNE) de Kasuya y Harmonics-to-Noise Ratio (HNR) de Yumoto17. HNR es ampliamente usado en EEUU, mientras que NNE es más usado en Japón, Europa y China. Nuestro estudio confirma, al igual que el de otros autores18 que, en general, las voces patológicas, tienen unos valores más altos que las voces normales. En nuestro trabajo el grupo de las DP presentó unos valores mayores y estadísticamente significativos de NNE respecto a los grupos normales y DN; sin embargo los valores de HNR y SNR no fueron estadísticamente significativos. Probablemente, se deba a que con el software “Dr Speech Science” la mejor forma de discriminar voces patológicas es con NNE. Tabla 5: Valores normales de Jitter y Shimmer Estudio N.º sujetos estudiados (n) Frecuencia empleada Fragm. estudio Unidad Jitter Jitter (media) Unidad Shimmer Shimmer (media) Milenkovic, 1988 6 8,3 KHz 2” Microseg. 0,23 % 1,90 Titze y col., 1987 2 100 KHz 30 ciclos % 0,30 % 00,80 Haji y col., 1986 ¿ 20 KHz 50 ciclos Semitonos 0,10 DB 0,141 Ramig y Ringel, 1983 48 40 KHz ¿? % 0,50 DB 0,35 Horii, 1980 31 40 KHz 3” % 0,64 DB 0,39 Horii, 1979 Koike y col., 1977 Nuestro estudio, 2000 6 40 KHz 100 ciclos Microseg. 0,36 ¿? ¿? 31 20 KHz <50 ciclos % 0,008 % 0,030 100 44,1 KHz 30 ciclos % 0,24 % 2,10 Acta Otorrinolaringol Esp 2001; 52: 476-482 481 sumario J. C. CASADO MORENTE ET AL. ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL Y DISFONÍA Para finalizar debemos hacernos cierta autocrítica ya que el análisis acústico de la voz presenta algunos inconvenientes19 como el no poder comparar los resultados obtenidos debido a que los algoritmos de cálculo que emplean los distintos programas no son similares; además, estos resultados numéricos son de difícil interpretación sin tener en cuenta la base de datos del propio programa (que generalmente pertenecen a sujetos de otro idioma). La espectrografía, que nos permite el estudio de los distintos componentes frecuenciales de la voz humana a través de un gráfico en el que se representan los armónicos y formantes 20, carece de las limitaciones comentadas anteriormente. No obstante, las limitaciones y utilidades de estos métodos se van comprendiendo según se avanza en su uso. laringoestroboscopia y el análisis de los principales parámetros acústicos vocales. 2. Los pacientes con una disfonía funcional mostraron unos resultados patológicos representados por un descenso de la frecuencia fundamental, un aumento de las perturbaciones de la frecuencia (jitter), un aumento de las perturbaciones de la intensidad (shimmer) y un aumento del Ruido Glótico (NNE, HNR, SNR). 3. Dentro de los pacientes disfónicos se detectaron mayores alteraciones en el grupo de la disfonía por pólipos vocales. CONCLUSIONES La realización de este trabajo fue posible gracias a la inestimable y desinteresada ayuda del Dr. D. Emilio Perea-Milla López, Responsable de Investigación del Hospital Costa del Sol de Marbella. 1. El estudio de la voz debe tender a la valoración objetiva de la misma. Esto se puede realizar mediante la AGRADECIMIENTOS REFERENCIAS 1.- Papsin B. The developing role of paediatric voice clinic: a review of our experience. J Laryngol Otol 1996;110:1022-1026. 7.- Jafari M, Till J, Truesdell L y cols. Time-shift, trial and gender effects on vocal perturbation measures. J Voice 1993;7:326-336. 2.- Stemple J. Objetive measures of voice production in normal subject following prolonged voice use. J Voice 1999;9:127-133. 8.- Sataloff RT, Spiegel JR, Carroll LM y cols. Strobovideostroboscopy in profesional voice users: results and clinic value. J Voice 1988;1:359364. 3.- Nuñez F, Suárez C, Moro M y cols. Evaluación objetiva de la patología vocal en la infancia.Acta Otorrinolaringol Esp 1999;50:525-529. 4.- Ford CN, Bless D. Phonosurgery Asessment and surgical management of voice disorders. New York. De Raven press 1991:546-567. 5.- Aronson A. Clinical voice disorders. An interdisciplinary approach. Nueva York: Thieme Inc, 1985. 6.- Fernández R, Damborenea D, Rueda P y cols. Análisis acústico de la voz en adultos no fumadores. Acta Otorrinolaringol Esp 1999;50:134-141. 482 9.- Karnell MP, Hall KD, Landhahl KR. Comparison of fundamental frequency and perturbations measurements among three analysis systems. J Voice 1995; 9:378-382, 10.- Titze IR, Winholtz WS. Effect of microphone type and placement on voice perturbation measurements. J Speech Hear Res 1993;36:11771190. 11.- Bielamowicz S, Kreiman J, Gerralt BR y cols. Comparison of voice analysis systems for perturbation measurements. J Speech Hear Res 1996;39:126-134. 12.- Brown W. Morris R, Hollien H y cols. Speaking fundamental frequency characteristics as a function of age and proffesional singing. J Voice 1991;5:310-315. 13.- Hoghikan N, Apel S, Guinn L y cols. Vocal folds nodules in adult singers: Regional opinions about etiologic factors, carees impact, and treatment. A surgey of otolaryngologicts, speech pathologics, and teachers of singing. J Voice 1999;13:128-142. 14.- Titze Y, Horii Y, Scherer R. Some technical considerations in voice perturbation measurements. J Speech Hear Res 1987;30:252-260. 15.- Preciado JA, Fernández S. El análisis digital de la señal acústica en el diagnóstico de la patología vocal. Sensibilidad y especificidad de las medidas del shimmer y del jitter. Acta Otorrinolaringol Esp 1998;49:475-481. Acta Otorrinolaringol Esp 2001; 52: 476-482 16.- Wolfe V, Martin D. Acoustic correlates of dysphonia: type and severity. J Commund Disor 1997;30:415-419. 17.- Yumoto E, Goruld W, Bear T. Harmonic-to-Noise ratio as an index of the degree of hoarseness. J Acoust Soc Am 1982;71:1544-1550. 18.- Huan Z, Minifie F y cols. Measures of vocal function during changes in vocal effort level. J Voice 1995;9:429-438. 19.- Nuñez-Batalla F, Suárez–Nieto C, Maldonado-Fernández M y cols. Aplicación del espectrograma de banda estrecha en fonocirugía. Acta Otorrinolaringol Esp 2000;51:243245. 20.- Nieto A, Cobeta I, Gamboa FJ y cols. La relación armónico/ruido y el análisis espectrográfico en la patología de abuso vocal. Acta Otorrinolaringol Esp 1996;47:370-376.