estudio objetivo de la voz en población normal y en la disfonía por

Anuncio
sumario
Acta Otorrinolaringol Esp 2001; 52: 476-482
INVESTIGACIÓN CLÍNICA APLICADA
ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL
Y EN LA DISFONÍA POR NÓDULOS Y PÓLIPOS VOCALES
J. C. CASADO MORENTE *, J. A. ADRIÁN TORRES **, M. CONDE JIMÉNEZ *, D. PIÉDROLA MAROTO *,
V. POVEDANO RODRÍGUEZ *, E. MUÑOZ GOMARIZ ***, E. CANTILLO BAÑOS ****, A. JURADO RAMOS ****
*SERVICIO DE OTORRINOLARINGOLOGÍA, HOSPITAL “COSTAL DEL SOL”, MARBELLA
**DIPLOMATURA DE LOGOPEDIA, FACULTAD DE PSICOLOGÍA, UNIVERSIDAD DE MÁLAGA.
***DEP. BIOESTADÍSTICA, FACULTAD DE MEDICINA, UNIVERSIDAD DE CÓRDOBA
****SERVICIO DE OTORRINOLARINGOLOGÍA, HOSPITAL UNIVERSITARIO “REINA SOFÍA”, CÓRDOBA
RESUMEN
P
resentamos un estudio sobre la evaluación objetiva de la voz en
100 adultos sanos y en 60 sujetos con disfonía por nódulos o
pólipos vocales. A todos se les realizó una laringoestroboscopia
y un análisis acústico vocal. Se registró y digitalizó la vocal “a” con el
programa Dr. Speech Science. Se estimaron los parámetros: frecuencia
fundamental (Fo, expresada en función del sexo), jitter, shimmer y Ruido
Glótico (NNE, HNR y SNR). La Fo en el grupo normal fue de 139.72 en
varones y 267.33 en mujeres, jitter 0.24 y shimmer 2.10. En pacientes
disfónicos por nódulos Fo fue 126.96 en varones y 240.72 en mujeres,
jitter 0.35 y shimmer 3.25. En pacientes disfónicos por pólipos Fo fue
119.75 en varones y 218.26 en mujeres, jitter 0.50 y shimmer 4.34. Todas estas diferencias fueron estadísticamente significativas. El Ruido
Glótico en población normal fue de: NNE –13.62, HNR 24.07 y SNR
24.49; en pacientes con nódulos: NNE –10.65, HNR 25.21 y SNR
25.55; en pacientes con pólipo vocal: NNE –8.24, HNR 29.63 y SNR
28.22. Sólo existió diferencia estadísticamente significativa en el parámetro NNE. Destacamos la importancia de la valoración objetiva de los
trastornos de la voz.
PALABRAS CLAVE: Análisis acústico. Voz. Disfonía (nódulos y pólipos)
ABSTRACT
STUDY OBJETIVE OF VOICE IN NORMAL POBLATION
AND DISPHONIA FOR NODULES AND POLYPS
A
study of the objetive evaluation of voice was made of 100 voices of healthy adults and 60 with disphonia (nodules and
polyps). A laryngostroboscopy and an acoustic analysis was
made to everyone. A sustained vowel “a” was carried out and digitalized with Dr. Speech Science software. These parameters were estimated: fundamental frequency (Fo, accourding to gender), Jitter,
Shimmer and glottic noise (NNE, HNR, SNR). In the healthy group Fo
was 139.72 in men and 267.33 in women, jitter 0.24 and shimmer
2.10. In disphonic patiens (nodules) Fo was 126.96 in men and
240.72 in women, jitter 0.35 and shimmer 3.25. In disphonic patiens
(polyps) Fo was 119.75 in men and 218.26 in women, jitter 0.50 and
shimmer 4.34. These difference were statistically significant. Glottic
Noise in healthy group was: NNE –13.62, HNR 24.07 and SNR
24.49; in disphonic patiens (nodules) was: NNE –10.65, HNR 25.21
and SNR 25.55; in disphonic patiens (polyps) was: NNE –8.24, HNR
29.63 and SNR 28.22. Only the difference in the NNE was statistically
significant. We highlight the importance of objetive evaluation of voice
disorders.
KEY WORDS: Acoustic analysis. Voice. Disphonia (nodules, polyps).
Correspondencia: Juan Carlos Casado Morente. Servicio de Otorrinolaringología. Hospital Costa del Sol.
Ctra. Nacional 340, Km. 187. 29600 Marbella. E-mail: [email protected]
Fecha de recepción: 17-1-2001
476
Acta Otorrinolaringol Esp 2001; 52: 476-482
ACTA OTORRINOLARINGOLÓGICA ESPAÑOLA
INTRODUCCIÓN
Sujetos
A lo largo de la última década se ha producido un
aumento por el interés de la voz humana y sus trastornos1. La preocupación por los problemas de la voz es un
indicador fiable de la cultura de un pueblo. Así lo es en la
medida en que pasa de considerarse una atención médica de lujo, para unos cuantos profesionales de la voz o
cantantes de élite, a formar parte del concepto de salud
en su sentido más amplio, al alcance de todos. Ya ha
pasado el momento en que la patología de la voz se consideraba una consecuencia inevitable de una grave enfermedad de base, que era la importante, o un problema
otorrinolaringológico menor, al que un individuo debía, en
la mayor parte de los casos, acostumbrarse2.
Los trastornos de la voz cobran su máxima importancia cuando el propio individuo los concibe como la alteración de un parámetro vital que le causa sufrimiento o
incapacidad de adaptarse al medio (social o laboral). Esto
es, en definitiva, lo que le hace acudir el médico otorrinolaringólogo, que es el profesional que debe valorar en primer lugar toda patología vocal3.
Hasta hace relativamente poco tiempo la valoración
objetiva y exacta de la voz era inexistente. Muchos otorrinolaringólogos opinaban que los únicos instrumentos
que se requerían para el estudio de la voz son el propio
oído y los espejos laríngeos y que la llamada valoración
objetiva y los novedosos “juguetes informáticos” resultaban innecesarios. Sin embargo, los tiempos cambian y
como cualquier función humana, la voz puede padecer
alteraciones y su patología debe ser investigada. Al mismo tiempo esta investigación tiende a la objetivación de
la alteración fonatoria con tres fines principales: a) para
comparar resultados post-tratamiento (médico, logopédico o quirúrgico), b) para poder realizar comparaciones
inter-institucionales y c), cada vez más frecuente, para
solucionar conflictos médico-legales.
La valoración objetiva de la voz se puede realizar
mediante el estudio morfo-funcional (exploración física
del órgano fonatorio con la laringoestroboscopia) y el
análisis acústico vocal (estudio de los principales parámetros acústicos que componen la voz humana).
El objetivo del presente trabajo es realizar un estudio
objetivo de la voz en sujetos normales y en pacientes con
disfonía por nódulos y pólipos, así como cuantificar las
diferencias existentes entre ellos.
Para el grupo control se ha utilizado a 100 adultos, 57
hombres y 43 mujeres. La edad media fue de 27 años
(rango entre 20 y 40 años, desviación típica 5).
Todos los sujetos eran voluntarios y no estaban familiarizados con la naturaleza de la investigación, tenían un
lenguaje y una audición normal, sin historia previa de
trastornos de la voz en los dos meses previos. Todos
eran no fumadores, con buen estado general de salud,
libres de alergia o cualquier problema respiratorio, congestión nasal o inflamación faringo-laríngea. Ninguno
estaba tomando medicación alguna. Ninguno de los
voluntarios tenía como profesión aquella que abusa de su
voz, bien hablada o cantada.
Para el grupo patológico hemos utilizado a 60 pacientes disfónicos distribuidos de la siguiente forma:
• 30 disfonías por nódulos vocales (DN); 11 hombres
y 19 mujeres, edad media 32 años (rango entre 38 y 25
años, desviación típica 3).
• 30 disfonías por pólipo vocal (DP); 17 hombres y 13
mujeres, edad media 35 años (rango entre 42 y 19 años,
desviación típica 5).
Todos ellos remitidos al Laboratorio de Voz desde las
consultas básicas de ORL.
MATERIAL Y MÉTODOS
Planteamos un estudio de prevalencia de las alteraciones morfofuncionales y acústicas en dos grupos de
pacientes disfónicos (disfonía por nódulos vocales -DN- y
disfonía por pólipo vocal –DP-) y en otro de controles
sanos.
Material instrumental o técnico
Para la valoración de la onda vibratoria (exploración
morfofuncional) hemos empleado: Telelaringoscopio
Richard Wolf de 70º, Fibrolaringoscopio Machida ENT30P-III, Cámara Fiegert Endotech CCD en color CD5131,
super-VHS y Estrobosocopio Richard Wolf 5012 con
fuente de luz fría.
Para el análisis acústico vocal se usó la aplicación
“Voice Assessment” del programa Dr. Speech Science
versión 3.0. La infraestructura necesaria fue: Ordenador
personal Pentium, con 8 Mb de RAM y a 66 Mhz bajo
entorno Windows (3.1 o superior), tarjeta de sonido
(Sound Blaster-Pro) y altavoces y micrófono profesional
de 600 ohmios de impedancia.
Metodología
De forma rutinaria se realizó en todos los individuos
una laringoestroboscopia usando el Telelaringoscopio. En
18 pacientes (10 del grupo normal, 5 del grupo DN y 3 del
DP) debido al excesivo reflejo nauseoso se sustituyó por
el fibrolaringoscopio. En ambos casos empleamos un
modelo de recogida de datos, tomado de Ford y Bless4.
Posteriormente se realizó el análisis acústico vocal.
Para ello hacemos fonar al sujeto la letra /a/ tras inspiración normal en su habitual y confortable tono e inten-
Acta Otorrinolaringol Esp 2001; 52: 476-482
477
J. C. CASADO MORENTE ET AL. ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL Y DISFONÍA
sidad, situando el micrófono a una distancia estándar de
los labios del sujeto de unos 15 cm y apuntando hacia
la boca con una cierta angulación (aproximadamente
45º).
Cada sujeto fue grabado individualmente en la misma
habitación insonorizada, de manera que las condiciones
de ruido ambiental son similares. Se consiguen tres mediciones de cada vocal en el mismo sujeto, obteniéndose
los valores medios. Escogemos un fragmento homogéneo de grabación (aproximadamente 50 ciclos vibratorios)
que corresponde a un segundo de la porción media de
cada registro vocal y procedemos a su análisis. La frecuencia de muestreo elegida fue de 44.1 KHz; los extremos para el cálculo de la frecuencia fundamental fueron
entre 80-400 Hz.
Una vez digitalizada la señal el programa calculó
estos parámetros:
a) jitter (variación de la frecuencia ciclo a ciclo). Fue
calculado como la razón de la variabilidad absoluta ciclo
a ciclo de la frecuencia dividido entre la frecuencia media;
se expresa en porcentaje.
b) shimmer (variación de la amplitud ciclo a ciclo).
Fue determinado como la razón de la variabilidad absoluta ciclo a ciclo de la amplitud dividido entre la amplitud
media; también es expresada en porcentaje.
c) ruido glótico (representa el ruido laríngeo resultante del paso de aire durante la fonación a través de un
cierre glótico imcompleto). Se obtiene mediante tres
medidas distintas:
• Energía del Ruido Normalizado que se conoce con
las siglas NNE (Normalized Noise Energy): se obtiene al
extraer la energía armónica de la señal de la energía
acústica total. Se expresa en decibelios (dB).
• Relación Armónicos-Ruido, se conoce como HNR
(Harmonic-to-Noise Ratio): se obtiene mediante la relación entre la energía acústica de los armónicos y el ruido
generado por la presencia de turbulencias del flujo aéreo.
Se expresa en dB.
• Relación Señal-Ruido que se conoce como SNR
(Signal-to-Noise Ratio) : corresponde a la relación entre
energía total de la señal hablada y la del ruido (señal
aperiódica) Se expresa en dB.
d) La media de la Fo (expresada como MEAN Fo,
donde Fo es la frecuencia fundamental de vibración de
las cuerdas vocales). Este parámetro se expresa en función del sexo y en Hz.
intervalos de confianza al 95% de seguridad para cada
uno de los tres grupos, así como sus desviaciones típicas y sus valores máximo y mínimo.
Para las comparaciones entre las medias de los tres
grupos para las distintas variables se utilizó análisis de
varianza de un factor. Las comparaciones a posteriori se
efectuaron con la prueba de Scheffé; se consideraron
como significativos aquellos valores de “p” inferiores a
0.05 (error tipo I).
RESULTADOS
Estudio morfo-funcional
(laringoestroboscopia)
Son subjetivos y, obviamente sólo reflejan lo obtenido
en los grupos patológicos.
En el grupo de DN las imágenes morfológicas obtenidas mediante laringoestroboscopia revelaron la existencia
de dos nódulos a nivel del tercio medio de la glotis membranosa. Unas veces de carácter edematoso (en 10
casos), que casi queda ocultado con la onda vibratoria al
estar en la misma fase de frecuencia y otras, de aspecto queratinizado (en los 20 restantes) con diferencia de
fase vibratoria con respecto al de la cuerda vocal (casos
más evolucionados). Hay signos evidentes de hiperfunción: onda vocal de amplitud reducida, aperiódica con
respecto a la otra, con hiato irregular o en cascanueces y
mucosa espesa a nivel del segmento supraglótico y gloto-subglótico. Predominio de la fase de apertura sobre la
de cierre.
En el grupo de DP se obtuvieron imágenes polipoideas; todas fueron unilaterales. Los de carácter angiomatoso (sólo en 5 casos) se sitúan generalmente en la cara
superior de la cuerda; si persisten en el tiempo han creado una zona de queratosis o edema fusiforme leve en la
cuerda contralateral. La onda vocal se encuentra alterada
en su amplitud (reducida) y frecuencia (aperiódica) con
respecto a la opuesta. Aparece un hiato glótico irregular.
Aquellos casos en los que el pólipo asienta en la cara
superior o inferior de la cuerda vocal, no aparece hiato
glótico o éste es mínimo, apreciándose perfectamente el
acompañamiento que hace el pólipo (sobre todo sí es
muy edematoso y algo sésil) de la onda vibrátil.
Análisis acústico vocal
Análisis estadístico
Se crearon tres bases de datos mediante la hoja de
cálculo Excel versión 5.0. El paquete estadístico utilizado
fue SPSS para Windows versión 7.5.
Para el estudio de los parámetros acústicos de los
pacientes con disfonía se calcularon las medias con sus
478
Los valores del grupo control aparecen en la Tabla 1,
los del grupo de DN en la Tabla 2 y los del grupo DP en
la Tabla 3. Se expresan los valores correspondientes a la
media aritmética, desviación típica, intervalos de confianza al 95% así como los valores máximo y mínimo de cada
una de las variables.
Acta Otorrinolaringol Esp 2001; 52: 476-482
ACTA OTORRINOLARINGOLÓGICA ESPAÑOLA
Tabla 1: Valores de los parámetros acústicos del grupo normal
Variables
Jitter
Shimmer
Media
0,24
Desviación típica
Intervalos Confianza (al 95%)
Valores Máx/Mín
0,14
0,20 a 0,26
0,88/0,10
2,10
0,95
1,90 a 2,28
5,99/0,88
NNE
–13,62
4,27
–14,47 a –12,78
–3,60/–23,09
HNR
24,07
3,30
23,41 a 24,72
33,02/13,82
SNR
24,49
5,44
23,40 a 25,56
67,69/14,05
Fo (varones)
139,72
19,14
Fo (mujeres)
267,33
25,32
Mean Fo
204,87
29,75
159,28 a 250,45
221,31/95,26
Tabla 2: Valores de los parámetros acústicos del grupo disfonía por nódulos
Variables
Media
Desviación típica
Intervalos Confianza (al 95%)
Valores Máx/Mín
Jitter
0,35
0,08
0,22 a 0,27
0,47/0,14
Shimmer
3,25
0,86
1,93 a 2,57
4,50/1,16
NNE
–10,65
3,95
–13,12 a –10,18
–3,76/–17,84
HNR
25,21
3,04
24,07 a 26,34
30,21/17,33
24,33 a 26,76
30,21/17,44
171,14 a 196,07
291,35/127,65
SNR
25,55
3,26
Fo (varones)
126,96
23,63
Fo (mujeres)
240,72
20,32
Mean Fo
183,61
33,39
Tabla 3: Valores de los parámetros acústicos del grupo disfonía por pólipos
Variables
Media
Desviación típica
Intervalos Confianza (al 95%)
Valores Máx/Mín
Jitter
0,50
0,40
0,35 a 0,65
1,61/0,13
Shimmer
4,34
2,46
3,42 a 5,25
10,87/1,35
NNE
–8,24
4,93
–10,08 a –6,37
–2,24/18,17
HNR
29,63
4,80
17,83 a 21,41
27,49/10,83
SNR
28,22
4,47
18,55 a 21,89
27,51/11,31
Fo (varones)
119,75
36,17
Fo (mujeres)
218,26
29,83
Mean Fo
167,10
34,53
154,20 a 180,00
222,31/110,51
En la Tabla 4 aparecen los valores de la media y
desviación típica de cada una de las variables de los
tres grupos de estudio así como las comparaciones
entre los mismos y su grado de significación estadística
(P).
DISCUSIÓN
El primer problema que nos encontramos al estudiar y
comparar distintas voces es establecer qué se entiende
por voz normal.
Acta Otorrinolaringol Esp 2001; 52: 476-482
479
J. C. CASADO MORENTE ET AL. ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL Y DISFONÍA
Tabla 4: Comparación entre los grupos normal, disfonía por nódulos y disfonía por pólipos
Variables
Normales
(media y desv. típica)
Disfonía por Nódulos
(media y desv. típica)
Disfonía por Pólipos
(media y desv. típica)
P
Jitter
0,24-0,14
0,35-0,08a
0,50-0,40a,b
<0,0001
Shimmer
2,10-0,95
3,25-0,86a
4,34-2,46a,b
<0,0001
–8,24-4,93a,b
<0,0001
<0,0001
<0,0001
NNE
–13,62-4,27
–10,65-3,95a
HNR
24,07-3,3
25,21-3,04
29,63-4,80
a,b
SNR
24,49-5,44
25,55-3,26
28,22-4,47
a,b
204,87-29,75
183,61-33,39
Mean Fo
a
167,10-34,53
a,b
0,035
: Indica diferencias significativas (p<0,05) con respecto al grupo NORMAL (test de Scheffe).
b
: Indica diferencias significativas (p<0,05) con respecto al grupo D.F.N. (test de Scheffe).
a
Según Aronson 5 “hay alteración de la voz cuando
difiere de las voces de otras personas del mismo sexo y
similar edad y grupo cultural en timbre, tono, volumen y
flexibilidad en la dicción. El concepto de voz normal, con
criterios objetivos y absolutos, no existe”.
Tal y como está el problema planteado respecto al
concepto de una voz normal, la siguiente cuestión sería
averiguar de qué forma podemos obtener un grupo de
control (con supuesta voz normal) con el que hacer las
distintas comparaciones con grupos patológicos (por
ejemplo, nódulos vocales, pólipos, edema de Reinke,
parálisis recurrencial, etc.). Los distintos autores6,7 a lo
largo de los últimos años consideran que un paciente no
fumador, sin historia previa de trastorno vocal, sin problemas respiratorios, neurológicos, nasosinusales y faringolaríngeos previos, sin antecedentes de alergia, con una
audición normal y sin uso profesional de la voz, es el que
más se acerca a lo que se considera “voz normal”. En el
presente trabajo hemos escogido como control a un grupo que reunía estas características.
La laringoestroboscopia es el más importante avance
tecnológico en el diagnóstico laríngeo con la posible
excepción de la fibrolaringoscopia8. Esta técnica suministra en cualquier disfonía toda la información clínica necesaria; así nos permite detectar asimetrías vibratorias,
anormalidades estructurales, pequeñas masas, cicatrices
submucosas, y otras condiciones que son invisibles bajo
luz ordinaria. También es extremadamente sensible para
detectar fijación de las cuerdas ante mínimas neoplasias
laríngeas, en pacientes que estamos controlando afectos
de leucoplasia o post-radioterapia. Nuestro método
maneja el telaringoscopio de 70º, ya que suministra una
imagen de alta calidad, nitidez y tamaño. En el caso de
pacientes con excesivo reflejo nauseoso, se prefiere el
fibrolaringoscopio. El protocolo subjetivo de obtención de
datos está basado en el empleado por Hirano y Bless.
El análisis acústico proporciona información sobre la
calidad de la voz; no sólo tiene la ventaja de ser una téc-
480
nica diagnóstica no invasiva, sino que también suministra
una información cuantitativa para el estudio de la función
vocal. Además todos los resultados y gráficos obtenidos
pueden ser archivados y exportados a la mayor parte de
los softwares existentes en el mercado. Dado que la función vocal es un fenómeno multidimensional, cualquier
medida simple de la voz obtendría una información parcial de la función vocal. Por lo tanto, según las tendencias
actuales9,10 el análisis multidimensional de varios parámetros acústicos es más fidedigno para describir voces patológicas.
La frecuencia fundamental se define como el número
de ciclos glóticos que se producen en la unidad de tiempo. Es una de las mediciones presentes en la mayoría de
sistemas informáticos para el estudio de los parámetros
acústicos de la voz; sin embargo, no todos ellos utilizan
la misma estrategia de extracción de Fo, ni utilizan la misma señal (señal microfónica, señal laringográfica). En
nuestro trabajo se obtienen unos valores absolutos
medios de la Fo de 263.33 para mujeres y 139.72 para
hombres. Las diferencias en la medida de la Fo entre los
distintos estudios11 pueden ser debidas, al margen de la
propia variabilidad de las mediciones, a cuestiones metodológicas. La tarea realizada para obtener el fragmento a
analizar influye en la frecuencia fundamental. De igual
forma, la Fo obtenida en la emisión de una vocal prolongada suele resultar algo más elevada que la promediada
en lectura o voz conversacional.
La frecuencia fundamental de la voz puede sufrir
variaciones a lo largo de los años como consecuencia
de los cambios tisulares que tienen lugar. Así, se ha visto que en los varones entre los veinte y cincuenta años
la media de la Fo disminuye ligeramente, para a partir
de la 5ª década incrementar progresivamente, siendo
esto más marcado a partir de los sesenta y cinco años.
Por esto se puede detectar una frecuencia más aguda
entre los varones de mayor edad. Por el contrario, en
las mujeres se suele asumir una caída gradual de la fre-
Acta Otorrinolaringol Esp 2001; 52: 476-482
ACTA OTORRINOLARINGOLÓGICA ESPAÑOLA
cuencia fundamental desde la juventud. En nuestro
estudio, al estar limitado a sujetos cuya edad está comprendida entre 20 y 40 años, estas diferencias no influyen12.
De cualquier forma la determinación de la frecuencia
fundamental tiene un gran interés en la clínica diaria, ya
que las variaciones de la misma pueden traducir el estado de las cuerdas vocales. Así un paciente con un nódulo o pólipo en sus cuerdas vocales experimentará un descenso de su Fo debido al aumento de la masa que se
produce13. Esta tendencia es observada en nuestro estudio, principalmente en el grupo de las DP, que presentaba valores sensiblemente inferiores respecto al grupo de
los normales y al de las DN.
Durante la fonación normal se producen variaciones
de carácter involuntario llamadas perturbaciones. Como
ya sabemos, la perturbación de la frecuencia fundamental se denomina jitter y la de la intensidad, shimmer.
Ambas expresan el grado de inestabilidad del sistema
fonatorio durante la producción vocal. La laringe no es,
por tanto, una máquina perfecta. Parece lógico pensar
que unas cuerdas vocales en las que hubiera algún tipo
de alteración estructural producirían un mayor número de
ciclos erráticos.
Varios investigadores14 han intentado usar las medidas de estas perturbaciones para discriminar varios tipos
de patología laríngea. Desafortunadamente, parece haber
demasiada diversidad entre ellos en la forma de definir y
medir los distintos parámetros (diferentes instrumentos de
grabación utilizados, diferencias en el proceso de conversión de la señal analógica a una señal digital, añadido a
que cada autor utiliza un software diferente y algoritmos
distintos en el análisis de la señal acústica). Todo esto
dificulta en gran medida la comparación de nuestros
resultados con los de otros autores15; incluso hoy en día
siguen apareciendo programas que analizan la voz y que
modifican en uno u otro sentido a los precedentes. Debi-
do a esto los valores normales de jitter y shimmer varían
de unos estudios a otros, como se puede apreciar en la
Tabla 5.
En general, se observa que las voces patológicas16
tienen valores más altos de jitter y shimmer que las voces
normales. Nuestro estudio aporta un valor medio de jitter
y shimmer en controles sanos de 0.24% y 2.10%, respectivamente y se confirma esta tendencia, apareciendo
valores del jitter y shimmer más altos en el grupo de las
DN, siendo estos estadísticamente significativos respecto, tanto con el grupo de los normales, como con el de las
DP.
El Ruido Glótico es el parámetro acústico que calcula
la relativa magnitud de energía de ruido laríngeo resultante del cierre incompleto glótico durante la fonación. Es
ampliamente conocido que el grado de percepción de voz
aérea o espirante en una laringe patológica está fielmente relacionado con la cantidad de ruido glótico presente
en la señal vocal.
Las tres medidas más conocidas de este ruido glótico
son: Signal to Noise ratio de Kojima (SNR la menos utilizada, aunque algunos trabajos destacan su utilidad en la
detección del tipo y la severidad de la disfonía), Normalized Noise Energy (NNE) de Kasuya y Harmonics-to-Noise Ratio (HNR) de Yumoto17. HNR es ampliamente usado
en EEUU, mientras que NNE es más usado en Japón,
Europa y China.
Nuestro estudio confirma, al igual que el de otros
autores18 que, en general, las voces patológicas, tienen
unos valores más altos que las voces normales. En nuestro trabajo el grupo de las DP presentó unos valores
mayores y estadísticamente significativos de NNE respecto a los grupos normales y DN; sin embargo los valores de HNR y SNR no fueron estadísticamente significativos. Probablemente, se deba a que con el software “Dr
Speech Science” la mejor forma de discriminar voces
patológicas es con NNE.
Tabla 5: Valores normales de Jitter y Shimmer
Estudio
N.º sujetos
estudiados (n)
Frecuencia
empleada
Fragm.
estudio
Unidad
Jitter
Jitter
(media)
Unidad
Shimmer
Shimmer
(media)
Milenkovic, 1988
6
8,3 KHz
2”
Microseg.
0,23
%
1,90
Titze y col., 1987
2
100 KHz
30 ciclos
%
0,30
%
00,80
Haji y col., 1986
¿
20 KHz
50 ciclos
Semitonos
0,10
DB
0,141
Ramig y Ringel, 1983
48
40 KHz
¿?
%
0,50
DB
0,35
Horii, 1980
31
40 KHz
3”
%
0,64
DB
0,39
Horii, 1979
Koike y col., 1977
Nuestro estudio, 2000
6
40 KHz
100 ciclos
Microseg.
0,36
¿?
¿?
31
20 KHz
<50 ciclos
%
0,008
%
0,030
100
44,1 KHz
30 ciclos
%
0,24
%
2,10
Acta Otorrinolaringol Esp 2001; 52: 476-482
481
sumario
J. C. CASADO MORENTE ET AL. ESTUDIO OBJETIVO DE LA VOZ EN POBLACIÓN NORMAL Y DISFONÍA
Para finalizar debemos hacernos cierta autocrítica ya
que el análisis acústico de la voz presenta algunos inconvenientes19 como el no poder comparar los resultados
obtenidos debido a que los algoritmos de cálculo que
emplean los distintos programas no son similares; además, estos resultados numéricos son de difícil interpretación sin tener en cuenta la base de datos del propio programa (que generalmente pertenecen a sujetos de otro
idioma). La espectrografía, que nos permite el estudio de
los distintos componentes frecuenciales de la voz humana a través de un gráfico en el que se representan los
armónicos y formantes 20, carece de las limitaciones
comentadas anteriormente. No obstante, las limitaciones
y utilidades de estos métodos se van comprendiendo
según se avanza en su uso.
laringoestroboscopia y el análisis de los principales parámetros acústicos vocales.
2. Los pacientes con una disfonía funcional mostraron unos resultados patológicos representados por
un descenso de la frecuencia fundamental, un aumento
de las perturbaciones de la frecuencia (jitter), un
aumento de las perturbaciones de la intensidad (shimmer) y un aumento del Ruido Glótico (NNE, HNR,
SNR).
3. Dentro de los pacientes disfónicos se detectaron
mayores alteraciones en el grupo de la disfonía por pólipos vocales.
CONCLUSIONES
La realización de este trabajo fue posible gracias a la
inestimable y desinteresada ayuda del Dr. D. Emilio
Perea-Milla López, Responsable de Investigación del
Hospital Costa del Sol de Marbella.
1. El estudio de la voz debe tender a la valoración
objetiva de la misma. Esto se puede realizar mediante la
AGRADECIMIENTOS
REFERENCIAS
1.- Papsin B. The developing role of
paediatric voice clinic: a review of
our experience. J Laryngol Otol
1996;110:1022-1026.
7.- Jafari M, Till J, Truesdell L y
cols. Time-shift, trial and gender effects on vocal perturbation measures. J Voice 1993;7:326-336.
2.- Stemple J. Objetive measures of
voice production in normal subject
following prolonged voice use. J Voice 1999;9:127-133.
8.- Sataloff RT, Spiegel JR, Carroll
LM y cols. Strobovideostroboscopy
in profesional voice users: results
and clinic value. J Voice 1988;1:359364.
3.- Nuñez F, Suárez C, Moro M y
cols. Evaluación objetiva de la patología vocal en la infancia.Acta Otorrinolaringol Esp 1999;50:525-529.
4.- Ford CN, Bless D. Phonosurgery
Asessment and surgical management of voice disorders. New York.
De Raven press 1991:546-567.
5.- Aronson A. Clinical voice disorders. An interdisciplinary approach.
Nueva York: Thieme Inc, 1985.
6.- Fernández R, Damborenea D,
Rueda P y cols. Análisis acústico de
la voz en adultos no fumadores. Acta
Otorrinolaringol Esp 1999;50:134-141.
482
9.- Karnell MP, Hall KD, Landhahl
KR. Comparison of fundamental frequency and perturbations measurements among three analysis systems. J Voice 1995; 9:378-382,
10.- Titze IR, Winholtz WS. Effect of
microphone type and placement on
voice perturbation measurements. J
Speech Hear Res 1993;36:11771190.
11.- Bielamowicz S, Kreiman J, Gerralt BR y cols. Comparison of voice
analysis systems for perturbation
measurements. J Speech Hear Res
1996;39:126-134.
12.- Brown W. Morris R, Hollien H y
cols. Speaking fundamental frequency characteristics as a function
of age and proffesional singing. J
Voice 1991;5:310-315.
13.- Hoghikan N, Apel S, Guinn L y
cols. Vocal folds nodules in adult
singers: Regional opinions about
etiologic factors, carees impact, and
treatment. A surgey of otolaryngologicts, speech pathologics, and teachers of singing. J Voice
1999;13:128-142.
14.- Titze Y, Horii Y, Scherer R. Some technical considerations in voice
perturbation measurements. J Speech Hear Res 1987;30:252-260.
15.- Preciado JA, Fernández S. El
análisis digital de la señal acústica
en el diagnóstico de la patología vocal. Sensibilidad y especificidad de
las medidas del shimmer y del jitter.
Acta
Otorrinolaringol
Esp
1998;49:475-481.
Acta Otorrinolaringol Esp 2001; 52: 476-482
16.- Wolfe V, Martin D. Acoustic correlates of dysphonia: type and severity. J Commund Disor
1997;30:415-419.
17.- Yumoto E, Goruld W, Bear T.
Harmonic-to-Noise ratio as an index
of the degree of hoarseness. J
Acoust Soc Am 1982;71:1544-1550.
18.- Huan Z, Minifie F y cols. Measures of vocal function during changes in vocal effort level. J Voice
1995;9:429-438.
19.- Nuñez-Batalla F, Suárez–Nieto
C, Maldonado-Fernández M y cols.
Aplicación del espectrograma de
banda estrecha en fonocirugía. Acta
Otorrinolaringol Esp 2000;51:243245.
20.- Nieto A, Cobeta I, Gamboa FJ
y cols. La relación armónico/ruido y
el análisis espectrográfico en la patología de abuso vocal. Acta Otorrinolaringol Esp 1996;47:370-376.
Descargar