MVID Tema 1. Sistema de visión humano MVID Tema 1 Sistema de visión humano 1U Curso 2019-2020 1 MVID Tema 1. Sistema de visión humano Tema 1. Sistema de visión humano 1.1. Visión general del sistema visual La corteza visual es quizás la parte más compleja del cuerpo humano. Es el lugar en el cerebro donde tiene lugar la mayor parte del procesamiento visual. Para estudiarlo, los neurocientíficos lo han dividido en regiones etiquetadas con la letra "V" seguida de un número. La más extensa de estas regiones, donde se cree que tiene lugar la mayor parte del procesamiento preliminar, es la denominada región corteza visual primaria(V1). V1 también se conoce como corteza estriada, porque se encuentra dentro de una región que tiene un aspecto estriado en cruz, y está situada en el área o región anatómica 17 de Brodmann. Las otras regiones de la corteza visual, a saber, V2, V3, V4 y V5, se encuentran fuera de la región estriada del cerebro. Recientemente, se han identificado otras áreas retinotrópicamente mapeadas (retinotopía) a las que se les ha nombrado con designaciones como V6, V7 y V8. Como ya comenté anteriormente, algunas líneas de investigación se apoyan en los movimientos de los ojos, cuya gestión se lleva a cabo en la corteza visuales V1 y V5. En términos generales, se puede afirmar que cuanto más avancemos en el camino visual, cuanto más nos alejamos del ojo, menos comprendemos lo que está sucediendo. También es cierto que cada vez se tiene una mayor comprensión del papel que desempeñan cada una de las capas del sistema visual, en general, y en modo particular del sistema ocular, núcleo geniculado lateral (NGL) y de la corteza visual primaria (V1). 1U Curso 2019-2020 2 MVID Tema 1. Sistema de visión humano 1.1.1 Principios y teorías de la visión humana El sistema de visión es el más poderoso y complejo de nuestros sentidos y sólo hemos comenzado a entenderlo desde el trabajo pionero de Helmholtz en la década de 1890 *5+. Se estima que entre el 40% y el 50% de las neuronas en el cerebro humano están asociadas con el procesamiento de información visual. Esto se compara con aproximadamente el 10% para la audición, el 10% para los otros sentidos, y el 20% para las funciones motoras, dejando 10-20% para todo lo demás-cosas como jugar al ajedrez *1+. Esto no es del todo sorprendente porque la actividad visual está ligada a casi todo lo que hacemos. En términos básicos, interpretamos los colores, clasificamos las formas, detectamos y evaluamos el movimiento, estimamos las distancias y realizamos un trabajo muy bueno para crear un mundo tridimensional a partir de las imágenes en 2D que caen sobre nuestras retinas. Entonces, ¿cuál es la diferencia entre lo que vemos y lo que percibimos? Realmente bastante. Por ejemplo, llenamos los puntos ciegos donde el nervio óptico pasa a través de la parte posterior del ojo, corregimos las imágenes imperfectas distorsionadas que caen sobre la retina, e ignoramos las cosas que se interponen en el camino como nuestra nariz y los vasos sanguíneos en la ojo. En un nivel superior, está claro que el sistema visual no existe para registrar fielmente las imágenes, sino para interpretar al mundo y sobrevivir en él: reconocer a los amigos, evaluar amenazas, encontrar compañeros,… Los seres humanos también hemos utilizado estímulos visuales para entretenernos, comunicarnos e informarnos. Una retina típica contiene unos 130 millones de células sensibles a la luz, conos y bastones. Sus procesadores neuronales son una extensión de la corteza visual y es la única parte del cerebro visible desde fuera del cuerpo. Cada uno de los nervios ópticos, que transporta las señales del ojo al cerebro, consiste en alrededor de un millón de fibras y son éstas las que transmiten las señales de la retina al resto de la corteza visual.Esto contrasta estrechamente con otros sentidos, por ejemplo, cada nervio auditivo comprende unas 30.000 fibras. 1.1.2 Teorías de la visión Parece necesario hacer un pequeño repaso de las teorías que existen acerca de cómo funciona nuestro sistema visual. La percepción visual es altamente especializada y compleja. Muchas de las investigaciones históricas sobre los aspectos biológicos y anatómicos del sistema de visión se han basado en cerebros de primates, que parecen ser muy similares a los del sistema de visión humano SVH. Más recientemente, sin embargo, las tecnologías como “imagen por resonancia magnética funcional” (fMRI)han revolucionado la neurociencia y la neuropsicología, proporcionando cada vez mayor visión sobre el funcionamiento del SVH. Hasta finales de los años setenta había dos teorías competidoras principales de la visión, desde los puntos de vista de los “empiristas” y de los “racionalistas”. Sus opiniones sobre el funcionamiento del sistema visual difieren significativamente: 1U Curso 2019-2020 3 MVID Tema 1. Sistema de visión humano Los empiristas creían en el procesamiento innato, de bajo nivel, de abajo hacia arriba, asignando menos importancia a las funciones de nivel superior. Por ejemplo, B. Julesz, en 1960, demostró que la percepción de profundidad puede surgir de estereogramas de puntos aleatorios sin un significado de alto nivel y, por lo tanto, inferir que esto no podría ser impulsado por un mecanismo de arriba hacia abajo. Los modelos empiristas se basaban en gran medida en la extracción de rasgos que facilitaban la generación de patrones conectados. Hubel y Wiesel (premios Nobel en 1981), en 1959, demostraron que el SVH tenía mecanismos de orientación y escalabilidad que se resolvían en capas de bajo nivel. Por su parte, Uhr y Vossler en 1961 demostraron el reconocimiento de características decaracteres, que también se resolvían en capas de bajo nivel. Los racionalistas, en contraste, se centraron en el control de alto nivel de la visión y la construcción de percepciones por el cerebro. Ellos hipotetizaron los modelos mentales que se utilizan para influir en nuestra búsqueda y verificación de las características visuales de menor nivel. Los primeros trabajos describieron las propiedades de imágenes procedentes de escenas en dos dimensiones (2-D), focalizando su trabajo más en la sintaxis de la escena que en el propio contenido de la misma, encontrando verdaderas dificultades en la descripción de imágenes procedentes de escenas en tres dimensiones (3-D). Sus hipótesis y sus modelos no pudieron describir cómo los seres humanos podemos generar percepciones de objetos desconocidos, ya que los modelos se basaban en el conocimiento previo de la sintaxis para describir la entrada visual en un alto nivel. En 1982, D. Marr encabezó un enfoque “conexionista” entre ambos puntos de vista. Sus teorías pusieron de relieve las interconexiones entre unidades de procesamiento que incorporan tanto la extracción ascendente, de abajo hacia arriba, (basada en datos), correlacionado con los procesos de arriba hacia abajo (interpretativos), que genera percepciones basadas en la información de bajo nivel, previamente recibida. En la actualiad, el procesamiento distribuido conexionista sigue siendo influyente y se basa en gran medida en pruebas biológicas que proporcionan estrechas correlaciones con datos experimentales. 1U Curso 2019-2020 4 MVID Tema 1. Sistema de visión humano 1.2 Adquisición: el ojo humano Los fotones del sol u otras fuentes de luz reflejan objetos físicos, y algunos de estos fotones entran en nuestros ojos. Nuestro sistema visual percibe la energía radiada en la parte del espectro electromagnético con longitudes de onda de, aproximadamente, 380 a 720 nm (420790 THz) como se muestra en la Figura 2.2. No hay nada especial en esta gama de longitudes de onda, excepto que nuestra fisiología se ha adaptado a ella, y se ha adaptado a ella porque es útil para cosas como encontrar comida y detectar amenazas y potenciales compañeros. El ojo humano tiene un pico de sensibilidad alrededor de 555 nm en la región verde del espectro; quizás no sea una coincidencia ya que la superficie de la Tierra refleja principalmente la luz en la banda verde de 550 a 560 nm debido a la cubierta vegetal. El ojo humano detecta el brillo aproximadamente de manera logarítmica sobre una amplia gama de valores de luminancia y también puede ver colores que no están presentes en el espectro (los colores no saturados, como el rosa, no están presentes y tampoco están colores como el magenta que se forma a partir de una combinación de varias longitudes de onda). Figura 2.2 Espectro de frecuencias visibles para el ser humano El diagrama del ojo humano en sección transversal se muestra en la Figura 2.3. Veamos ahora un poco más de detalle en sus componentes principales. Figura 2.3. Sección transversal del ojo humano. 1U Curso 2019-2020 5 MVID Tema 1. Sistema de visión humano 1.2.1 Capas de tejido de la retina El ojo es un volumen aproximadamente esférico lleno de líquido, que comprende cuatro capas de tejido: la esclerótica, la retina, la coroides y el cuerpo ciliar. La esclerótica La esclerótica es la capa de tejido blanco que proporciona la fuerza principal de la estructura del ojo. Se vuelve transparente en la parte frontal del ojo donde la luz entra a través de la córnea. El cuerpo ciliar El cuerpo ciliar es un anillo de tejido que rodea el ojo. Contiene los músculos ciliares que ajustan el poder refractivo de la lente cambiando su forma. La retina La retina contiene los fotorreceptores que son sensibles a la luz, así como varios otros tipos de neuronas que procesan y combinan las señales de los fotorreceptores y transmitirlos a las principales áreas del cerebro a través del nervio óptico. En la figura 2.3 se muestra una fotografía de fondo de una retina humana sana. La mácula es el área más oscura en el centro y el disco óptico, donde las fibras nerviosas pasan a través de la parte posterior del ojo, puede ser visto como el área más brillante a la izquierda. Curiosamente, ya pesar de su tamaño, nuestro sistema de visión hace un trabajo bastante bueno de crear una impresión de visión en este punto ciego, aunque no hay fotorreceptores presentes Las principales vías nerviosas se ven como patrones de rayas blancas que se irradian desde el disco óptico y los vasos sanguíneos también puede verse claramente. La coroides La coroides es el lecho capilar que proporciona alimento a los fotorreceptores. También contiene el pigmento-melanina sensible a la luz, que absorbe los rayos UV. Veamos ahora el frente del ojo, donde entra la luz, con un poco más de detalle. 1U Curso 2019-2020 6 MVID Tema 1. Sistema de visión humano Figura 2.4 Imagen de fondo de una retina saludable. Fuente http://commons.wikimedia.org/ 1.2.2 Procesamiento óptico La córnea La córnea es la región circular transparente sensible en la parte frontal del ojo donde entra la luz. Refracta la luz sobre la lente que luego se enfoca hacia la retina. El cristalino La lente¿cristalino? es la estructura transparente situada detrás de la pupila que, en combinación con la córnea, refracta la luz incidente para enfocarla en la retina. Para los objetos distantes, los músculos ciliares hacen que se vuelva más delgado y para los objetos de cerca que se vuelve más gordo. Curiosamente, la lente sólo es responsable de alrededor del 25% del poder refractivo de la óptica del ojo, el resto es proporcionado por la córnea. Aunque la lente tiene mucho menos poder refractivo que la córnea, permite cambios en la distancia focal que nos permiten acomodar objetos de interés a diferentes distancias. La longitud focal del ojo humano es de unos 17 mm y la potencia óptica es de unos 60 dioptrías.La relación entre la distancia del objeto do, la distancia retiniana dr y la distancia focal ,están relacionadas como se muestra en la siguiente ecuación. En la Figura 2.5. se representa la relación citada. 1U Curso 2019-2020 7 MVID Tema 1. Sistema de visión humano El iris El iris es la región circular de color individual en la parte frontal del ojo que contiene los músculos ciliares que controlan la apertura de la pupila. La pupila La pupila es la abertura que controla cuánta luz entra en el ojo y se hace más pequeña en ambientes más brillantes. La pupila se ajusta por un factor de alrededor de 16: 1 (dilatación de 2 mm a 8 mm de diámetro). El SVH tiene una enorme capacidad de compensación de la variación en los niveles de luz procedentes del mundo exterior, lo que nos permite adaptarnos a unos 8-9 órdenes de magnitud de luminancia; la pupila participa en la compensación temprana a esas variaciones, sin embargo la gran capacidad de compensación y adaptación a las variaciones de la luminancia se produce en los fotorreceptores de la retina, abriendo y cerrando canales de sodio, proceso que, a su vez, está gobernado por otras áreas del cerebro, que evalúan y miden las características de las imágenes en la retina. Como podemos ir intuyendo existe una retroalimentación necesaria entre las primeras capas del SVH y las capas más altas, con un alto grado de correlación en entre sus funciones. Figura 2.5. La longitud focal de la lente. La retina. La retina es el lugar donde se realiza la fototransducción, convirriendo de energía electomagnética a energía eléctrica, mediante procesos q (con procesos de y se lleva a cabo la primertor en la parte posterior del ojo, la retina. Cuando la luz llega a la retina se convierte en pulsos eléctricos por las respuestas de los fotorreceptores. Hay típicamente cerca de 130 millones de células sensores en la retina - 125 millones de barras y 6-7 millones de conos. La distribución de estos es como se muestra en la Figura 2.6. Aunque la distribución de los conos es más denso en la fóvea, todavía hay varios miles por milímetro cuadrado en la periferia. Atendiendo a las bases del estudio de la óptica 1U Curso 2019-2020 8 MVID Tema 1. Sistema de visión humano convencional, esta alta densidad de conos en la fóvea, proporciona una mayor agudeza visual a esta región de la retina. Figura 2.6. Distribución de los fotorreceptores en la retina. Fuente: Mustafia y otros. Los bastones 1U Curso 2019-2020 9 MVID Tema 1. Sistema de visión humano Hay aproximadamente 125 millones de varillas en la retina. Estos son responsables de la visión a bajos niveles de luz (visión escotópica) y son tan sensibles que se saturan o blanquean a los niveles de luz media (visión mesópica). Las varillas no median la visión de color y proporcionan menor agudeza espacial que las células de cono foveal. El photopigment, rhodopsin, es el más sensible a la luz verde de la longitud de onda alrededor 498 nanómetro. La fóvea central -la región de mayor agudeza visual- tiene una densidad muy baja de vástagos, por lo que, por la noche, podemos ver objetos mejor mirando ligeramente lejos de ellos. Los conos Los conos funcionan a niveles de luz más altos que las varillas y proporcionan lo que se conoce como visión fotópica. En contraste con las varillas, ofrecen una gama de diferentes características de sensibilidad espectral y median la visión del color. Existen tres tipos de cono y éstos se conocen generalmente como longitud de onda corta (S) o azul; longitud de onda media (M) o verde; y longitud de onda larga (L) o roja. Éstos tienen amplias respuestas espectrales superpuestas con picos en torno a 420, 534 y 564 nm respectivamente. La luz en las longitudes de onda azules tiende a estar fuera de foco ya que es refractada más que la luz roja y verde. Las características normalizadas de respuesta en frecuencia de las bastones y conos se muestran en la Figura 2.7. Figura 2.7. Respuesta el frecuencia, normalizada, para los bastones y los conos L, M y S del sistema visual humano. Fuente:Avail Wikimedia Commons. Las células ganglionares ipRGC La retina contiene no sólo fotorreceptores clásicos que nos permiten distinguir formas y colores. También posee células ganglionares con un pigmento llamado melanopsina, las que a través del tracto retinohipotalámico llevan información al núcleo supraquiasmático NSQ. Aestas células se las conoce como células ganglionares fotorreceptoras intrínsecamente fotosensibles (ipRGC), de 1U Curso 2019-2020 10 MVID Tema 1. Sistema de visión humano las que ha descrito su participación en una serie de funciones adicionales a la formación de imágenes, funciones accesorias o extravisuales de la retina,entre las que destaca la sincronización del ritmo circadiano por la luz, actuando como una especie de “fotómetro” para el SVH. En mis lecturas he podido observar que, existen trabajos de investigación que atribuyen un papel capital a la función que las células ipRGC tienen en la medición de la amplitud luminosa de la imagen en retina, posibilitando que el SVH pueda controlar, con rapidez, la apertura de la pupila. El mecanismo intracelular iniciado por la melanopsina es todavía una interrogante, así como las interacciones celulares que podrían modular la actividad de las ipRGC. El descubrimiento de las ipRGC y de su participación en las funciones extravisuales de la retina, ha generado una nueva línea de investigación en la fisiología retiniana y la fisiología sensorial en general. Por lo tanto, a la arquitectura celular convencional de la retina (hasta hace unos años) que representaré, un poco más adelante, en la Figura 10?, se le debe incorporar este “nuevo” componente,tal como reflejo en la Figura 2.8.; al igual que debe completarse la respuesta en frecuencia normalizada, incorporando a las células ipRGC, como se puede observar en la Figura 2.9. Figura 2.8. Arquitectura celular de la Retina, con la inclusión de las células ipRGC 1U Curso 2019-2020 11 MVID Tema 1. Sistema de visión humano Figura 2.9. Respuesta el frecuencia, normalizada, para los bastones y los conos L, M y S y células ganglionares ipRGC del sistema visual humano. La mácula La mácula es una región deprimidacerca del centro de la retina, que rodea a la fóvea, de aproximadamente, un diámetro de 5,5 mm. En esta región, la concentración de conos comienza a aumentar, vertiginosamente, a medida que se acerca a la fóvea. Debido a su color amarillo la mácula absorbe el exceso de luz azul y ultravioleta y actúa como un bloqueadorsolar natural. La fóvea La fóvea es la depresión en el centro de la mácula de aproximadamente, 1,5 mm de diámetro, que es responsable de la visión central de alta resolución. Tiene una concentración muy elevada de conos y apenas bastones. densidad espacial muy alta de conos y muy pocas varillas. También coincide con una región de la retina que está vacía de los vasos sanguíneos y esto mejora aún más la agudeza como dispersión y pérdida son minimizados. El centro de la fóvea, la fóveola, tiene un diámetro aproximado de 0,2 mm y está completamente formado por conos finos muy compactos, llenos de forma hexagonal y de estructura similar a una varilla. La fóvea contiene principalmente conos M y L con alrededor del 5% de los conos S. La resolución de muestreo de la imagen retiniana es altamente no uniforme y cae rápidamente con una excentricidad creciente. Esto crea una imagen más borrosa en la visión periférica que no percibimos debido a movimientos oculares rápidos y procesamiento visual de nivel superior. El ángulo efectivo subtendido en la fóvea es de alrededor de 2 °, por lo tanto, realmente sólo 1U Curso 2019-2020 12 MVID Tema 1. Sistema de visión humano "ver" una pequeña proporción de la escena visual agudamente, sin embargo, todavía percibimos todo a ser agudo. El espaciamiento medio de los receptores de cono en la fóvea es de 2-3 μm (en la periferia esto aumenta a alrededor de 10 μm), y es esto que limita efectivamente nuestra resolución espacial a aproximadamente 1 arcmin. Esto es importante cuando evaluamos los méritos relativos de los formatos de televisión de alta resolución en términos de distancia de visualización. El espaciado también nos da la máxima frecuencia espacial que se puede percibir. En la práctica, el ojo no puede resolver frecuencias espaciales de más de aproximadamente 60 ciclos por grado (c/g). Disco óptico y nervio óptico El disco óptico es la porción del nervio óptico que se puede ver en la retina, donde las señales de las células ganglionares de la retina salen de la retina a lo largo de los axones en su camino hacia la corteza visual. Aproximadamente la mitad de las fibras nerviosas en el nervio óptico se originan en la fóvea y el resto contiene información del resto de la retina. La retina contiene una serie de otros tipos de células, que proporcionan tratamiento de visión temprana y reducir la cantidad de información (compresión HVS!) Que se transmite a la corteza visual principal. 1.2.3 Procesamiento visual en la retina Las respuestas de los fotorreceptores de la retina son procesadas por una red compleja (y lejos de ser perfectamente entendida) de neuronas. Esta red comprende: bipolar, horizontal, amacrina, y las células ganglionares de la retina. Juntos, estos proporcionan el preprocesamiento visual temprano, la extracción y la detección de la característica, dando por resultado flujo de información reducido perceptiblemente a través del nervio óptico. Esta estructura se muestra en la Figura 2.9. Como se muestra en la Figura 2.9, las células bipolares se conectan a barras o conos y se activan por un aumento en los fotones incidentes en los fotorreceptores asociados. Las células horizontales conectan lateralmente a través de la retina a una extensión espacial más grande y, debido a su estimulación de un vecindario de fotorreceptores, permiten la inhibición lateral. Mientras que la respuesta de las células bipolares en el aislamiento es bastante cruda, la influencia de las células horizontales es añadir una señal oponente donde la respuesta de uno o más fotorreceptores puede influir en la respuesta de los receptores circundantes, formando así el campo receptivo. También se sabe que las células horizontales modulan la señal del fotorreceptor en diferentes condiciones de iluminación. Se sabe relativamente poco sobre el papel de las células amacrinas, excepto que pueden tener árboles dendríticos extensos y, de manera similar a las células horizontales, contribuir a la retroalimentación de los campos receptivos de las células bipolares y ganglionares. 1U Curso 2019-2020 13 MVID Tema 1. Sistema de visión humano Figura 2.9. Arquitectura de las células de la Retina. Fuente: Wikimedia Hay aproximadamente 1,6 millones de células ganglionares de la retina y éstas crean los primeros campos receptivos en el sistema de visión, proporcionando una base para la detección de características de bajo nivel y la codificación de color del oponente. Los axones de estos forman el nervio óptico y transmiten las señales electroquímicas a las funciones superiores de la corteza visual. Hay aproximadamente 100 veces más fotorreceptores que las células ganglionares en el ojo, lo que proporciona evidencia de la compresión realizada por la retina. El campo receptivo de una célula es una región dentro de la cual debe producirse un estímulo si es para influir en la respuesta de esa célula. Los campos receptivos se forman usando oposición espacial, es decir, las respuestas de una parte del campo receptivo son opuestas o inhibidas por otras partes del campo receptivo. Las interacciones entre las células bipolares y horizontales proporcionan una organización centro-envolvente insensible a la orientación del campo receptivo de la célula ganglionar, donde el centro y las áreas circundantes actúan en oposición. Esto podría comprender un centro excitador y un envolvente inhibitorio como se muestra en la Figura 2.10o viceversa. Las células ganglionares actúan como detectores de cambios, respondiendo sólo a las diferencias en las intensidades de luz (o contraste) a través de su campo receptivo y no a niveles de luz absolutos. Por lo tanto, son sensibles a los bordes y pueden ser modelados como una diferencia de funciones gaussianas (DoG). 1U Curso 2019-2020 14 MVID Tema 1. Sistema de visión humano Oponencia espacial, mostrando el centro-envolvente en la célula y su patrón de disparo debido a Excitación. Una escena se codifica así efectivamente a medida que cambia la intensidad en los diferentes canales de color. Sin embargo, está claro que vemos más que sólo bordes, por lo que esto proporciona evidencia de que los niveles más altos del sistema de visión realizan un llenado entre respuestas de campo receptivo con promedios en niveles de intensidad. Esto es interesante ya que puede ser visto como una forma simple de síntesis de imágenes, proporcionando un análogo biológico a la eliminación de la redundancia perceptiva. Un ejemplo particularmente llamativo de esto es el llenado visual de nuestro punto ciego que no contiene fotorreceptores. El primer procesado de la información de los conos y los bastones se realizaen la retina, y es un procesado de “contraste”, donde cada campo receptivo de un célula ganglionar, ya sea “centro ON”, o de centro “OFF”, va a provocar una respuesta de la célula con un potencial de acción, dependiente de la diferencia de luz centro-periferia, de tal modo que una célula ganglionar con una cantidad de luz en su centro “100” y en su periferia “80”, va a transmite una respuesta de contraste “20”; si la cantidad de luz en su centro es “200” y en su periferia “180”, va a transmitir una respuesta de contraste también “20”. Entonces, los bastones y los conos forman parte de campos receptivos cuyas células ganglionares “no transmiten información de la cantidad de luz, sino del contraste entre lo recogido por su centro y su periferia. Un resumen gráfico lo podemos observar en la Figura 2.11. Aproximadamente el 80% de esta información es transmitida al núcleo geniculadolateral NGL. Es importante saber que las únicas células existentes en el ojo capaces de generar un “potencial de acción”, es decir, una respuesta eléctrica, son las células ganglionares de retina, cuyos axones las abandonan, dirigiéndose a distintas partes del cerebro. El resto de células generan 1U Curso 2019-2020 15 MVID Tema 1. Sistema de visión humano “potenciales de membrana”, que polarizan o despolarizan la célula, pero sus axones nunca se desprenden de ellas, por lo que nunca transmiten una señal eléctrica. La información de cantidad o amplitud de luz, como comenté anteriormente, será transmitida directamente al cerebro, por las células ganglionares fotorreceptoras intrínsecamente fotosensibles (ipRGC), convitiéndose así en la primera capa del “fotómetro” del SVH. 1.3. La corteza Visual En la Figura 2.12 se muestra un diagrama simple que muestra las principales vías visuales desde las retinas hasta la corteza visual primaria. Los axones del nervio óptico de las células ganglionares de la retina en cada ojo se encuentran en el quiasma óptico donde todas las fibras del lado nasal de cada ojo cruzan para unirse a las del lado temporal del otro ojo y forman dos tramos ópticos. El campo visual izquierdo es así procesado por el hemisferio derecho y viceversa. Las fibras en el tracto óptico luego sinapsis en el núcleo geniculado lateral (LGN) donde se distribuyen a otras áreas de la corteza visual. Después de la LGN, las señales pasan a la corteza visual primaria, V1, situada en la parte posterior del cráneo. Luego pasan a V2 y se ramifican a por lo menos otros 20 centros, cada uno de los cuales proporciona funciones especializadas, como detectar movimiento, reconocer caras o interpretar el color y la forma. El HVS proporciona su funcionalidad principalmente a través de los procesos combinados de inhibición, excitación, competencia sesgada, carreras de entrada, codificación de oponente y adaptación. Estos se consideran con más detalle a continuación. 1U Curso 2019-2020 16 MVID Tema 1. Sistema de visión humano Figura 2.12 La corteza Visual ( Poner otra imagen más bonita ) 1.3.1 Procesos de oposición Como se ha expuesto anteriormente y se muestra en la Figura 2.8, muchas funciones neuronales en el sistema de visión parecen codificar datos utilizando la codificación del oponente. La codificación del oponente es un proceso en el cual las neuronas codifican características opuestas o opuestas en su única salida. Por ejemplo, una célula sensible al movimiento tiene una velocidad de disparo de base que se reduce cuando se detecta movimiento en una dirección y que aumenta con el movimiento en la dirección opuesta. Los procesos adversos de inhibición y excitación parecen cruciales para funcionar, con respuestas inhibitorias a menudo usadas para controlar un estado normalmente excitatorio. También interpretamos el color mediante el procesamiento de señales de conos y varillas en la oposición. Las respuestas espectrales de cono L, M y S se superponen en términos de sus longitudes de onda, por lo que es más eficiente para el sistema visual usar diferencias entre sus respuestas en lugar de respuestas individuales. Esto sugiere que hay tres canales oponentes: rojo contra verde, azul contra amarillo, y negro contra blanco. 1.3.2 Competencia parcial La competencia sesgada se refiere a la forma en que la información tiene que competir por recursos limitados en las vías visuales y las cortezas. Las entradas de los detectores de 1U Curso 2019-2020 17 MVID Tema 1. Sistema de visión humano características en el sistema visual compiten para ser codificadas en la memoria visual de corto plazo. La competencia entre estos insumos se pondera de acuerdo con una realimentación de nivel superior, llamada atención, para asegurar que se prioricen las características relevantes para la tarea actual. Por ejemplo, durante la tarea de Stroop (se pide a los sujetos que indiquen el color de una serie de palabras en lugar de leer las mismas palabras) se ha observado que la atención basada en la tarea provoca el realce de las áreas sensibles relevantes del color del cerebro mientras suprime respuestas de las áreas que realizan el procesamiento de palabras. 1.3.3 Procesos de adaptación La adaptación es el proceso por el cual la respuesta de una célula se reduce con el tiempo cuando su entrada es constante. La adaptación en diversos grados es común en la mayoría de las células corticales y, cuando está acoplada con los procesos de codificación del oponente, es responsable de los efectos posteriores, la experiencia relacionada con el brillo, el color o la movilidad. Después de que una célula adaptada a la función codificadora del oponente se adapte a un estímulo particular y que el estímulo se elimine, la célula reacciona, indicando brevemente la característica opuesta a la que se ha adaptado. Ejemplos de tales efectos secundarios incluyen la sensación de lentitud después de viajar a altas velocidades y la percepción de que los objetos estáticos se mueven en la dirección opuesta a la de un objeto móvil visto anteriormente. El brillo dramático y los efectos secundarios del color también se utilizan con frecuencia como la base para las ilusiones visuales. ¡Incluso observar sonrisas durante un período prolongado puede hacer que las caras sin expresión parezcan más tristes! 1.3.4 La corteza visual primaria: V1 La corteza visual o estriada primaria (en capas) (también conocida como V1) es probablemente el área mejor entendida del HVS. El papel de V1 es extraer características visuales básicas de una escena y se ha demostrado que V1 contiene campos receptivos que son sensibles a las orientaciones de línea, color y frecuencia espacial. Esto afecta a la compactación visual de datos mediante la abstracción de estímulos visuales en construcciones de nivel superior. La mayoría de las conexiones V1 son de la retina, pero también se sabe que reciben conectividad de retroalimentación desde áreas funcionales superiores, que influyen en los campos receptivos de sus células. Hubel y Wiesel *7+ identificaron tres detectores primarios en V1: 1U - Células simples: Sintonizadas con orientaciones específicas de los bordes. - Células complejas: Versiones insensibles a la fase de células simples, es decir, la respuesta a un estímulo orientado apropiadamente es la misma, sin importar dónde caiga dentro del campo receptivo. Curso 2019-2020 18 MVID Tema 1. Sistema de visión humano - Células hipercomplejas: que muestran la sensibilidad a la longitud del estímulo, es decir, la respuesta celular aumenta a medida que aumenta la longitud del estímulo. Las neuronas en V1 generalmente se agrupan en columnas que responden a una característica particular de bajo nivel, como orientación de línea, frecuencia espacial o color. Se sabe que V1 preserva la cartografía retinotópica de las células ganglionares en la retina en su organización. Sin embargo, esto no es un mapeo lineal o uniforme, ya que V1 exhibe un aumento cortical, dedicando un porcentaje desproporcionado de sus células al procesamiento de información foveal. Esto enfatiza la importancia de la parte central de mayor resolución del campo visual. 1.3.5 La corteza preestriada V2 V2 está fuertemente vinculado a V1 con ambas conexiones feedforward y feedback y también se conecta fuertemente a V3, V4 y V5. Aunque se comprenden menos bien que V1, las células V2 parecen operar de una manera similar, combinando características V1 ajustadas a la orientación, la frecuencia espacial y el color, así como respondiendo a patrones más complejos. Los daños en V2 pueden conducir a una mala textura y discriminación de forma. También hay evidencia de la modulación de células V2 por disparidad binocular. 1.3.6 Corrientes dorsal y ventral Las conexiones de V1 a la zona V2 generalmente se consideran divergentes en dos corrientes dorsal y ventral (también conocido como "dónde" y "qué" o "acción" y "percepción"). La corriente dorsal se relaciona con la percepción de movimiento y profundidad, que se origina en V2 y pasa dorsalmente a través del cerebro a las partes sensibles al movimiento de la corteza visual. La corriente ventral, por otro lado, está asociada con la percepción de los campos visuales y la agudeza de las formas y el reconocimiento de objetos, nuevamente originados en V2, pero en este caso pasando ventralmente por V4 a la corteza temporal inferior (TI). 1.3.7 Zonas extrastriadas Las áreas de la corteza visual más allá de V1 se denominan generalmente áreas extrastriadas. Éstos poseen campos receptivos más grandes y generalmente calculan rasgos más complejos y abstractos. También suelen mostrar una fuerte modulación atencional. Aunque la función de estas áreas no es bien entendida, su conectividad es informativa. V3 está fuertemente conectado a V2 con entradas adicionales de V1. Procesa las corrientes dorsal y ventral y se ha demostrado que responde a los movimientos globales. V4 se encuentra en la corriente ventral y se ha demostrado que responden a formas de complejidad relativamente alta. También muestra una fuerte modulación atencional y una cantidad significativa de sensibilidad al color. El daño a la V4 puede causar alteraciones en la forma y la textura. 1U Curso 2019-2020 19 MVID Tema 1. Sistema de visión humano V5 contiene células que responden a complejos patrones de movimiento y se cree que es el área principal dedicada a la percepción del movimiento. El área temporal medial superior (MST) se alimenta principalmente del área temporal medial (MT), y también es sensible al movimiento. Existe evidencia de que el MST calcula el flujo óptico, especialmente en el contexto de expansiones y rotaciones globales. La memoria visual de corto plazo (VSTM) puede considerarse como un buffer de corto plazo donde los datos priorizados se almacenan para su posterior procesamiento. Se ha demostrado que VSTM persiste a través de interrupciones visuales tales como saccades y parpadeos y proporciona así un enlace entre la escena vista previamente y la nueva después de la interrupción. La corteza temporal inferior (IT) proporciona un reconocimiento complejo de la forma al analizar formas más simples de niveles inferiores en el HVS. Contiene células que se activan en respuesta a formas y patrones específicos y que alojan células que se sabe que responden a las caras. Combina la información de ambas mitades del campo visual (que hasta este punto estaba separada a través de los hemisferios del cerebro). En las etapas superiores del procesamiento visual, los campos receptivos se hacen más grandes y más complejos en su conectividad. Por ejemplo, en la TI se piensa que algunos campos receptivos cubren todo el campo visual. Muchas otras áreas importantes de la corteza visual han sido identificadas e investigadas, incluyendo el área de la cara fusiforme (FFA), en gran parte responsables del reconocimiento de caras y otras entidades complejas. El campo del ojo frontal (FEF) es otra área importante que controla los movimientos voluntarios de los ojos. Se ha propuesto que esto se basa en algún tipo de mapa de saliencia visual, codificado con características conductuales significativas. 1.4 Los campos visuales y agudeza 1.4.1 El campo de visión El campo de visión del ojo humano es aproximadamente 95◦ en la dirección temporal (lejos de la nariz), 60◦ en la dirección nasal (hacia la nariz), 75◦ hacia abajo y 60◦ hacia arriba, permitiendo un campo de visión horizontal en exceso de 180◦. Obviamente, cuando se incluye la rotación del ojo, el sistema visual humano aumenta aún más el campo de visión horizontal, incluso sin movimiento de la cabeza. 1.4.2 La agudeza No es demasiado difícil estimar la agudeza espacial de la retina basándose simplemente en la distribución de conos en la fóvea. Ilustramos esto en el Ejemplo 2.1. La frecuencia Nyquist medida para el HVS está normalmente entre 40 y 60 cpd. Este valor superior se ha atribuido al patrón de rejilla de muestreo del fotorreceptor que es hexagonal en lugar de rectangular ya otras técnicas de realce local. El HVS no experimenta normalmente ningún efecto de aliasing y 1U Curso 2019-2020 20 MVID Tema 1. Sistema de visión humano esto se debe al hecho de que la óptica del ojo realiza un filtrado de paso bajo, actuando como un filtro anti-aliasing. 1.4.3 Luz, luminancia y brillo Las sensaciones de brillo no son análogos directos de la intensidad fotométrica (luminancia). El número de fotones que entran en el ojo y la percepción del brillo sólo están relacionados indirectamente. Por ejemplo, el brillo aparente de un blanco acromático, en condiciones equiluminantes, dependerá del contenido en frecuencia de la radiación electromagnética reflejada en su entorno. Por lo tanto, un objetivo gris sobre un fondo relativamente oscuro parece más brillante que el mismo objetivo en un fondo más claro. Como resultado de esta percepción basada en el contexto, generalmente se piensa que el sistema visual calcula el brillo usando relaciones de luminancia a través de los límites de contraste en una escena. La influencia del color sobre el brillo también proporciona evidencia de que las percepciones de luminancia están relacionadas con la frecuencia electromagnética. La influencia del contraste local puede verse, en combinación con los efectos de la inhibición lateral, en las bandas de Mach mostradas en la Figura 2.13. Aquí la intensidad es uniforme sobre el ancho de cada barra, pero la apariencia visual es que cada tira es más oscura en su lado derecho que su izquierda. Otro ejemplo llamativo es proporcionado por la rejilla de Adelson como se muestra en la Figura 2.14, donde los cuadrados A y B parecen muy diferentes debido a la sombra, pero son en realidad idénticos. Hay una confusión significativa acerca de los términos utilizados en relación con la radiación luminosa, así que definamos algunos términos relacionados con la luz y cómo la percibimos. Figura 2.13. Efecto de banda Mach. 1U Curso 2019-2020 21 MVID Tema 1. Sistema de visión humano Figura 2.14 Red de Adelson. Fuente: http://web.mit.edu La luminancia Ninguna de las medidas anteriores tiene en cuenta la composición de la luz en términos de su longitud de onda o longitudes de onda. La luminancia hace esto ponderando el valor de radiancia de acuerdo con la respuesta visual humana. La luminancia Y, por lo tanto, se representa normalmente mediante la ecuación (2.2), donde L (λ) es la intensidad de la luz incidente en función de la longitud de onda en una posición y un tiempo dado y ¯y (λ) es una ponderación dependiente de la longitud de onda eficiencia luminosa) que refleja la luminancia percibida del flujo incidente. La luminancia se mide en candelas / m2 (cd / m2): La constante K = 685 lúmenes / W. La función ¯y (λ) variará de persona a persona, pero fue medida por el CIE1 en 1929 para un observador estándar como se muestra en la Figura 2.12. Si en la integral de la ecuación (2.2) el término L (λ) es reemplazado por el flujo radiante (λ) entonces el resultado se denomina flujo luminoso y tiene las unidades de lúmenes. Figura 2.15. Curva de eficiencia luminosa CIE. Fuente: Wikipedia El brillo El brillo es la percepción obtenida por la luminancia de un objetivo visual y, como tal, representa una indicación no cuantitativa de la sensación fisiológica de la luz. Normalmente es 1U Curso 2019-2020 22 MVID Tema 1. Sistema de visión humano evaluado subjetivamente por un observador con referencia a un área blanca ajustada para tener el mismo brillo que el objetivo visto. La corrección gamma Un sensor de imagen normalmente produce valores de salida proporcionales a la radiancia, con la luz incidente típicamente filtrada en bandas R, G y B. Sin embargo, antes de que éstos surjan de la cámara, generalmente se mapean no linealmente de acuerdo con la respuesta del HVS, usando una técnica conocida como “corrección gamma”. Estas salidas son normalmente etiquetadas como R-G-B. Se denomina “luma” al término utilizado para denotar la combinación de estos componentes corregidos que produce la señal de luminancia gamma-corregida, de acuerdo con la especificación del espacio de color utilizado. 1.4.4 Adaptación al nivel de luz Nuestra capacidad de adaptarse a una amplia gama de niveles de luz es crítica para la función y la supervivencia. Los fotorreceptores, de hecho la totalidad del sistema visual, deben permanecer sensibles a medida que varía la intensidad de la luz ambiente. Esta variación es bastante dramática, ya que podemos ver en condiciones de luz estelar (10-3 cd / m2), iluminación interior (102 cd / m2) a luz solar brillante (105 cd / m2). Por lo tanto, el ojo puede funcionar (al menos en cierto grado) a través de unos ocho órdenes de magnitud en el nivel de luminancia: una relación de 100.000.000: 1. El ojo, por supuesto, no puede hacer frente a este rango dinámico instantáneamente. Si consideramos el rango dinámico instantáneo de nuestro ojo (donde la apertura de la pupila es fija), entonces esto es alrededor de 10 f-stops. Si incluimos la adaptación rápida de la pupila, esto aumenta hasta aproximadamente 14 f-stops. El diámetro de la pupila oscila típicamente entre aproximadamente 2 mm en condiciones brillantes y alrededor de 8 mm en condiciones de oscuridad, dando un rango dinámico de 16: 1 o 4 fstops. La adaptación también tiene lugar tanto en varillas como en conos. Los conos se adaptan más rápido que las varillas y esto explica por qué se necesita mucho más tiempo para adaptarse a la oscuridad (adaptación oscura) que al brillo. La figura 2.16 muestra una curva característica de adaptación a la oscuridad típica del SVH. Esto ilustra la variación en el tiempo del umbral del individuo después de la adaptación a una luz brillante. Esta figura muestra que el proceso de adaptación de la oscuridad es bastante lento, tardando varios minutos para la adaptación completa, pero también que la adaptación se produce en dos etapas. El primero de ellos es debido a la adaptación de los conos y el segundo se debe a las varillas. Los fotorreceptores de la retina se adaptan a través del blanqueamiento del pigmento, pero también por la retroalimentación de las células horizontales. 1U Curso 2019-2020 23 MVID Tema 1. Sistema de visión humano Figura 2.16. Adaptación a la oscuridad de los bastones y de los conos 1.5. Procesado de color. Teoría de los lares oponentes La percepción del color en el HVS emplea un enfoque basado en “pares oponentes”. La razón de esto se hace evidente si tenemos en cuenta los requisitos de constancia de color. Claramente si la luz reflejada de un determinado objeto varía, preferiríamos idealmente percibirla como una versión más brillante o más oscura del mismo color. Esto puede lograrse si consideramos la relación de las salidas de los fotorreceptores en lugar de sus salidas absolutas. Esto fue identificado por primera vez por Herring en 1878, que se dio cuenta de que ciertos matices no podían coexistir en una sola sensación de color. Por ejemplo, podemos experimentar un rojoamarillo=naranja y azul-verde=cian pero no puede experimentar fácilmente rojo-verde o azulamarillo. Por lo tanto, los pares rojo-verde y azul-amarillo se denominan pares oponentes. Herring argumentó que no podríamos experimentar ambos colores en un par , de forma simultánea, ya que están codificados en el mismo camino. Esta observación ha sido validada a partir de experimentos psicofísicos. En la figura 2.17 se muestra un diagrama que muestra un posible modelo de “pares oponentes”. Esto muestra una señal de luminancia generada a partir de la suma de las señales de los conos verdes y rojos y dos canales de crominancia generados a partir de relaciones de rojo a verde y amarillo a azul. Aquí hay que anotar tres cosas. En primer lugar, la opinión de un experto varía en función de la naturaleza de los procesos de combinación y hay alguna evidencia de que los canales de crominancia están basados en diferencias de color (es decir, R-G e Y-B). Sin embargo, 1U Curso 2019-2020 24 MVID Tema 1. Sistema de visión humano debido a que las sensibilidades de las respuestas espectrales de los conos se superponen, la mayoría de las longitudes de onda estimularán al menos dos tipos de cono. Por lo tanto, algunos valores no pueden existir físicamente como un espacio de color aditivo e implican valores negativos para al menos uno de los tres colores primarios. En segundo lugar, es bien sabido que las sensaciones de color varían significativamente con el contexto y la frecuencia espacial, como se puede observar en la figura 2.18.; si movemos la página más cerca, las barras azules se volverán de color verde. En el modelo, no hay ninguna contribución de los conos azules en el canal de luminancia, la razón principal de esto es que hay relativamente pocos conos azules en la fóvea y casi ninguno en su centro. Esto es probablemente debido a los efectos de la aberración cromática que reduciría significativamente la agudeza visual. Figura 2.17. Procesado de colores oponentes(Revisar la figura) 1U Curso 2019-2020 25 MVID Tema 1. Sistema de visión humano Figura 2.18. Dependencia del color en el contexto. La imagen inferior es sólo una versión aplastada de la parte superior, donde las rayas verdes se vuelven azules. Figura 2.19-a. Sensibilidad del ojo humano. Normalizada para las longitudes de onda visibles Figura 2.19-b. Carta de cromaticidad CIE 1931 1.6 Los movimientos oculares 1U Curso 2019-2020 26 MVID Tema 1. Sistema de visión humano Aparte de cuando compensamos los movimientos de la cabeza, nuestros ojos se mueven de dos maneras distintas: Sacádicos Como movimientos involuntarios rápidos entre puntos de fijación. El sistema visual se borra durante el sacar, por lo que no experimentamos efectos de movimiento rápido debido a la exploración. Saccades puede tomar dos formas: - Microsacádicos: Pequeños movimientos involuntarios usados para refrescar las respuestas celulares que pueden caerse debido a la adaptación. - Fovealización: Los ojos también se mueven rápidamente en la visión fotópica, para permitir la exploración de nuevas áreas de una escena que proporciona una impresión de mayor agudeza a través del campo visual. Búsqueda suave: Estos son movimientos voluntarios más lentos guiados por la atención que suceden, por ejemplo, al rastrear objetos en movimiento. Este proceso mantiene el objeto de interés centrado en la fóvea para mantener una agudeza espacial elevada y reducir el desenfoque de movimiento. Bajo las condiciones de la búsqueda suave, los límites espacio-temporales cambian drásticamente. Este tipo de movimiento ocular tiene el efecto de extender el límite temporal de nuestro sistema visual, mostrando que se pueden percibir frecuencias de varios cientos de hertzios. El seguimiento de los ojos se utiliza ampliamente en la investigación de la visión, con el fin de evaluar la mirada y las fijaciones de un observador en respuesta a un estímulo. En las figura 2.31, se puede ver el resultado de un experimento llevado a cabo, recientemente por una conocida marca de componentes fotográficos, donde se pidió la observación del cuadro mostrado en la figura 2.30b, se proporcionó a los observadores una serie de tareas de visualización asociadas con la pintura,durante un tiempo limitado. Una de las personas participantes no era fotógrafa, otra era un estudiante de fotografía y una tercera que era fotógrafo profesional,registrándose los movimientos oculares de fijación de cada área de interés (AOI) en la fóvea. 1U Curso 2019-2020 27 MVID Tema 1. Sistema de visión humano Figura 2.30a. Experimento de seguimiento de fijación de la mirada. Figura 2.30 b. Cuadro utilizado en el registro. . Es interesante observar como los patrones de los movimientos sacádicos se relacionan con la tarea especificada y el entrenamiento de la persona. El experimento de muestra cómo los fotógrafos están obsesionados con los detalles, haciendo de ello, una pormenorización de tareas de fijación de la retina (fóvea). Este aspecto del funcionamiento del SVH resulta de gran interés para algunos investigaciones sobre superresolución o hiperagudeza, las cuáles pueden aplicar sus métodos, muestreando pequeñas áreas de interés (AOIs), reduciendo enormemente el coste computacional, realizando un barrido por el resto de áreas hasta completar la imagen; por ejemplo para trabajos y líneas de investigación que utilizan un proceso de muestreo e interpolación, como por ejemplo *13+*14+. 1U Curso 2019-2020 28 MVID Tema 1. Sistema de visión humano Figura 2.31 Los movimientos oculares de un no profesional, un estudiante de fotografía, y un fotógrafo profesional. 1U Curso 2019-2020 29 MVID Tema 1. Sistema de visión humano 1.0. Introducción La Acústica es la disciplina que se ocupa de estudiar el sonido en sus diversos aspectos. Se puede dividir en una gran cantidad de subdisciplinas, entre ellas: 1. Acústica física. 2. Psicoacústica. 3. Acúsica musical. 4. Acústica arquitectónica. 5. Acústica fisiológica. 6. Macroacústica. 7. Acústica estructural. 8. Acústica fonética. 9. Mediciones acústicas. La Acústica física es la disciplina que se encarga del análisis de los fenómenos sonoros mediante modelos físicos y matemáticos. 1.1. El sonido. El sonido es una variación de presión del aire que puede ser percibida por el oído humano.Para lograr esta percepción, es imprescindible que estas variaciones se efectúen dentro de una determinada gama de frecuencias, para las cuales el oído humano está preparado, y que está comprendida entre 20 y 20.000 ciclos por segundo (Hz) aproximadamente. Por debajo de 20 Hz las variaciones de presión ya no son percibidas como sonido por el oído, aunque si tienen suficiente amplitud, pueden llegar a notarse por el tacto (infrasonidos). 1U Curso 2019-2020 30 MVID Tema 1. Sistema de visión humano Si la frecuencia de los cambios de presión es superior a 20 Khz nos encontraremos en presencia de los "ultrasonidos", muy abundante en nuestro entorno, y que, aunque no podamos oirlos como algunos animales, si que los utilizamos en nuestro provecho en multitud de aplicaciones (ecografía, limpieza, soldadura, etc.). Por tanto, el sonido es simplemente una variación de la presión atmosférica que tiene lugar con una determinada rapidez o frecuencia. Por lo tanto no es de extrañar que en el vacío no exista sonido, al no haber aire o cualquier otro fluido cuya presión pueda cambiar. 1.2. El sonido: un fenómeno ondulatorio El sonido consiste en la propagación de una perturbación en el aire. Para comprender mejor este concepto imaginemos un tubo muy largo lleno de aire, con un pistón en un extremo. El aire está formado por una cantidad muy grande de pequeñas partículas o moléculas. Inicialmente, el aire dentro del tubo está en reposo, o, más técnicamente, en equilibrio (Figura - a). Este equilibrio es dinámico, lo cual significa que las moléculas no están quietas, sino que se mueven caóticamente en todas las direcciones debido a la agitación térmica, pero con la particularidad de que están homogéneamente repartidas en el interior del tubo. En otras palabras, en cada centímetro cúbico de aire, ya sea cerca del pistón o lejos de él, hay 1U Curso 2019-2020 31 MVID Tema 1. Sistema de visión humano aproximadamente la misma cantidad de moléculas (una cantidad muy grande: unos 25 trillones). Para comprender mejor el fenómeno de la propagación del sonido hemos de imaginarlo como una serie de compresiones y rarefacciones de las moléculas del aire que se desplazan en todas las direcciones Propagación de una perturbación en un tubo. (a) El aire en reposo (moléculas repartidas uniformemente). (b) Ante una perturbación el aire se concentra cerca del pistón. (c), (d), (e) La perturbación se propaga alejándose de la fuente. Supongamos ahora que se desplaza rápidamente el pistón hacia el interior del tubo(Figura 1.1b). Las moléculas que se encuentran junto al pistón serán empujadas por éste, mientras que las que se encuentran muy alejadas no. Esto implica que en la zona del pistón el aire se encontrará más comprimido que lejos de él, es decir que la misma cantidad de aire ahora ocupa menos espacio. En otras palabras, habrá ahora más moléculas por centímetro cúbico cerca del pistón que lejos de él. Al igual que lo que sucede cuando se abre la válvula de un neumático, el aire comprimido tiende a descomprimirse, desplazándose hacia la derecha, y comprimiendo a su vez el aire que se encuentra próximo a él (Figura 1.1c). Esta nueva compresión implica, otra vez, una tendencia a descomprimirse, que se efectiviza a costa de comprimir el aire contiguo (Figura 1.1d). 1U Curso 2019-2020 32 MVID Tema 1. Sistema de visión humano El proceso se repite así en forma permanente, con lo cual la perturbación original (la compresión del aire cercano al pistón) se propaga a lo largo del tubo alejándose de la fuente de la perturbación (el pistón). Este proceso se denomina también propagación de una onda sonora, y es similar a lo que sucede cuando en una pileta en calma se deja caer una piedra. En el instante en que la piedra golpea el agua, se produce una perturbación, que se propaga en forma de una circunferencia cuyo radio va en aumento, como se aprecia en la siguiente figura. Una perturbación de la superficie del agua en una pileta inicialmente en calma se propaga como una circunferencia de radio .cada vez mayor. Al aire libre, es decir sin la restricción de un tubo (y en ausencia de superficies que reflejen el sonido), la perturbación se propaga, similarmente, en forma de una onda esférica cuyo radio va aumentando a medida que transcurre el tiempo. 1.3. Velocidad del sonido Ahora nos preguntamos qué tan rápido se aleja la onda de la fuente. La respuesta es que el sonido se propaga con una velocidad VS que en el aire a 20 ºC vale VS-20 = 343 m/s Esta velocidad varía con la temperatura según la siguiente ecuación: VS-T = 343 m/s + ( T – 20ºC) * 0,6 1U Curso 2019-2020 33 MVID Tema 1. Sistema de visión humano Una observación importante es que la velocidad del sonido es independiente de la intensidad de la perturbación. Veamos algunos ejemplos. Si una persona se encuentra a 100 m de distancia de otra, un grito de la primera tardará, a causa de esta velocidad, 29 centésimas de segundo en llegar a donde se encuentra la segunda. Otro ejemplo es el de los relámpagos y los truenos. Un relámpago es una enorme chispa que se produce por una descarga eléctrica entre distintas capas de aire con cargas opuestas. Esta chispa produce a la vez luz y sonido. Sin embargo, la luz viaja a una velocidad mucho más alta, y alcanza nuestra vista casi instantáneamente, mientras que el sonido demora un tiempo apreciable en llegar a nosotros. Así, si cronómetro en mano comprobamos que el trueno se escucha 5 s después de ver un relámpago, conociendo la velocidad del sonido podemos calcular que el relámpago se produjo a una distancia d = 343 m/s × 5 s = 1715 m = 1,715 km. Otro ejemplo interesante es el eco. Si gritamos frente a una superficie vertical un tanto alejada (por ejemplo una barranca o un acantilado), el sonido tardará un tiempo en llegar a la superficie, se reflejará en ella, y volverá demorando otro tiempo adicional. El resultado será que se escucha, unos instantes después, que la pared “repite” el grito. Más adelante veremos ejemplos correspondientes a los sistemas de sonido, en los cuales a causa de la distancia entre los altavoces y el público se producen retardos que es preciso corregir. 1.4. Sonidos periódicos El fenómeno sonoro que analizamos anteriormente (Figura 1.1) consistía en una única perturbación del aire. La mayor parte de los sonidos de la naturaleza son, en realidad, el resultado no de una sino de múltiples perturbaciones sucesivas. Estos sonidos se denominan periódicos, y pueden dividirse en ciclos, donde cada ciclo abarca todo lo que sucede entre dos perturbaciones sucesivas del aire. En la Figura 1.3 se muestra un ejemplo de un sonido de este tipo. En (a) todavía no se ha producido ninguna perturbación. 1U Curso 2019-2020 34 MVID Tema 1. Sistema de visión humano En (b) se produce la primera perturbación, que se propaga con una velocidad c alejándose del pistón. En (c), después de que la perturbación ha recorrido cierta distancia, el pistón se mueve nuevamente provocando una segunda perturbación. Mientras la primera perturbación sigue desplazándose con velocidad VS, la segunda comienza a hacerlo también con velocidad VS. En (d) y (e), se agregan nuevas perturbaciones, las cuales a su vez se propagarán con idéntica velocidad, y así sigue el proceso hasta que en algún momento cesa el sonido. En el aire libre, y lejos de toda superficie capaz de reflejar el sonido, las sucesivas perturbaciones se propagarán como esferas concéntricas crecientes que se alejan de la fuente. En presencia de superficies reflectoras, la onda deja de ser esférica para volverse sumamente compleja. Muchas veces se habla de campo sonoro para referirse a la forma en que se distribuye el sonido en los diversos puntos de un determinado espacio, por ejemplo dentro de una sala o al aire libre. Un sonido consecuencia de una perturbación repetitiva, es decir, periódica. (a) El aire en reposo. (b) Primera perturbación. (c) Segunda perturbación, cuando la primera ha recorrido una distancia λ (longitud de onda). (d) Tercera perturbación, cuando la primera ha recorrido una distancia 2λ y la segunda una distancia λ. (e) Cuarta 1U Curso 2019-2020 35 MVID Tema 1. Sistema de visión humano perturbación, cuando las anteriores han recorrido las distancias 3λ, 2λ, y λ respectivamente. El sonido se caracteriza, además de por su frecuencia, por su intensidad o amplitud de las fluctuaciones de la presión del aire. Estas variaciones de presión se miden en Pascales (Pa) y pueden ser tan pequeñas que apenas pueden ser oídas (umbral de la audición), o tan grandes que dañen nuestros oídos (umbral del dolor). 1.5. Longitud de onda Vamos ahora a definir algunos parámetros muy importantes relacionados con los sonidos periódicos. El primero es la longitud de onda, que se representa con la letra griega lambda, λ, y es la distancia entre dos perturbaciones sucesivas en el espacio (Figura 1.3). Se mide en metros (m) o en centímetros (cm), y para los sonidos audibles está comprendida entre los 2 cm (sonidos muy agudos) y los 17 m (sonidos muy graves). La longitud de onda es importante en varias situaciones. En primer lugar, un objeto grande comparado con la longitud de onda es capaz de alterar significativamente la propagación del sonido cuando se interpone entre la fuente sonora y el oyente. Así, por ejemplo, los sonidos graves pueden “doblar la esquina” fácilmente porque su longitud de onda es grande. Los agudos, en cambio, cuya longitud de onda puede ser de apenas algunos cm, se ven considerablemente atenuados. Otra situación en la cual la longitud de onda juega un papel importante es en la eficiencia de los altavoces. Cuando la longitud de onda λ emitida por un parlante es mucho más pequeña que su propio tamaño, la potencia emitida se reduce considerablemente. Por esa razón, los tweeters (altavoces de agudos) son mucho más pequeños que los woofers (altavoces de graves). Por último, veremos más adelante que la respuesta de los micrófonos se altera para aquellos sonidos de longitud de onda λ comparable con el tamaño del micrófono. 1.6. Periodo Un segundo parámetro es el periodo, T, que se define como el tiempo transcurrido entre una 1U Curso 2019-2020 36 MVID Tema 1. Sistema de visión humano perturbación y la siguiente. Se mide en segundos (s) o milisegundos (ms), es decir la milésima parte de un segundo. El periodo de los sonidos audibles para el ser humano varía entre los 0,05 ms (sonidos muy agudos) y los 50 ms (sonidos muy graves). Cabe destacar que son tiempos muy cortos que impiden en general que los ciclos puedan percibirse como fenómenos separados. El cerebro tiende a integrarlos en una única sensación, la sensación sonora. 1.7. Frecuencia El tercer parámetro, uno de los más fundamentales en Acústica, es la frecuencia, F. Se define como la cantidad de ciclos por segundo, o lo que es lo mismo, la cantidad de perturbaciones por segundo. Se expresa en hertz (Hz), unidad llamada así en honor a Heinrich Hertz, científico del siglo XIX que descubrió las ondas de radio. Esta unidad es equivalente al ciclo por segundo (cps), aunque la unidad Hz se encuentra más frecuentemente en los textos y en las especificaciones técnicas de los diversos equipos. La frecuencia de los sonidos audibles está comprendida entre los 20 Hz (sonidos graves) y los 20.000 Hz (sonidos agudos) ó 20 kHz (kilohertz, es decir 1.000 Hz). Existen algunas relaciones matemáticas importantes entre estos parámetros. Así, el periodo T y la frecuencia f están relacionados por las siguientes ecuaciones: F = 1/T y T = 1/F T se expresa en segundos (s) y F se expresa en hertzios (Hz Si sabemos que el periodo de cierto sonido es de 0,01 s, es decir 1/100 s, entonces la frecuencia será, aplicando la primera relación, 100 Hz. Si, en cambio conocemos que la frecuencia es de 1.000 Hz, aplicando la segunda relación se llega a que el periodo es de 0,001 s, es decir 1 ms. La otra relación importante es la que vincula la longitud de onda con la frecuencia, y es la siguiente: 1U Curso 2019-2020 37 MVID Tema 1. Sistema de visión humano λ = VS/F donde VS es la velocidad del sonido. Así, un sonido de frecuencia 500 Hz, tiene una longitud de onda de λ = 345/500 = 0,69 m = 69 cm. Como segundo ejemplo, la voz masculina (al hablar normalmente) tiene una frecuencia de unos 120 Hz, lo cual corresponde, según la fórmula anterior, a una longitud de onda de 2,88 m. 1.8. Presión sonora Según hemos visto, el sonido puede considerarse como una sucesión de ondas de compresión seguidas por ondas de descompresión que se propagan por el aire a una velocidad de 345 m/s. Sin embargo, si nos ubicamos en una posición fija, veremos que la presión atmosférica aumenta y disminuye periódicamente, conforme pasan por el lugar las sucesivas perturbaciones. Dado que nos referiremos bastante seguido a valores de presión, conviene aclarar que la unidad adoptada internacionalmente para la presión es el Pascal, abreviada Pa. Expresada en esta unidad, la presión atmosférica es del orden de 100.000 Pa (o, como se suele anunciar en los informes meteorológicos, alrededor de 1.000 hPa, donde hPa es la abreviatura de hectopascal, es decir 100 Pa). Ahora bien, los aumentos y las disminuciones de presión debidas a las ondas sonoras son realmente muy pequeños comparados con este valor de presión atmosférica. Los sonidos más intensos que se perciben como tales (después de eso se perciben como dolor) implican un aumento de unos 20 Pa. Para distinguir este incremento de la presión atmosférica en ausencia de sonido, se lo denomina presión sonora, abreviada p. Así, la presión sonora es lo que se debe agregar a la presión atmosférica en reposo para obtener el valor real de presión atmosférica. Por ejemplo, si la presión en reposo es de 100.000 Pa y la presión en presencia de un sonido es de 100.008 Pa, entonces la presión sonora es p = 100.008 Pa − 100.000 Pa = 8 Pa 1U Curso 2019-2020 38 MVID Tema 1. Sistema de visión humano El trabajar con la presión sonora en lugar de la presión total, nos ahorra tener que arrastrar números con gran cantidad de cifras. Las presiones sonoras audibles varían entre 0,00002 Pa y 20 Pa. El valor más pequeño, también expresado como 20 μPa (donde μPa es la abreviatura de micropascal, es decir una millonésima de Pa), se denomina umbral auditivo. 1.9. Representación gráfica del sonido Hasta ahora no habíamos tenido en cuenta la manera en que se aplican las perturbaciones sucesivas. Así, podría ocurrir que éstas fueran el resultado de un suave vaivéndel pistón, o que por el contrario cada perturbación consistiera en una brusca sacudida del mismo. La realidad es que aún manteniéndose la frecuencia, ambos sonidos sonarán muy diferentes, lo cual muestra la importancia de conocer la forma de la perturbación. Para ello se utiliza un tipo de representación gráfica denominada osci lograma, que consiste en mostrar la evolución en el tiempo de la perturbación en un par de ejes correspondientes al tiempo (eje horizontal) y a la presión sonora (eje vertical). El oscilograma de un sonido, en el cual pueden apreciarse 3 ciclos o periodos completos del mismo. En el eje horizontal se representa el tiempo y en el eje vertical la presión sonora. Obsérvese que la forma de onda es en este caso relativamente compleja. 1U Curso 2019-2020 39 MVID Tema 1. Sistema de visión humano El significado de este gráfico es que para cada instante t, representado como unpunto o posición en el eje horizontal, corresponde una presión sonora p, representada por una altura medida en la escala del eje vertical. Los valores positivos (arriba del eje t) representan compresiones y los valores negativos (debajo del eje t), descompresiones. 1.10. Amplitud El oscilograma nos permite interpretar fácilmente un parámetro del sonido vinculado a la fuerza o intensidad del mismo: la amplitud. La amplitud se define como el máximo valor que alcanza una oscilación en un ciclo. La amplitud se denomina también valor de pico o valor pico. Dos Dos ondas con igual frecuencia y forma de onda, pero con diferente amplitud. (a) Pequeña amplitud. (b) Gran amplitud. 1.11. Envolvente La amplitud de un sonido no es necesariamente constante, sino que puede variar en el tiempo. De hecho, la mayor parte de los sonidos reales tienen amplitud variable. Se define la envolvente de un sonido como la forma que se obtiene uniendo las amplitudes de los ciclos sucesivos. En la Figura 1.7 se puede apreciar una onda cuya amplitud varía en el tiempo. En línea de trazos se muestra la envolvente respectiva. Veremos que la envolvente es uno de los factores decisivos en la determinación del timbre de una voz o instrumento. El otro factor es el espectro. 1U Curso 2019-2020 40 MVID Tema 1. Sistema de visión humano Una forma de onda con amplitud variable con el tiempo. En línea de trazos se ha dibujado la envolvente, curva que une los picos de cada ciclo. 1.12. Nivel de presión sonora Para el rango de los sonidos audibles, la presión sonora varía entre valores extremadamente pequeños (0,00002 Pa = 20 × 10−6 Pa) hasta valores que si bien todavía pequeños, son un millón de veces más grandes que los anteriores (20 Pa). Estas cifras son poco prácticas de manejar, por lo cual se ha introducido otra escala que comprime este rango: la escala de decibeles. Para expresar una presión sonora en decibelios, se define primero una presión de referencia PREF que es la mínima presión sonora audible (correspondiente al sonido más suave que se puede escuchar): Pref = 0,00002 Pa = 20 μPa . Entonces se define el nivel de presión sonora, NPS (en inglés se utiliza la sigla SPL, sound pressure level), mediante la siguiente fórmula: NPS = 20 log10 ( P/PREF ) *dB+ donde P es la presión sonora, y log10 el logaritmo en base 10. El resultado está expresado en decibelios, abreviado dB. Así, para un sonido apenas audible, para el cual P = PREF , resulta NPS = 20 log10 ( P/PREF ) = 20 log10 1 = 0 dB , 1U Curso 2019-2020 41 MVID Tema 1. Sistema de visión humano dado que el logaritmo de 1 es 0. Como segundo ejemplo, consideremos un sonido que tiene una amplitud 1000 veces mayor que el anterior. Entonces NPS = 20 log10 ( 1000 PREF/PREF ) = 20 log10 1000 = 60 dB , Por último, para el sonido más intenso, NPS = 20 log10 ( 20 Pa/PREF ) = 20 log10 ( 20 Pa/20 μPa) 20 log10 1.000.000 = 120 dB , Nota: log10 1000 = 3 y log10 1000000 = 6. 1.13. Onda senoidal La onda senoidal es la más importante, no sólo en Acústica sino en toda la Física y gran parte de la Matemática: la onda senoidal. Si bien matemáticamente tiene cierta complicación (está representada por la función trigonométrica seno), físicamente esta forma de onda corresponde a las oscilaciones más sencillas posibles. Una forma de onda senoidal Lo que da mayor importancia a esta forma de onda es el hecho de que cualquier onda periódica 1U Curso 2019-2020 42 MVID Tema 1. Sistema de visión humano puede considerarse como una superposición (suma) de ondas senoidales de distintas frecuencias, todas ellas múltiplos de la frecuencia de la onda (propiedad conocida como Teorema de Fourier). Dichas ondas se llaman armónicos. La onda senoidal es la más simple precisamente porque consta de una sola frecuencia. 1.14. Espectro del sonido Cualquier sonido periódico puede representarse como la suma de una serie de armónicos, es decir de sonidos senoidales cuyas frecuencias son f, 2f, 3f, 4f, 5f, etc. Por ejemplo, el LA central del piano, cuya frecuencia es de 440 Hz, contiene armónicos de frecuencias 440 Hz, 880 Hz, 1320 Hz, 1760 Hz, 2200 Hz, etc. Cada uno de estos armónicos puede tener su propia amplitud. En la siguiente se muestran los primeros armónicos de una onda cuadrada; se ha obtenido su suma, que según se aprecia se va aproximando a la onda cuadrada. (a) Los tres primeros armónicos no nulos de una onda cuadrada de frecuencia fo, cuyas frecuencias son fo, 3fo y 5fo. (b) El resultado de superponer los tres armónicos, comparado con la onda cuadrada. Si bien tres armónicos son poca cantidad, vemos que comienza a esbozarse la forma de la onda cuadrada. La información sobre las frecuencias que contiene un determinado sonido y sus respectivas amplitudes constituyen lo que se denomina el espectro del sonido. El espectro se puede especificar en forma de tabla, o se puede representar gráficamente mediante un 1U Curso 2019-2020 43 MVID Tema 1. Sistema de visión humano espectrograma, que es un gráfico con dos ejes: el horizontal, graduado en frecuencia, y el vertical, en amplitud. En la Tabla 1.3 se indican los primeros armónicos para las ondas cuadrada, triangular y diente de sierra, suponiendo que la amplitud es, en los tres casos, 1. Tabla 1.3. Amplitud de los primeros 7 armónicos del espectro de las ondas cuadrada, triangular y diente de sierra. En la siguiente figura se representa el espectrograma para una onda cuadrada de amplitud 1 y frecuencia 100 Hz, incluyendo hasta el armónico 7. Espectro de una onda cuadrada de amplitud 1 y frecuencia 100 Hz. Esta onda tiene únicamente armónicos impares. Así como la amplitud de un sonido puede variar en el tiempo de acuerdo con su envolvente, también es posible que los diversos armónicos que integran determinada forma de onda posean sus correspondientes envolventes, que no tienen por qué ser iguales. De hecho, esto es lo que sucede en la mayoría de los sonidos naturales. Un caso bastante común es que los armónicos superiores (los de frecuencias más altas) se extingan antes que los de menor frecuencia, quedando al cabo de unos segundos un sonido prácticamente senoidal. Esto sucede 1U Curso 2019-2020 44 MVID Tema 1. Sistema de visión humano por ejemplo en el piano, cuyos sonidos comienzan con un gran contenido armónico (en cantidad y amplitud), lo cual se manifiesta como una sonoridad brillante e incisiva. A medida que transcurre el tiempo, los armónicos de mayor frecuencia van desapareciendo, y el sonido se vuelve más opaco. Agregando un tercer eje para representar el tiempo (lo cual obliga a una representación tridimensional, a menudo hecha sobre el papel o la pantalla recurriendo a la perspectiva), es posible representar gráficamente la variación temporal de cada armónico, como se muestra en la siguiente figura. Espectrograma tridimensional en el cual se pone de manifiesto la evolución temporal de cada armónico. En este ejemplo se ha tomado una forma de onda de 100 Hz con sólo 3 armónicos. El armónico 1 (100 Hz) se extingue rápidamente, el armónico 2 (200 Hz) se extingue muy lentamente, y el armónico 3 (300 Hz) se extingue moderadamente rápido. Al cabo de algún tiempo, por consiguiente, predomina ampliamente el segundo armónico. 1.15. Espectros inarmónicos Hasta ahora hemos analizado el caso de espectros armónicos, es decir en los cuales las frecuencias presentes eran múltiplos de cierta frecuencia, denominada frecuencia fundamental. No hay impedimento, sin embargo, para que los “armónicos” sean de frecuencias cualesquiera, 1U Curso 2019-2020 45 MVID Tema 1. Sistema de visión humano por ejemplo 100 Hz, 235 Hz y 357 Hz. De hecho, muchos sonidos naturales son de esta última clase, por ejemplo el sonido de las campanas, o el correspondiente a los diversos tipos de tambores. En estos casos las ondas senoidales que constituyen el sonido en cuestión se denominan sonidos parciales en lugar de armónicos. Este tipo de sonidos no es periódico, a pesar de lo cual también pueden representarse gráficamente en un oscilograma. Sin embargo, lógicamente, no podrá identificarse una frecuencia ni un periodo. El espectro correspondiente a estos sonidos se denomina espectro inarmónico. En el caso de los espectros inarmónicos también puede existir una variación en el tiempo, pudiendo en este caso inclusive variar no sólo la amplitud de los sonidos parciales sino también la frecuencia. En los sonidos reales esta variación existe, aunque normalmente es pequeña. Se debe a que la frecuencia con que vibran algunos cuerpos físicos varía ligeramente con la amplitud de vibración, por lo cual al ir disminuyendo esta amplitud, su frecuencia varía con ella. 1.16. Espectros continuos Existe aún otro tipo de sonidos, formados por una cantidad muy grande de parciales muy próximos entre sí, que se denominan genéricamente ruido. Algunos ejemplos de esto son el sonido del mar, el ruido de fondo de un cassette y el sonido que se emite al pronunciar las consonantes f, j, s, z o simplemente al soplar. Debido a la gran cantidad de parciales, y al hecho de que cada uno es de amplitud muy pequeña, lo más conveniente es representar el espectro no mediante líneas espectrales individuales, sino como una curva continua, denominada densidad espectral, p2. Ejemplo de espectro continuo de un ruido. En el eje horizontal se indica la frecuencia, y en el vertical la densidad 1U Curso 2019-2020 46 MVID Tema 1. Sistema de visión humano espectral, que representa la energía en función de la frecuencia. Existen dos tipos de ruido que tienen importancia específica en Acústica: el ruido blanco y el ruido rosa. También se menciona a veces el ruido browniano. El ruido blanco se caracteriza por tener una densidad espectral constante, es decir igual para todas las frecuencias. Esto significa que contiene parciales de todas las frecuencias con igual amplitud. El nombre de ruido “blanco” proviene de realizar una analogía con la luz blanca, que contiene todos los colores del espectro con la misma intensidad. El ruido rosa contiene mayor proporción de bajas frecuencias (de allí el nombre de “rosa”, ya que contiene todas las frecuencias pero más las bajas frecuencias, que en la luz corresponderían al color rojo). Tiene la particularidad de que en cada octava (es decir el intervalo de frecuencias desde un do al siguiente, o desde un re al siguiente, etc.) tiene la misma energía sonora. El ruido rosa tiene aplicación en la ecualización de sistemas de sonido mediante ecualizadores por octavas o por tercios de octava. Es también una señal útil para la prueba de equipos de sonido, ya que es un tipo de ruido que suena natural al oído. (a) Densidad espectral del ruido blanco. (b) Densidad espectral del ruido rosa. 1U Curso 2019-2020 47
0
Puede agregar este documento a su colección de estudio (s)
Iniciar sesión Disponible sólo para usuarios autorizadosPuede agregar este documento a su lista guardada
Iniciar sesión Disponible sólo para usuarios autorizados(Para quejas, use otra forma )