UNIVERSIDAD VERACRUZANA FACULTAD DE INGENIERÍA EN ELECTRÓNICA Y COMUNICACIONES ZONA POZA RICA - TUXPAN “FUNDAMENTOS EN LA DIGITALIZACIÓN Y PROCESAMIENTO DE UNA IMAGEN” MONOGRAFÍA QUE PARA OBTENER EL TITULO DE: INGENIERO EN ELECTRÓNICA Y COMUNICACIONES PRESENTA: HERNANDEZ SOSA CARLOS EMMANUELLE DIRECTOR DE MONOGRAFÍA: M. en C. ROMÁN GARCÍA RAMOS ASESOR DE MONOGRAFIA: M. en I. LUIS DAVID RAMÍREZ GONZÁLEZ POZA RICA, VER. 2007 Índice ÍNDICE CAPITULO I INTRODUCCIÓN 1 1.1 Antecedentes 1 1.2 Justificación 2 1.3 Objetivo 3 1.4 Alcance del trabajo 3 1.5 Limitaciones 3 CAPITULO II DIGITALIZACIÓN DE UNA IMAGEN ANALOGICA 4 2.1 Introducción 4 2.2 Digitalización 5 2.3 Dispositivos de digitalización 5 2.3.1 Escáner a) Generaciones del Escáner 6 6 b) El escáner de tambor 11 c) El escáner Plano 15 2.3.2 La cámara digital 16 a) Los componentes 17 b) Los sistemas de enfoque 18 c) Métodos de almacenamiento 19 d) Información cromática 20 e) Ventajas 21 f) Inconvenientes 21 g) Cámara filmadora 22 2.3.3 Tableta Digitalizadora 23 2.3.4 Lápiz Óptico 24 2.4 Imagen digitalizada 25 i CA Índice CAPITULO III PROCESAMIENTO DE UNA IMAGEN DIGITAL 27 3.1 Introducción 27 3.2 Muestreo y Cuantización 28 3.3 Espacio que ocupa una imagen digital 32 3.4 Procesamiento de Imágenes a color 34 3.5 Histogramas 36 3.6 Compresión de una imagen 38 3.6.1 Compresión sin pérdidas o sin error: 38 3.6.2 Compresión con pérdidas 42 3.6.3 Formatos de compresión más utilizados: 46 a) Formato JPG (Joint Photographic Group) 46 b) Formato GIF (Graphic Interchange Format) 47 c) Formato PNG (Portable Network Graphic) 48 d) Formato BMP (BitMaP) 49 e) Formato TIFF (Tagged Image File Format) 50 3.6.4 Problemas derivados de la compresión con pérdidas 50 CAPITULO IV APLICACIONES 53 4.1 Introducción 53 4.2 Tratamientos de una imagen digital 54 4.3 Imagen digital para la detección del Cáncer (La mamografía) 61 4.4 Imagen digital en Odontología 64 4.5 Imágenes digitales en la Ecografía 67 4.6 Imagen digital de la NASA demuestra que por la superficie de Marte corrió agua 69 CAPITULO V CONSIDERACIONES FINALES 72 GLOSARIO 74 ABREVIATURAS 80 BIBLIOGRAFÍA 83 ii Introducción CAPITULO I INTRODUCCIÓN 1.1 Antecedentes La digitalización es actualmente el medio más disponible y adecuado para la preservación de una imagen o un documento original así como para su acceso y difusión. Sin embargo, las nuevas tecnologías han permitido el desarrollo de la digitalización, que supera sus limitaciones y ofrece nuevas ventajas en cuanto a control de calidad de la imagen obtenida, a las posibilidades de navegación y al acceso al documento o imagen digital. El escanear un texto no se escanean letras, palabras y frases, sino sencillamente los puntos que las forman, una especie de fotografía del texto. La digitalización tiene un carácter de innovación y de prestigio. El procesamiento digital de imágenes se basa en manipular y analizar imágenes por computadora. El presente trabajo describe los fundamentos en la digitalización y procesamiento de una imagen. En el capitulo dos se centrará en el proceso de digitalización de una imagen analógica, mencionando algunos de los diferentes dispositivos de digitalización que existen hoy en día por ejemplo el escáner, la cámara fotográfica, etc. La imagen digitalizada no es tangible para nuestras manos, la imagen está compuesta por un código numérico que una computadora nos representa en la pantalla mediante píxeles, que englobados en el ojo humano lo interpreta como una imagen integra. I-1 Introducción En el capitulo tres se tratará del procesamiento de una imagen digital en el cual el muestreo y la cuantización son importantes para estos procesos. También se menciona como se realiza la compresión que reduce el número de bits necesarios para transmitir o almacenar una imagen digital, además se nombran algunos formatos de compresión más comunes. La calidad de una imagen puede verse afectada por las técnicas de compresión utilizadas o por el nivel de compresión aplicado. Las técnicas de compresión pueden ser sin pérdida o con pérdida. Estas compresiones admiten diferentes opciones, y según se elija, se puede llegar a una solución satisfactoria: imagen de buena calidad con tamaño aceptable. En capitulo cuatro se mencionan algunas de las muchas aplicaciones que existen en la actualidad en el procesamiento digital de imágenes que se utilizan la vida diaria, medicina e investigación. La aplicación de los diferentes tipos de procesamientos en cualquier área que utilicen las imágenes digitales, es posible resaltar los distintos elementos de forma más clara y sencilla que en una imagen normal a simple vista no pueden ser observados. 1.2 Justificación Proporcionar información que facilite a cualquier estudiante y público en general interesados en adquirir conocimiento en la digitalización de una imagen analógica y su procesamiento que entre otras cosas permita conseguir una mejor calidad de la imagen. El tema me resulta interesante para aumentar mis conocimientos y conocer el procesamiento correcto que debe conseguirse en una imagen digital. I-2 Introducción 1.3 Objetivo Adquirir los conocimientos fundamentales que se emplean en la digitalización de una imagen analógica, conocer la imagen digital interiormente para tener un mejor entendimiento sobre como darle un tratamiento que ayude a mejorar la calidad de la misma. Comprender los procedimientos de reducción del tamaño de almacenamiento de una imagen. Conocer que la imagen digital se aplica en diversas áreas. 1.4 Alcance del trabajo Se presenta la forma en que se efectúa la digitalización de una imagen, maneras en que se procesa correctamente una imagen digital. Se explicarán los procesos de digitalización, mostrando algunos ejemplos de estos. Mencionaré aplicaciones de la imagen digital en algunas áreas que son relevantes. 1.5 Limitaciones El presente trabajo se limita a imágenes en escala de grises (blanco y negro). Se mencionan fundamentos de digitalización y procesamientos de imágenes antes mencionadas con las similitudes de imágenes a color; estas últimas, son tratadas con poca profundidad, debido a que es demasiado amplio el tema para ser cubierto en este trabajo. I-3 Digitalización de una Imagen Analógica CAPITULO II DIGITALIZACIÓN DE UNA IMAGEN ANALÓGICA 2.1 Introducción Hoy en día se vive una era en la que todas las formas de la información están sufriendo un proceso de digitalización. Las imágenes por supuesto, no han podido escapar a este proceso. El digitalizar una imagen analógica se requiere de ciertos dispositivos electrónicos de reproducción de imágenes y posteriormente la imagen estará digitalizada. La reproducción de esa imagen almacenada en un soporte digital puede ser duplicada tantas veces como se desee, produciendo siempre una copia con la misma calidad que la imagen original. Se puede decir de una manera sencilla que la digitalización de una imagen, se crea como la descomposición de la misma en series de dígitos que pueden ser manejados por una computadora, facilitar la manipulación y aumentar la calidad de la imagen. II-4 Digitalización de una Imagen Analógica 2.2 Digitalización El término digitalización se puede asociar en una primera aproximación, como la forma en que una imagen, texto, fotos, sonido, movimiento, etc., se pueden convertir en un idioma comprensible para los sistemas digitales. Las señales exteriores que hacen posible la identificación en su estado natural, se transforman en código binario (0's y 1's) que mediante la utilización de procesos se pueden transformar de acuerdo a los requerimientos. En general se establecerá que digitalizar es convertir cualquier señal de entrada analógica (como una imagen o una señal de sonido, etc.) en una serie de valores binarios. 2.3 Dispositivos de digitalización 2.3.1 Escáner 2.3.2 Cámara Digital 2.3.3 Tableta Digitalizadora 2.3.4 Lápiz Óptico II-5 Digitalización de una Imagen Analógica 2.3.1 Escáner El escáner es un dispositivo electrónico diseñado para registrar caracteres escritos, gráficos en forma de fotografías o dibujos, todos ellos impresos en una hoja de papel, con lo que se facilita su introducción en la computadora, convirtiéndolos en información binaria comprensible para ésta. En este apartado utilizaré la palabra escáner refiriéndome a los diferentes términos semejantes encontrados durante la investigación (escáner y scanner). Hay diferentes tipos de escáner primero se presentan las generaciones y se finaliza con los tipos más usuales. a) Generaciones del Escáner Existen cuatro generaciones de escáner que se nombran a continuación: PRIMERA GENERACION El primer escáner, creado por la compañía EMI (Electrical and Musical Industries) fue diseñado y restringido a la exploración del cerebro humano (figura 2.1). Este hecho causó tremendo impacto en la Neurorradiólogia, porque este campo carecía de herramientas de diagnóstico simple. En un intento por aplicar el principio de la primera generación de escáner para el cuerpo, el Dr. Robert Ledley de la Universidad de Georgetown diseño y construyo un prototipo de escáner para el cuerpo, llamado escáner ACTA; logrando la patente de éste, el 14 de febrero de 1974. Las imágenes borrosas fueron presentadas con colores brillantes. II-6 Digitalización de una Imagen Analógica A pesar de tener poca calidad, estas imágenes se convirtieron en una promesa para el futuro del escaneo del cuerpo. Fig. 2.1 Principio de la primera generación CT escáner. SEGUNDA GENERACION Permiten la ampliación, reducción de la imagen y realizan el tramado, mediante tramas físicas de contacto. Hay una mínima diferencia entre la primera y la segunda generación del escáner, en lugar de un detector existe un número de ellos colocados con un ángulo pequeño en un abanico en el plano del explorador. El escáner de la primera y segunda generación tienen mucho en común y por lo tanto, el escáner de la primera generación puede algunas veces actualizarse a la segunda generación. Es una práctica común debido a su baja velocidad para grabar simultáneamente dos porciones doblando el número de detectores. El primer escáner de la segunda generación, el Delta 50, fue presentado en diciembre de 1974 por la empresa Ohio Nuclear. Tenía dos renglones de tres detectores. II-7 Digitalización de una Imagen Analógica En Marzo de 1975, EMI presentó un escáner con 30 detectores. Como resultado de su incremento en detectores fueron casi 10 veces más rápidos. Esto empezó con la era del escáner rápido en la segunda generación (figura 2.2). Este escáner no requiere la técnica de doble porción la cual resultó en una pequeña porción geométrica. La primera y segunda generación del escáner fue especialmente susceptible a los movimientos del cuerpo humano, pues estos movimientos no podían medirse durante los intervalos de rotación. Aunque rápidamente la segunda generación del escáner tuvo la ventaja de un corto tiempo de escaneo, también tuvo la desventaja de que no todos los haces de rayos X entre la fuente y el detector se enfocara por separado, y como parte del resultado de la radiación que pasaba por el paciente fue entre el detector y no era utilizado. El uso del escáner cambió rápidamente. El escáner de la primera generación era dedicado a la exploración del cerebro, el escáner de la segunda generación se usaba para la exploración de todo el cuerpo. Fig. 2.2 Principio de la segunda generación CT escáner. II-8 Digitalización de una Imagen Analógica TERCERA GENERACION Son los denominados EDG (Electronic Dot Generation) generación electrónica del punto, este tipo de escáner es muy sofisticado y de alta productividad, puede realizar múltiples correcciones y tratamientos, así como almacenar la información de imágenes en disco. La tercera generación del escáner es completamente un tipo nuevo, el movimiento de translación ha sido eliminado y el abanico (ángulo) ensanchado para incorporar el cuerpo entero. En el orden de 300 a 500 detectores fueron colocados dentro del espectro (abanico). Estos cambios hicieron más rápido el escaneo y como consecuencia la continúa adquisición de datos, provocando mucho menos susceptibilidad al movimiento. La tercera generación fue introducida por la empresa Artronix en 1974 como un escáner para el cerebro. En el verano de 1975 la empresa General Electronic anunció una mamografía como un proyecto piloto para el escaneo del cuerpo. Un problema inicial de la tercera generación del escáner era que cada detector contribuía principalmente al anillo de elementos de imágenes y cuando cada detector estaba mal calibrado, una forma de anillo se presentaba conjuntamente en el eje de rotación. Sin embargo este problema después fue solucionado usando detectores estables y procedimientos de calibración. La tercera generación es lo más extensamente posible aplicado en cuestión del escáner rápido. Durante 1978 y 1979 prácticamente toda la tercera generación manufacturó el doble de detectores y los incorporó al escáner (figura 2.3). II-9 Digitalización de una Imagen Analógica Fig. 2.3 Principio de la tercera generación CT escáner. CUARTA GENERACION Son los más utilizados actualmente. Constan de una unidad de entrada independiente conectada a la computadora mientras que la salida se realiza mediante una filmadora o CTP (Computer To Plate), este es uno de los últimos desarrollos tecnológicos en fase de implantación. Consiste en la filmación directa en la plancha de impresión, eliminando el paso a película. Este tipo de escáner es de los primeros que digitalizan imágenes, mediante un conversor analógico-digital. Aunque no ha resultado en un intento de disminuir el tiempo de exploración, como en el caso de previas generaciones, no puede ser realmente considerado una nueva generación sino como una variación de la tercera generación. II-10 Digitalización de una Imagen Analógica Esta variante originada de una búsqueda por mejorar la calidad de la imagen: la geometría de rayos X, es tal que, las distorsiones de anillo no sean probables de ocurrir. La más avanzada variación a la cuarta generación es el concepto desarrollado por EMI llamado el escáner de anillo distribuido, donde el tubo de rayos X a las afueras del detector y el lado más cercano del detector del tubo, es continuamente jalado hacia afuera para dejar pasar los rayos X. Este escáner fue presentado en diciembre de 1977 (figura 2.4). Fig. 2.4 Principio de la cuarta generación CT escáner. b) El escáner de tambor El escáner de tambor ha sido tradicionalmente el dispositivo de reproducción electrónica de imágenes y posteriormente de digitalización. Hoy en día sigue siendo el sistema que aporta la más alta calidad y resolución, sobre todo para la realización de ampliaciones. En los dos gráficos siguientes se pueden apreciar las dos unidades: de análisis (figura 2.5) y de exposición (figura 2.6) que conforman el escáner de la tercera generación: II-11 Digitalización de una Imagen Analógica Fig. 2.5 Unidad de análisis. Fig. 2.6 Unidad de exposición o recorder. En el escáner de tambor, la imagen se coloca alrededor de la superficie de un tambor transparente. El original suele ser negativos o transparencias (guardan más calidad que las fotografías en papel). Las transparencias se bañan en un aceite especial, una delgadísima capa, que asegura un contacto perfecto con la superficie del tambor. II-12 Digitalización de una Imagen Analógica Fig. 2.7 Escáner de tambor PTM. En la figura 2.7 se pueden apreciar todos los elementos del escáner de tambor: Cilindro de exploración, fuente luminosa, lente y espejo, espejos dicroicos y tubos fotomultiplicadores, así como la trayectoria de la luz para un original transparente. A continuación se explica la función de cada uno de ellos: Cilindro de exploración De material transparente (metacrilato, plexiglás o cristal) se encarga de soportar los originales. Éstos deben estar bien sujetos al cilindro o tambor mediante cinta adhesiva para evitar movimientos durante la exploración. II-13 Digitalización de una Imagen Analógica Fuente luminosa El escáner de tambor dispone de una fuente luminosa que actúa de dos formas dependiendo del tipo de original: - Si el original es opaco, la luz se proyecta desde el cabezal de exploración. - Si el original es transparente, la luz se proyecta mediante un brazo articulado, desde el interior del cilindro para que la luz atraviese la diapositiva. Conjuntos de lentes y espejos La trayectoria de la luz reflejada o transmitida por el original no mantiene una línea recta, de tal forma que se hace necesario disponer de un conjunto de espejos que modifiquen dicha trayectoria y un juego de lentes que mantengan enfocada la imagen desde el cabezal de exploración hasta los fotomultiplicadores. Espejos dicroicos Estos espejos son los responsables de la separación del color, cada uno de los espejos está construido para permitir o reflejar un rayo de luz en función de su longitud de onda, de tal forma que las luces reflejadas son enviadas al fotomultiplicador. Fotomultiplicadores La función del fotomultiplicador al igual que en el escáner plano que utiliza el CCD (Charge Coupled Device, dispositivo acoplado por carga eléctrica) es la de transformar la luz en señal eléctrica. Una de las principales ventajas de los fotomultiplicadores frente al CCD es la de ser sensible a intensidades muy bajas de luz, con lo que se asegura la captación del detalle en las zonas de sombras de las diapositivas (las cuales alcanzan niveles de densidad de 5,00 D). Esa señal eléctrica será finalmente enviada al convertidor Analógico / Digital (convertidor A/D) el cual generará los píxeles con los valores tonales en función de la resolución y el tipo de imagen escaneada; esta operación es necesaria para que la estación de trabajo pueda procesar la información. II-14 Digitalización de una Imagen Analógica c) El escáner Plano Fig. 2.8 Escáner Plano. Escáner plano o de sobremesa (figura 2.8), es uno de los más utilizados. Normalmente se suelen utilizar para escanear imágenes o textos planos aunque también para objetos. Cómo funciona: El proceso de captación de una imagen resulta casi idéntico para cualquier escáner: ilumina la imagen con un foco de luz, se conduce mediante espejos la luz reflejada hacia un dispositivo denominado CCD que transforma la luz en señales eléctricas, convierte dichas señales eléctricas a formato digital en un convertidor A/D y transmite el caudal de bits resultante a una computadora. II-15 Digitalización de una Imagen Analógica El CCD es el elemento fundamental de todo escáner, independientemente de su forma, tamaño o mecánica. Consiste en un elemento electrónico que reacciona ante la luz, transmitiendo más o menos electricidad según sea la intensidad y el color de la luz que recibe; es un auténtico ojo electrónico. Hoy en día es bastante común, puede que la mayoría de las personas tengan uno sin saberlo: en una cámara de vídeo, en el fax, en una cámara de fotos digital. La calidad final del escaneado dependerá fundamentalmente de la calidad del CCD; los demás elementos podrán hacer un trabajo mejor o peor, pero si la imagen no es captada con fidelidad cualquier operación posterior no podrá arreglar el problema. Teniendo en cuenta lo anterior, también se debe considerar la calidad del convertidor A/D, puesto que de nada sirve captar la luz con enorme precisión si se pierde mucha de esa información al transformar el caudal eléctrico a bits. Por este motivo se suele decir que es preferible el escáner de marca de prestigio u otro con una mayor resolución teórica, pero con CCDs que no captan con fidelidad los colores o convertidores A/D que no aprovechan bien la señal eléctrica, dando resultados de menor calidad. 2.3.2 La cámara digital La cámara digital captura imágenes de calidad instantáneas sin la necesidad de un revelado tradicional. Existen muchos tipos de cámaras (figura 2.9) dentro del campo de las imágenes digitales, estás satisfacen una variedad de gustos y necesidades, actualmente hay varios modelos, económicos para el publico en general y hasta las más sofisticadas con precios elevados para el fotógrafo profesional. II-16 Digitalización de una Imagen Analógica Existen cámaras digitales con lentes fijos o intercambiables, con visor o con pantalla de visualización en la zona posterior, con controles sofisticados y hasta con flash. La cámara digital cuenta con varios elementos computacionales que se mencionan a continuación los cuales aportan no solo a la calidad de la imagen final, sino también a la cantidad monetaria que se invierte. Fig. 2.9 Cámaras Digitales. a) Los componentes Al interior del cuerpo de la cámara digital se encuentra una alta tecnología la cual abarca principalmente a chips y circuitos. Estos elementos trabajan en conjunto para calcular una exposición idónea al mismo tiempo que logran un enfoque nítido. Al pasar la luz por el lente cae sobre las células sensibles CCD las cuales dirigen la información al procesador de la cámara. El dispositivo CCD se encuentra directamente dentro del lente y dentro del cuerpo de la cámara, es un chip de células fotosensibles las cuales emiten una carga eléctrica cuando la luz cae sobre ellas. II-17 Digitalización de una Imagen Analógica El CCD llegó en esta era digital a tomar el lugar de la película fotográfica, entre más sensores individuales tenga, mejor es la calidad de la imagen. Las cámaras para uso del publico en general llegan a tener hasta 480,000 sensores, y las profesionales hasta 14, 000, 000 sensores. Entre más fina la cámara, más fino es el sistema que determina la apertura adecuada del diafragma (el cual controla la cantidad de luz). Algunas cámaras traen un sistema interno el cual mide varios puntos de la imagen para calcular la exposición, y algunos otros únicamente miden al centro de la imagen. b) Los sistemas de enfoque En cuanto a la nitidez de la imagen, existen sistemas manuales de enfoque y otros de autoenfoque. El sistema manual es idéntico al de las cámaras tradicionales. En cambio el sistema autoenfoque presenta dos opciones, la activa y la pasiva. La opción activa arroja un rayo infrarrojo o de ultrasonido desde la cámara el cual cae y rebota sobre el objeto o escena que se encuentre frente al lente midiendo así la distancia entre este y la superficie del CCD. La opción pasiva procesa la información que pasa a través del lente directamente del objeto o escena que se fotografía. Como en muchas de las cámaras tradicionales, el lente de la cámara digital puede contar con un círculo, con una línea la cual lo parte por la mitad, si la imagen se percibe dividida, esto significa que no esta bien enfocada la imagen, se deben unir los medios para conformar una imagen nítida. Para enfocar la imagen, el CCD se encarga de dirigir los rayos de luz que se encuentran dentro del círculo hacia el procesador y este en turno, activa al motor del lente para ajustar el foco de la imagen y para determinar la exposición. II-18 Digitalización de una Imagen Analógica Este procesador captura los voltajes provenientes del CCD y modela la imagen la cual se guardara dentro del sistema específico de memoria de la cámara digital. c) Métodos de almacenamiento La información digital que captura la cámara se puede almacenar de diversas formas, la transferencia de las imágenes a la computadora precisa el uso de software de manipulación y edición específicas. Muchas cámaras traen la opción de tomar y descargar las imágenes de inmediato en la computadora conectando la cámara a esta por medio de un cable adaptador hacia un puerto específico. Con esto se puede editar, borrar eficientemente y almacenar únicamente las imágenes que más se quieren. También permite que se envíen las imágenes digitales por correo electrónico o Internet (cosa que ha llegado a revolucionar al fotoperiodismo). También hay algunos modelos que permiten mostrar las imágenes capturadas en casi cualquier TV, reproductora de vídeo o proyector multimedia por medio de una conexión de salida de vídeo de la cámara. La mayoría tiene memorias las cuales se mencionan a continuación: - Memoria removible: almacenan fotografías en una tarjeta de memoria. Algunas las almacenan en un disquete regular que se usa dentro de esta. Se puede reemplazar una tarjeta de memoria desmontables con capacidad de Mb específica o disquete cuando esté llena. - Memoria incorporada: almacenan al menos 20 fotografías. Una vez que está llena, se las transfiere a la computadora. II-19 Digitalización de una Imagen Analógica Estas tarjetas capturan una cantidad de imágenes predeterminadas por el fabricante de la cámara, y almacena imágenes de menor a mayor grado de compresión (entre mayor compresión más imágenes caben en la tarjeta). Tienen la ventaja de que una vez que se descargan, se pueden utilizar una y otra vez. En general, el formato de las imágenes digitales es de tipo JPG, esto permite que se puedan exportar desde la cámara a una gran variedad de programas de tratamiento a una computadora. d) Información cromática La mayoría incluyen una pantalla tipo visualizador de cristal líquido (LCD), que puede utilizar para tener una vista preliminar y visualizar las fotografías. El diseño del CCD determina que su mecanismo permita grabar imágenes en tonos de gris; es decir, en blanco y negro, y en un sistema monocromático. Con película de color la imagen se graba en varias capas sensibles al color, ya que cada capa es transparente. Como el CCD es una capa única opaca se presentan varias opciones: Tres sensores del CCD los cuales van montados dentro del cuerpo de la cámara. Este cuerpo contiene dentro un sistema de prisma el cual parte el rayo de luz y separa la imagen en tres bandas de rojo, verde y azul, gracias a filtros de color colocados detrás de la lente. Las tres señales distintas se integran en una única dentro de la computadora. Filtrar el color sobre el mismo CCD se puede lograr si los sensores individuales se pueden dividir en un conjunto de filtros (rojo, verde y azul) montados sobre la superficie del sensor. II-20 Digitalización de una Imagen Analógica e) Ventajas El formato digital se basa en el almacenamiento de la imagen mediante dígitos, que se mantendrán inmutables a lo largo del tiempo, con lo que la calidad de la imagen no disminuirá nunca. La imagen digital puede ser repetida varias veces, produciendo siempre una copia de igual calidad que la imagen original. Sobre la imagen digital se pueden realizar una enorme cantidad de procesos de retoques informáticos que facilitan la labor de reproducción de copias con mejor calidad que los propios originales. En algunos casos se pueden conseguir efectos de muy diversos tipos: enfoque/desenfoque, aplicación de filtros, modificación de la gama de colores, de contrastes, de brillos, etc. f) Inconvenientes Se trata de una tecnología relativamente trascendente por lo que se puede prever que los equipos que se compren en la actualidad quedarán en desuso. La introducción de la tecnología digital implica otra serie de inconvenientes propios de toda la tecnología emergente, entre los que se pueden destacar los elevados precios y los diferentes tamaños. La calidad aportada es suficiente para la mayoría de los trabajos realizables por un auténtico profesional. No obstante se debe reconocer que es inferior a la que se puede conseguir con materiales químicos. II-21 Digitalización de una Imagen Analógica g) Cámara Filmadora Las filmadoras (figura 2.10) son unos aparatos periféricos altamente especializados que convierten información, que se les introduce en código binario, en imágenes con una calidad similar a la de una imprenta (1.600 puntos por pulgada como mínimo) o fotogramas similares a los de cinematografía. Las filmadoras se pueden conectar a una computadora o trabajar con ellas remotamente llevando la información hasta el punto donde están por medio de un soporte magnético. Fig. 2.10 Cámara filmadora. Se utilizan para grabar conversaciones y otros sonidos, utilizando programas de conferencia para comunicarse a través de Internet. Con los programas de control de voz se puede conversar en un micrófono y emplear los comandos de voz para controlar la computadora. Las formas de grabar los sonidos de las filmadoras son: Unidireccional: graba sonidos de una dirección, lo que ayuda a reducir el ruido de fondo. Este tipo es útil para grabar una voz individual. II-22 Digitalización de una Imagen Analógica Omnidireccional: graba sonidos de todas direcciones. Este tipo es útil para grabar varias voces en una conversación en grupo. 2.3.3 Tableta Digitalizadora Es una tableta compacta generalmente de 127 x 102 mm que incorpora un lápiz sin cables (figura 2.11). Esta excelente herramienta de trabajo permite adaptar una pizarra electrónica ideal para los ordenadores portátiles. Permiten el manejo del cursor a través de la pantalla del sistema informático y facilitan una importante ayuda en el tratamiento de los comandos de órdenes en aplicaciones de CAD / CAM (diseño asistido por computadora). Fig. 2.11 Tableta Digitalizadora. Las tabletas digitalizadoras convierten una serie de coordenadas espaciales en un código binario que se introduce en la computadora. Estas coordenadas serán manejadas posteriormente por programas de dibujo, ingeniería, etc. II-23 Digitalización de una Imagen Analógica La tableta suele tener impresos en su armazón pulsadores con símbolos dibujados para ejecutar de modo directo comandos que agilizan el trabajo de manejo del software. Las tabletas digitalizadoras poseen una resolución de alrededor de una décima de milímetro y pueden manejar gráficos en dos o tres dimensiones. Una posibilidad de manejo muy intuitiva convierte a las tabletas digitalizadoras en unas herramientas muy útiles y pequeñas en los sistemas informáticos de diseño y manejo de gráficos. Existen diversas tecnologías de construcción de tabletas, pudiendo ser éstas: • Tabletas mecánicas. • Tabletas electrónicas. Las mecánicas, debido al desgaste producido en sus componentes por el uso continuado, son menos precisas y más delicadas de manejar que las electrónicas, siendo las más extendidas comercialmente en el mercado. 2.3.4 Lápiz Óptico Es un instrumento en forma de lápiz que por medio de un sistema óptico, ubicado en su extremo, permite la entrada de datos directamente a la pantalla. Para elaborar dibujos, basta con mover el lápiz frente a la pantalla y en ella va apareciendo una línea que describe dicho movimiento, igualmente se puede mover líneas de un sitio a otro, cuando se coloca el punto de la pluma en la pantalla y se presiona un botón, un dispositivo siente dentro de la pluma activada. Transmite a la memoria de la computadora el sitio de la luz en la pantalla. También sirve para señalar ítems de los menús al igual que el mouse. II-24 Digitalización de una Imagen Analógica Los lápices ópticos son dispositivos de introducción de datos que trabajan directamente con la pantalla de la computadora, señalando puntos en ella y realizando operaciones de manejo de software. Para operar con el lápiz óptico se coloca éste sobre la pantalla del sistema informático. En el momento en que el cañón de rayos catódicos de la pantalla barre el punto sobre el que se posiciona el lápiz, éste envía la información a un software especial que la maneja. El microprocesador calcula cuál es la posición sobre la pantalla de la computadora permitiendo manipular la información representada en ella. Los lápices ópticos son una asistencia para las limitaciones de los teclados en algunas aplicaciones, sobre todo las que no son de gestión pura (creativas, etc.). O bien los bolígrafos-escáner, utensilios con forma y tamaño de lápiz o marcador fluorescente que escanean el texto por encima del cual se pasan y a veces hasta lo traducen a otro idioma al instante. 2.4 Imagen digitalizada Una imagen digitalizada se caracteriza por poder ser representada mediante una serie de dígitos binarios. Es decir, cualquier imagen digital se puede almacenar en un formado por una larga secuencia como el siguiente tipo: “100101010100001110010010110100111101010……. “ Simplificando, se puede decir que cada imagen puede ser descompuesta en una serie de cuadriculas minúsculas y elementales, cada una de ellas estará representada por determinado número de dígitos binarios que, en definitiva, representan tanto su intensidad de iluminado como su color. Un ejemplo de digitalización de una imagen en blanco y negro se muestra en la figura 2.12. II-25 Digitalización de una Imagen Analógica Fig. 2.12 Imagen analógica transformada en secuencias de ceros y unos. Para obtener una imagen digital es necesario el proceso de muestreo para descomponerla en píxeles y la cuantización que asigna un valor de luminosidad de la imagen original (figura 2.13). Fig. 2.13 a) Lenna; b) Extracto de Lenna; c) Niveles de gris. II-26 Procesamiento de una Imagen Digital CAPITULO III PROCESAMIENTO DE UNA IMAGEN DIGITAL 3.1 Introducción Actualmente la tecnología digital ha despojado a la fotografía de su legado de verdad y rompe definitivamente esa conexión existencial, hasta ahora indisoluble con su referente. Muchos intelectuales imaginan ya la muerte de la fotografía tal y como se conoce hoy, para dar paso a una era post-fotográfica, en la que la imagen se vuelve cada vez más maleable y manipulable; una era donde lo real y lo irreal (nunca mejor que ahora definido por su categoría virtual) comienzan a mezclarse indisolublemente. Las nuevas imágenes sintéticas parecen haberse centrado especialmente en la idea de la “pérdida de lo real”, puesto que la propia realidad ha comenzado a ser reemplazada por el mundo de la simulación digital. La imagen digital es un producto del desarrollo de la tecnología que tiene como antecesor a la fotografía, (que toma como punto de partida un objeto del mundo real) y a la pintura, (donde la imagen ha sido creada por un artista). Como el principio básico de los multimedios permite manipular la tradicional estructura del medio en sí, en la imagen digital se pueden ver incluidos los dos hechos, la originalidad de la imagen cuando es tomada por primera vez, y luego el resultado de los procesamientos de la imagen digital, que forman parte del arte digital contemporáneo. La imagen digital toma vida mediante un archivo de diferentes formatos, que puede ser almacenado en una PC, diferentes unidades flexibles, enviado por correo electrónico e incluso ser impreso. III-27 Procesamiento de una Imagen Digital 3.2 Muestreo y Cuantización El termino procesamiento digital de imágenes trata sobre la manipulación y análisis de imágenes por computadora. El procesamiento de imagen puede considerarse como un tipo especial del procesamiento digital en dos dimensiones, el cual se usa para revelar información sobre imágenes y que involucra hardware, software y soporte teórico. El término imagen corresponde a una imagen monocromática y se refiere a una función bidimensional de intensidad de luz f(x; y), donde x y y denotan las coordenadas espaciales y el valor de f en cualquier punto (x; y) es proporcional al brillo (o nivel de gris) de la imagen en ese punto. La figura 3.1 muestra la convención de coordenadas que se usará. Una imagen digital es una imagen f(x; y) que ha sido discretizada en coordenadas espaciales y en brillo. Una imagen digital puede considerarse como una matriz cuyos índices del renglón y columna identifican un punto en la imagen y el correspondiente valor del elemento de la matriz que identifica el nivel de intensidad de luz en ese punto. Para trabajar con números en la computadora, el nivel de brillo, o valor de cada píxel, es cuantizado a códigos binarios enteros positivos (el brillo no puede ser negativo). El número de niveles de cuantización está determinado por la relación. G = 2k III-28 Procesamiento de una Imagen Digital Fig. 3.1 Convención de ejes usada. Donde k representa el número de bits necesarios para cada muestra. Esto es, con 5 bits de cuantización en la intensidad se pueden representar 32 niveles de gris (25 = 32). Para tener una imagen de buena calidad para el ojo humano es necesario tener como mínimo 64 niveles de gris. Para una apreciación fina se usa una cuantización estándar a 8 bits, esto es, 256 niveles de gris. A una imagen cuantizada de esta manera se le conoce como imagen en tonos de gris. La cuantización a 8 bits (1 byte) se dice estándar porque es el mínimo número direccionable directamente por la mayoría de los microprocesadores. Una imagen natural capturada con una cámara, un telescopio, un microscopio o cualquier otro tipo de instrumento óptico presenta una variación de sombras y tonos continuos. Imágenes de este tipo se llaman imágenes analógicas. Para que una imagen analógica, en blanco y negro, en escala de grises (llamadas comúnmente, imágenes en blanco y negro) como se muestra en la figura 3.2, pueda ser "manipulada" usando una computadora, primero deben convertirse a un formato adecuado. Este formato es la imagen digital correspondiente. III-29 Procesamiento de una Imagen Digital Fig. 3.2 Imagen en escala de grises. La transformación de una imagen analógica a otra discreta se llama digitalización y es el primer paso en cualquier aplicación de procesamiento de imágenes digitales, estos son: muestreo y cuantificación. Muestreo: la imagen se divide en líneas horizontales y estas a su vez se descomponen en una serie de puntos o píxeles. Cuantificación: a cada uno de estos puntos se le asigna un valor en función de la luminosidad o color de la imagen original. El proceso de digitalización, que permite manejar una imagen en una computadora, implica que la función imagen f(x, y) se muestrea en una matriz con N columnas y M filas (figura 3.3a). El proceso de cuantización asigna a cada muestra de la matriz un valor entero (figura 3.3b). Cada valor representa al valor de la variable física en ese punto. III-30 Procesamiento de una Imagen Digital Fig. 3.3 a) Matriz de Muestreo; b) Matriz de Cuantización. El rango continuo de la función imagen f(x, y) se discretiza en k intervalos. La fineza del muestreo (valor de N y M) y el grado de cuantización (valor de k) determinan el grado de aproximación de la imagen digital a la función imagen continua f(x, y). Por ejemplo para el caso de muestreo se presenta en la figura 3.4. Fig. 3.4 Ejemplo de muestreo. III-31 Procesamiento de una Imagen Digital El valor de la función imagen se expresa, en procesado de imagen, mediante valores digitales. El número de niveles de cuantización es fundamental para la percepción humana de los detalles finos de la escena. La mayor parte de los dispositivos de digitalización usan G intervalos iguales. Un ejemplo se presenta en la figura 3.5. Fig. 3.5 Ejemplo de cuantización. 3.3 Espacio que ocupa una imagen digital La cantidad de niveles de gris y la finura del mallado que se elija, deben producir una imagen digital aceptable, en el sentido de que no sea perceptible al ojo humano el paso de un color a otro, entre dos píxeles consecutivos. El número de filas M, el número de columnas es N y el grado de profundidad o niveles de gris es k. Sin embargo, se debe de tener en cuenta que si el muestreo consiste en un mallado de N por M cuadrados y el número de niveles de gris permitido son G=2 k, entonces el número de bits necesarios para almacenar una imagen digitalizada es: III-32 Procesamiento de una Imagen Digital NxMxk Por ejemplo, una imagen de 128 x 128 con 64 niveles de gris necesita 98,304 bits = 12 KB de memoria. Una de 256 x 256 con 32 niveles de gris necesita 327,680 bits = 40 KB. Y una de 1024 x 1024 con 256 niveles de gris necesita 8, 388,608 bits = 1024 KB = 1 MB. Otros ejemplos sobre diferentes tipos de dimensiones y grado de profundidad, se muestran en la tabla 3.1. Imagen Niveles de gris bits Memoria 64 x 64 16 16,384 2 KB 64 x 64 64 24,576 3 KB 64 x 64 256 32,768 4 KB 128 x 128 64 98,304 12 KB 128 x 128 256 131,072 16 KB 128 x 128 512 147,456 18 KB 256 x 256 32 327,680 40 KB 256 x 256 64 393,216 48 KB 256 x 256 128 458,752 56 KB 512 x 512 128 1,835,008 224 KB 512 x 512 256 2,097,152 256 KB 512 x 512 512 2,359,296 288 KB 1024 x 1024 64 6,291,456 768 KB 1024 x 1024 128 7,340,032 896 KB 1024 x 1024 256 8,388,608 1024 KB = 1 M Tabla 3.1 Ejemplos sobre diferentes dimensiones y grados de profundidad. III-33 Procesamiento de una Imagen Digital Dependiendo de los distintos tipos de mallado, la distribución de los píxeles es distinta, como se observa en la figura 3.6. Fig. 3.6 Los bordes de las regiones están pintados en negro. Los píxeles están representados por puntos en color gris. Se conectan dos píxeles si las regiones correspondientes comparten un lado común. Este trabajo está centrado en imágenes digitales cuadradas o rectangulares, cuyos píxeles (x, y) representan regiones cuadradas. La coordenada x especifica la columna donde está localizado el píxel; la coordenada y representa la fila. Por convención, el píxel (0,0) está localizado en la esquina superior izquierda de la imagen. 3.4 Procesamiento de Imágenes a color Las imágenes digitales a color están gobernadas por los mismos conceptos de muestreo, cuantificación y resolución que las imágenes en escala de grises. Sin embargo, en lugar de un único valor de intensidad que expresa el nivel de gris, los píxeles de las imágenes a color están cuantificados usando tres componentes independientes uno por cada color primario (RGB = rojo, verde y azul). Combinando distintas intensidades de estos tres colores, se pueden obtener todos los colores visibles. III-34 Procesamiento de una Imagen Digital En algunos casos, son más apropiados modelos diferentes del RGB para algoritmos y aplicaciones específicas. De cualquier manera, cualquier otro modelo sólo requiere una conversión matemática simple para obtener el modelo RGB. Por ejemplo, para imprimir una imagen digital, es necesario convertir la imagen RGB al modelo CMY (C=cian, M=magenta, Y=amarillo). La conversión es: C 1 R M = 1 1 G Y B Donde se supone que todos los colores han sido normalizados en el rango [0,1]. Esta ecuación muestra que la luz reflejada en una superficie pintada de color cian puro no contiene rojo (C = 1 – R); la reflejada en una superficie pintada de color magenta puro no contiene el verde (C = 1 – R) y la reflejada una superficie pintada de color amarillo puro no contiene el azul (C = 1 – R). Teóricamente, con igual cantidad de pigmentos primarios, cian, magenta y amarillo, se producirá el color negro, pero en realidad, debido a las impurezas en las tintas, da lugar a un color café pardo; de ahí que para conseguir un color negro de calidad es conveniente añadir este color a las impresoras y fotocopiadoras, pues es el que más utilizan, y se obtiene así el espacio de color CMYK. El modelo YIQ (Y=luminancia, I=tonalidad, Q=saturación) se usa en las televisiones comerciales. Básicamente, YIQ es una recodificación de RGB para mantener la compatibilidad con las televisiones en blanco y negro. De hecho, la componente Y (luminancia) provee toda la información requerida para una televisión en blanco y negro. La conversión de RGB a YIQ es: III-35 Procesamiento de una Imagen Digital Y 0.299 = 0.596 0.212 Q I 0.587 0.275 0.523 0.114 R 0.321 * G 0.311 B Se puede observar que si sólo tomó en cuenta la componente Y de la imagen, lo que obtengo es una imagen en escala de grises. Así pues, la forma de obtener una imagen en escala de grises a partir de una en RGB es aplicando al valor RGB de cada píxel, la fórmula Y = 0.299*R + 0.587*G + 0.114*B. Otro modelo muy utilizado es el HSI que representa el color de una manera intuitiva (es decir, de la forma en que los humanos percibimos el color). La componente I se corresponde con la intensidad, H con el color y S con la saturación. Este modelo es muy utilizado en algoritmos de procesamiento de imágenes basados en propiedades del sistema de visión humano. En este trabajo se da importancia al tratamiento de imágenes en blanco y negro. 3.5 Histogramas Una forma de estudio, permite ver si una imagen cuenta con características, como: posibles de reducción en cuanto al almacenamiento, comparar contrastes e intensidades entre imágenes es derivado de un análisis estadístico, el histograma. Si se tiene una imagen en niveles de grises, siendo el rango de 256 colores (de 0 a 255). El histograma de la imagen consiste en una gráfica donde se muestra el número de píxeles de cada nivel de gris que aparecen en la imagen. La figura 3.7 se muestran ejemplos donde se puede ver tres imágenes con sus correspondientes histogramas. III-36 Procesamiento de una Imagen Digital Fig. 3.7 Histograma escala de gris y niveles de contraste en la imagen digital. El histograma es utilizado para binarizar una imagen digital, es decir, convertirla en una imagen en blanco y negro, de tal manera que se preserven las propiedades "esenciales" de la imagen. La forma usual para binarizar una imagen es eligiendo un valor adecuado L dentro de los niveles de grises, tal que el histograma forme un "valle" en ese nivel. Todos los niveles de grises menores que L se convierten en 0 (negro), y los mayores que L se convierten en 255 (blanco). El histograma de una imagen a color RGB consiste en tres gráficas siendo cada una el histograma de cada color primario. El concepto de resolución está muy relacionado con la calidad de la imagen, ya que se determina el número de muestreos de la imagen por unidad de superficie, por lo tanto a mayor número de muestreos mayor detalle. La resolución se mide normalmente en píxel por pulgada (ppp o ppi en inglés). La relación entre píxeles y líneas de impresión suele denominársele factor de calidad. III-37 Procesamiento de una Imagen Digital 3.6 Compresión de una imagen La compresión de las imágenes trata de aprovecharse de la redundancia de los datos para reducir el número de bits necesarios para representar la imagen, consiguiendo de esta forma ahorrar recursos tanto de almacenamiento como de transmisión. Durante la compresión, los datos duplicados o que no tienen un valor específico se eliminan o se guardan en una forma más simplificada de almacenamiento, por lo que se reduce el tamaño del archivo de la imagen resultante en gran medida. Cuando la imagen se edita o visualiza posteriormente, entonces el proceso de compresión se invierte. Hay dos formas de compresión, sin pérdidas o con pérdidas. La principal característica de estos métodos es que los factores de compresión son la relación entre el número de bits que ocupa la imagen antes de ser comprimida respecto a la imagen comprimida, no son muy elevados. 3.6.1 Compresión sin pérdidas o sin error: Compresión sin pérdidas, se distingue entre sistemas no adaptativos, semiadaptativos y adaptativos, según tengan en cuenta o no las características del archivo a comprimir. Los no adaptativos (código Huffman, CCITT) establecen una tabla de códigos con las combinaciones de bits que más se repiten estadísticamente. A estas secuencias se asignan códigos cortos, y a otras menos probables claves más largas. El problema que presentan es que un diccionario de claves único tiene resultados muy diferentes en distintos originales. III-38 Procesamiento de una Imagen Digital Un código de tipo Huffman puede aplicarse de modo semiadaptativo, si se analiza primero la cadena de datos a comprimir y se crea una tabla a medida. Se logra mayor compresión, pero introduce dos inconvenientes: la pérdida de velocidad al tener que leer el original dos veces, por un lado, y la necesidad de incrustar en el archivo comprimido el índice de claves, por el otro. Los compresores de uso general más populares utilizan métodos como éste, por eso tardan más en empaquetar los datos que en descomprimirlos. El número de entradas de la tabla puede ser configurable, como se muestra en la figura 3.8. Fig. 3.8 Codificación de una línea de píxeles sobre una tabla de cuatro entradas y sobre otra de seis. Entre los métodos adaptativos, el más simple es el RLE (Run Lengh Encode), que consiste en sustituir series de valores repetidos por una clave con indicador numérico, como se observa en la figura 3.9. III-39 Procesamiento de una Imagen Digital Fig. 3.9 El método RLE codifica series de píxeles repetidos. Esta secuencia de 12 valores se anota con seis datos. Muchos otros métodos derivan de éste, pero su eficacia depende del tipo de imagen. Los dos ejemplos en la figura 3.10, tienen 25 valores, pero mientras que el primero se queda en 10 datos, el segundo (un caso extremo) no reduce su tamaño, sino que lo duplica. La anotación de píxeles por series es adecuada en imágenes con zonas amplias de colores uniformes, pero no en otras con cambios frecuentes de valor o predominio de texturas: Fig. 3.10 Ejemplos de otros métodos. El sistema adaptativo LZ (de Abraham Lempel y Jacob Ziv), del que deriva el LZW (Lempel-Ziv-Welch), es más ingenioso y consigue, en una lectura única, codificar repeticiones sin crear una tabla de códigos. III-40 Procesamiento de una Imagen Digital Cuando se localiza una secuencia similar a otra anterior, se sustituye por una clave de dos valores: los correspondientes a cuántos pasos se retrocede y cuántos datos se repiten, ejemplo en la figura 3.11. Rápido y fiable, se utiliza en formatos universales como el GIF o el TIFF y logra proporciones de compresión de 50 a 90%, normalmente ahorra un tercio del archivo. Fig. 3.11 Comportamiento del algoritmo LZ: # 3 2 significa retroceder tres píxeles y repetir dos; # 12 7 significa retroceder 12 píxeles y repetir siete. La compresión sin pérdidas comprime una imagen para que su calidad sea semejante a la original. Aunque la compresión sin pérdidas parece ideal, no proporciona mucha compresión. III-41 Procesamiento de una Imagen Digital 3.6.2 Compresión con pérdidas La compresión con pérdida se refiere a que se puede suprimir cierta información de la imagen para hacerla más pequeña y sin que el ojo humano note la diferencia o permitiendo perder pequeños detalles no significativos. Es decir, al volver a descomprimir la imagen se recupera con alguna pequeña diferencia respecto a la original. La mayor parte de los procesos de compresión con pérdidas, son con el empleo de métodos de transformación, tales como: transformada discreta coseno, transformada haar, transformada wavelets, transformada slant, etc. Hasta este punto, donde se han mencionado algunos de los factores más importantes que intervienen en la formación de una imagen, se puede decir que es en especial la compresión, los que definen el formato de una imagen digital estática. En la tabla 3.2 se muestran los principales formatos en que se presenta en un archivo de imagen digital estática. III-42 Procesamiento de una Imagen Digital BMP CUR EPS GIF HDF ICO JPG WMF PBM PGM PIC PCX PICT PIX PNG PPM PS RAS RGB RLA RLE RPBM RPGM RPNM RPPM SYNU TGA TIFF VIFF X XBM XWD Microsoft Windows Bitmap file (sc) Microsoft Windows Cursor file Encapsulated PostScript CompuServe Graphics Image Format file Hierarchical Data Format file Microsoft Windows Icon file Joint Photographic Experts Group Window Meta File Portable Bitmap file Portable Grayscale Map file PIXAR Picture file PC Paintbrush Softimage PICT file Alias Pixel image file Portable Network Graphic Portable Pixel Map file PostScript Sun Raster file Silicon Graphics RGB image file Wavefront raster image file Utah Runlength-encoded image file Raw Portable Bitmap file Raw Portable Grayscale Map file Raw Portable any Map file Raw Portable Pixel Map file Synu image file Truevision Targa image file Tagged Image File Khoros Visualization Image File Format Stardent AVS X image file X11 Bit Map file X Window Dump image file Tabla 3.2 Principales formatos en que se presenta en un archivo de imagen digital estática. III-43 Procesamiento de una Imagen Digital Aunque es posible comprimir imágenes sin perder mucha calidad, no es práctico su empleo en muchos casos. Por consiguiente, todas las cámaras digitales populares usan una compresión digital con pérdidas, donde se degrada la información gráfica hasta cierto punto y cuanto más comprimidas están, más degradadas se vuelven estas imágenes, con respecto a su original. Aunque la compresión con pérdidas no reproduce las imágenes con la misma calidad que la imagen original, la imagen sigue pareciendo visualmente sin pérdidas y aparece normal a la vista humana, si no se agranda demasiado la reproducción no se distinguen sus deficiencias. El formato de compresión con pérdida principal es el JPEG (Joint Photographic Experts Group o Grupo de Expertos Fotográficos Unidos). Este formato de imagen permite seleccionar el grado de compresión. El sistema propuesto por el JPEG es una combinación de varias técnicas que crea un archivo JPEG (o JPG) con un nivel de compresión regulable capaz de reducir en algunos casos el peso informático de la imagen a menos del 1%. El proceso estándar consta de cinco pasos: 1. Convertir la imagen a un modo de color que defina la luminancia en un canal, como LAB. Los bitmaps se pasan a grises, mientras que en las escalas de grises se eliminan este pasó. 2. Dado que ópticamente se es capaz de ver un cambio sutil en la luminosidad mucho antes que en el tono cromático, se iguala el tono en cada grupo de cuatro píxeles, respetando los valores individuales de luz como se muestra en la figura 3.12. III-44 Procesamiento de una Imagen Digital Fig. 3.12 En modo LAB, cada píxel tiene un valor L de luz y dos valores AB para definir el color. Obsérvese como sólo este paso de la compresión JPEG supone una disminución del 50% de los datos a anotar. 3. La imagen se divide en bloques de 8 x 8 píxeles. Para cada subimagen se anota el valor promedio, la amplitud de la oscilación de valores y una descripción frecuencial de esta oscilación mediante una función de tipo Fourier, llamada Transformada Discreta del Coseno (TDC). 4. Los valores TDC se cuantifican a la baja, dividiéndolos por un factor entero. El número de coeficientes de onda y el factor a dividir determinan la profundidad de la compresión, que es lo que se dice en una escala que, según el programa, va de 1 a 10, de 1 a 12 o de 0 a 100, pero siempre jugando inversamente entre el nivel de compresión y la calidad del resultado. Tras esta cuantificación, abundan las fracciones decimales, que se redondean al entero más próximo. De este modo, resulta una cadena de datos con muchas probabilidades de reiteración. 5. Al resultado se le aplica la codificación estadística de Huffman, compactando las cadenas más repetidas en códigos breves. III-45 Procesamiento de una Imagen Digital 3.6.3 Formatos de compresión más utilizados Los principales formatos de las imágenes comprimidas son: JPG o JPEG, recomendable para fotografías, texturas, etc.; GIF, aconsejable para archivos de imágenes con pocos colores como logotipos, dibujos, etc.; PNG, documentos Web.; BMP, imágenes que son enormes en tamaño.; TIFF, archivos gráficos. a) Formato JPG (Joint Photographic Group) Es un formato de compresión con pérdidas, pero que desecha en primer lugar la información no visible, por lo que las pérdidas apenas se notan. El algoritmo jpg está basado en el hecho de que el ojo humano percibe peor los cambios de color que las variaciones de luminosidad. Jpg divide la información de la imagen en dos partes: color y luminosidad, y las comprime por separado. Admite modos en escala de grises con una profundidad de 8 bits y en color hasta 24 bits. Permite la carga progresiva en un navegador, el cual lo convierte en el formato estándar en la Web. No es un formato adecuado para imágenes con alto contraste de color. Además, hay que tener en cuenta que la compresión se produce automáticamente cada vez que se guarda el archivo, por lo que es aconsejable guardar en este formato por sólo una vez, cuando la imagen esté terminada. III-46 Procesamiento de una Imagen Digital b) Formato GIF (Graphic Interchange Format) Formato creado por CompuServe en 1987 (su primera versión) aunque la patente del mismo pertenece a la empresa Unisys. En 1989, CompuServe amplió las propiedades de este formato, dando lugar a la segunda versión de este estándar, conocida como gif 89a. Usa un sistema de compresión LZW modificado. Los ficheros gráficos GIF son los más comunes en las páginas Web, debidas sobre todo a su facilidad de construcción y a su poco peso, además de ser soportados por todos los navegadores. Con este formato, cuantos menos colores tenga la imagen y más extensión total ocupe cada uno de ellos dentro de la misma, mejor compresión se obtiene. Dentro de sus ventajas conviene destacar: Con este formato se pueden crear gráficos de fondo transparente. Se puede guardar una imagen asociándola con su propia paleta de colores. De esta forma disminuye el tiempo de carga y las imágenes son más compatibles con sistemas operativos y navegadores. Se utiliza para construir imágenes animadas, creando un gráfico formado por varias escenas que se unen y forman una secuencia con un tiempo establecido entre una imagen y otra, como en una película. Permite construir imágenes entrelazadas. III-47 Procesamiento de una Imagen Digital Entre sus desventajas conviene destacar: Sólo permite trabajar con 256 colores. Debido a esta limitación en los colores, no es adecuado para representar escenas con muchos colores ni con una gradación entre estos, como es el caso de una fotografía. En estos casos es mejor usar otro tipo de formato, como el JPG. CompuServe Inc., ha provocado la aparición del formato libre png que, además, comprime mejor que gif. c) Formato PNG (Portable Network Graphic) Se trata de un formato de compresión sin pérdidas, con una profundidad de color de 24 bits. Soporta hasta 256 niveles de transparencias, lo que permite fundir la imagen perfectamente con el fondo. PNG es el nuevo formato de compresión de imágenes para la Web. Entre sus más destacadas ventajas están la gran calidad y la alta compresión. PNG es uno de los últimos formatos de compresión que aparecen en la escena Web, exactamente en 1994. Conjuga lo mejor de los formatos que habitualmente se han venido utilizando, que son .GIF y .JPG. Es de uso libre, es decir, no es necesario pagar ningún tipo de licencia para usarlo. El proceso a seguir para convertir una imagen a formato. PNG es muy simple y su entorno de programación está abierto a los desarrolladores. Además, no sólo se usa para la World Wide Web. Entre otras cuestiones a destacar, se puede señalar que es el formato oficial de Microsoft Office 97. III-48 Procesamiento de una Imagen Digital Acepta miles de colores, frente a los 256 máximos admitidos por .GIF y ante los miles soportados por JPG, que también dan problemas de compresión y descompresión, además de contar con un mayor peso en kilobytes. El formato de compresión que utiliza es de alta calidad, lo que permite lograr la reducción en los tiempos de bajada. El sistema de entrelazado que utiliza es más óptimo que con GIF. El efecto de transparencia fondo/figura es mejor, ya que no se basa en un color de fondo. PNG es ideal en dos casos: cuando se trabaja con imágenes transparentes y en los casos en que se quiere introducir en un documento Web. Entre sus inconvenientes hay que citar que no soporta animaciones y que su uso no está aún muy extendido, aunque los principales programas gráficos permiten trabajar con él. d) Formato BMP (BitMaP) Es un formato de compresión sin pérdidas. Desarrollado e impulsado por Microsoft, BMP es una abreviatura de Windows BitMaP (Mapa de Bits de Windows), y en realidad una imagen en este formato es la sucesión de puntos coloreados guardados cada uno independientemente. Características de BMP: Utiliza imágenes de 24 bits de color, los archivos no aumentan de tamaño, no modifica el formato, las imágenes son totalmente compatibles, no cambia parámetros de la imagen (resolución, color, etc.), las imágenes no cambian para el ojo humano. III-49 Procesamiento de una Imagen Digital e) Formato TIFF (Tagged Image File Format) Formato que permite el almacenamiento e intercambio de informaciones gráficas provenientes del escáner, programas de retoque y edición de fotos. La estructura de un archivo de formato TIFF se define por una secuencia de 8 bits. Sus principales ventajas son: Su estructura es conocida por una amplia variedad de aplicaciones. Es independiente de sistemas operativos. Los archivos con este formato se pueden ajustar a las características de un escáner, monitor o impresora. Una de sus principales desventajas es que un usuario puede indicar nuevos atributos en una imagen, imposibilitando la interpretación correcta de los datos por otro sistema de lectura de imágenes. 3.6.4 Problemas derivados de la compresión con pérdidas Los efectos negativos de una excesiva compresión pueden ser la disminución del tono y la nitidez, que se notaría más bien en una impresión, y la aparición de artefactos a nivel local visibles sobre todo en pantalla. Estos efectos son menores en imágenes grandes, de varios megapíxeles, en que los cuadros de 8 x 8 píxeles son menos importantes para el detalle y la codificación de la última fase es mucho más efectiva. Se consiguen así buenas relaciones de compresión, aunque se indiquen niveles de calidad media-alta. III-50 Procesamiento de una Imagen Digital Los efectos más típicos son la aparición de los bloques de 8 x 8 píxeles, el ruido cromático en las zonas oscuras y la alteración del contorno, que se ven borrosas en imágenes de poca resolución y el reflejo intenso de luminosidad más grandes. En la figura 3.13 se muestran imágenes donde se puede observar la imagen original y los efectos negativos por la compresión. a b c Fig. 3.13 a) Imagen original; b) Reflejo de luminosidad en los bordes por una excesiva compresión; c) Detalle de los bloques de 8 x 8 píxeles. III-51 Procesamiento de una Imagen Digital La reverberación la producen los contornos que coinciden con un borde marcado. Su reconstrucción es mucho más irregular que las de sus vecinas, que coinciden en una zona de menor oscilación y resultan mucho más homogéneas. Así, se producen pinceladas de falso contraste a varios píxeles de distancia de la verdadera silueta. La solución pasa por lograr una mejor correspondencia formal (que hoy se busca en las formas Wavelet, un tipo de patrones de onda diseñables que pueden ser sinusoidales o no) y establecerse con una duración finita. Combinando Wavelets (TDW), pueden describirse formas complejas con muchos menos coeficientes. Ésta es la base de nuevas técnicas, como EZW, SPIHT, MrSID o JPEG 2000, que quieren ser la alternativa al actual JPEG. III-52 Aplicaciones CAPITULO IV APLICACIONES 4.1 Introducción Es evidente que las nuevas tecnologías llevan algún tiempo ofreciendo interesantes oportunidades en cualquier campo de ciencia y, por supuesto, también del conocimiento. La imagen digital en países avanzados ha progresado enormemente, el cual existe compañías especializadas que trabajan en la investigación como la "Nasa ", para filtraje y restauración de imágenes de satélites en misiones espaciales o locales. En la industria militar el estudio de análisis de imágenes para detectar movimientos y estrategias con la amplificación de imágenes, la industria del entretenimiento como el "cine", y por último en la industria de las comunicaciones con la aparición de "Internet". La imagen digital es de gran importancia para los seres humanos, y más cuando son aplicadas para un fin, estableciendo que a veces el “fin” es parte del cuerpo humano puesto que utiliza mayoritariamente como herramienta de diagnóstico médico. En el campo de la medicina y de investigación científica se tienen la difícil misión de tratar imágenes para ayudar a la distribución y observación. Las fuentes clásicas que generan imágenes digitales en medicina o telemedicina son la Ultrasonografía, Resonancia Magnética Nuclear y Tomografía Axial Computarizada. En el campo de investigación científica se utiliza para determinar nuevos descubrimientos. IV-53 Aplicaciones 4.2 Tratamientos de una imagen digital Los procesos de mejora de imagen pueden agruparse en distintas categorías, teniendo en cuenta el efecto que producen sobre la imagen (modificación del brillo, contraste, compresión, restauración, reducción de ruido, iluminación de masas, etc.). La implementación responde de forma satisfactoria frente a lo que se busca, no se debe olvidar que existen ciertas mejoras que pueden realizarse. Entre ellas, se encuentran el poder trabajar con una forma genérica de borde del sector desconocido; la detección automática del mismo; el considerar de forma distinta a aquellos entornos que contienen muy pocos píxeles conocidos dentro; y no elegir el valor de los píxeles regenerados al azar de entre todos los posibles, sino ponderándolos por sus distancias. "La imagen de Lenna contiene una buena mezcla de detalle, regiones planas, sombras y texturas que hacen un buen trabajo para probar varios procesamientos de imágenes", esta se presenta en la figura 4.1. Fig. 4.1. Imagen de Lenna original. IV-54 Aplicaciones A continuación se mencionan algunos factores que influyen en el procesamiento de imágenes digitales para obtener mejor calidad de las mismas. a) Resolución La calidad de la imagen digital depende de la resolución espacial, basado en ello el fichero gráfico que la almacene tendrá más o menos tamaño. En la figura 4.2 se puede observar como al aumentar la resolución mejora la calidad de la imagen. En la figura 4.3 se muestra una imagen con más detalle, donde puede observarse éste mismo efecto. Fig. 4.2 Imagen de Lenna con resoluciones de 10 x 10; 20 x 20; 30 x 30. Fig. 4.3 Fotos con mayor y menor resolución. IV-55 Aplicaciones La nitidez, en cambio, depende de la profundidad de cada celda, o lo que es lo mismo, cuantos más dígitos binarios estén asociados a cada celda mayor será la nitidez como se presenta en la figura 4.4. Fig. 4.4 Imagen de alta resolución, imagen de menor resolución tratada con nitidez y calidad. En cualquier caso, no se debe olvidar que en la fotografía digital no se debe perseguir la mayor resolución y nitidez posibles, sino unos valores apropiados para el fin perseguido. b) Ruido Las imágenes con ruido, son pequeñas variaciones aleatorias en la luminosidad del color captadas por los fotosensores del CCD, que degradan la calidad de la imagen capturada. La cantidad de ruido captada va a depender de la relación entre señal y ruido de los fotosensores (cuanto más baja sea, más ruido captarán y peor será la calidad de la imagen resultante). En las figuras 4.5 y 4.6 se muestran imágenes con ruido (aparición de puntos blancos y negros sobre la imagen) y después de aplicar uno de los procesamientos digitales como el uso del filtrado se obtiene una mejor calidad de imágenes (sin ruido). IV-56 Aplicaciones a) b) Fig.4.5 Imagen de Lenna: a) con ruido; b) sin ruido. a) b) Fig. 4.6 Imágenes de flores: a) con ruido; b) sin ruido. Existen filtros que se denominan según su acción en el espacio de las frecuencias (filtros de baja o alta frecuencia, filtros direccionales). Sin embargo, cada vez es más frecuente, en los sistemas de proceso de imagen, otorgarles nombres más de acuerdo con el resultado visual que producen sobre la imagen "filtrada" (filtros de enfoque, desenfoque). IV-57 Aplicaciones Los filtros de baja limita o elimina las altas frecuencias; los de alta frecuencia, elimina las bajas, y los direccionales, ambas, es decir, limita el rango posible del intervalo entre un valor mínimo y otro máximo. c) Compresión Aunque es posible comprimir imágenes sin perder mucha calidad, no es práctico su empleo en muchos casos, debido al gran espacio que estas pueden ocupar. Por consiguiente, todas las cámaras digitales populares utilizan fundamentalmente la compresión digital con pérdidas para el almacenamiento de sus imágenes, que degrada la información gráfica almacenada hasta cierto punto y cuanto más comprimidas están, más degradadas se vuelven las imágenes, con respecto a su original de compresión sin pérdidas. En la figura 4.7 se puede ver una misma imagen a diferentes valores de compresión JPEG y su original en la figura 4.1. Fig. 4.7 Imagen de Lenna con valores de compresión: 1.2 KB; 1.5 KB; 1.9 KB. IV-58 Aplicaciones Existen en el mercado cámaras profesionales que además de la compresión sin pérdidas, ofrecen al fotógrafo la posibilidad de emplear la compresión con pérdidas, siempre a elección de estos especialistas, de acuerdo al tamaño y calidad de la imagen que permita con una máxima calidad la ampliación que se desee obtener. d) Restauración En la figura 4.8a se tiene la foto Lenna y que por alguna razón se requiere regenerar un sector del lado izquierdo de la misma (donde hay una especie de columna blanca), se marca con negro la zona que se pretende regenerar. Si puede observar que el ancho de la columna es poco menos de treinta píxeles, poniendo una ventana de ancho igual a diez píxeles, se obtienen los resultados que se pueden ver en la figura 4.8b. El restaurar píxeles con valores demasiado bajos, donde tendrían que ser mucho más altos, y continúa la zona gris oscura. Si ahora se ingresa una ventana de cuarenta píxeles de ancho, los resultados son los esperados. Se llega a ver que se trata de una columna y por lo tanto regenera de la manera correcta. La imagen obtenida para este caso se puede ver en la figura 4.8c. IV-59 Aplicaciones a) b) c) Fig. 4.8 Restauración de columna: a) área afectada; b) área incompleta; c) área completa. Como puede observarse en las imágenes de este ejemplo, el rectángulo "desconocido" está formado por píxeles negros, es decir, de intensidad luminosa nula. Para evitar confusiones con otros píxeles de la imagen, conocidos pero también de valor cero, se crea una nueva matriz, de las mismas dimensiones que la imagen original, de valor '0' en los índices correspondientes a aquellos píxeles que se buscan regenerar, y en los índices de los píxeles conocidos. Se realizan una serie de comparaciones entre las diferentes ventanas cercanas a este rectángulo, de forma que se puedan inferir los valores originales aproximados. Depende del tipo de algoritmo que se emplea para ello. Esto es todo un tratado, hay varias formas para lograrlo y esto esta fuera del alcance de este trabajo. Otro ejemplo se muestra en la figura 4.9 IV-60 Aplicaciones a) b) Fig. 4.9 Restauración de la boca: a) área afectada; b) restauración completa. 4.3 Imagen digital para la detección del Cáncer (La mamografía) El uso de la imagen electrónica en el diagnóstico de tumores mamarios ofrece una mayor precisión y seguridad que las técnicas convencionales. La detección temprana del cáncer de pecho en las mujeres es fundamental para orientar un tratamiento eficaz contra una de las principales causas de muerte por cáncer entre la población femenina en el mundo. La mamografía digital permite obtener a los especialistas una imagen electrónica que puede ser guardada y manipulada con un software adecuado para detectar cualquier irregularidad en el pecho, frente a la limitación actual que supone obtener una imagen fija. En la figura 4.10a esta mamografía análoga es el método más efectivo para la detección de cánceres pequeños, pero tiene limitaciones como: menor sensibilidad en mamas fibrosas, técnica y operador dependiente, imposibilidad de modificar la imagen una vez procesada y cualquier duda requiere una nueva exposición. IV-61 Aplicaciones La mamografía digital como se muestra en la figura 4.10b supera éstas limitaciones de la mamografía convencional permitiendo la manipulación electrónica de la imagen, elimina la toma de placas adicionales y el proceso de revelado, etc. Además, introduce la detección de lesiones por computadora, transmisión de imágenes en red a otro centro o a otro país, la tomosíntesis, estudia la mama en tres dimensiones, especialmente en lesiones situadas profundamente en la mama. En las figuras 4.10, 4.11 y 4.12 se presentan algunos casos con imágenes comparativas donde se demuestra que la mamografía digital aportó una nueva información no detectada en mamografía convencional, y además, permitió el diagnóstico de otros puntos de microcalcificaciones, lejos de la lesión principal, que en algunos casos se modifica la conducta del tratamiento, en el sentido de una cirugía. En la mamografía convencional no se detecta la presencia de microcalcificaciones. En éstas imágenes digitalizadas se pueden procesar brillo y contraste, archivar la imagen e imprimirlas. a) b) Figura 4.10. Mastopatía fibroquística: a) análoga; b) digital. IV-62 Aplicaciones a) b) Figura 4.11. Microcalcificaciones no detectadas en mamografía convencional. a) análoga; b) digital. a) b) Figura 4.12. Calcificaciones: a) análoga; b) digital. IV-63 Aplicaciones En la actualidad se sugieren algunas indicaciones de mamografía digital: mamas fibrosas, pacientes con antecedentes personales o familiares directos de cáncer mamario, previo a cirugía por cáncer de mama, control de cáncer de mama tratado y previo a la terapia de sustitución hormonal o cirugía plástica. Las imágenes de mama aumentan la capacidad del médico para detectar tumores pequeños. Cuando el cáncer es pequeño, hay más opciones de tratamiento y es más probable la cura. El uso de la mamografía de detección facilita la detección de crecimientos anormales pequeños en los conductos de la leche, llamados Carcinoma Ductal In Situ (CDIS). Estos tumores tempranos no hacen daño si se eliminan en esta etapa; la mamografía es el único método comprobado de detectar de forma fiable estos tumores. 4.4 Imagen digital en Odontología El incremento en el uso de equipos tecnológicos ha demostrado ser invaluables recursos en el diagnóstico, planificación de tratamientos y presentación de casos clínicos. Las diferentes tecnologías disponibles y aplicables al área de la odontología, con el objetivo de dar a conocer el alcance de sus beneficios en el área de la salud oral, los cuales van desde representar una valiosa herramienta de diagnóstico en problemas que anteriormente eran difíciles de detectar, hasta ofrecer sus virtudes en la actividad docente y de investigación. IV-64 Aplicaciones El diagnóstico basado en imágenes digitales ha incrementado dramáticamente la cantidad de datos no textual generada en la clínica dental. Estas tecnologías de imágenes son esenciales para la práctica moderna de la Odontología y ayudan al odontólogo en la toma de decisiones clínicas, además de dar mayor calidad a la atención del paciente, involucrar al paciente en la toma de decisiones clínicas y posibilitar la creación de conocimientos significativos en esta área. La imagen digital en la odontología están beneficiando de manera creciente a los profesionales de esta área, debido a las posibilidades que proveen de ver inmediatamente la foto tomada, dando la posibilidad de borrarla y repetirla. La imagen digital odontológica se transfiere a una computadora para su observación y posterior edición, a esta imagen se le puede editar el contraste, brillo, tamaño, resolución, colores, etc. a través del software diseñado específicamente para odontología. En una radiografía convencional, el ojo humano detecta de 28 a 32 tonos de gris, pero a través de la radiología digital se ven hasta 256 tonos de gris, optimizando así el diagnóstico. Mediante dispositivos de digitalización se pueden capturar imágenes de excelente calidad tanto dentro como fuera de la cavidad bucal. Las imágenes permiten mostrar la anatomía dentaria y sus patologías a través de macrofotografías ampliadas decenas de veces, como puede observarse en la figura 4.13. IV-65 Aplicaciones Fig. 4.13 Imagen digital de restauración de molar. Desde la primera radiografía, los profesionales de la salud tienen una imagen, un artículo indispensable para el análisis y la programación de tratamientos, con el surgimiento de las imágenes digitales, las mismas han sido adoptadas por estos profesionales como herramientas de diagnósticos. La imagen digital en el consultorio odontológico, permite al profesional de esta área realizar el seguimiento clínico de un tratamiento e imprimir las imágenes al paciente, para explicarle de forma clara y didáctica el plan de tratamiento a seguir a fin de que éste se sienta motivado para llevarlo a cabo. El uso de imágenes dentales en formato digital, los odontólogos y sus colaboradores pueden explorar diferentes opciones de tratamiento y comunicárselas a sus pacientes en una forma nunca antes posible. En ortodoncia y cirugía se puede predecir el resultado de un tratamiento, como también fusionar los datos tales como texto, imágenes de la boca, radiografías, céfalograma, etc., en un solo archivo que represente la historia de cada paciente, a fin de crear bancos de datos electrónicos que incluyan imágenes de la cavidad bucal de los pacientes. IV-66 Aplicaciones La captura y reproducción de imágenes con equipos de tecnología digital es parte importante de la ortodoncia, ya que estas imágenes pueden ser usadas de manera inmediata para educación profesional, educación al paciente y propósitos médico-legales, entre otros. 4.5 Imágenes digitales en la Ecografía La ecografía o ultrasonido es un método de diagnóstico que utiliza ondas sonoras de alta frecuencia (no usa rayos X, por lo que no ofrece ningún riesgo en el embarazo) para la formación de imágenes de distintos órganos o tejidos corporales. La ecografía estudia los órganos sólidos (hígado, útero, ovarios, etc.) y aquellos que contienen líquidos (vejiga, vesícula biliar, etc.), puede analizar partes blandas (músculos, tendones, etc.) y en ciertas circunstancias vísceras huecas (estómago). La imagen digital en uso de la ecografía es útil en muchos casos por que se puede estudiar elementos que son imposibles para la radiografía simple, ya que puede ser manipulada para tener una mejor observación de los órganos deseados y tener de todos los diagnósticos un diagnóstico de lo más eficaz posible. Las imágenes digitales de vesículas normales se pueden observar en la figura 4.14 en la cual se pudo determinar que los pacientes tienen vesículas en buenas condiciones. En la figura 4.15 se muestra otra imagen digital para observar las condiciones en que se encuentran el hígado y el riñón derecho. IV-67 Aplicaciones Fig. 4.14 Imágenes de vesículas normales La figura 4.15 es una imagen de rutina en que los resultados se entregaron en ese momento al paciente, se le otorga una duplicación, sin ningún costo adicional y eliminando la posibilidad de perdida, caso contrario de una radiografía simple el paciente hubiese regresado para tener sus resultados y su interpretación de los mismos. Fig. 4.15 Hígado y Riñón derecho. IV-68 Aplicaciones Otro caso se presenta en la figura 4.16 donde se puede determinar el estado de ubicación de la placenta y detectar tempranamente cualquier alteración en el embarazo que pueda llevar al retardo del crecimiento fetal. Fig. 4.16 Imagen de un feto obtenida por eco de ultrasonidos 4.6 Imagen digital de la NASA demuestra que por la superficie de Marte corrió agua La NASA anuncia su más importante descubrimiento de los últimos años.”Por Marte un día corrió agua líquida”. Científicos han encontrado marcas en algunas rocas que les permiten aseverar con certeza que, un día, ese cráter estuvo sumergido por agua. “El agua se fue evaporando con el paso del tiempo, pero ha dejado huellas en las rocas”. La prueba de que el planeta rojo fue húmedo en algún momento de su existencia no es nueva, aunque sí es la primera vez que los científicos tienen pruebas físicas, materiales, de sus descubrimientos. IV-69 Aplicaciones Las sondas Mars Odissey (de la NASA) y Mars Express (de la Agencia Espacial Europea) ya habían mostrado indicios de que no sólo en Marte podía haber hielo en los polos, sino que los gigantescos cañones que se pueden observar desde la atmósfera gracias a las cámaras digitales. La sonda de la NASA Mars Odissey, que en el año 2002 tomó imágenes desde la atmósfera del planeta rojo que hicieron pensar a los científicos que, por las enormes cráteres y cañones, hubo en un lejano día catastróficas inundaciones. La Odissey además demostró que había grandes cantidades de hidrógeno en el polo Sur de Marte, indicio incontestable de la presencia de agua. Pero esta presencia no pudo ser demostrada a través de fotografías. Entonces, la sonda espacial Mars Express envió imágenes que demostraban la existencia de agua congelada y dióxido de carbono helado en el polo sur del planeta rojo. Las fotografías que probaban estos descubrimientos fueron tomadas por la sonda, que orbita el planeta rojo a una altura de 2 000 Km. En el año 2005, cuando aterrizó el robot Opportunity (de la NASA), los científicos se mostraron entusiasmados al ver las primeras imágenes digitales enviadas por el robot, que mostraban un suelo rocoso en el fondo del cráter como se muestra en la figura 4.17 y 4.18 con muchísimas posibilidades para la investigación. “Durante algunos días esas imágenes se manipularon con software especiales desplegado todos los instrumentos y se analizaron hasta la extenuación todas las imágenes”. IV-70 Aplicaciones Fig. 4.17 Imagen microscópica de un fragmento de la superficie marciana tomada por el 'Opportunity'. (NASA) Fig. 4.18 El terreno sobre el que aterrizó el 'Opportunity'. (NASA) Para el estudio de las rocas marcianas, el Opportunity ha usado instrumentos que habría utilizado un geólogo. Gracias al espectrómetro de rayos X han podido analizar los elementos químicos de las rocas, y eso ha permitido a la NASA encontrar unas altas concentraciones de sulfuros en el lecho rocoso, que sólo podría ser posible por la actuación de moléculas de agua. Ahora, ya no son sólo indicios lo que tiene la NASA, sino pruebas materiales de que las rocas que hoy están en el suelo marciano han sufrido los efectos de la acción prolongada del agua. IV-71 Consideraciones Finales CAPITULO V CONSIDERACIONES FINALES Para la adquisición de una imagen digital son necesarios ciertos dispositivos de digitalización como el escáner, cámara digital, etc. Una imagen digital tiene la posibilidad de procesamiento, facilidad de duplicación, traslado, edición, lo que permite la reducción de costos. En otros casos es posible brindar información inmediata, lo que no se puede lograr tan rápido en una imagen convencional. Es importante conocer la imagen por dentro, que no se debe limitar al proceso de edición sin al menos conocer qué mecanismos o procesos que están operando en el interior de una imagen. A su vez, la gran variedad de transformaciones que puede sufrir una imagen. Existen imágenes que ocupan gran espacio en memoria y es necesaria la compresión, para así obtener tasas de transmisión eficiente y reducir los requerimientos de almacenamiento. Los avances en la fotografía digital brinda la posibilidad de mejorar la imagen, en el caso de la fotografía clínica o medica (mamografía, ultrasonido, radiografías, etc.) permite diagnosticar antes y durante la aparición de una enfermedad; en el área científica (astronómica, meteorológicas, biológicas, etc.) es de gran importancia ya que permite determinar cosas que el ojo humano a simple vista no lo puede hacer u objetos que se encuentran a millones de kilómetros. V-72 Consideraciones Finales La fotografía digital permite ampliar el campo fotográfico y con esto las formas de transporte y archivo de las imágenes prestando particular atención a la transmisión directa e instantánea de la comunicación humana gracias a la era electrónica. V-73 Glosario GLOSARIO Células fotosensibles: Matriz que convierten luz en electricidad. Al medir cuanta electricidad produce una célula, se sabe cuanta luz ha incidido en ella, y, por tanto, el nivel de brillo de ese punto concreto de la matriz. Cantidad de píxeles (de células fotoeléctricas en la matriz), un sensor más grande, tendrá las células más grandes, y, por tanto, dará menos ruido. Colores substractivos: Los colores substractivos están representados por los tres colores primarios Cían, Magenta y Amarillo. Los colores substractivos absorben parte del espectro de la luz reflejada y vuelven a emitir otros. Por ejemplo, Cían absorbe la luz roja mientras que refleja la luz azul y verde; el amarillo sólo absorbe la luz azul, mientras que refleja luz roja y verde. Por lo tanto, al mezclar Cían y Amarillo totalmente saturados da verde. Compresión: Técnica que se utiliza para reducir el tamaño de los ficheros de imágenes y otros datos, para ser procesados más fácilmente, almacenados o comunicados a través de Internet. Los métodos utilizados se basan, generalmente, en abreviar información repetida o eliminar información que el ojo humano tiene dificultades para apreciar. Por lo tanto, la calidad de una imagen puede verse afectada por las técnicas de compresión utilizadas o por el nivel de compresión aplicado. Compresión con pérdidas: Técnica que eliminan información de forma definitiva para obtener índices de compresión considerablemente altos. Compresión sin pérdidas: Técnica que reduce el tamaño de la imagen sin que se pierda calidad visual. 74 Glosario Contraste: Diferencia en un atributo visual que hace que un objeto sea distinguible. Se refiere al rango de brillo o sombras de grises en una imagen. Una imagen de mayor contraste es una imagen en blanco y negro sin sombras de grises. Una imagen de bajo contraste muestra sombras de grises en un rango medio. Cromático: Término que se refiere al matiz relativo de un color. Cuantificación: Valor en función de la luminosidad o color de la imagen original. Cuantización: Asigna a cada muestra de la matriz un valor entero. Cada valor representa al valor de la variable física en ese punto. Digitalización: Convertir cualquier señal de entrada analógica en una serie de valores binarios. Ecografía: Método de diagnóstico que utiliza ondas sonoras de alta frecuencia (no usa rayos X) para la formación de imágenes de distintos órganos o tejidos corporales. Espectro: Serie de imágenes, a modo de bandas con líneas brillantes y líneas oscuras, que se forman cuando la radiación de una fuente luminosa o electromagnética se descompone en sus colores u ondas constituyentes; que se arreglan en orden de sus respectivas longitudes. Espejos dicroicos: Es un espejo, reflector o filtro el cual selectivamente refleja diferentes ondas de luz, permitiendo a un proyector transmitir luz más visible con menos temperatura. Espejos dicroicos se utilizan asimismo para convergencia interna en proyectores multimedia que trabajan con sistema de proyección LCD y DLP. 75 Glosario Fotomultiplicador: Dispositivo electrónico, que transforman la luz en señal eléctrica. Histograma: Representación gráfica de la gama de tonos de una foto, desde las zonas más oscuras a las más claras. Algunas cámaras digitales incluyen una función de histograma que permite comprobar con exactitud la exposición de la foto. Imagen digital: Fotografía electrónica fija o en movimiento, compuesta por un número determinado de puntos, llamados píxeles, que forman una matriz con filas y columnas. Cuanto mayor sea el número de filas y columnas mayor será el detalle de la imagen y mayor también su tamaño de archivo. Cada píxel de una imagen almacena información de su tono o luminosidad, donde el tono negro es el valor 0 y el blanco el valor más alto, normalmente 255 en la escala de grises, pero representados en formato binario. Mamografía: Examen de rayos X de los senos. Se utiliza para detectar y diagnosticar la enfermedad del seno en las mujeres que tienen problemas con estos como nudos, dolor o flujo de los senos, así como para mujeres que no tienen problemas con ellos. Ayuda a los médicos a detectar el cáncer en sus primeras etapas, cuando las probabilidades de éxito de un tratamiento son mayores. Mastopatía fibroquística: Inflamación de glándula mamaria. Megapíxeles: El número de píxeles por pulgada que una cámara digital puede producir en una imagen; un megapíxel representa 1.000 píxeles por pulgada. Metacrilato: Material químico metacrilato metílico se usa para hacer plásticos transparentes que remplazan el vidrio. 76 Glosario Microcalcificaciones: Son depósitos de calcio en el espesor de la glándula mamaria. Se aprecian en la mamografía como pequeños puntitos blanquecinos. En las placas de mamografía se les da gran importancia y se buscan ya que pueden ser el primer signo de un proceso canceroso. Las microcalcificaciones pueden ser benignas o sospechosas de malignidad según su tamaño, aspecto y distribución. Microprocesador: Conjunto de circuitos electrónicos altamente integrado para cálculo y control computacional, es utilizado como Unidad Central de Proceso en un sistema microordenador y en otros dispositivos electrónicos complejos como cámaras fotográficas, impresoras, etc. Es un chip programable, un circuito integrado electrónico que por sí solo constituye la Unidad Central de un ordenador. La cantidad de operaciones se miden Megahertz o Gigahertz. Monocromático: Adj. Monocromo. Que solo deja pasar la luz o rayos de un solo color. Palabra que se utiliza para referirse a una radiación electromagnética de una sola longitud de onda. Que tiene un único color en sus diversas intensidades. Muestreo: La imagen se divide en líneas horizontales y estas a su vez se descomponen en una serie de puntos o píxeles. Nanómetro: Medida de longitud, equivalente a la mil millonésima parte de un metro. Neurorradiólogia: Diagnóstico y tratamiento de enfermedades del sistema nervioso central y periférico a través de técnicas de imagen de alta tecnología (Resonancia Magnética), permitiendo la aplicación de nuevas intervenciones de alta eficacia en el tratamiento de aneurismas intracerebrales, malformaciones arteriovenosas, fístulas carótido-cavernosas, hemangiomas capilares, vaso espasmos y trombosis cerebrales. 77 Glosario Nitidez: Claridad de detalle de una foto. Píxel = píxeles: Píxel (Picture Element). Se refiere al elemento de la imagen más pequeño (punto) que define una imagen en una pantalla de ordenador. Placenta: Órgano complejo formado por tejidos maternales y fetales que funciona como, puente nutritivo, órgano excretor, respiratorio y endocrino. Plexiglás: Resina sintética que tiene el aspecto del vidrio: el plexiglás se utiliza en construcción y en industria. Resolución: Es la medida de la cantidad de píxeles por unidad de longitud, comúnmente píxeles por pulgada (una pulgada equivale a 2,54 cm de longitud). Se suele abreviar como ppp o dpi (puntos por pulgada o dots per inch). De esta definición se deduce que a mayor resolución, mayor número de puntos de imagen en el mismo espacio, y por tanto mayor definición. La resolución es la relación entre las medidas digitales (medidas en píxeles) y las físicas (las que tiene una vez impresa, o en el dispositivo que se está visualizando). La resolución no es una medida de la calidad de una imagen digital, aunque a menudo se utilice para ello. Es una medida de nitidez o definición, de forma que cuanta más alta sea, mayor definición y viceversa. Capacidad de reproducir fielmente los detalles de una imagen. Reverberación: Reflexión intensa de las radiaciones luminosas. Resonancia magnética nuclear: Técnica de diagnóstico por imagen, basada en el fenómeno físico de la resonancia, por la cual se obtienen imágenes internas y detalladas del organismo. 78 Glosario TAC: Exploración de rayos X que produce imágenes detalladas de cortes axiales del cuerpo. Tomografía del griego tomos que significa corte o sección y grafía que significa representación gráfica. Por tanto tomografía es la obtención de imágenes de cortes o secciones de algún objeto. La palabra axial significa "relativo al eje". Plano axial es aquel que es perpendicular al eje longitudinal de un cuerpo. La tomografía axial computarizada, aplicada al estudio del cuerpo humano, obtiene cortes transversales a lo largo de una región concreta del cuerpo (o de todo él). Computarizar significa someter datos al tratamiento de una computadora. Telemedicina: Actividad que utiliza la medicina para proveer asistencia, diagnostico o transmisión de imágenes radiológicas a distancia mediante la utilización de tecnologías de comunicación y computación. Tomosíntesis: Esta tecnología es una extensión del mamograma digital. La tomosíntesis permite que el seno sea visto como muchas secciones delgadas y provee la posibilidad ofrecer un diagnóstico de cáncer del seno más preciso y temprano. Todavía esta tecnología sigue considerándose experimental y no está disponible en el mercado. Tono: Atributo de sensación visual de una imagen por la que una zona parece similar a otra. Grado de intensidad de los colores: tonos claros, neutros. Ultrasonografía: Técnica de estudio radiológica con ultrasonidos por medio de la cual se obtienen imágenes de estructuras profundas del cuerpo empleando sonidos de alta frecuencia. 79 Abreviaturas ABREVIATURAS CAD (Computer Aided Design) Diseño asistido por computadora CAM (Computer Aided Manufacturing) Manufactura asistida por computadora CCD (Charge Coupled Device) Dispositivo acoplado por carga eléctrica CCITT (Consultative Committee for International Telegraphy and Telephony) Comité Consultivo Internacional Telegráfico y Telefónico CDIS (Carcinoma Ductal In Situ) CT escáner (Tomografía computarizada de escáner) CTP (Computer To Plate) CMY (Cyan, Magenta, Yellow) Cian, Magenta, Amarillo, CMYK (Cyan, Magenta, Yellow, Black) Cian, Magenta, Amarillo, Negro. DPI (dots per inch) puntos por pulgada EDG (Electronic Dot Generation) EMI (Electrical and Musical Industries) EZW (Embedded Zerotree Wavelet) 80 Abreviaturas GIF (Graphic Interchange Format) Formato Grafico Intercambiable HSI (H = color, S = saturación y I = intensidad) JPEG (Joint Photographic Experts Group) Grupo de Expertos Fotográficos Unidos) Lab valor "L" representa la cantidad de luz, el valor "a" la cantidad de rojo / verde que posee el matiz, y el valor "b" la cantidad de amarillo / azul. LCD (Pantalla de cristal líquido) LZ (de Abraham Lempel y Jacob Ziv) LZW (Lempel-Ziv-Welch), MrSID (Multi-resolution Seamless Image Database) PPP o PPI (Píxel por pulgada o píxel per inches) PTM (Fotomultiplicador) PNG (Portable Network Graphic) RGB (Red, Green, Blue) Rojo, Verde y Azul RLE (Run Lengh Encode) SPIHT (Set Partitioning In Hierarchical Trees) TAC (Tomografía Axial Computarizada) 81 Abreviaturas TIFF (Tagged Image File Format) TDC (Transformada Discreta del Coseno) TDW (Transformada Discreta Wavelet) YIQ (Y=luminancia, I=tonalidad, Q=saturación) 82 Bibliografía BIBLIOGRAFÍA Tratamiento Digital de voz e imagen y aplicación a la multimedia. Autor Marcos Faúdez Zanuy. ED. Alfa Omega. Págs. 113 -199 Para la investigación y estudio de este documental se consultaron diferentes direcciones en Internet. 83