UNIVERSIDAD VERACRUZANA

Anuncio
UNIVERSIDAD VERACRUZANA
FACULTAD DE INGENIERÍA EN ELECTRÓNICA Y
COMUNICACIONES
ZONA POZA RICA - TUXPAN
“FUNDAMENTOS EN LA DIGITALIZACIÓN Y
PROCESAMIENTO DE UNA IMAGEN”
MONOGRAFÍA
QUE PARA OBTENER EL TITULO DE:
INGENIERO EN ELECTRÓNICA Y
COMUNICACIONES
PRESENTA:
HERNANDEZ SOSA CARLOS EMMANUELLE
DIRECTOR DE MONOGRAFÍA:
M. en C. ROMÁN GARCÍA RAMOS
ASESOR DE MONOGRAFIA:
M. en I. LUIS DAVID RAMÍREZ GONZÁLEZ
POZA RICA, VER.
2007
Índice
ÍNDICE
CAPITULO I INTRODUCCIÓN
1
1.1 Antecedentes
1
1.2 Justificación
2
1.3 Objetivo
3
1.4 Alcance del trabajo
3
1.5 Limitaciones
3
CAPITULO II DIGITALIZACIÓN DE UNA IMAGEN ANALOGICA
4
2.1 Introducción
4
2.2 Digitalización
5
2.3 Dispositivos de digitalización
5
2.3.1 Escáner
a) Generaciones del Escáner
6
6
b) El escáner de tambor
11
c) El escáner Plano
15
2.3.2 La cámara digital
16
a) Los componentes
17
b) Los sistemas de enfoque
18
c) Métodos de almacenamiento
19
d) Información cromática
20
e) Ventajas
21
f) Inconvenientes
21
g) Cámara filmadora
22
2.3.3 Tableta Digitalizadora
23
2.3.4 Lápiz Óptico
24
2.4 Imagen digitalizada
25
i
CA
Índice
CAPITULO III PROCESAMIENTO DE UNA IMAGEN DIGITAL
27
3.1 Introducción
27
3.2 Muestreo y Cuantización
28
3.3 Espacio que ocupa una imagen digital
32
3.4 Procesamiento de Imágenes a color
34
3.5 Histogramas
36
3.6 Compresión de una imagen
38
3.6.1 Compresión sin pérdidas o sin error:
38
3.6.2 Compresión con pérdidas
42
3.6.3 Formatos de compresión más utilizados:
46
a) Formato JPG (Joint Photographic Group)
46
b) Formato GIF (Graphic Interchange Format)
47
c) Formato PNG (Portable Network Graphic)
48
d) Formato BMP (BitMaP)
49
e) Formato TIFF (Tagged Image File Format)
50
3.6.4 Problemas derivados de la compresión con pérdidas
50
CAPITULO IV APLICACIONES
53
4.1 Introducción
53
4.2 Tratamientos de una imagen digital
54
4.3 Imagen digital para la detección del Cáncer (La mamografía)
61
4.4 Imagen digital en Odontología
64
4.5 Imágenes digitales en la Ecografía
67
4.6 Imagen digital de la NASA demuestra que por la superficie de Marte corrió
agua
69
CAPITULO V CONSIDERACIONES FINALES
72
GLOSARIO
74
ABREVIATURAS
80
BIBLIOGRAFÍA
83
ii
Introducción
CAPITULO I
INTRODUCCIÓN
1.1 Antecedentes
La digitalización es actualmente el medio más disponible y adecuado para la
preservación de una imagen o un documento original así como para su acceso y
difusión. Sin embargo, las nuevas tecnologías han permitido el desarrollo de la
digitalización, que supera sus limitaciones y ofrece nuevas ventajas en cuanto a
control de calidad de la imagen obtenida, a las posibilidades de navegación y al
acceso al documento o imagen digital. El escanear un texto no se escanean letras,
palabras y frases, sino sencillamente los puntos que las forman, una especie de
fotografía del texto. La digitalización tiene un carácter de innovación y de prestigio.
El procesamiento digital de imágenes se basa en manipular y analizar
imágenes por computadora.
El presente trabajo describe los fundamentos en la digitalización y
procesamiento de una imagen.
En el capitulo dos se centrará en el proceso de digitalización de una imagen
analógica, mencionando algunos de los diferentes dispositivos de digitalización
que existen hoy en día por ejemplo el escáner, la cámara fotográfica, etc.
La imagen digitalizada no es tangible para nuestras manos, la imagen está
compuesta por un código numérico que una computadora nos representa en la
pantalla mediante píxeles, que englobados en el ojo humano lo interpreta como
una imagen integra.
I-1
Introducción
En el capitulo tres se tratará del procesamiento de una imagen digital en el
cual el muestreo y la cuantización son importantes para estos procesos. También
se menciona
como se realiza la compresión que reduce el número de bits
necesarios para transmitir o almacenar una imagen digital, además se nombran
algunos formatos de compresión más comunes. La calidad de una imagen puede
verse afectada por las técnicas de compresión utilizadas o por el nivel de
compresión aplicado. Las técnicas de compresión pueden ser sin pérdida o con
pérdida. Estas compresiones admiten diferentes opciones, y según se elija, se
puede llegar a una solución satisfactoria: imagen de buena calidad con tamaño
aceptable.
En capitulo cuatro se mencionan algunas de las muchas aplicaciones que
existen en la actualidad en el procesamiento digital de imágenes que se utilizan la
vida diaria, medicina e investigación. La aplicación de los diferentes tipos de
procesamientos en cualquier área que utilicen las imágenes digitales, es posible
resaltar los distintos elementos de forma más clara y sencilla que en una imagen
normal a simple vista no pueden ser observados.
1.2 Justificación
Proporcionar información que facilite a cualquier estudiante y público en
general interesados en adquirir conocimiento en la digitalización de una imagen
analógica y su procesamiento que entre otras cosas permita conseguir una mejor
calidad de la imagen. El tema me resulta interesante para aumentar mis
conocimientos y conocer el procesamiento correcto que debe conseguirse en una
imagen digital.
I-2
Introducción
1.3 Objetivo
Adquirir los conocimientos fundamentales que se emplean en la digitalización
de una imagen analógica, conocer la imagen digital interiormente para tener un
mejor entendimiento sobre como darle un tratamiento que ayude a mejorar la
calidad de la misma. Comprender los procedimientos de reducción del tamaño de
almacenamiento de una imagen. Conocer que la imagen digital se aplica en
diversas áreas.
1.4 Alcance del trabajo
Se presenta la forma en que se efectúa la digitalización de una imagen,
maneras en que se procesa correctamente una imagen digital. Se explicarán los
procesos de digitalización, mostrando algunos ejemplos de estos. Mencionaré
aplicaciones de la imagen digital en algunas áreas que son relevantes.
1.5 Limitaciones
El presente trabajo se limita a imágenes en escala de grises (blanco y negro).
Se mencionan fundamentos de digitalización y procesamientos de imágenes antes
mencionadas con las similitudes de imágenes a color; estas últimas, son tratadas
con poca profundidad, debido a que es demasiado amplio el tema para ser
cubierto en este trabajo.
I-3
Digitalización de una Imagen Analógica
CAPITULO II
DIGITALIZACIÓN DE UNA IMAGEN ANALÓGICA
2.1 Introducción
Hoy en día se vive una era en la que todas las formas de la información están
sufriendo un proceso de digitalización. Las imágenes por supuesto, no han podido
escapar a este proceso.
El digitalizar una
imagen analógica se requiere de ciertos dispositivos
electrónicos de reproducción de imágenes y posteriormente la imagen estará
digitalizada.
La reproducción de esa imagen almacenada en un soporte digital puede ser
duplicada tantas veces como se desee, produciendo siempre una copia con la
misma calidad que la imagen original.
Se puede decir de una manera sencilla que la digitalización de una imagen,
se crea como la descomposición de la misma en series de dígitos que pueden ser
manejados por una computadora, facilitar la manipulación y aumentar la calidad
de la imagen.
II-4
Digitalización de una Imagen Analógica
2.2 Digitalización
El término digitalización se puede asociar en una primera aproximación,
como la forma en que una imagen, texto, fotos, sonido, movimiento, etc., se
pueden convertir en un idioma comprensible para los sistemas digitales.
Las señales exteriores que hacen posible la identificación en su estado
natural, se transforman en código binario (0's y 1's) que mediante la utilización de
procesos se pueden transformar de acuerdo a los requerimientos.
En general se establecerá que digitalizar es convertir cualquier señal de
entrada analógica (como una imagen o una señal de sonido, etc.) en una serie de
valores binarios.
2.3 Dispositivos de digitalización
2.3.1 Escáner
2.3.2 Cámara Digital
2.3.3 Tableta Digitalizadora
2.3.4 Lápiz Óptico
II-5
Digitalización de una Imagen Analógica
2.3.1 Escáner
El escáner es un dispositivo electrónico diseñado para registrar caracteres
escritos, gráficos en forma de fotografías o dibujos, todos ellos impresos en una
hoja de papel, con lo que se facilita su introducción en la computadora,
convirtiéndolos en información binaria comprensible para ésta.
En este apartado utilizaré la palabra escáner refiriéndome a los diferentes
términos semejantes encontrados durante la investigación (escáner y scanner).
Hay diferentes tipos de escáner primero se presentan las generaciones y se
finaliza con los tipos más usuales.
a) Generaciones del Escáner
Existen cuatro generaciones de escáner que se nombran a continuación:
PRIMERA GENERACION
El primer escáner, creado por la compañía EMI (Electrical and Musical
Industries) fue diseñado y restringido a la exploración del cerebro humano (figura
2.1). Este hecho causó tremendo impacto en la Neurorradiólogia, porque este
campo carecía de herramientas de diagnóstico simple.
En un intento por aplicar el principio de la primera generación de escáner
para el cuerpo, el Dr. Robert Ledley de la Universidad de Georgetown diseño y
construyo un prototipo de escáner para el cuerpo, llamado escáner ACTA;
logrando la patente de éste, el 14 de febrero de 1974. Las imágenes borrosas
fueron presentadas con colores brillantes.
II-6
Digitalización de una Imagen Analógica
A pesar de tener poca calidad, estas imágenes se convirtieron en una
promesa para el futuro del escaneo del cuerpo.
Fig. 2.1 Principio de la primera generación CT escáner.
SEGUNDA GENERACION
Permiten la ampliación, reducción de la imagen y realizan el tramado,
mediante tramas físicas de contacto.
Hay una mínima diferencia entre la primera y la segunda generación del
escáner, en lugar de un detector existe un número de ellos colocados con un
ángulo pequeño en un abanico en el plano del explorador.
El escáner de la primera y segunda generación tienen mucho en común y por
lo tanto, el escáner de la primera generación puede algunas veces actualizarse a
la segunda generación.
Es una práctica común debido a su baja velocidad para grabar
simultáneamente dos porciones doblando el número de detectores. El primer
escáner de la segunda generación, el Delta 50, fue presentado en diciembre de
1974 por la empresa Ohio Nuclear. Tenía dos renglones de tres detectores.
II-7
Digitalización de una Imagen Analógica
En Marzo de 1975, EMI presentó un escáner con 30 detectores. Como
resultado de su incremento en detectores fueron casi 10 veces más rápidos.
Esto empezó con la era del escáner rápido en la segunda generación (figura
2.2). Este escáner no requiere la técnica de doble porción la cual resultó en una
pequeña porción geométrica.
La primera y segunda generación del escáner fue especialmente susceptible
a los movimientos del cuerpo humano, pues estos movimientos no podían medirse
durante los intervalos de rotación.
Aunque rápidamente la segunda generación del escáner tuvo la ventaja de
un corto tiempo de escaneo, también tuvo la desventaja de que no todos los haces
de rayos X entre la fuente y el detector se enfocara por separado, y como parte del
resultado de la radiación que pasaba por el paciente fue entre el detector y no era
utilizado.
El uso del escáner cambió rápidamente. El escáner de la primera generación
era dedicado a la exploración del cerebro, el escáner de la segunda generación se
usaba para la exploración de todo el cuerpo.
Fig. 2.2 Principio de la segunda generación CT escáner.
II-8
Digitalización de una Imagen Analógica
TERCERA GENERACION
Son los denominados EDG (Electronic Dot Generation) generación
electrónica del punto, este tipo de escáner es muy sofisticado y de alta
productividad, puede realizar múltiples correcciones y tratamientos, así como
almacenar la información de imágenes en disco.
La tercera generación del escáner es completamente un tipo nuevo, el
movimiento de translación ha sido eliminado y el abanico (ángulo) ensanchado
para incorporar el cuerpo entero. En el orden de 300 a 500 detectores fueron
colocados dentro del espectro (abanico).
Estos cambios hicieron más rápido el escaneo y como consecuencia la
continúa adquisición de datos, provocando mucho menos susceptibilidad al
movimiento.
La tercera generación fue introducida por la empresa Artronix en 1974 como
un escáner para el cerebro. En el verano de 1975 la empresa General Electronic
anunció una mamografía como un proyecto piloto para el escaneo del cuerpo.
Un problema inicial de la tercera generación del escáner era que cada
detector contribuía principalmente al anillo de elementos de imágenes y cuando
cada detector estaba mal calibrado, una forma de anillo se presentaba
conjuntamente en el eje de rotación. Sin embargo este problema después fue
solucionado usando detectores estables y procedimientos de calibración.
La tercera generación es lo más extensamente posible aplicado en cuestión
del escáner rápido. Durante 1978 y 1979 prácticamente toda la tercera generación
manufacturó el doble de detectores y los incorporó al escáner (figura 2.3).
II-9
Digitalización de una Imagen Analógica
Fig. 2.3 Principio de la tercera generación CT escáner.
CUARTA GENERACION
Son los más utilizados actualmente. Constan de una unidad de entrada
independiente conectada a la computadora mientras que la salida se realiza
mediante una filmadora o CTP (Computer To Plate), este es uno de los últimos
desarrollos tecnológicos en fase de implantación. Consiste en la filmación directa
en la plancha de impresión, eliminando el paso a película. Este tipo de escáner es
de los primeros que digitalizan imágenes, mediante un conversor analógico-digital.
Aunque no ha resultado en un intento de disminuir el tiempo de exploración,
como en el caso de previas generaciones, no puede ser realmente considerado
una nueva generación sino como una variación de la tercera generación.
II-10
Digitalización de una Imagen Analógica
Esta variante originada de una búsqueda por mejorar la calidad de la imagen:
la geometría de rayos X, es tal que, las distorsiones de anillo no sean probables de
ocurrir.
La más avanzada variación a la cuarta generación es el concepto
desarrollado por EMI llamado el escáner de anillo distribuido, donde el tubo de
rayos X a las afueras del detector y el lado más cercano del detector del tubo, es
continuamente jalado hacia afuera para dejar pasar los rayos X. Este escáner fue
presentado en diciembre de 1977 (figura 2.4).
Fig. 2.4 Principio de la cuarta generación CT escáner.
b) El escáner de tambor
El escáner de tambor ha sido tradicionalmente el dispositivo de reproducción
electrónica de imágenes y posteriormente de digitalización.
Hoy en día sigue siendo el sistema que aporta la más alta calidad y
resolución, sobre todo para la realización de ampliaciones. En los dos gráficos
siguientes se pueden apreciar las dos unidades: de análisis (figura 2.5) y de
exposición (figura 2.6) que conforman el escáner de la tercera generación:
II-11
Digitalización de una Imagen Analógica
Fig. 2.5 Unidad de análisis.
Fig. 2.6 Unidad de exposición o recorder.
En el escáner de tambor, la imagen se coloca alrededor de la superficie de
un tambor transparente. El original suele ser negativos o transparencias (guardan
más calidad que las fotografías en papel). Las transparencias se bañan en un
aceite especial, una delgadísima capa, que asegura un contacto perfecto con la
superficie del tambor.
II-12
Digitalización de una Imagen Analógica
Fig. 2.7 Escáner de tambor PTM.
En la figura 2.7 se pueden apreciar todos los elementos del escáner de
tambor:
Cilindro de exploración, fuente luminosa, lente y espejo, espejos dicroicos y
tubos fotomultiplicadores, así como la trayectoria de la luz para un original
transparente. A continuación se explica la función de cada uno de ellos:
Cilindro de exploración
De material transparente (metacrilato, plexiglás o cristal) se encarga de
soportar los originales. Éstos deben estar bien sujetos al cilindro o tambor
mediante cinta adhesiva para evitar movimientos durante la exploración.
II-13
Digitalización de una Imagen Analógica
Fuente luminosa
El escáner de tambor dispone de una fuente luminosa que actúa de dos
formas dependiendo del tipo de original:
- Si el original es opaco, la luz se proyecta desde el cabezal de exploración.
- Si el original es transparente, la luz se proyecta mediante un brazo
articulado, desde el interior del cilindro para que la luz atraviese la diapositiva.
Conjuntos de lentes y espejos
La trayectoria de la luz reflejada o transmitida por el original no mantiene una
línea recta, de tal forma que se hace necesario disponer de un conjunto de
espejos que modifiquen dicha trayectoria y un juego de lentes que mantengan
enfocada la imagen desde el cabezal de exploración hasta los fotomultiplicadores.
Espejos dicroicos
Estos espejos son los responsables de la separación del color, cada uno de
los espejos está construido para permitir o reflejar un rayo de luz en función de su
longitud de onda, de tal forma que las luces reflejadas son enviadas al
fotomultiplicador.
Fotomultiplicadores
La función del fotomultiplicador al igual que en el escáner plano que utiliza el
CCD (Charge Coupled Device, dispositivo acoplado por carga eléctrica) es la de
transformar la luz en señal eléctrica. Una de las principales ventajas de los
fotomultiplicadores frente al CCD es la de ser sensible a intensidades muy bajas
de luz, con lo que se asegura la captación del detalle en las zonas de sombras de
las diapositivas (las cuales alcanzan niveles de densidad de 5,00 D). Esa señal
eléctrica será finalmente enviada al convertidor Analógico / Digital (convertidor
A/D) el cual generará los píxeles con los valores tonales en función de la
resolución y el tipo de imagen escaneada; esta operación es necesaria para que la
estación de trabajo pueda procesar la información.
II-14
Digitalización de una Imagen Analógica
c) El escáner Plano
Fig. 2.8 Escáner Plano.
Escáner plano o de sobremesa (figura 2.8), es uno de los más utilizados.
Normalmente se suelen utilizar para escanear imágenes o textos planos aunque
también para objetos.
Cómo funciona: El proceso de captación de una imagen resulta casi idéntico
para cualquier escáner: ilumina la imagen con un foco de luz, se conduce
mediante espejos la luz reflejada hacia un dispositivo denominado CCD que
transforma la luz en señales eléctricas, convierte dichas señales eléctricas a
formato digital en un convertidor A/D y transmite el caudal de bits resultante a una
computadora.
II-15
Digitalización de una Imagen Analógica
El CCD es el elemento fundamental de todo escáner, independientemente de
su forma, tamaño o mecánica. Consiste en un elemento electrónico que reacciona
ante la luz, transmitiendo más o menos electricidad según sea la intensidad y el
color de la luz que recibe; es un auténtico ojo electrónico. Hoy en día es bastante
común, puede que la mayoría de las personas tengan uno sin saberlo: en una
cámara de vídeo, en el fax, en una cámara de fotos digital.
La calidad final del escaneado dependerá fundamentalmente de la calidad
del CCD; los demás elementos podrán hacer un trabajo mejor o peor, pero si la
imagen no es captada con fidelidad cualquier operación posterior no podrá arreglar
el problema. Teniendo en cuenta lo anterior, también se debe considerar la calidad
del convertidor A/D, puesto que de nada sirve captar la luz con enorme precisión si
se pierde mucha de esa información al transformar el caudal eléctrico a bits.
Por este motivo se suele decir que es preferible el escáner de marca de
prestigio u otro con una mayor resolución teórica, pero con CCDs que no captan
con fidelidad los colores o convertidores A/D que no aprovechan bien la señal
eléctrica, dando resultados de menor calidad.
2.3.2 La cámara digital
La cámara digital captura imágenes de calidad instantáneas sin la necesidad
de un revelado tradicional. Existen muchos tipos de cámaras (figura 2.9) dentro del
campo de las imágenes digitales, estás satisfacen una variedad de gustos y
necesidades, actualmente hay varios modelos, económicos para el publico en
general y hasta las más sofisticadas con precios elevados para el fotógrafo
profesional.
II-16
Digitalización de una Imagen Analógica
Existen cámaras digitales con lentes fijos o intercambiables, con visor o con
pantalla de visualización en la zona posterior, con controles sofisticados y hasta
con flash.
La cámara digital cuenta con varios elementos computacionales que se
mencionan a continuación los cuales aportan no solo a la calidad de la imagen
final, sino también a la cantidad monetaria que se invierte.
Fig. 2.9 Cámaras Digitales.
a) Los componentes
Al interior del cuerpo de la cámara digital se encuentra una alta tecnología la
cual abarca principalmente a chips y circuitos. Estos elementos trabajan en
conjunto para calcular una exposición idónea al mismo tiempo que logran un
enfoque nítido.
Al pasar la luz por el lente cae sobre las células sensibles CCD las cuales
dirigen la información al procesador de la cámara. El dispositivo CCD se encuentra
directamente dentro del lente y dentro del cuerpo de la cámara, es un chip de
células fotosensibles las cuales emiten una carga eléctrica cuando la luz cae sobre
ellas.
II-17
Digitalización de una Imagen Analógica
El CCD llegó en esta era digital a tomar el lugar de la película fotográfica,
entre más sensores individuales tenga, mejor es la calidad de la imagen. Las
cámaras para uso del publico en general llegan a tener hasta 480,000 sensores, y
las profesionales hasta 14, 000, 000 sensores.
Entre más fina la cámara, más fino es el sistema que determina la apertura
adecuada del diafragma (el cual controla la cantidad de luz). Algunas cámaras
traen un sistema interno el cual mide varios puntos de la imagen para calcular la
exposición, y algunos otros únicamente miden al centro de la imagen.
b) Los sistemas de enfoque
En cuanto a la nitidez de la imagen, existen sistemas manuales de enfoque y
otros de autoenfoque. El sistema manual es idéntico al de las cámaras
tradicionales. En cambio el sistema autoenfoque presenta dos opciones, la activa y
la pasiva. La opción activa arroja un rayo infrarrojo o de ultrasonido desde la
cámara el cual cae y rebota sobre el objeto o escena que se encuentre frente al
lente midiendo así la distancia entre este y la superficie del CCD.
La opción pasiva procesa la información que pasa a través del lente
directamente del objeto o escena que se fotografía. Como en muchas de las
cámaras tradicionales, el lente de la cámara digital puede contar con un círculo,
con una línea la cual lo parte por la mitad, si la imagen se percibe dividida, esto
significa que no esta bien enfocada la imagen, se deben unir los medios para
conformar una imagen nítida. Para enfocar la imagen, el CCD se encarga de dirigir
los rayos de luz que se encuentran dentro del círculo hacia el procesador y este en
turno, activa al motor del lente para ajustar el foco de la imagen y para determinar
la exposición.
II-18
Digitalización de una Imagen Analógica
Este procesador captura los voltajes provenientes del CCD y modela la
imagen la cual se guardara dentro del sistema específico de memoria de la
cámara digital.
c) Métodos de almacenamiento
La información digital que captura la cámara se puede almacenar de diversas
formas, la transferencia de las imágenes a la computadora precisa el uso de
software de manipulación y edición específicas. Muchas cámaras traen la opción
de tomar y descargar las imágenes de inmediato en la computadora conectando la
cámara a esta por medio de un cable adaptador hacia un puerto específico. Con
esto se puede editar, borrar eficientemente y almacenar únicamente las imágenes
que más se quieren. También permite que se envíen las imágenes digitales por
correo
electrónico o
Internet
(cosa
que
ha
llegado
a revolucionar al
fotoperiodismo).
También hay algunos modelos que permiten mostrar las imágenes
capturadas en casi cualquier TV, reproductora de vídeo o proyector multimedia por
medio de una conexión de salida de vídeo de la cámara.
La mayoría tiene memorias las cuales se mencionan a continuación:
- Memoria removible: almacenan fotografías en una tarjeta de memoria.
Algunas las almacenan en un disquete regular que se usa dentro de esta. Se
puede reemplazar una tarjeta de memoria desmontables con capacidad de Mb
específica o disquete cuando esté llena.
- Memoria incorporada: almacenan al menos 20 fotografías. Una vez que
está llena, se las transfiere a la computadora.
II-19
Digitalización de una Imagen Analógica
Estas tarjetas capturan una cantidad de imágenes predeterminadas por el
fabricante de la cámara, y almacena imágenes de menor a mayor grado de
compresión (entre mayor compresión más imágenes caben en la tarjeta). Tienen la
ventaja de que una vez que se descargan, se pueden utilizar una y otra vez.
En general, el formato de las imágenes digitales es de tipo JPG, esto permite
que se puedan exportar desde la cámara a una gran variedad de programas de
tratamiento a una computadora.
d) Información cromática
La mayoría incluyen una pantalla tipo visualizador de cristal líquido (LCD),
que puede utilizar para tener una vista preliminar y visualizar las fotografías.
El diseño del CCD determina que su mecanismo permita grabar imágenes en
tonos de gris; es decir, en blanco y negro, y en un sistema monocromático. Con
película de color la imagen se graba en varias capas sensibles al color, ya que
cada capa es transparente.
Como el CCD es una capa única opaca se presentan varias opciones:
Tres sensores del CCD los cuales van montados dentro del cuerpo de la
cámara. Este cuerpo contiene dentro un sistema de prisma el cual parte el
rayo de luz y separa la imagen en tres bandas de rojo, verde y azul, gracias
a filtros de color colocados detrás de la lente. Las tres señales distintas se
integran en una única dentro de la computadora.
Filtrar el color sobre el mismo CCD se puede lograr si los sensores
individuales se pueden dividir en un conjunto de filtros (rojo, verde y azul)
montados sobre la superficie del sensor.
II-20
Digitalización de una Imagen Analógica
e) Ventajas
El formato digital se basa en el almacenamiento de la imagen mediante
dígitos, que se mantendrán inmutables a lo largo del tiempo, con lo que la calidad
de la imagen no disminuirá nunca.
La imagen digital puede ser repetida varias veces, produciendo siempre una
copia de igual calidad que la imagen original.
Sobre la imagen digital se pueden realizar una enorme cantidad de procesos
de retoques informáticos que facilitan la labor de reproducción de copias con mejor
calidad que los propios originales. En algunos casos se pueden conseguir efectos
de muy diversos tipos: enfoque/desenfoque, aplicación de filtros, modificación de
la gama de colores, de contrastes, de brillos, etc.
f) Inconvenientes
Se trata de una tecnología relativamente trascendente por lo que se puede
prever que los equipos que se compren en la actualidad quedarán en desuso.
La introducción de la tecnología digital implica otra serie de inconvenientes
propios de toda la tecnología emergente, entre los que se pueden destacar los
elevados precios y los diferentes tamaños.
La calidad aportada es suficiente para la mayoría de los trabajos realizables
por un auténtico profesional. No obstante se debe reconocer que es inferior a la
que se puede conseguir con materiales químicos.
II-21
Digitalización de una Imagen Analógica
g) Cámara Filmadora
Las filmadoras (figura 2.10) son unos aparatos periféricos altamente
especializados que convierten información, que se les introduce en código binario,
en imágenes con una calidad similar a la de una imprenta (1.600 puntos por
pulgada como mínimo) o fotogramas similares a los de cinematografía.
Las filmadoras se pueden conectar a una computadora o trabajar con ellas
remotamente llevando la información hasta el punto donde están por medio de un
soporte magnético.
Fig. 2.10 Cámara filmadora.
Se utilizan para grabar conversaciones y otros sonidos, utilizando programas
de conferencia para comunicarse a través de Internet. Con los programas de
control de voz se puede conversar en un micrófono y emplear los comandos de
voz para controlar la computadora.
Las formas de grabar los sonidos de las filmadoras son:
Unidireccional: graba sonidos de una dirección, lo que ayuda a reducir el
ruido de fondo. Este tipo es útil para grabar una voz individual.
II-22
Digitalización de una Imagen Analógica
Omnidireccional: graba sonidos de todas direcciones. Este tipo es útil para
grabar varias voces en una conversación en grupo.
2.3.3 Tableta Digitalizadora
Es una tableta compacta generalmente de 127 x 102 mm que incorpora un
lápiz sin cables (figura 2.11). Esta excelente herramienta de trabajo permite
adaptar una pizarra electrónica ideal para los ordenadores portátiles.
Permiten el manejo del cursor a través de la pantalla del sistema informático
y facilitan una importante ayuda en el tratamiento de los comandos de órdenes en
aplicaciones de CAD / CAM (diseño asistido por computadora).
Fig. 2.11 Tableta Digitalizadora.
Las tabletas digitalizadoras convierten una serie de coordenadas espaciales
en un código binario que se introduce en la computadora. Estas coordenadas
serán manejadas posteriormente por programas de dibujo, ingeniería, etc.
II-23
Digitalización de una Imagen Analógica
La tableta suele tener impresos en su armazón pulsadores con símbolos
dibujados para ejecutar de modo directo comandos que agilizan el trabajo de
manejo del software.
Las tabletas digitalizadoras poseen una resolución de alrededor de una
décima de milímetro y pueden manejar gráficos en dos o tres dimensiones. Una
posibilidad de manejo muy intuitiva convierte a las tabletas digitalizadoras en unas
herramientas muy útiles y pequeñas en los sistemas informáticos de diseño y
manejo de gráficos.
Existen diversas tecnologías de construcción de tabletas, pudiendo ser éstas:
• Tabletas mecánicas.
• Tabletas electrónicas.
Las mecánicas, debido al desgaste producido en sus componentes por el uso
continuado, son menos precisas y más delicadas de manejar que las electrónicas,
siendo las más extendidas comercialmente en el mercado.
2.3.4 Lápiz Óptico
Es un instrumento en forma de lápiz que por medio de un sistema óptico,
ubicado en su extremo, permite la entrada de datos directamente a la pantalla.
Para elaborar dibujos, basta con mover el lápiz frente a la pantalla y en ella va
apareciendo una línea que describe dicho movimiento, igualmente se puede mover
líneas de un sitio a otro, cuando se coloca el punto de la pluma en la pantalla y se
presiona un botón, un dispositivo siente dentro de la pluma activada. Transmite a
la memoria de la computadora el sitio de la luz en la pantalla. También sirve para
señalar ítems de los menús al igual que el mouse.
II-24
Digitalización de una Imagen Analógica
Los lápices ópticos son dispositivos de introducción de datos que trabajan
directamente con la pantalla de la computadora, señalando puntos en ella y
realizando operaciones de manejo de software.
Para operar con el lápiz óptico se coloca éste sobre la pantalla del sistema
informático. En el momento en que el cañón de rayos catódicos de la pantalla
barre el punto sobre el que se posiciona el lápiz, éste envía la información a un
software especial que la maneja. El microprocesador calcula cuál es la posición
sobre la pantalla de la computadora permitiendo manipular la información
representada en ella.
Los lápices ópticos son una asistencia para las limitaciones de los teclados
en algunas aplicaciones, sobre todo las que no son de gestión pura (creativas,
etc.). O bien los bolígrafos-escáner, utensilios con forma y tamaño de lápiz o
marcador fluorescente que escanean el texto por encima del cual se pasan y a
veces hasta lo traducen a otro idioma al instante.
2.4 Imagen digitalizada
Una imagen digitalizada se caracteriza por poder ser representada mediante
una serie de dígitos binarios. Es decir, cualquier imagen digital se puede
almacenar en un formado por una larga secuencia como el siguiente tipo:
“100101010100001110010010110100111101010……. “
Simplificando, se puede decir que cada imagen puede ser descompuesta en
una serie de cuadriculas minúsculas y elementales, cada una de ellas estará
representada por determinado número de dígitos binarios que, en definitiva,
representan tanto su intensidad de iluminado como su color. Un ejemplo de
digitalización de una imagen en blanco y negro se muestra en la figura 2.12.
II-25
Digitalización de una Imagen Analógica
Fig. 2.12 Imagen analógica transformada en secuencias de ceros y unos.
Para obtener una imagen digital es necesario el proceso de muestreo para
descomponerla en píxeles y la cuantización que asigna un valor de luminosidad de
la imagen original (figura 2.13).
Fig. 2.13 a) Lenna; b) Extracto de Lenna; c) Niveles de gris.
II-26
Procesamiento de una Imagen Digital
CAPITULO III
PROCESAMIENTO DE UNA IMAGEN DIGITAL
3.1 Introducción
Actualmente la tecnología digital ha despojado a la fotografía de su legado de
verdad y rompe definitivamente esa conexión existencial, hasta ahora indisoluble
con su referente. Muchos intelectuales imaginan ya la muerte de la fotografía tal y
como se conoce hoy, para dar paso a una era post-fotográfica, en la que la imagen
se vuelve cada vez más maleable y manipulable; una era donde lo real y lo irreal
(nunca mejor que ahora definido por su categoría virtual) comienzan a mezclarse
indisolublemente. Las nuevas imágenes sintéticas parecen haberse centrado
especialmente en la idea de la “pérdida de lo real”, puesto que la propia realidad
ha comenzado a ser reemplazada por el mundo de la simulación digital.
La imagen digital es un producto del desarrollo de la tecnología que tiene
como antecesor a la fotografía, (que toma como punto de partida un objeto del
mundo real) y a la pintura, (donde la imagen ha sido creada por un artista). Como
el principio básico de los multimedios permite manipular la tradicional estructura
del medio en sí, en la imagen digital se pueden ver incluidos los dos hechos, la
originalidad de la imagen cuando es tomada por primera vez, y luego el resultado
de los procesamientos de la imagen digital, que forman parte del arte digital
contemporáneo. La imagen digital toma vida mediante un archivo de diferentes
formatos, que puede ser almacenado en una PC, diferentes unidades flexibles,
enviado por correo electrónico e incluso ser impreso.
III-27
Procesamiento de una Imagen Digital
3.2 Muestreo y Cuantización
El termino procesamiento digital de imágenes trata sobre la manipulación y
análisis de imágenes por computadora.
El procesamiento de imagen puede considerarse como un tipo especial del
procesamiento digital en dos dimensiones, el cual se usa para revelar información
sobre imágenes y que involucra hardware, software y soporte teórico.
El término imagen corresponde a una imagen monocromática y se refiere a
una función bidimensional de intensidad de luz f(x; y), donde x y y denotan las
coordenadas espaciales y el valor de f en cualquier punto (x; y) es proporcional al
brillo (o nivel de gris) de la imagen en ese punto. La figura 3.1 muestra la
convención de coordenadas que se usará.
Una imagen digital es una imagen f(x; y) que ha sido discretizada en
coordenadas espaciales y en brillo. Una imagen digital puede considerarse como
una matriz cuyos índices del renglón y columna identifican un punto en la imagen y
el correspondiente valor del elemento de la matriz que identifica el nivel de
intensidad de luz en ese punto.
Para trabajar con números en la computadora, el nivel de brillo, o valor de
cada píxel, es cuantizado a códigos binarios enteros positivos (el brillo no puede
ser negativo). El número de niveles de cuantización está determinado por la
relación.
G = 2k
III-28
Procesamiento de una Imagen Digital
Fig. 3.1 Convención de ejes usada.
Donde k representa el número de bits necesarios para cada muestra. Esto
es, con 5 bits de cuantización en la intensidad se pueden representar 32 niveles
de gris (25 = 32). Para tener una imagen de buena calidad para el ojo humano es
necesario tener como mínimo 64 niveles de gris. Para una apreciación fina se usa
una cuantización estándar a 8 bits, esto es, 256 niveles de gris. A una imagen
cuantizada de esta manera se le conoce como imagen en tonos de gris.
La cuantización a 8 bits (1 byte) se dice estándar porque es el mínimo
número direccionable directamente por la mayoría de los microprocesadores.
Una imagen natural capturada con una cámara, un telescopio, un
microscopio o cualquier otro tipo de instrumento óptico presenta una variación de
sombras y tonos continuos. Imágenes de este tipo se llaman imágenes analógicas.
Para que una imagen analógica, en blanco y negro, en escala de grises
(llamadas comúnmente, imágenes en blanco y negro) como se muestra en la
figura 3.2, pueda ser "manipulada" usando una computadora, primero deben
convertirse a un formato adecuado. Este formato es la imagen digital
correspondiente.
III-29
Procesamiento de una Imagen Digital
Fig. 3.2 Imagen en escala de grises.
La transformación de una imagen analógica a otra discreta se llama
digitalización y es el primer paso en cualquier aplicación de procesamiento de
imágenes digitales, estos son: muestreo y cuantificación.
Muestreo: la imagen se divide en líneas horizontales y estas a su vez se
descomponen en una serie de puntos o píxeles.
Cuantificación: a cada uno de estos puntos se le asigna un valor en función
de la luminosidad o color de la imagen original.
El proceso de digitalización, que permite manejar una imagen en una
computadora, implica que la función imagen f(x, y) se muestrea en una matriz con
N columnas y M filas (figura 3.3a).
El proceso de cuantización asigna a cada muestra de la matriz un valor
entero (figura 3.3b). Cada valor representa al valor de la variable física en ese
punto.
III-30
Procesamiento de una Imagen Digital
Fig. 3.3 a) Matriz de Muestreo; b) Matriz de Cuantización.
El rango continuo de la función imagen f(x, y) se discretiza en k intervalos. La
fineza del muestreo (valor de N y M) y el grado de cuantización (valor de k)
determinan el grado de aproximación de la imagen digital a la función imagen
continua f(x, y). Por ejemplo para el caso de muestreo se presenta en la figura 3.4.
Fig. 3.4 Ejemplo de muestreo.
III-31
Procesamiento de una Imagen Digital
El valor de la función imagen se expresa, en procesado de imagen, mediante
valores digitales.
El número de niveles de cuantización es fundamental para la percepción
humana de los detalles finos de la escena. La mayor parte de los dispositivos de
digitalización usan G intervalos iguales. Un ejemplo se presenta en la figura 3.5.
Fig. 3.5 Ejemplo de cuantización.
3.3 Espacio que ocupa una imagen digital
La cantidad de niveles de gris y la finura del mallado que se elija, deben
producir una imagen digital aceptable, en el sentido de que no sea perceptible al
ojo humano el paso de un color a otro, entre dos píxeles consecutivos.
El número de filas M, el número de columnas es N y el grado de profundidad
o niveles de gris es k.
Sin embargo, se debe de tener en cuenta que si el muestreo consiste en un
mallado de N por M cuadrados y el número de niveles de gris permitido son G=2 k,
entonces el número de bits necesarios para almacenar una imagen digitalizada
es:
III-32
Procesamiento de una Imagen Digital
NxMxk
Por ejemplo, una imagen de 128 x 128 con 64 niveles de gris necesita 98,304
bits = 12 KB de memoria. Una de 256 x 256 con 32 niveles de gris necesita
327,680 bits = 40 KB. Y una de 1024 x 1024 con 256 niveles de gris necesita 8,
388,608 bits = 1024 KB = 1 MB. Otros ejemplos sobre diferentes tipos de
dimensiones y grado de profundidad, se muestran en la tabla 3.1.
Imagen
Niveles de gris
bits
Memoria
64 x 64
16
16,384
2 KB
64 x 64
64
24,576
3 KB
64 x 64
256
32,768
4 KB
128 x 128
64
98,304
12 KB
128 x 128
256
131,072
16 KB
128 x 128
512
147,456
18 KB
256 x 256
32
327,680
40 KB
256 x 256
64
393,216
48 KB
256 x 256
128
458,752
56 KB
512 x 512
128
1,835,008
224 KB
512 x 512
256
2,097,152
256 KB
512 x 512
512
2,359,296
288 KB
1024 x 1024
64
6,291,456
768 KB
1024 x 1024
128
7,340,032
896 KB
1024 x 1024
256
8,388,608 1024 KB = 1 M
Tabla 3.1 Ejemplos sobre diferentes dimensiones y grados de profundidad.
III-33
Procesamiento de una Imagen Digital
Dependiendo de los distintos tipos de mallado, la distribución de los píxeles
es distinta, como se observa en la figura 3.6.
Fig. 3.6 Los bordes de las regiones están pintados en negro. Los píxeles están
representados por puntos en color gris. Se conectan dos píxeles si las regiones
correspondientes comparten un lado común.
Este trabajo está centrado en imágenes digitales cuadradas o rectangulares,
cuyos píxeles (x, y) representan regiones cuadradas. La coordenada x especifica la
columna donde está localizado el píxel; la coordenada y representa la fila. Por
convención, el píxel (0,0) está localizado en la esquina superior izquierda de la
imagen.
3.4 Procesamiento de Imágenes a color
Las imágenes digitales a color están gobernadas por los mismos conceptos
de muestreo, cuantificación y resolución que las imágenes en escala de grises. Sin
embargo, en lugar de un único valor de intensidad que expresa el nivel de gris, los
píxeles de las imágenes a color están cuantificados usando tres componentes
independientes uno por cada color primario (RGB = rojo, verde y azul).
Combinando distintas intensidades de estos tres colores, se pueden obtener todos
los colores visibles.
III-34
Procesamiento de una Imagen Digital
En algunos casos, son más apropiados modelos diferentes del RGB para
algoritmos y aplicaciones específicas. De cualquier manera, cualquier otro modelo
sólo requiere una conversión matemática simple para obtener el modelo RGB.
Por ejemplo, para imprimir una imagen digital, es necesario convertir la
imagen RGB al modelo CMY (C=cian, M=magenta, Y=amarillo). La conversión es:
C
1
R
M
= 1
1
G
Y
B
Donde se supone que todos los colores han sido normalizados en el rango
[0,1].
Esta ecuación muestra que la luz reflejada en una superficie pintada de color
cian puro no contiene rojo (C = 1 – R); la reflejada en una superficie pintada de
color magenta puro no contiene el verde (C = 1 – R) y la reflejada una superficie
pintada de color amarillo puro no contiene el azul (C = 1 – R).
Teóricamente, con igual cantidad de pigmentos primarios, cian, magenta y
amarillo, se producirá el color negro, pero en realidad, debido a las impurezas en
las tintas, da lugar a un color café pardo; de ahí que para conseguir un color negro
de calidad es conveniente añadir este color a las impresoras y fotocopiadoras,
pues es el que más utilizan, y se obtiene así el espacio de color CMYK.
El modelo YIQ (Y=luminancia, I=tonalidad, Q=saturación) se usa en las
televisiones comerciales. Básicamente, YIQ es una recodificación de RGB para
mantener la compatibilidad con las televisiones en blanco y negro. De hecho, la
componente Y (luminancia) provee toda la información requerida para una
televisión en blanco y negro. La conversión de RGB a YIQ es:
III-35
Procesamiento de una Imagen Digital
Y
0.299
= 0.596
0.212
Q
I
0.587
0.275
0.523
0.114
R
0.321 * G
0.311
B
Se puede observar que si sólo tomó en cuenta la componente Y de la
imagen, lo que obtengo es una imagen en escala de grises. Así pues, la forma de
obtener una imagen en escala de grises a partir de una en RGB es aplicando al
valor RGB de cada píxel, la fórmula Y = 0.299*R + 0.587*G + 0.114*B.
Otro modelo muy utilizado es el HSI que representa el color de una manera
intuitiva (es decir, de la forma en que los humanos percibimos el color). La
componente I se corresponde con la intensidad, H con el color y S con la
saturación. Este modelo es muy utilizado en algoritmos de procesamiento de
imágenes basados en propiedades del sistema de visión humano. En este trabajo
se da importancia al tratamiento de imágenes en blanco y negro.
3.5 Histogramas
Una forma de estudio, permite ver si una imagen cuenta con características,
como: posibles de reducción en cuanto al almacenamiento, comparar contrastes e
intensidades entre imágenes es derivado de un análisis estadístico, el histograma.
Si se tiene una imagen en niveles de grises, siendo el rango de 256 colores
(de 0 a 255). El histograma de la imagen consiste en una gráfica donde se
muestra el número de píxeles de cada nivel de gris que aparecen en la imagen. La
figura 3.7 se muestran ejemplos donde se puede ver tres imágenes con sus
correspondientes histogramas.
III-36
Procesamiento de una Imagen Digital
Fig. 3.7 Histograma escala de gris y niveles de contraste en la imagen digital.
El histograma es utilizado para binarizar una imagen digital, es decir,
convertirla en una imagen en blanco y negro, de tal manera que se preserven las
propiedades "esenciales" de la imagen. La forma usual para binarizar una imagen
es eligiendo un valor adecuado L dentro de los niveles de grises, tal que el
histograma forme un "valle" en ese nivel. Todos los niveles de grises menores que
L se convierten en 0 (negro), y los mayores que L se convierten en 255 (blanco).
El histograma de una imagen a color RGB consiste en tres gráficas siendo
cada una el histograma de cada color primario.
El concepto de resolución está muy relacionado con la calidad de la imagen,
ya que se determina el número de muestreos de la imagen por unidad de
superficie, por lo tanto a mayor número de muestreos mayor detalle. La resolución
se mide normalmente en píxel por pulgada (ppp o ppi en inglés). La relación entre
píxeles y líneas de impresión suele denominársele factor de calidad.
III-37
Procesamiento de una Imagen Digital
3.6 Compresión de una imagen
La compresión de las imágenes trata de aprovecharse de la redundancia de
los datos para reducir el número de bits necesarios para representar la imagen,
consiguiendo de esta forma ahorrar recursos tanto de almacenamiento como de
transmisión.
Durante la compresión, los datos duplicados o que no tienen un valor
específico se eliminan o se guardan en una forma más simplificada de
almacenamiento, por lo que se reduce el tamaño del archivo de la imagen
resultante en gran medida. Cuando la imagen se edita o visualiza posteriormente,
entonces el proceso de compresión se invierte. Hay dos formas de compresión, sin
pérdidas o con pérdidas.
La principal característica de estos métodos es que los factores de
compresión son la relación entre el número de bits que ocupa la imagen antes de
ser comprimida respecto a la imagen comprimida, no son muy elevados.
3.6.1 Compresión sin pérdidas o sin error:
Compresión sin pérdidas, se distingue entre sistemas no adaptativos,
semiadaptativos y adaptativos, según tengan en cuenta o no las características del
archivo a comprimir.
Los no adaptativos (código Huffman, CCITT) establecen una tabla de códigos
con las combinaciones de bits que más se repiten estadísticamente. A estas
secuencias se asignan códigos cortos, y a otras menos probables claves más
largas. El problema que presentan es que un diccionario de claves único tiene
resultados muy diferentes en distintos originales.
III-38
Procesamiento de una Imagen Digital
Un código de tipo Huffman puede aplicarse de modo semiadaptativo, si se
analiza primero la cadena de datos a comprimir y se crea una tabla a medida. Se
logra mayor compresión, pero introduce dos inconvenientes: la pérdida de
velocidad al tener que leer el original dos veces, por un lado, y la necesidad de
incrustar en el archivo comprimido el índice de claves, por el otro.
Los compresores de uso general más populares utilizan métodos como éste,
por eso tardan más en empaquetar los datos que en descomprimirlos. El número
de entradas de la tabla puede ser configurable, como se muestra en la figura 3.8.
Fig. 3.8 Codificación de una línea de píxeles sobre una tabla de cuatro entradas y
sobre otra de seis.
Entre los métodos adaptativos, el más simple es el RLE (Run Lengh Encode),
que consiste en sustituir series de valores repetidos por una clave con indicador
numérico, como se observa en la figura 3.9.
III-39
Procesamiento de una Imagen Digital
Fig. 3.9 El método RLE codifica series de píxeles repetidos.
Esta secuencia de 12 valores se anota con seis datos.
Muchos otros métodos derivan de éste, pero su eficacia depende del tipo de
imagen. Los dos ejemplos en la figura 3.10, tienen 25 valores, pero mientras que
el primero se queda en 10 datos, el segundo (un caso extremo) no reduce su
tamaño, sino que lo duplica. La anotación de píxeles por series es adecuada en
imágenes con zonas amplias de colores uniformes, pero no en otras con cambios
frecuentes de valor o predominio de texturas:
Fig. 3.10 Ejemplos de otros métodos.
El sistema adaptativo LZ (de Abraham Lempel y Jacob Ziv), del que deriva el
LZW (Lempel-Ziv-Welch), es más ingenioso y consigue, en una lectura única,
codificar repeticiones sin crear una tabla de códigos.
III-40
Procesamiento de una Imagen Digital
Cuando se localiza una secuencia similar a otra anterior, se sustituye por una
clave de dos valores: los correspondientes a cuántos pasos se retrocede y cuántos
datos se repiten, ejemplo en la figura 3.11.
Rápido y fiable, se utiliza en formatos universales como el GIF o el TIFF y
logra proporciones de compresión de 50 a 90%, normalmente ahorra un tercio del
archivo.
Fig. 3.11 Comportamiento del algoritmo LZ:
# 3 2 significa retroceder tres píxeles y repetir dos;
# 12 7 significa retroceder 12 píxeles y repetir siete.
La compresión sin pérdidas comprime una imagen para que su calidad sea
semejante a la original. Aunque la compresión sin pérdidas parece ideal, no
proporciona mucha compresión.
III-41
Procesamiento de una Imagen Digital
3.6.2 Compresión con pérdidas
La compresión con pérdida se refiere a que se puede suprimir cierta
información de la imagen para hacerla más pequeña y sin que el ojo humano note
la diferencia o permitiendo perder pequeños detalles no significativos. Es decir, al
volver a descomprimir la imagen se recupera con alguna pequeña diferencia
respecto a la original.
La mayor parte de los procesos de compresión con pérdidas, son con el
empleo de métodos de transformación, tales como: transformada discreta coseno,
transformada haar, transformada wavelets, transformada slant, etc.
Hasta este punto, donde se han mencionado algunos de los factores más
importantes que intervienen en la formación de una imagen, se puede decir que es
en especial la compresión, los que definen el formato de una imagen digital
estática.
En la tabla 3.2 se muestran los principales formatos en que se presenta en
un archivo de imagen digital estática.
III-42
Procesamiento de una Imagen Digital
BMP
CUR
EPS
GIF
HDF
ICO
JPG
WMF
PBM
PGM
PIC
PCX
PICT
PIX
PNG
PPM
PS
RAS
RGB
RLA
RLE
RPBM
RPGM
RPNM
RPPM
SYNU
TGA
TIFF
VIFF
X
XBM
XWD
Microsoft Windows Bitmap file (sc)
Microsoft Windows Cursor file
Encapsulated PostScript
CompuServe Graphics Image Format file
Hierarchical Data Format file
Microsoft Windows Icon file
Joint Photographic Experts Group
Window Meta File
Portable Bitmap file
Portable Grayscale Map file
PIXAR Picture file
PC Paintbrush
Softimage PICT file
Alias Pixel image file
Portable Network Graphic
Portable Pixel Map file
PostScript
Sun Raster file
Silicon Graphics RGB image file
Wavefront raster image file
Utah Runlength-encoded image file
Raw Portable Bitmap file
Raw Portable Grayscale Map file
Raw Portable any Map file
Raw Portable Pixel Map file
Synu image file
Truevision Targa image file
Tagged Image File
Khoros Visualization Image File Format
Stardent AVS X image file
X11 Bit Map file
X Window Dump image file
Tabla 3.2 Principales formatos en que se presenta en un archivo de imagen digital
estática.
III-43
Procesamiento de una Imagen Digital
Aunque es posible comprimir imágenes sin perder mucha calidad, no es
práctico su empleo en muchos casos. Por consiguiente, todas las cámaras
digitales populares usan una compresión digital con pérdidas, donde se degrada la
información gráfica hasta cierto punto y cuanto más comprimidas están, más
degradadas se vuelven estas imágenes, con respecto a su original.
Aunque la compresión con pérdidas no reproduce las imágenes con la misma
calidad que la imagen original, la imagen sigue pareciendo visualmente sin
pérdidas y aparece normal a la vista humana, si no se agranda demasiado la
reproducción no se distinguen sus deficiencias.
El formato de compresión con pérdida principal es el JPEG (Joint
Photographic Experts Group o Grupo de Expertos Fotográficos Unidos). Este
formato de imagen permite seleccionar el grado de compresión.
El sistema propuesto por el JPEG es una combinación de varias técnicas que
crea un archivo JPEG (o JPG) con un nivel de compresión regulable capaz de
reducir en algunos casos el peso informático de la imagen a menos del 1%. El
proceso estándar consta de cinco pasos:
1. Convertir la imagen a un modo de color que defina la luminancia en un
canal, como LAB. Los bitmaps se pasan a grises, mientras que en las escalas de
grises se eliminan este pasó.
2. Dado que ópticamente se es capaz de ver un cambio sutil en la
luminosidad mucho antes que en el tono cromático, se iguala el tono en cada
grupo de cuatro píxeles, respetando los valores individuales de luz como se
muestra en la figura 3.12.
III-44
Procesamiento de una Imagen Digital
Fig. 3.12 En modo LAB, cada píxel tiene un valor L de luz y dos valores AB para
definir el color. Obsérvese como sólo este paso de la compresión JPEG supone
una disminución del 50% de los datos a anotar.
3. La imagen se divide en bloques de 8 x 8 píxeles. Para cada subimagen se
anota el valor promedio, la amplitud de la oscilación de valores y una descripción
frecuencial de esta oscilación mediante una función de tipo Fourier, llamada
Transformada Discreta del Coseno (TDC).
4. Los valores TDC se cuantifican a la baja, dividiéndolos por un factor
entero. El número de coeficientes de onda y el factor a dividir determinan la
profundidad de la compresión, que es lo que se dice en una escala que, según el
programa, va de 1 a 10, de 1 a 12 o de 0 a 100, pero siempre jugando
inversamente entre el nivel de compresión y la calidad del resultado.
Tras esta cuantificación, abundan las fracciones decimales, que se
redondean al entero más próximo. De este modo, resulta una cadena de datos con
muchas probabilidades de reiteración.
5. Al resultado se le aplica la codificación estadística de Huffman,
compactando las cadenas más repetidas en códigos breves.
III-45
Procesamiento de una Imagen Digital
3.6.3 Formatos de compresión más utilizados
Los principales formatos de las imágenes comprimidas son: JPG o JPEG,
recomendable para fotografías, texturas, etc.; GIF, aconsejable para archivos de
imágenes con pocos colores como logotipos, dibujos, etc.; PNG, documentos
Web.; BMP, imágenes que son enormes en tamaño.; TIFF, archivos gráficos.
a) Formato JPG (Joint Photographic Group)
Es un formato de compresión con pérdidas, pero que desecha en primer
lugar la información no visible, por lo que las pérdidas apenas se notan.
El algoritmo jpg está basado en el hecho de que el ojo humano percibe peor los
cambios de color que las variaciones de luminosidad. Jpg divide la información de
la imagen en dos partes: color y luminosidad, y las comprime por separado.
Admite modos en escala de grises con una profundidad de 8 bits y en color
hasta 24 bits. Permite la carga progresiva en un navegador, el cual lo convierte en
el formato estándar en la Web. No es un formato adecuado para imágenes con
alto contraste de color.
Además, hay que tener en cuenta que la compresión se produce
automáticamente cada vez que se guarda el archivo, por lo que es aconsejable
guardar en este formato por sólo una vez, cuando la imagen esté terminada.
III-46
Procesamiento de una Imagen Digital
b) Formato GIF (Graphic Interchange Format)
Formato creado por CompuServe en 1987 (su primera versión) aunque la
patente del mismo pertenece a la empresa Unisys. En 1989, CompuServe amplió
las propiedades de este formato, dando lugar a la segunda versión de este
estándar, conocida como gif 89a. Usa un sistema de compresión LZW modificado.
Los ficheros gráficos GIF son los más comunes en las páginas Web, debidas
sobre todo a su facilidad de construcción y a su poco peso, además de ser
soportados por todos los navegadores.
Con este formato, cuantos menos colores tenga la imagen y más extensión
total ocupe cada uno de ellos dentro de la misma, mejor compresión se obtiene.
Dentro de sus ventajas conviene destacar:
Con este formato se pueden crear gráficos de fondo transparente.
Se puede guardar una imagen asociándola con su propia paleta de colores.
De esta forma disminuye el tiempo de carga y las imágenes son más
compatibles con sistemas operativos y navegadores.
Se utiliza para construir imágenes animadas, creando un gráfico formado
por varias escenas que se unen y forman una secuencia con un tiempo
establecido entre una imagen y otra, como en una película.
Permite construir imágenes entrelazadas.
III-47
Procesamiento de una Imagen Digital
Entre sus desventajas conviene destacar:
Sólo permite trabajar con 256 colores.
Debido a esta limitación en los colores, no es adecuado para representar
escenas con muchos colores ni con una gradación entre estos, como es el
caso de una fotografía. En estos casos es mejor usar otro tipo de formato,
como el JPG.
CompuServe Inc., ha provocado la aparición del formato libre png que, además,
comprime mejor que gif.
c) Formato PNG (Portable Network Graphic)
Se trata de un formato de compresión sin pérdidas, con una profundidad de
color de 24 bits. Soporta hasta 256 niveles de transparencias, lo que permite fundir
la imagen perfectamente con el fondo.
PNG es el nuevo formato de compresión de imágenes para la Web. Entre sus más
destacadas ventajas están la gran calidad y la alta compresión.
PNG es uno de los últimos formatos de compresión que aparecen en la
escena Web, exactamente en 1994. Conjuga lo mejor de los formatos que
habitualmente se han venido utilizando, que son .GIF y .JPG. Es de uso libre, es
decir, no es necesario pagar ningún tipo de licencia para usarlo.
El proceso a seguir para convertir una imagen a formato. PNG es muy simple
y su entorno de programación está abierto a los desarrolladores. Además, no sólo
se usa para la World Wide Web. Entre otras cuestiones a destacar, se puede
señalar que es el formato oficial de Microsoft Office 97.
III-48
Procesamiento de una Imagen Digital
Acepta miles de colores, frente a los 256 máximos admitidos por .GIF y ante
los miles soportados por JPG, que también dan problemas de compresión y
descompresión, además de contar con un mayor peso en kilobytes. El formato de
compresión que utiliza es de alta calidad, lo que permite lograr la reducción en los
tiempos de bajada. El sistema de entrelazado que utiliza es más óptimo que con
GIF. El efecto de transparencia fondo/figura es mejor, ya que no se basa en un
color de fondo.
PNG es ideal en dos casos: cuando se trabaja con imágenes transparentes y
en los casos en que se quiere introducir en un documento Web.
Entre sus inconvenientes hay que citar que no soporta animaciones y que su
uso no está aún muy extendido, aunque los principales programas gráficos
permiten trabajar con él.
d) Formato BMP (BitMaP)
Es un formato de compresión sin pérdidas. Desarrollado e impulsado por
Microsoft, BMP es una abreviatura de Windows BitMaP (Mapa de Bits de
Windows), y en realidad una imagen en este formato es la sucesión de puntos
coloreados guardados cada uno independientemente.
Características de BMP: Utiliza imágenes de 24 bits de color, los archivos no
aumentan de tamaño, no modifica el formato, las imágenes son totalmente
compatibles, no cambia parámetros de la imagen (resolución, color, etc.), las
imágenes no cambian para el ojo humano.
III-49
Procesamiento de una Imagen Digital
e) Formato TIFF (Tagged Image File Format)
Formato que permite el almacenamiento e intercambio de informaciones
gráficas provenientes del escáner, programas de retoque y edición de fotos. La
estructura de un archivo de formato TIFF se define por una secuencia de 8 bits.
Sus principales ventajas son:
Su estructura es conocida por una amplia variedad de aplicaciones.
Es independiente de sistemas operativos.
Los archivos con este formato se pueden ajustar a las características de un
escáner, monitor o impresora.
Una de sus principales desventajas es que un usuario puede indicar nuevos
atributos en una imagen, imposibilitando la interpretación correcta de los datos por
otro sistema de lectura de imágenes.
3.6.4 Problemas derivados de la compresión con pérdidas
Los efectos negativos de una excesiva compresión pueden ser la disminución
del tono y la nitidez, que se notaría más bien en una impresión, y la aparición de
artefactos a nivel local visibles sobre todo en pantalla.
Estos efectos son menores en imágenes grandes, de varios megapíxeles, en
que los cuadros de 8 x 8 píxeles son menos importantes para el detalle y la
codificación de la última fase es mucho más efectiva. Se consiguen así buenas
relaciones de compresión, aunque se indiquen niveles de calidad media-alta.
III-50
Procesamiento de una Imagen Digital
Los efectos más típicos son la aparición de los bloques de 8 x 8 píxeles, el
ruido cromático en las zonas oscuras y la alteración del contorno, que se ven
borrosas en imágenes de poca resolución y el reflejo intenso de luminosidad más
grandes. En la figura 3.13 se muestran imágenes donde se puede observar la
imagen original y los efectos negativos por la compresión.
a
b
c
Fig. 3.13 a) Imagen original; b) Reflejo de luminosidad en los bordes por una
excesiva compresión; c) Detalle de los bloques de 8 x 8 píxeles.
III-51
Procesamiento de una Imagen Digital
La reverberación la producen los contornos que coinciden con un borde
marcado. Su reconstrucción es mucho más irregular que las de sus vecinas, que
coinciden en una zona de menor oscilación y resultan mucho más homogéneas.
Así, se producen pinceladas de falso contraste a varios píxeles de distancia de la
verdadera silueta.
La solución pasa por lograr una mejor correspondencia formal (que hoy se
busca en las formas Wavelet, un tipo de patrones de onda diseñables que pueden
ser sinusoidales o no) y establecerse con una duración finita. Combinando
Wavelets (TDW), pueden describirse formas complejas con muchos menos
coeficientes. Ésta es la base de nuevas técnicas, como EZW, SPIHT, MrSID o
JPEG 2000, que quieren ser la alternativa al actual JPEG.
III-52
Aplicaciones
CAPITULO IV
APLICACIONES
4.1 Introducción
Es evidente que las nuevas tecnologías llevan algún tiempo ofreciendo
interesantes oportunidades en cualquier campo de ciencia y, por supuesto,
también del conocimiento.
La imagen digital en países avanzados ha progresado enormemente, el cual
existe compañías especializadas que trabajan en la investigación como la "Nasa ",
para filtraje y restauración de imágenes de satélites en misiones espaciales o
locales.
En la industria militar el estudio de análisis de imágenes para detectar
movimientos y estrategias con la amplificación de imágenes, la industria del
entretenimiento como el "cine", y por último en la industria de las comunicaciones
con la aparición de "Internet".
La imagen digital es de gran importancia para los seres humanos, y más
cuando son aplicadas para un fin, estableciendo que a veces el “fin” es parte del
cuerpo humano puesto que utiliza mayoritariamente como herramienta de
diagnóstico médico.
En el campo de la medicina y de investigación científica se tienen la difícil
misión de tratar imágenes para ayudar a la distribución y observación. Las fuentes
clásicas que generan imágenes digitales en medicina o telemedicina son la
Ultrasonografía,
Resonancia
Magnética
Nuclear
y
Tomografía
Axial
Computarizada. En el campo de investigación científica se utiliza para determinar
nuevos descubrimientos.
IV-53
Aplicaciones
4.2 Tratamientos de una imagen digital
Los procesos de mejora de imagen pueden agruparse en distintas
categorías, teniendo en cuenta el efecto que producen sobre la imagen
(modificación del brillo, contraste, compresión, restauración, reducción de ruido,
iluminación de masas, etc.).
La implementación responde de forma satisfactoria frente a lo que se busca,
no se debe olvidar que existen ciertas mejoras que pueden realizarse. Entre ellas,
se encuentran el poder trabajar con una forma genérica de borde del sector
desconocido; la detección automática del mismo; el considerar de forma distinta a
aquellos entornos que contienen muy pocos píxeles conocidos dentro; y no elegir
el valor de los píxeles regenerados al azar de entre todos los posibles, sino
ponderándolos por sus distancias.
"La imagen de Lenna contiene una buena mezcla de detalle, regiones planas,
sombras y texturas que hacen un buen trabajo para probar varios procesamientos
de imágenes", esta se presenta en la figura 4.1.
Fig. 4.1. Imagen de Lenna original.
IV-54
Aplicaciones
A continuación se mencionan algunos factores que influyen en el
procesamiento de imágenes digitales para obtener mejor calidad de las mismas.
a) Resolución
La calidad de la imagen digital depende de la resolución espacial, basado en
ello el fichero gráfico que la almacene tendrá más o menos tamaño. En la figura
4.2 se puede observar como al aumentar la resolución mejora la calidad de la
imagen. En la figura 4.3 se muestra una imagen con más detalle, donde puede
observarse éste mismo efecto.
Fig. 4.2 Imagen de Lenna con resoluciones de 10 x 10; 20 x 20; 30 x 30.
Fig. 4.3 Fotos con mayor y menor resolución.
IV-55
Aplicaciones
La nitidez, en cambio, depende de la profundidad de cada celda, o lo que es
lo mismo, cuantos más dígitos binarios estén asociados a cada celda mayor será
la nitidez como se presenta en la figura 4.4.
Fig. 4.4 Imagen de alta resolución, imagen de menor resolución tratada con nitidez
y calidad.
En cualquier caso, no se debe olvidar que en la fotografía digital no se debe
perseguir la mayor resolución y nitidez posibles, sino unos valores apropiados para
el fin perseguido.
b) Ruido
Las imágenes con ruido, son pequeñas variaciones aleatorias en la
luminosidad del color captadas por los fotosensores del CCD, que degradan la
calidad de la imagen capturada. La cantidad de ruido captada va a depender de la
relación entre señal y ruido de los fotosensores (cuanto más baja sea, más ruido
captarán y peor será la calidad de la imagen resultante). En las figuras 4.5 y 4.6 se
muestran imágenes con ruido (aparición de puntos blancos y negros sobre la
imagen) y después de aplicar uno de los procesamientos digitales como el uso del
filtrado se obtiene una mejor calidad de imágenes (sin ruido).
IV-56
Aplicaciones
a)
b)
Fig.4.5 Imagen de Lenna: a) con ruido; b) sin ruido.
a)
b)
Fig. 4.6 Imágenes de flores: a) con ruido; b) sin ruido.
Existen filtros que se denominan según su acción en el espacio de las
frecuencias (filtros de baja o alta frecuencia, filtros direccionales). Sin embargo,
cada vez es más frecuente, en los sistemas de proceso de imagen, otorgarles
nombres más de acuerdo con el resultado visual que producen sobre la imagen
"filtrada" (filtros de enfoque, desenfoque).
IV-57
Aplicaciones
Los filtros de baja limita o elimina las altas frecuencias; los de alta frecuencia,
elimina las bajas, y los direccionales, ambas, es decir, limita el rango posible del
intervalo entre un valor mínimo y otro máximo.
c) Compresión
Aunque es posible comprimir imágenes sin perder mucha calidad, no es
práctico su empleo en muchos casos, debido al gran espacio que estas pueden
ocupar.
Por
consiguiente,
todas
las
cámaras
digitales
populares
utilizan
fundamentalmente la compresión digital con pérdidas para el almacenamiento de
sus imágenes, que degrada la información gráfica almacenada hasta cierto punto y
cuanto más comprimidas están, más degradadas se vuelven las imágenes, con
respecto a su original de compresión sin pérdidas. En la figura 4.7 se puede ver
una misma imagen a diferentes valores de compresión JPEG y su original en la
figura 4.1.
Fig. 4.7 Imagen de Lenna con valores de compresión: 1.2 KB; 1.5 KB; 1.9 KB.
IV-58
Aplicaciones
Existen en el mercado cámaras profesionales que además de la compresión
sin pérdidas, ofrecen al fotógrafo la posibilidad de emplear la compresión con
pérdidas, siempre a elección de estos especialistas, de acuerdo al tamaño y
calidad de la imagen que permita con una máxima calidad la ampliación que se
desee obtener.
d) Restauración
En la figura 4.8a se tiene la foto Lenna y que por alguna razón se requiere
regenerar un sector del lado izquierdo de la misma (donde hay una especie de
columna blanca), se marca con negro la zona que se pretende regenerar.
Si puede observar que el ancho de la columna es poco menos de treinta
píxeles, poniendo una ventana de ancho igual a diez píxeles, se obtienen los
resultados que se pueden ver en la figura 4.8b. El restaurar píxeles con valores
demasiado bajos, donde tendrían que ser mucho más altos, y continúa la zona gris
oscura.
Si ahora se ingresa una ventana de cuarenta píxeles de ancho, los resultados
son los esperados.
Se llega a ver que se trata de una columna y por lo tanto regenera de la
manera correcta. La imagen obtenida para este caso se puede ver en la figura
4.8c.
IV-59
Aplicaciones
a)
b)
c)
Fig. 4.8 Restauración de columna: a) área afectada; b) área incompleta; c) área
completa.
Como puede observarse en las imágenes de este ejemplo, el rectángulo
"desconocido" está formado por píxeles negros, es decir, de intensidad luminosa
nula. Para evitar confusiones con otros píxeles de la imagen, conocidos pero
también de valor cero, se crea una nueva matriz, de las mismas dimensiones que
la imagen original, de valor '0' en los índices correspondientes a aquellos píxeles
que se buscan regenerar, y en los índices de los píxeles conocidos.
Se realizan una serie de comparaciones entre las diferentes ventanas
cercanas a este rectángulo, de forma que se puedan inferir los valores originales
aproximados. Depende del tipo de algoritmo que se emplea para ello. Esto es todo
un tratado, hay varias formas para lograrlo y esto esta fuera del alcance de este
trabajo. Otro ejemplo se muestra en la figura 4.9
IV-60
Aplicaciones
a)
b)
Fig. 4.9 Restauración de la boca: a) área afectada; b) restauración completa.
4.3 Imagen digital para la detección del Cáncer (La mamografía)
El uso de la imagen electrónica en el diagnóstico de tumores mamarios
ofrece una mayor precisión y seguridad que las técnicas convencionales.
La detección temprana del cáncer de pecho en las mujeres es fundamental
para orientar un tratamiento eficaz contra una de las principales causas de muerte
por cáncer entre la población femenina en el mundo.
La mamografía digital permite obtener a los especialistas una imagen
electrónica que puede ser guardada y manipulada con un software adecuado para
detectar cualquier irregularidad en el pecho, frente a la limitación actual que
supone obtener una imagen fija.
En la figura 4.10a esta mamografía análoga es el método más efectivo para
la detección de cánceres pequeños, pero tiene limitaciones como: menor
sensibilidad en mamas fibrosas, técnica y operador dependiente, imposibilidad de
modificar la imagen una vez procesada y cualquier duda requiere una nueva
exposición.
IV-61
Aplicaciones
La mamografía digital como se muestra en la figura 4.10b supera éstas
limitaciones de la mamografía convencional permitiendo la manipulación
electrónica de la imagen, elimina la toma de placas adicionales y el proceso de
revelado, etc. Además, introduce la detección de lesiones por computadora,
transmisión de imágenes en red a otro centro o a otro país, la tomosíntesis,
estudia la mama en tres dimensiones, especialmente en lesiones situadas
profundamente en la mama.
En las figuras 4.10, 4.11 y 4.12 se presentan algunos casos con imágenes
comparativas donde se demuestra que la mamografía digital aportó una nueva
información no detectada en mamografía convencional, y además, permitió el
diagnóstico de otros puntos de microcalcificaciones, lejos de la lesión principal,
que en algunos casos se modifica la conducta del tratamiento, en el sentido de
una cirugía. En la mamografía convencional no se detecta la presencia de
microcalcificaciones. En éstas imágenes digitalizadas se pueden procesar brillo y
contraste, archivar la imagen e imprimirlas.
a)
b)
Figura 4.10. Mastopatía fibroquística: a) análoga; b) digital.
IV-62
Aplicaciones
a)
b)
Figura 4.11. Microcalcificaciones no detectadas en mamografía convencional.
a) análoga; b) digital.
a)
b)
Figura 4.12. Calcificaciones: a) análoga; b) digital.
IV-63
Aplicaciones
En la actualidad se sugieren algunas indicaciones de mamografía digital:
mamas fibrosas, pacientes con antecedentes personales o familiares directos de
cáncer mamario, previo a cirugía por cáncer de mama, control de cáncer de mama
tratado y previo a la terapia de sustitución hormonal o cirugía plástica.
Las imágenes de mama aumentan la capacidad del médico para detectar
tumores pequeños. Cuando el cáncer es pequeño, hay más opciones de
tratamiento y es más probable la cura.
El uso de la mamografía de detección facilita la detección de crecimientos
anormales pequeños en los conductos de la leche, llamados Carcinoma Ductal In
Situ (CDIS).
Estos tumores tempranos no hacen daño si se eliminan en esta etapa; la
mamografía es el único método comprobado de detectar de forma fiable estos
tumores.
4.4 Imagen digital en Odontología
El incremento en el uso de equipos tecnológicos ha demostrado ser
invaluables
recursos
en
el
diagnóstico,
planificación
de
tratamientos
y
presentación de casos clínicos.
Las diferentes tecnologías disponibles y aplicables al área de la odontología,
con el objetivo de dar a conocer el alcance de sus beneficios en el área de la salud
oral, los cuales van desde representar una valiosa herramienta de diagnóstico en
problemas que anteriormente eran difíciles de detectar, hasta ofrecer sus virtudes
en la actividad docente y de investigación.
IV-64
Aplicaciones
El
diagnóstico
basado
en
imágenes
digitales
ha
incrementado
dramáticamente la cantidad de datos no textual generada en la clínica dental.
Estas tecnologías de imágenes son esenciales para la práctica moderna de la
Odontología y ayudan al odontólogo en la toma de decisiones clínicas, además de
dar mayor calidad a la atención del paciente, involucrar al paciente en la toma de
decisiones clínicas y posibilitar la creación de conocimientos significativos en esta
área.
La imagen digital en la odontología están beneficiando de manera creciente a
los profesionales de esta área, debido a las posibilidades que proveen de ver
inmediatamente la foto tomada, dando la posibilidad de borrarla y repetirla.
La imagen digital odontológica se transfiere a una computadora para su
observación y posterior edición, a esta imagen se le puede editar el contraste,
brillo, tamaño, resolución, colores, etc. a través del software diseñado
específicamente para odontología.
En una radiografía convencional, el ojo humano detecta de 28 a 32 tonos de
gris, pero a través de la radiología digital se ven hasta 256 tonos de gris,
optimizando así el diagnóstico.
Mediante dispositivos de digitalización se pueden capturar imágenes de
excelente calidad tanto dentro como fuera de la cavidad bucal. Las imágenes
permiten mostrar la anatomía
dentaria y sus patologías a
través de
macrofotografías ampliadas decenas de veces, como puede observarse en la
figura 4.13.
IV-65
Aplicaciones
Fig. 4.13 Imagen digital de restauración de molar.
Desde la primera radiografía, los profesionales de la salud tienen una
imagen, un artículo indispensable para el análisis y la programación de
tratamientos, con el surgimiento de las imágenes digitales, las mismas han sido
adoptadas por estos profesionales como herramientas de diagnósticos.
La imagen digital en el consultorio odontológico, permite al profesional de
esta área realizar el seguimiento clínico de un tratamiento e imprimir las imágenes
al paciente, para explicarle de forma clara y didáctica el plan de tratamiento a
seguir a fin de que éste se sienta motivado para llevarlo a cabo. El uso de
imágenes dentales en formato digital, los odontólogos y sus colaboradores pueden
explorar diferentes opciones de tratamiento y comunicárselas a sus pacientes en
una forma nunca antes posible.
En ortodoncia y cirugía se puede predecir el resultado de un tratamiento,
como también fusionar los datos tales como texto, imágenes de la boca,
radiografías, céfalograma, etc., en un solo archivo que represente la historia de
cada paciente, a fin de crear bancos de datos electrónicos que incluyan imágenes
de la cavidad bucal de los pacientes.
IV-66
Aplicaciones
La captura y reproducción de imágenes con equipos de tecnología digital es
parte importante de la ortodoncia, ya que estas imágenes pueden ser usadas de
manera inmediata para educación profesional, educación al paciente y propósitos
médico-legales, entre otros.
4.5 Imágenes digitales en la Ecografía
La ecografía o ultrasonido es un método de diagnóstico que utiliza ondas
sonoras de alta frecuencia (no usa rayos X, por lo que no ofrece ningún riesgo en
el embarazo) para la formación de imágenes de distintos órganos o tejidos
corporales. La ecografía estudia los órganos sólidos (hígado, útero, ovarios, etc.) y
aquellos que contienen líquidos (vejiga, vesícula biliar, etc.), puede analizar partes
blandas (músculos, tendones, etc.) y en ciertas circunstancias vísceras huecas
(estómago).
La imagen digital en uso de la ecografía es útil en muchos casos por que se
puede estudiar elementos que son imposibles para la radiografía simple, ya que
puede ser manipulada para tener una mejor observación de los órganos deseados
y tener de todos los diagnósticos un diagnóstico de lo más eficaz posible.
Las imágenes digitales de vesículas normales se pueden observar en la
figura 4.14 en la cual se pudo determinar que los pacientes tienen vesículas en
buenas condiciones. En la figura 4.15 se muestra otra imagen digital para observar
las condiciones en que se encuentran el hígado y el riñón derecho.
IV-67
Aplicaciones
Fig. 4.14 Imágenes de vesículas normales
La figura 4.15 es una imagen de rutina en que los resultados se entregaron
en ese momento al paciente, se le otorga una duplicación, sin ningún costo
adicional y eliminando la posibilidad de perdida, caso contrario de una radiografía
simple el paciente hubiese regresado para tener sus resultados y su interpretación
de los mismos.
Fig. 4.15 Hígado y Riñón derecho.
IV-68
Aplicaciones
Otro caso se presenta en la figura 4.16 donde se puede determinar el estado
de ubicación de la placenta y detectar tempranamente cualquier alteración en el
embarazo que pueda llevar al retardo del crecimiento fetal.
Fig. 4.16 Imagen de un feto obtenida por eco de ultrasonidos
4.6 Imagen digital de la NASA demuestra que por la superficie de
Marte corrió agua
La NASA anuncia su más importante descubrimiento de los últimos años.”Por
Marte un día corrió agua líquida”. Científicos han encontrado marcas en algunas
rocas que les permiten aseverar con certeza que, un día, ese cráter estuvo
sumergido por agua. “El agua se fue evaporando con el paso del tiempo, pero ha
dejado huellas en las rocas”.
La prueba de que el planeta rojo fue húmedo en algún momento de su
existencia no es nueva, aunque sí es la primera vez que los científicos tienen
pruebas físicas, materiales, de sus descubrimientos.
IV-69
Aplicaciones
Las sondas Mars Odissey (de la NASA) y Mars Express (de la Agencia
Espacial Europea) ya habían mostrado indicios de que no sólo en Marte podía
haber hielo en los polos, sino que los gigantescos cañones que se pueden
observar desde la atmósfera gracias a las cámaras digitales.
La sonda de la NASA Mars Odissey, que en el año 2002 tomó imágenes
desde la atmósfera del planeta rojo que hicieron pensar a los científicos que, por
las enormes cráteres y cañones, hubo en un lejano día catastróficas inundaciones.
La Odissey además demostró que había grandes cantidades de hidrógeno en
el polo Sur de Marte, indicio incontestable de la presencia de agua. Pero esta
presencia no pudo ser demostrada a través de fotografías.
Entonces, la sonda espacial Mars Express envió imágenes que demostraban
la existencia de agua congelada y dióxido de carbono helado en el polo sur del
planeta rojo. Las fotografías que probaban estos descubrimientos fueron tomadas
por la sonda, que orbita el planeta rojo a una altura de 2 000 Km.
En el año 2005, cuando aterrizó el robot Opportunity (de la NASA), los
científicos se mostraron entusiasmados al ver las primeras imágenes digitales
enviadas por el robot, que mostraban un suelo rocoso en el fondo del cráter como
se muestra en la figura 4.17 y 4.18 con muchísimas posibilidades para la
investigación. “Durante algunos días esas imágenes se manipularon con software
especiales
desplegado todos los instrumentos y se
analizaron hasta la
extenuación todas las imágenes”.
IV-70
Aplicaciones
Fig. 4.17 Imagen microscópica de un fragmento de la
superficie marciana tomada por el 'Opportunity'. (NASA)
Fig. 4.18 El terreno sobre el que aterrizó el 'Opportunity'. (NASA)
Para el estudio de las rocas marcianas, el Opportunity ha usado instrumentos
que habría utilizado un geólogo. Gracias al espectrómetro de rayos X han podido
analizar los elementos químicos de las rocas, y eso ha permitido a la NASA
encontrar unas altas concentraciones de sulfuros en el lecho rocoso, que sólo
podría ser posible por la actuación de moléculas de agua.
Ahora, ya no son sólo indicios lo que tiene la NASA, sino pruebas materiales
de que las rocas que hoy están en el suelo marciano han sufrido los efectos de la
acción prolongada del agua.
IV-71
Consideraciones Finales
CAPITULO V
CONSIDERACIONES FINALES
Para la adquisición de una imagen digital son necesarios ciertos dispositivos
de digitalización como el escáner, cámara digital, etc.
Una imagen digital tiene la posibilidad de procesamiento, facilidad de
duplicación, traslado, edición, lo que permite la reducción de costos. En otros
casos es posible brindar información inmediata, lo que no se puede lograr tan
rápido en una imagen convencional.
Es importante conocer la imagen por dentro, que no se debe limitar al
proceso de edición sin al menos conocer qué mecanismos o procesos que están
operando en el interior de una imagen.
A su vez, la gran variedad de
transformaciones que puede sufrir una imagen.
Existen imágenes que ocupan gran espacio en memoria y es necesaria la
compresión, para así obtener tasas de transmisión eficiente y reducir los
requerimientos de almacenamiento.
Los
avances en la fotografía digital brinda la posibilidad de mejorar la
imagen, en el caso de la fotografía clínica o medica (mamografía, ultrasonido,
radiografías, etc.) permite diagnosticar antes y durante la aparición de una
enfermedad; en el área científica (astronómica, meteorológicas, biológicas, etc.) es
de gran importancia ya que permite determinar cosas que el ojo humano a simple
vista no lo puede hacer u objetos que se encuentran a millones de kilómetros.
V-72
Consideraciones Finales
La fotografía digital permite ampliar el campo fotográfico y con esto las
formas de transporte y archivo de las imágenes prestando particular atención a la
transmisión directa e instantánea de la comunicación humana gracias a la era
electrónica.
V-73
Glosario
GLOSARIO
Células fotosensibles: Matriz que convierten luz en electricidad. Al medir
cuanta electricidad produce una célula, se sabe cuanta luz ha incidido en ella, y,
por tanto, el nivel de brillo de ese punto concreto de la matriz. Cantidad de píxeles
(de células fotoeléctricas en la matriz), un sensor más grande, tendrá las células
más grandes, y, por tanto, dará menos ruido.
Colores substractivos: Los colores substractivos están representados por
los tres colores primarios Cían, Magenta y Amarillo. Los colores substractivos
absorben parte del espectro de la luz reflejada y vuelven a emitir otros. Por
ejemplo, Cían absorbe la luz roja mientras que refleja la luz azul y verde; el
amarillo sólo absorbe la luz azul, mientras que refleja luz roja y verde. Por lo tanto,
al mezclar Cían y Amarillo totalmente saturados da verde.
Compresión: Técnica que se utiliza para reducir el tamaño de los ficheros de
imágenes y otros datos, para ser procesados más fácilmente, almacenados o
comunicados a través de Internet. Los métodos utilizados se basan, generalmente,
en abreviar información repetida o eliminar información que el ojo humano tiene
dificultades para apreciar. Por lo tanto, la calidad de una imagen puede verse
afectada por las técnicas de compresión utilizadas o por el nivel de compresión
aplicado.
Compresión con pérdidas: Técnica que eliminan información de forma
definitiva para obtener índices de compresión considerablemente altos.
Compresión sin pérdidas: Técnica que reduce el tamaño de la imagen sin
que se pierda calidad visual.
74
Glosario
Contraste: Diferencia en un atributo visual que hace que un objeto sea
distinguible. Se refiere al rango de brillo o sombras de grises en una imagen. Una
imagen de mayor contraste es una imagen en blanco y negro sin sombras de
grises. Una imagen de bajo contraste muestra sombras de grises en un rango
medio.
Cromático: Término que se refiere al matiz relativo de un color.
Cuantificación: Valor en función de la luminosidad o color de la imagen
original.
Cuantización: Asigna a cada muestra de la matriz un valor entero. Cada
valor representa al valor de la variable física en ese punto.
Digitalización: Convertir cualquier señal de entrada analógica en una serie
de valores binarios.
Ecografía: Método de diagnóstico que utiliza ondas sonoras de alta
frecuencia (no usa rayos X) para la formación de imágenes de distintos órganos o
tejidos corporales.
Espectro: Serie de imágenes, a modo de bandas con líneas brillantes y
líneas oscuras, que se forman cuando la radiación de una fuente luminosa o
electromagnética se descompone en sus colores u ondas constituyentes; que se
arreglan en orden de sus respectivas longitudes.
Espejos dicroicos: Es un espejo, reflector o filtro el cual selectivamente
refleja diferentes ondas de luz, permitiendo a un proyector transmitir luz más
visible con menos temperatura. Espejos dicroicos se utilizan asimismo para
convergencia interna en proyectores multimedia que trabajan con sistema de
proyección LCD y DLP.
75
Glosario
Fotomultiplicador: Dispositivo electrónico, que transforman la luz en señal
eléctrica.
Histograma: Representación gráfica de la gama de tonos de una foto, desde
las zonas más oscuras a las más claras. Algunas cámaras digitales incluyen una
función de histograma que permite comprobar con exactitud la exposición de la
foto.
Imagen digital: Fotografía electrónica fija o en movimiento, compuesta por
un número determinado de puntos, llamados píxeles, que forman una matriz con
filas y columnas. Cuanto mayor sea el número de filas y columnas mayor será el
detalle de la imagen y mayor también su tamaño de archivo. Cada píxel de una
imagen almacena información de su tono o luminosidad, donde el tono negro es el
valor 0 y el blanco el valor más alto, normalmente 255 en la escala de grises, pero
representados en formato binario.
Mamografía: Examen de rayos X de los senos. Se utiliza para detectar y
diagnosticar la enfermedad del seno en las mujeres que tienen problemas con
estos como nudos, dolor o flujo de los senos, así como para mujeres que no tienen
problemas con ellos. Ayuda a los médicos a detectar el cáncer en sus primeras
etapas, cuando las probabilidades de éxito de un tratamiento son mayores.
Mastopatía fibroquística: Inflamación de glándula mamaria.
Megapíxeles: El número de píxeles por pulgada que una cámara digital
puede producir en una imagen; un megapíxel representa 1.000 píxeles por
pulgada.
Metacrilato: Material químico metacrilato metílico se usa para hacer
plásticos transparentes que remplazan el vidrio.
76
Glosario
Microcalcificaciones: Son depósitos de calcio en el espesor de la glándula
mamaria. Se aprecian en la mamografía como pequeños puntitos blanquecinos.
En las placas de mamografía se les da gran importancia y se buscan ya que
pueden ser el primer signo de un proceso canceroso. Las microcalcificaciones
pueden ser benignas o sospechosas de malignidad según su tamaño, aspecto y
distribución.
Microprocesador: Conjunto de circuitos electrónicos altamente integrado
para cálculo y control computacional, es utilizado como Unidad Central de Proceso
en un sistema microordenador y en otros dispositivos electrónicos complejos como
cámaras fotográficas, impresoras, etc. Es un chip programable, un circuito
integrado electrónico que por sí solo constituye la Unidad Central de un ordenador.
La cantidad de operaciones se miden Megahertz o Gigahertz.
Monocromático: Adj. Monocromo. Que solo deja pasar la luz o rayos de un
solo color. Palabra que se utiliza para referirse a una radiación electromagnética
de una sola longitud de onda. Que tiene un único color en sus diversas
intensidades.
Muestreo: La imagen se divide en líneas horizontales y estas a su vez se
descomponen en una serie de puntos o píxeles.
Nanómetro: Medida de longitud, equivalente a la mil millonésima parte de un
metro.
Neurorradiólogia: Diagnóstico y tratamiento de enfermedades del sistema
nervioso central y periférico a través de técnicas de imagen de alta tecnología
(Resonancia Magnética), permitiendo la aplicación de nuevas intervenciones de
alta eficacia en el tratamiento de aneurismas intracerebrales, malformaciones
arteriovenosas, fístulas carótido-cavernosas, hemangiomas capilares, vaso
espasmos y trombosis cerebrales.
77
Glosario
Nitidez: Claridad de detalle de una foto.
Píxel = píxeles: Píxel (Picture Element). Se refiere al elemento de la imagen
más pequeño (punto) que define una imagen en una pantalla de ordenador.
Placenta: Órgano complejo formado por tejidos maternales y fetales que
funciona como, puente nutritivo, órgano excretor, respiratorio y endocrino.
Plexiglás: Resina sintética que tiene el aspecto del vidrio: el plexiglás se
utiliza en construcción y en industria.
Resolución: Es la medida de la cantidad de píxeles por unidad de longitud,
comúnmente píxeles por pulgada (una pulgada equivale a 2,54 cm de longitud). Se
suele abreviar como ppp o dpi (puntos por pulgada o dots per inch). De esta
definición se deduce que a mayor resolución, mayor número de puntos de imagen
en el mismo espacio, y por tanto mayor definición. La resolución es la relación
entre las medidas digitales (medidas en píxeles) y las físicas (las que tiene una
vez impresa, o en el dispositivo que se está visualizando). La resolución no es una
medida de la calidad de una imagen digital, aunque a menudo se utilice para ello.
Es una medida de nitidez o definición, de forma que cuanta más alta sea, mayor
definición y viceversa. Capacidad de reproducir fielmente los detalles de una
imagen.
Reverberación: Reflexión intensa de las radiaciones luminosas.
Resonancia magnética nuclear: Técnica de diagnóstico por imagen,
basada en el fenómeno físico de la resonancia, por la cual se obtienen imágenes
internas y detalladas del organismo.
78
Glosario
TAC: Exploración de rayos X que produce imágenes detalladas de cortes
axiales del cuerpo. Tomografía del griego tomos que significa corte o sección y
grafía que significa representación gráfica. Por tanto tomografía es la obtención de
imágenes de cortes o secciones de algún objeto. La palabra axial significa "relativo
al eje". Plano axial es aquel que es perpendicular al eje longitudinal de un cuerpo.
La tomografía axial computarizada, aplicada al estudio del cuerpo humano, obtiene
cortes transversales a lo largo de una región concreta del cuerpo (o de todo él).
Computarizar significa someter datos al tratamiento de una computadora.
Telemedicina: Actividad que utiliza la medicina para proveer asistencia,
diagnostico o transmisión de imágenes radiológicas a distancia mediante la
utilización de tecnologías de comunicación y computación.
Tomosíntesis: Esta tecnología es una extensión del mamograma digital. La
tomosíntesis permite que el seno sea visto como muchas secciones delgadas y
provee la posibilidad ofrecer un diagnóstico de cáncer del seno más preciso y
temprano. Todavía esta tecnología sigue considerándose experimental y no está
disponible en el mercado.
Tono: Atributo de sensación visual de una imagen por la que una zona
parece similar a otra. Grado de intensidad de los colores: tonos claros, neutros.
Ultrasonografía: Técnica de estudio radiológica con ultrasonidos por medio
de la cual se obtienen imágenes de estructuras profundas del cuerpo empleando
sonidos de alta frecuencia.
79
Abreviaturas
ABREVIATURAS
CAD (Computer Aided Design) Diseño asistido por computadora
CAM (Computer Aided Manufacturing) Manufactura asistida por computadora
CCD (Charge Coupled Device) Dispositivo acoplado por carga eléctrica
CCITT (Consultative Committee for International Telegraphy and Telephony)
Comité Consultivo Internacional Telegráfico y Telefónico
CDIS (Carcinoma Ductal In Situ)
CT escáner (Tomografía computarizada de escáner)
CTP (Computer To Plate)
CMY (Cyan, Magenta, Yellow) Cian, Magenta, Amarillo,
CMYK (Cyan, Magenta, Yellow, Black) Cian, Magenta, Amarillo, Negro.
DPI (dots per inch) puntos por pulgada
EDG (Electronic Dot Generation)
EMI (Electrical and Musical Industries)
EZW (Embedded Zerotree Wavelet)
80
Abreviaturas
GIF (Graphic Interchange Format) Formato Grafico Intercambiable
HSI (H = color, S = saturación y I = intensidad)
JPEG (Joint Photographic Experts Group) Grupo de Expertos Fotográficos Unidos)
Lab valor "L" representa la cantidad de luz, el valor "a" la cantidad de rojo / verde
que posee el matiz, y el valor "b" la cantidad de amarillo / azul.
LCD (Pantalla de cristal líquido)
LZ (de Abraham Lempel y Jacob Ziv)
LZW (Lempel-Ziv-Welch),
MrSID (Multi-resolution Seamless Image Database)
PPP o PPI (Píxel por pulgada o píxel per inches)
PTM (Fotomultiplicador)
PNG (Portable Network Graphic)
RGB (Red, Green, Blue) Rojo, Verde y Azul
RLE (Run Lengh Encode)
SPIHT (Set Partitioning In Hierarchical Trees)
TAC (Tomografía Axial Computarizada)
81
Abreviaturas
TIFF (Tagged Image File Format)
TDC (Transformada Discreta del Coseno)
TDW (Transformada Discreta Wavelet)
YIQ (Y=luminancia, I=tonalidad, Q=saturación)
82
Bibliografía
BIBLIOGRAFÍA
Tratamiento Digital de voz e imagen y aplicación a la multimedia.
Autor Marcos Faúdez Zanuy. ED. Alfa Omega. Págs. 113 -199
Para la investigación y estudio de este documental se consultaron diferentes
direcciones en Internet.
83
Descargar