CONTEO DE OBJETOS APLICANDO FILTROS
Y
OPERACIONES MORFOLOGICAS
Jorge Andres Ramirez Soscue
2266889
[email protected]
Curso:
VISION ARTIFICIAL
UNIVERSIDAD DEL VALLE
SEXTO SEMESTRE
TECNOLOGIA EN ELECTRONICA INDUSTRIAL
2025
INTRODUCCION
La visión artificial ha revolucionado el procesamiento de imágenes. La visión artificial
permite que las máquinas interpreten y comprendan imágenes digitales con un nivel de
precisión cada vez mayor. Mediante algoritmos avanzados de aprendizaje y redes neuronales
profundas, los sistemas pueden identificar patrones, reconocer objetos.
El procesamiento de imágenes es ampliamente utilizado en seguridad, redes sociales y
dispositivos móviles. También se aplica en el diagnóstico médico por imágenes, como en
radiografías, tomografías o resonancias, donde los modelos entrenados pueden detectar
tumores o fracturas con una precisión comparable a la de los expertos humanos (Esteva et
al., 2017).
En el ámbito industrial, el procesamiento de imágenes permite realizar inspección
automatizada de calidad, donde las cámaras y sistemas inteligentes identifican defectos en
productos con un margen mínimo de error. Por otro lado, en el sector automotriz, los
vehículos autónomos dependen en gran medida de la visión artificial para detectar peatones,
señales de tránsito y otros vehículos en tiempo real (Chen et al., 2015).
El progreso de esta tecnología ha sido posible gracias al desarrollo de redes neuronales
convolucionales, que son especialmente efectivas para el análisis de datos visuales. Estas
redes han sido entrenadas con grandes volúmenes de imágenes etiquetadas, lo que ha
permitido mejorar la precisión de las predicciones en tareas específicas (Krizhevsky et al.,
2012).
1) Código para transistores
Bloque 1 y 2
importe librerías y la imagen a utilizar
Bloque 3
convertí la imagen original a RGB y en escala de grises para su procesamiento
Bloque 4
Aplique detección de bordes para empezar a identificar los transistores
Bloque 5
Aplique la operación morfológica de dilatación para cerrar los bordes de los objetos, con una
estructura de (3,3) y 2 iteraciones
Bloque 6
Aplique la operación morfológica de relleno de huecos para tener los objetos completos
Bloque 7
Utilice el código para contar objetos y código para guardar imagen final binaria
2) Código para Tornillos
Bloque 1 y 2
Cargue librerías e imagen a utilizar
Bloque 3
Convertí la imagen en RGB y en escala de grises para poder procesar
Bloque 4
Utilizo detección de bordes para identificar objetos
Bloque 5
Utilizo la operación de dilatación con una estructura de (13,13) y una iteración para cerrar
todos los bordes de los objetos
Bloque 6
Utilizo la operación relleno de huecos para completar todos los objetos
Bloque 7
Utilizo la operación de erosión para eliminar todos los ruidos de la imagen
Bloque 8
Utilice el código para contar objetos y código para guardar imagen final binaria
3) Códigos para euros
Bloque 1 y 2
Cargue librerías e imágenes a utilizar
Bloque 3
Convertí la imagen a RGB y escala de grises
Bloque 4
Utilizo detección de bordes para detectar los bordes de las monedas
Bloque 5
Utilizo la operación dilatación para cerrar los bordes de las monedas, con una estructura de
(9,9) y una iteración
Bloque 6
Utilizo la operación relleno de huecos para completar todas las monedas
Bloque 7
Utilizo la operación de erosión para eliminar ruidos de la imagen con una estructura de (5,5)
y 5 iteraciones lo suficiente para no perder la figura de las monedas
Bloque 8
Utilizo el código para contar los objetos y para guardar la imagen final binaria
4) Código para carritos
Bloque 1 y 2
Importo librerías e imagen a utilizar
Bloque 3
Convierto la imagen a RGB y escala de grises
Bloque 4
Utilizo detección de bordes
Bloque 5
Utilizo la operación de dilatación para cerrar los bordes de los carros
Bloque 6
Aplico la operación relleno de huecos para completar los carros
Bloque 7
Utilizo la operación de erosión para eliminar todos los ruidos de la imagen
Bloque 8
Utilizo el código para contar los objetos y el de descargar la imagen final binaria
5) Código para billetes
Bloque 1 y 2
Importo librería y cargo la imagen a utilizar
Bloque 3
Convierto la imagen a RGB y escala de grises para su procesamiento
Bloque 4
Utilizo detección de borde
Bloque 5
Utilizo la operación de dilatación para cerrar los bordes de los billetes
Bloque 6
Utilizo l operación de relleno de huecos para completar los billetes, aunque uno quedo con
un pequeño hueco a un lateral
Bloque 7
Utilizo el código para contar objetos y el de guardar la imagen final binaria
RESULTADO DE IMÁGENES
1) Transistores
2) Tornillos
3) Euros
4) Carritos
5) Billetes
COMENTARIOS
El reto que me pareció mas interesante fue el de los carros por evitar perder la figura
de ellos a la hora de hacer la erosión y eliminar los ruidos de la imagen.
Considero que la visión artificial si ayuda mucho en la detección de anomalías en las
radiografías ya que el contraste que estas necesitan la VA ayudaría demasiado en
identificar cualquier anomalía en la radiografía.
REFERENCIAS BIBLIOGRAFICAS
•
Redmon, J., & Farhadi, A. (2018). YOLOv3: An Incremental Improvement.
arXiv preprint arXiv:1804.02767.
https://arxiv.org/abs/1804.02767
•
Simonyan, K., & Zisserman, A. (2014). Very Deep Convolutional Networks for
Large-Scale Image Recognition. arXiv preprint arXiv:1409.1556.
https://arxiv.org/abs/1409.1556
•
Esteva, A., Kuprel, B., Novoa, R. A., Ko, J., Swetter, S. M., Blau, H. M., &
Thrun, S. (2017). Dermatologist-level classification of skin cancer with deep
neural networks. Nature, 542(7639), 115–118.
https://doi.org/10.1038/nature21056
•
Chen, C., Seff, A., Kornhauser, A., & Xiao, J. (2015). DeepDriving: Learning
affordance for direct perception in autonomous driving. Proceedings of the
IEEE International Conference on Computer Vision (ICCV), 2722–2730.
https://doi.org/10.1109/ICCV.2015.312
•
Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet classification
with deep convolutional neural networks. Advances in Neural Information
Processing Systems, 25, 1097–1105.
https://doi.org/10.1145/3065386