Contenido Curso de
Tópicos Avanzados en Visualización:
Reconocimiento 3D
Cuatrimestre Mayo-Agosto del 2005
Elaboró: Dr. Luis Gerardo de la Fraga
Objetivo:
En este curso se aplicarán las nociones de visión
por computadora (VC) en tres dimensiones. La meta de VC es deducir
las propiedades y
estructura de un mundo tridimensional a partir de una o más
vistas bidimensionales.
Primero se estudiarán algunas técnicas para procesamiento y
análisis de imagen y
también se tratarán
temas de
visualización 3D, animación y realidad
virtual, para la creación
de modelos tridimensionales y para tener la habilidad de
``navegar'' a través de ellos.
La herramientas de trabajo serán la librería de
procesamiento
de imágenes scimagen, y Qt (www.trolltech.com) para
el desarrollo de las interfaces gráficas y Mesa (www.mesa3d.org)
para interactuar con objetos tri-dimensionales.
Contenido:
- Introducción al Procesamiento de Imagen
- Representación de una Imagen digital
- Modelo general para el procesamiento de imágenes
- Elementos de un sistema de procesamiento digital de
imágenes: adquisición, almacenamiento, una computadora,
comunicación, despliegue y software.
- Fundamentos de Imágenes Digitales
- Un modelo simple de imagen
- Muestreo y cuantización
- Relaciones entre pixels: vecinos, conectividad, distancia,
operaciones aritméticas/lógicas.
- Geometría de imágenes: transformaciones y
proyecciones.
- Filtrado espacial.
- Segmentación de Imagen
- Detección de discontinuidades
- Umbralización
- Representación de la forma y reconocimiento del objeto
- Esquemas de representación. El esqueleto de una
región. Códigos de cadena.
- Descriptores de fronteras: momentos.
- Morfología.
- Elementos de análisis de imagen
- Métodos de decisión teórica:
emparejamiento (matching), clasificadores óptimos
estadísticos, redes neuronales.
- Algoritmos geométricos
- Algoritmo óptimo para encontrar el par de puntos
más cercano.
- Algoritmos para encontrar la cubierta convexa (convex hull)
- La lista de aristas doblemente ligada
- Algoritmo óptimo para encontrar el diagrama de
Voronoi.
- Reconstrucción del volumen a partir de líneas de contornos
- Extracción de las líneas de contorno
- Muestreo de las curvas extraídas
- Triangulación y visualización.
- Reconstrucción a partir de dos o más vistas
- Calibración de una cámara. Parámetros intrínsecos y extrínsecos
- Estimación de los parámetros de una cámara
- Detección de esquinas basado en la trasformada de Hough (1)
- Triangulación para recobrar la tercera dimensión
- Geometría equipolar. El tensor trifocal. Soluciones no-lineales
Prácticas:
- Digitalizar una imagen de puntos aleatorios y construir su malla.
- Digitalizar una imagen con contornos y reconocerlos
- Reconstruir objetos que tengan una simetría cilíndrica
- Reconstrucción 3D de un objeto a partir de sus líneas de contorno.
- Animación de objetos deformables.
- Reconstrucción 3D de un objeto a partir de dos o más vistas.
Bibliografía:
- E. Trucco and A. Verri, Introductory Techniques for 3D Computer Vision
1998, Prentice Hall.
- R. Hartley and A. Zisserman, Multiple View Geometry in Computer Vision
2nd edition, 2003, Cambridge
- Corner detection based on modified Hough transform
F. Shen and H. Wang, Pattern Recognition Letters 23 (2002) 1039-1049
- R.C. Gonzalez and R.E. Woods, Digital Image Processing
1992, Addison Wesley
-
Abigail Martínez Rivas, Reconstrucción del volumen a partir
de su mapa de contornos. Tesis de Maestría. 2005
Sección de Computación, Cinvestav.
Luis Gerardo de la Fraga
2005-05-17