Cinvestav
Departamento de Computación

Contenido del Curso de

Visión


Cuatrimestre mayo-agosto de 2020

Elaboró: Dr. Luis Gerardo de la Fraga

Objetivo: Se revisará la teoría para la reconstrucción tridimensional de escenas a partir de una o varias imágenes bidimensionales, tomadas por una cámara digital convencional. Se hará énfasis en los métodos para obtener la reconstrucción a partir de las correspondencias de puntos entre las imágenes, lo que se conoce como autocalibración de la cámara.

La herramientas de trabajo serán la biblioteca de procesamiento de imágenes scimagen y OpenCV, Qt (www.trolltech.com) para el desarrollo de las interfaces gráficas y Mesa (www.mesa3d.org) para interactuar con objetos tri-dimensionales.

Contenido:

  1. Rectificación de imágenes planas usando la homografía
  2. El modelo de la cámara obscura
  3. Método líneal de ajuste. Ecuaciones normales
  4. Propiedades de la descomposición en valores singulares (DVS)
  5. Propiedades de la descomposición QR
  6. Solución al problema Ax=b usando las descomposiciones ortogonales QR ó DVS
  7. Calibración usando un patrón plano
  8. Auto-calibración de la cámara usando planos.
  9. Álgebra lineal con matrices de tamaño 3x3
    1. Matrices simétricas y positivas definidas
    2. Cálculo de la inversa por el método de Cramer
    3. Eigenvalores y eigenvectores
    4. Cálculo de las raíces de una ecuación cúbica

  10. Ajuste lineal de círculos y elipses
  11. Auto-calibración de la cámara usando un patrón de círculos concéntricos
  12. Ajuste no lineal por mínimos cuadrados
    1. Las series de Taylor
    2. El método de Newton
    3. El método de Gauss-Newton
    4. El método Levenberg-Marquardt
    5. La evolución diferencial: una heurística para optimización nolineal
    6. Ajuste no lineal de círculos y elipses

  13. Ajuste total ó ajuste no lineal del modelo y la cámara
  14. Reconstrucción tridimensional
    1. Auto-calibración de la cámara usando cuboides.
    2. Reconstrucción usando varias cámaras
    3. Visualización de la reconstrucción con mapeo de texturas
  15. Introducción al procesamiento de imagen
    1. Representación de una Imagen digital
    2. Modelo general para el procesamiento de imágenes
    3. Elementos de un sistema de procesamiento digital de imágenes: adquisición, almacenamiento, una computadora, comunicación, despliegue y software.

  16. Fundamentos de imágenes digitales
    1. Un modelo simple de imagen
    2. Muestreo y cuantización
    3. Relaciones entre pixels: vecinos, conectividad, distancia, operaciones aritméticas/lógicas.
    4. Geometría de imágenes: translación y rotación
    5. Filtrado espacial.

  17. Segmentación de imagen
    1. Detección de discontinuidades
    2. Umbralización
    3. Obtención del objeto por rellenado
    4. Morfología

  18. Representación de la forma y reconocimiento del objeto
    1. Esquemas de representación. El esqueleto de una región. Códigos de cadena.
    2. Descriptores de fronteras: momentos.
    3. El clasificador de mínima distancia

Prácticas:

  1. Reconocer círculos y elipses con métodos lineales y no-lineales
  2. Calibrar una cámara usando planos.
  3. Calibrar una cámara usando un patrón de dos circulos concéntricos
  4. Reconstruir cuboides a partir de imágenes sintéticas
  5. Verificar la exactitud de un método de auto-calibración
  6. Reconstruir escenas a partir de varias vistas
  7. Digitalizar una imagen de puntos aleatorios y construir su malla
  8. Reconocimiento de formas con métodos de momentos y el clasificador de mínima distancia.

Bibliografía:

  1. R.C. Gonzalez and R.E. Woods, Digital Image Processing
    1992, Addison Wesley
  2. Real Time Collision Detection. C. Ericson. 2005. Morgan Kaufmann
  3. R. Hartley and A. Zisserman, Multiple View Geometry in Computer Vision 2nd edition, 2003, Cambridge
  4. Y. Ma, S, Soatto, J Kosecka and A Shankar Sastry, An inivitation to 3D vision, from imagen to geometry models
  5. Corner detection based on modified Hough transform
    F. Shen and H. Wang, Pattern Recognition Letters 23 (2002) 1039-1049
  6. E. Trucco and A. Verri, Introductory Techniques for 3D Computer Vision
    1998, Prentice Hall.
  7. J.S. Kim, P. Gurdjos and I.S. Kweon, Geometric and Algebraic Constraints of Projected Concentric Circles and Their Applications to Camera Calibration, IEEE Trans. PAMI, vol 27, 4, Apr 2005, pp. 637-642.
  8. Z. Zhang, A flexible new technique for camera calibration, IEEE Trans. PAMI, vol 22, 11, Nov. 2000, pp. 1330-1334.

Luis Gerardo de la Fraga
Última actualización: 14 de enero, 2014