Curso: Aprendizaje automático

Dr. Luis Gerardo de la Fraga

Cuatrimestre enero a abril de 2024.

Este es el contenido del curso

Apuntes del curso:

  1. 11.04.2024 Ensambles de algoritmos: baging, boosting, voto duro y voto suave.

  2. 10.04.2024 El clasificador de Bayes ingenuo.

  3. 20.03.2024 Descenso de gradiente.

  4. 20.03.2024 la función softmax para la clasificación de más de dos clases usando una red neuronal.

  5. 20.03.2024 Intento de resolver el problema del xor con el descenso de gradiente de Sklearn.

  6. 14.03.2024 Tres problemas resueltos con redes neuronales: lineal, no lineal y el problema del xor.

  7. 07.03.2024 Búsqueda en malla de los valores para dos hiperparámetros.

  8. 06.03.2024 Árboles de decision.

  9. 06.03.2024 Pruebas estadísticas t de Student y Wilcoxon para seleccionar el mejor método de clasificación o regresión.

  10. 29.02.2024 Validación cruzada: k dobleces, dejando uno fuera y el bootstrap.

  11. 21.02.2024 El problema de multiples clases.

  12. 15.02.2024 Las máquinas de vectores de soporte lineales y con funciones básicas radiales.

  13. 01.02.2024 Análisis de componentes principales.

  14. 01.02.2024 Preprocesamiento de los datos: imputación, estandarización, tratamiento de variables categóricas.

  15. 31.01.2024 Script para graficar la superficie de decisión.

  16. 31.01.2024 Corrección del resultado del modelo de la regresión logística.

  17. 25.01.2024 Clasificación en dos clases usando la regresión logística.

  18. 24.01.2024 Las funciones gausiana y sigmoide.

  19. 18.01.2024 Clasificación usando los k vecinos más cercanos.

  20. 18.01.2024 Regularización en la regresión lineal.

  21. 10.01.2024 La regresión lineal.

  22. 08.01.2024 Lectura de la base de datos de iris.

  23. 08.01.2024 Introducción a matplotlib.

  24. 08.01.2024 Introducción a numpy.

Tareas del curso:

  1. Tarea 9: Clasificación usando redes neuronales
    Fecha de entrega 11.04.2024
    1. Realizar la clasificación de los datos de Iris con una red neuronal

  2. Tarea 8: Clasificación usando árboles de decisión
    Fecha de entrega 21.03.2024
    1. Con los siguientes datos, contestar las preguntas siguientes
    2. ¿Cuál fue el razonamiento del médico para recetar cada medicina? ¿Se puede ver la relación entre los valores en sangre y la medicina que el médico recetó?
    3. Deben usar validación cruzada
    4. Visualizar el mejor árbol
    5. Realizar la importancia de las características
    6. Y van a usar las tres las características más importantes, rehacer el clasificador y lo comparan con el obtenido usando todas las características.

  3. Tarea 7. Lectura de un artículo de investigación
    Fecha de entrega 14.03.2024
    1. Leer el artículo: A Performance Evaluation of Machine Learning Techniques for Breast Ultrasound Classification Francisco A. González-Luna; Juanita Hernández-López; Wilfrido Gomez-Flores DOI: 10.1109/ICEEE.2019.8884547
    2. Contestar los siguientes puntos
    3. ¿Qué características se usaron? ¿Cuántas?
    4. ¿Cómo se realizaron las pruebas?
    5. ¿Cómo se realizó la figura 3?
    6. ¿Para qué sirve la prueba Kruskal-Wallis?
    7. ¿Qué software se utilizó para realizar los clasificadores?
    8. ¿Tienen ustedes el software para poder replicar los resultados si tuvieses acceso a los datos de los autores?
  4. Tarea 6. Clasificación multiclase
    Fecha de entrega jueves 29.02.2024
    1. Con estos datos clasificarlos usando la máquina de vectores de soporte lineal. Usar el modelo uno contra todos.
    2. Realizar el modelo de la función de decisión para el punto anterior.
    3. Mostrar la superficie de decisión.

  5. Tarea 5. Máquina de vectores de soporte
    Fecha de entrega 22.02.2024
    1. Realizar la clasificación con una MVS lineal con el módulo sklearn.svm.SVC, con los mismo datos vistos en clase, y comparar la función de decisión con la obtenida en clase con el módulo sklearn.svm.LinearSVC.
    2. Realizar la clasificación con una MVS con funciones básicas radiales de las dos primeras clases de la base de datos Iris.
    3. Se debe mostrar la superficie de decisión obtenida en el punto anterior.
  6. Tarea 4. Análisis de componentes principales
    Fecha de entrega 08.02.2024
    1. Con toda la base de datos iris que tiene cuatro características, reducir el números de características a 3 y 2 usando el ACP.
    2. Realizar la clasificación usando el algoritmo de k vecinos más cercanos sobre los datos reducidos.
    3. Reportar las exactitudes de entrenamiento y prueba
    4. Reportar las gráficas de los datos de entrenamiento y el resultado de las pruebas

  7. Tarea 3. Regresión logística
    Fecha de entrega 01.02.2024
    1. Realizar la gráfica del valor de producto punto entre los vectores 'a' y 'x' contra el valor de la sigmoide para el ejemplo visto en clase. Dibujar cada punto de un color distinto para cada clase y la gráfica continua de la sigmoide.
    2. Repetir el resultado del ejemplo visto en clase pero con los datos con ruido. Realizar también la gráfica del punto anterior.
    3. Realizar el clasificador con las dos primeras clases de la base de datos de iris.

  8. Tarea 2. K vecinos más cercanos
    Fecha de entrega 25.01.2024
    1. Utilizar los datos realizados en la clase del 18.01.2024
    2. Realizar los resultados con k=1,3,5,7,9 y 11
    3. Mostrar en una misma gráfica el error de entrenamiento y el error de prueba contra el valor de k.

  9. Tarea 1. Regresión lineal
    Fecha de entrega 18.01.2024
    1. Ajustar los mismos datos vistos en clase a polinomios de grado n = 2, 3, 4, 5 y 6.
    2. Mostrar una tabla con los valores de los coeficientes obtenidos, las cinco gráficas de los datos contra el modelo y una última tabla de n contra la medida R^2

Última actualización: 11.04.2024