Curso: Aprendizaje automático
Dr. Luis Gerardo de la Fraga
Cuatrimestre enero a abril de 2023.
Este es el contenido del curso
Apuntes del curso:
19.04.2023 Árboles de decisión impulsados por el gradiente y Adaboost
17.04.2023 Apuntes y programas para el proyecto.
22.03.2023 Bosques aleatorios.
15.03.2023 Pruebas con el clasificador basado en redes neuronales directas.
13.03.2023 El clasificador basado en el teorema de Bayes.
07.03.2023 Red neuronal para aproximar la función tangente hiperbólica.
27.02.2023 Árboles de decisión.
22.02.2023 La realización de la validación cruzada y los árboles de decisión.
15.02.2023 Máquina de vectores de soporte lineales con el problema multiclase.
08.02.2023 La máquina de vectores de soporte.
31.01.2023 Preprocesamiento de datos. Análisis de componentes principales.
24.01.2023 La regresión logística.
18.01.2023 Clasificación unsado los k vecinos más cercanos.
16.01.2023 Regresión lineal en python.
09.01.2023 Regresión lineal.
09.01.2023 Introducción a python y matplotlib.
Tareas del curso:
-
Clasificador con bosques aleatorios
Fecha de entrega, miércoles 29.03.2022
- Utilizar los mimos datos que la tarea anterior.
- La exactitud debe se mayor de 0.90
-
Clasificador de Bayes ingenuo
Fecha de entrega, miércoles 22.03.2022
- Utilizar estos datos para realizar el clasificador.
- La liga es del repositorio la Universidad de California en Irvine.
- Son 16 características, 7 clases y 13,611 instancias
- Reportar la exactitud con 5 dobleces
- Realizar la función para evaluar el modelo obtenido
y probar que funciona
-
Clasificación usando árboles de decisión
Fecha de entrega, lunes 07.03.2022
- Con los siguientes datos,
contestar las preguntas siguientes
-
¿Cuál fue el razonamiento del médico para recetar
cada medicina?
¿Se puede ver la relación entre los valores en sangre
y la medicina que el médico recetó?
-
Deben usar validación cruzada
-
Visualizar el mejor árbol
-
Realizar la importancia de las características
-
Y van a usar las tres las características más
importantes, rehacer el clasificador y lo comparan
con el obtenido usando todas las características.
Tarea 4: Máquinas de vectores de soporte
Fecha de entrega, lunes 27.02.2023
-
Con el siguiente script clases.py con 8 como
valor para el parámetro para el generador de números aleatorios se generarán los
datos. Son tres clases con dos características.
-
Se harán las máquinas de soporte multiclase, una a una y una contra todas.
-
Se deben se mostrar las superficies de decisión para ambos problemas.
Tarea 3: K vecinos más cercanos
Fecha de entrega lunes 13.02.2023
-
Con la base de datos Iris, separar los datos en
entrenamiento y prueba
-
Programar k=1,3,5,7,9,11 y realizar la gráfica
de exactitud (tanto de entrenamiento como de prueba) contra
el número de vecinos.
Tarea 2: Análisis de componentes principales
Fecha de entrega lunes 6.02.2023
-
La base de datos de Iris tiene 4 características,
(se quedan con las dos primeras clases)
entonces la pueden reducir a 3, 2 y 1 dimensiones
-
Usan el PCA de sklearn y lo verifican con el cálculo directo
con la eigendescomposición de la matriz de covarianzas
-
Clasifican los datos reducidos usando la regresión logística
Tarea 1: Regresión con modelos lineales
Fecha de entrega lunes 23.01.2023
-
Generar otros datos, para que el ruido sea distinto con este
script en python
-
Cambiar la semilla para particionar los datos de forma aleatoria.
-
Ajustar modelos con n=1 hasta 10, n es el número de coeficientes
-
Presentar los valores de los coeficientes según n
-
Graficar de n contra error_rms y el valor de R2 para todos los modelos
Última actualización: 19.04.2023