[MUSIC] Hola, en esta lección vamos a estudiar la tarea de clasificación. Veremos como un algoritmo de aprendizaje construye un modelo que identifica las clases presentes en el conjunto de datos. Algunos tipos de modelos de clasificación que podemos aprender. Y por último, presentaremos varios algoritmos de aprendizaje para realizar esta tarea. Veamos el caso de diagnóstico médico. Relacionado con enfermedades cardiovasculares o ECV. Con base en el conjunto de datos, queremos estimar la probabilidad de que un paciente padezca una enfermedad de este tipo. Los datos están asociados a registros de pacientes. Tanto de aquellos que han sufrido una enfermedad cardiovascular como de los que no. Caracterizados por un conjunto de variables que los médicos consideran importantes para un diagnóstico. Como la edad, el peso, la presión sanguínea, entre otros. Como en el caso de la regresión, distinguimos nuestra variable objetivo ECV, que en este caso es categórica. Y lo que se busca es la relación entre esta y el resto de las variables denotadas, por X negritas. Esta sucesión nos permitirá categorizar pacientes entre aquellos que pueden sufrir un ECV y los que no. Es decir, clasificar nuevos pacientes según la variable objetivo con la mayor exactitud posible. Tomemos dos variables para propósitos de visualización, el peso y la presión sistólica, y grafiquemos estos datos. Se han utilizado colores diferentes para distinguir los pacientes que tienen un valor de ECV igual a sí, y a los que tienen un valor igual a no. Es decir, para diferenciar las dos clases en el conjunto de datos. ¿Qué puede hacer un algoritmo de aprendizaje para resolver este problema de clasificación? Una opción es construir a partir de los datos un límite de decisión lineal, que divide el espacio de entrada en dos regiones. Una que describa los pacientes asociados a la clase SI, y otra para los pacientes que tienen la clase NO. Para el caso de dos variables, este límite se representa por una recta, con parámetros w0, w1 y w2. Fíjate en la similitud con una función de regresión. Sin embargo, ¿qué lo distingue de esta? Pues, que a partir de esta función lineal, se deriva una regla de decisión fijando un umbral. Que permita decidir cuándo un dato esta en la zona del SI y cuando se encuentra en la zona del NO. Esta función umbral se aplica en la combinación lineal y se interpreta de la siguiente forma. Cuando evaluemos la función en un dato, o sea, apliquemos el modelo. Si el valor numérico obtenido es mayor o igual a 0, entonces el dato será clasificado como clase SI. De lo contrario será clasificado como clase NO. Una vez aplicado el algoritmo de aprendizaje sobre este conjunto de datos, se obtienen los siguientes valores de los parámetros del modelo. w1 igual a 20, w2 igual a 10, y el intercepto w0 igual a menos 2800. ¿Cómo clasificar un nuevo dato con este modelo? Veamos dos ejemplos, el primero es un paciente con peso 90 kilos y una presión sistólica de 120. Al aplicar el modelo a este dato, obtenemos un valor de 200. Como es mayor que el umbral, a este paciente se le asigna la clase SI. Podemos ver que este dato se encuentra en la zona asociada a esta clase. Tomemos ahora otro dato, un paciente con peso de 60 kilos y presión sistólica de 130. Al aplicar la función, obtenemos un valor de -300. En este caso, según la regla de decisión, el paciente se clasificará como clase NO. Por supuesto, pueden haber errores en las predicciones y el objetivo será obtener un modelo con el mayor poder de clasificación. Para el caso de un algoritmo que construye discriminantes lineales, como en el ejemplo. Su tarea será aprender los valores de los parámetros. w0, w1 y w2 que dan lugar al límite de decisión que mejor se ajusta a los datos. En general, esta es la forma en que trabajan los algoritmos de clasificación. Aprenden una función o límite de decisión que utilizan para hacer las predicciones. Pero con base a la distribución de los datos, no siempre serán adecuados los límites de decisión lineales. Y esta es la principal característica que distingue a estos algoritmos, la posibilidad de aprender también límites no lineales. Un algoritmo que sea capaz de aprender funciones de decisión no lineales. Tendrá mayor capacidad para resolver problemas de clasificación complejos. Como ejemplo, se presenta un problema de clasificación de dos clases y los límites que generan diferentes algoritmos. El primer caso está asociado a un discriminante lineal. Se puede observar que este algoritmo no logra aprender completamente los datos. Por el sesgo que tiene en su capacidad de representación, solo puede generar funciones lineales. Otros como los árboles de decisión y las redes neuronales. Son capaces de aprender límites más complejos, aunque se observa que sus mecanismos de aprendizaje son diferentes. ¿Y cuáles algoritmos podemos utilizar para aprender modelos de clasificación? Son muy variados. Y los podemos categorizar por la cantidad de clases que pueden trabajar. Hay algoritmos que solo pueden aprender modelos de clasificación binarios, es decir, solo son capaces de aprender dos clases. Otros son multiclases, y pueden construir modelos que son capaces de identificar más de dos clases. Como los árboles de decisión, los basados en reglas e instancias, las redes neuronales entre otros. En este módulo tendrás la oportunidad de construir modelos de clasificación utilizando algoritmos basados en árboles de decisión. Te invito entonces a que continúes con la siguiente lección. En la cual explicaremos cómo resolver un problema de clasificación con árboles de decisión. [MUSIC] [MUSIC]