[MÚSICA] [MÚSICA] Hola, esta semana vamos a trabajar en lo del tema de los modelos predictivos un poco más, a nivel un poco más avanzado que lo que hemos visto hasta ahora. Pero siempre teniendo en mente éstos ingredientes claves que hemos ido explicando. Ahora you en este marco general de modelización, en el que nos vamos a centrar a partir de ahora, vamos a pensar que esa pieza de nuestro trabajo que corresponde a modelo, lo podemos pensar de modo más general posible. Algo así como una función de ciertas variables. Estas variables que aquí están indicadas como x1, x2 hasta x sub p serían los diferentes features, los cuales vamos a utilizar para hacer la modelización. Y f, aquí denotamos por f es una función d, esa función puede ser de cualquier tipo y con muchísima complejidad que incluso no permita escribirla de forma analítica. Pero de algún modo este caso tan general o este marco tan general lo debemos tener en mente cuando estemos haciendo modelización con big data. Como piezas claves, las técnicas básicas que encontramos en éste ámbito se basan en el desarrollo de diferentes enfoques y mejoras sobre modelos clásicos de minería de datos. Éstos métodos, éstos métodos tienen como dos piezas claves que son: los árboles y las redes. Es decir, en general un modelo lo pensamos de éste modo como una función d. Pero es cierto, que la mayoría de las veces esta función a pesar de su complejidad proviene de haber hecho algún tipo de modelo con árboles o un modelo con redes. Y esto cuando decimos árboles incluimos cosas mucho más complejas que lo que algunos quizás conozcáis como árboles de regresión o clasificación. Podemos estar pensando en métodos más complejos como Random Forest, por ejemplo. Y cuando digamos redes, pues nos basamos en cualquier método que de algún modo esté relacionado con el approach o el enfoque clásico de las redes. Así que bueno, aquí teneis un poco un dibujo muy esquemático de cuál sería la manera de ejemplizar, o de poder mostrar esa función f, en función de si se trata de un método basado en árbol o un método basado en redes. Como punto más importante es tener en cuenta que cuando hacemos árboles de algún modo estamos partiendo nuestros datos, los datos buscando diferentes tipos de tipologías para modelización. En cambio cuando estamos utilizando redes, estamos utilizando en cada paso de nuestro desarrollo del modelo utilizando toda la información de la que disponemos. Volvemos al caso tan sencillo, de estos datos x, y que habíamos visto la semana anterior para que realmente podamos volver a entrar en este detalle de quiénes estáis, esta función de los datos. Fijémonos que aquí en la función f, sería simplemente esta aplicación esa fórmula lineal, ¿no? Y en este caso x sería solo una variable x y la manera de representar el modelo podría ser a través de este gráfico, que es simplemente poniendo cuál es el valor, ¿cuál es la función representada como ésta recta? Esta recta que vemos aquí azul representa justamente el modelo, la f, es una manera de mostrar quién es la f. Esto en general no lo podemos hacer cuando estamos en alta dimensión, pero vamos a utilizar este ejemplo tan sencillo para poder un poco ejemplizar cómo diferentes modelos nos van a dar diferentes ajustes que no podremos ver en modo gráfico como hacemos aquí, pero que de algún modo van a tener algunos tipos de problemáticas como vamos a ver a continuación con estos datos. Fijémonos que éste podría ser otro modelo. Aquí la f, fijémonos correspondería a esta línea azul para cada valor de x le corresponde un valor que sería, que se sobrepone sobre la línea azul y sería el pronóstico para la variable y. Ahora no es una recta, ahora es una curva de hecho de grado 3. Esto podría ser otro modelo. Otra vez tenemos otro modelo que representa, está representado con la línea azul. Y fijémonos que corresponde simplemente a hacer la interpolación de todos los puntos que componen nuestra base de datos. Bueno éstos son tres posibles modelos. Así que esto es para que veamos un poco las diferentes tipologías de modelos que uno puede ir construyendo. Y así podemos ver como de 6 a f, esa función lineal que vemos en la estadística virtual cómo realmente puede ser cualquier función, pues una función cúbica o una función definida a trozos, cualquier cosa. Eso sería sólo en el caso analítico, en el caso general ni siquiera la representación se puede hacer con un, a través de una expresión de vermilista. En cualquiera de los casos, siguiendo con ese ejemplo vamos a fijarnos siempre en que tenemos este esquema general de respuesta igual a modelo más incertidumbre. Esto you lo habíamos comentado y ahora fijarnos de que a partir de esta semana cómo vamos a centrarnos en modelos predictivos, you no vamos a estar tan atentos al tema de la validación de algunas propiedades que nos den capacidad explicativa, este que de algún modo vamos a mezclar la etapa validación en la etapa de incertidumbre. Y por otro lado, las mejoras de modelo serán en el esquema habitual y you iremos viendo exactamente cuál va a ser el énfasis que se le da desde el punto de vista matching verming. Y esto es todo para el chat de introducción. [MÚSICA] [AUDIO EN BLANCO]