[MÚSICA] [MÚSICA] [MÚSICA] Vimos you cómo hacer el análisis estadístico para cuando tenemos una sola variable. Más allá de ello, podemos tener observaciones de las cuales hayamos levantado 2, 3 o más variables. En el caso de Godzilla por ejemplo, tomamos tres variables de tipo numérico, altura, peso y longitud, aunque haya dos versiones para las cuales nos faltó justamente la longitud. Trabajaremos particularmente con dos variables de tipo numérico tomadas de nuestra muestra de Godzilla. Trabajaremos específicamente con la altura y con el peso. Empezaremos por tratar de representar de manera conjunta estas dos variables. Para ello, lo que vamos a hacer es de cada versión de Godzilla, tomaremos las parejas de observaciones altura y peso y las graficaremos en el plano cartesiano como puntos, dado que tenemos pares ordenados. El gráfico que obtengamos se llama diagrama de dispersión. Y en él tendremos representadas las 18 versiones de Godzilla de manera simultánea en término de su altura y de su peso. Ahora, cuando trabajamos con dos variables simultáneamente, podríamos pensar que tal vez exista una relación entre ambas variables. Por ejemplo, podemos pensar que para mayor altura vamos a tener mayor peso en cada una de las versiones de Godzilla. El que dos variables puedan estar relacionadas es una idea que podemos sostener o descartar a través del diagrama de dispersión. Para ello, lo que trataremos de hacer primeramente por observación es ver si el conjunto de puntos que tenemos en el diagrama de dispersión se asemeja a alguna función conocida. Podríamos pensar en primera instancia hacia una línea recta you que es una función bastante simple de analizar. En principio, podemos tomar nuestro diagrama de dispersión y proponer una serie de rectas a las cuales nuestra distribución de puntos pudiera asemejarse. La cuestión aquí es que podemos proponer una infinidad de líneas. Algunos de estos modelos podrían representar de buena manera el comportamiento de las dos variables y algunos no tantos. La cuestión será cuál de todos los posibles modelos es el mejor posible. Sin importar qué recta tracemos, claramente tendremos puntos que queden fuera de dicha recta, que tengan alguna distancia desde el punto a la recta, entonces, si sumamos todas las distancias que guardan los puntos con respecto a la recta que pretende modelar el comportamiento de las dos variables, y encontramos una recta para la cual la suma de todas estas distancia sea la menor suma posible, entonces esa recta será el mejor modelo que podramos proponer para el comportamiento de nuestras dos variables tomadas de manera conjunta. Si medimos la distancia de los puntos ala recta que proponemos como modelo a la manera que sabemos hacerlo desde los cursos de geometría es decir, trazando la distancia desde el punto de manera perpendicular a la recta, estaremos midiendo esas distancias en términos de dos variables. Para facilitar el problema, lo que haremos es medir las distancias de manera vertical, es decir qué distancia guarda cada punto con respecto a la recta en término solamente de la ordenada que en este caso es el peso de Godzilla. De esta manera lo que estaremos calculando es el tamaño del error que guarda cada peso observado con respecto a la recta propuesta como modelo de ajuste. Sabemos desde que calculamos la desviación estándar en la unidad anterior, que al hacer esto podríamos tener errores tanto positivos como negativos you que hay puntos por debajo y por encima de la recta. Y sabemos también que una manera de evitar tener signos negativos es elevar estos errores al cuadrado, eliminando así la posibilidad de que su suma sea cero. De este modo, podemos proponer una serie de rectas calcular los errores al cuadrado de los puntos con respecto a la recta tomados de manera vertical, y después buscar cuál es el más pequeño de ellos o cuál es la suma de los errores al cuadrado más pequeña. El problema es que al poder proponer una cantidad infinita de rectas, este proceso no parece ser del todo operativo. Afortunadamente hay una vía que tiene sus fundamentos en el cálculo diferencial y que no abordaremos aquí que nos permite resolver el problema. En este curso veremos únicamente la parte operativa. [MÚSICA] [MÚSICA] [MÚSICA] [MÚSICA]