Hola. En este video te voy a brindar las bases teóricas para hacer comparaciones estadÃsticas. Para ello, vamos a hablar sobre la prueba p o "p-test", en inglés. El p-test es uno de los conceptos más utilizados en estadÃstica. En este video te contaré, conceptualmente, qué es el p-test, para qué se utiliza y cómo se combina para validar nuestras hipótesis, y cómo se complementa con los intervalos de confianza. El p-test es un valor, usualmente entre 0 y 1, que nos permite soportar o rechazar la hipótesis nula. Este valor lo podemos interpretar como un porcentaje de error en nuestra comparación estadÃstica y, por ende, queremos que ese valor porcentual sea muy bajo. Los valores p son muy útiles si queremos rechazar la hipótesis nula mediante un valor de p inaceptable. AsÃ, los valores de p se aplican sobre las funciones probabilÃsticas de las famosas pruebas o test estadÃsticos como los veremos más adelante. En general, lo que buscamos entonces es validar, mediante el uso de esta herramienta estadÃstica, qué tan probable es que nuestra hipótesis nula sea resultado del azar. Recordemos que una hipótesis nula es la aseveración del absurdo. Es decir, queremos plantear una hipótesis falsa con el fin de comprobar o rechazar que es falsa. De esta manera, la hipótesis nula es rechazada si nuestros valores de p son menores que los valores crÃticos aceptados para la función probabilÃstica que queremos contrastar. Por ejemplo, si al validar nuestras hipótesis tenemos un valor p de 0,25, tenemos un 2,5 por ciento de probabilidad que nuestra hipótesis alterna sea aleatoria, lo que hace muy improbable que esta hipótesis sea incierta. Si p tiene un valor muy bajo, podrÃamos decir que nuestra hipótesis nula tiene una significancia estadÃstica alta para ser falsa; esto es, que nuestra hipótesis nula sea rechazada. Si, por el contrario, nuestro valor p es muy alto o no aceptable, como veremos a continuación, podrÃamos decir que nuestra hipótesis nula no puede ser corroborada o no podemos asegurar que es falsa. Hay que tener mucho cuidado aquÃ, ya que tampoco podemos asegurar que la hipótesis nula es producto del azar, es decir, la hipótesis nula no es rechazada, pero no podemos asegurar que sea cierta. En términos matemáticos, el valor p viene siendo el área bajo la curva de la función probabilÃstica de la prueba a rechazar. Lo que buscamos es que dicha área, es decir p, sea muy pequeña, de manera que podamos obtener un resultado concluyente y asà rechazar la hipótesis nula H0. Usualmente se consideran valores aceptables de p los siguientes : si p es mayor a 0,1 o al 10 por ciento de dicha área, se considera que p no es significante y no podemos rechazar H0. Si p está entre 0,5 pero es menor a 0,1 se considera que p es marginalmente significante y no es muy diciente para rechazar la hipótesis nula. Si p está entre 0,01 y 0,05, es decir, oscila entre 1 por ciento y el 5 por ciento del área bajo la curva, podemos decir que p es significante y que tenemos indicios muy serios para rechazar la hipótesis nula. Finalmente, si p está por debajo de 0,01 hay una significancia muy fuerte para rechazar la hipótesis nula. La estadÃstica nos brinda varios tipos de pruebas estadÃsticas de contraste de hipótesis, dependiendo de las caracterÃsticas que queramos corroborar en nuestras muestras. Dentro de dichas funciones probabilÃsticas, encontramos el "z-test" que se utiliza para comparar o validar si 2 muestras provienen de la misma distribución si sabemos las varianzas y las medias de las mismas. La prueba "t-test" nos permite saber si 2 muestras tienen la misma distribución si las muestras son pequeñas. Existen otro tipo de pruebas estadÃsticas en donde no se requiere saber con antelación la varianza o la media y son muy útiles cuando no tenemos forma de calcular dichos parámetros, como la prueba de Mann Whitney, entre otras pruebas, que podemos utilizar para hacer contrastes. Ahora vamos a ver cómo se conectan los intervalos de confianza con el contraste de hipótesis. Los intervalos de confianza se reflejan como el restante del área bajo la curva de nuestro test estadÃstico que no representa el valor p. En este caso, nuestro valor p es el equivalente al 10 por ciento del test estadÃstico y el área restante equivale al 90 por ciento; es decir, que nuestro intervalo de confianza es de un 90 por ciento de probabilidad que el valor p, en este caso el 10 por ciento, sea verdadero. AsÃ, si por ejemplo queremos obtener una significancia con un intervalo de confianza mayor al 90 por ciento, deseamos obtener un valor p menor al área delimitada por el valor crÃtico que serÃa el valor en z de 1,645. Si nuestro valor crÃtico obtenido en nuestro test es mayor al del intervalo de confianza, podemos rechazar la hipótesis nula con una confianza, en este caso del 90 por ciento. Por ejemplo, supongamos que tenemos 2 muestras estadÃsticas en nuestro caso de "retail": un conjunto de muestras para Sao Paulo y otro conjunto de muestras para la ciudad de Pedreira y queremos saber si las medias en estas 2 poblaciones son diferentes. Lo primero que debemos hacer es plantear una hipótesis nula. Como lo que queremos saber es si, efectivamente, las poblaciones son diferentes, entonces planteamos una hipótesis nula rechazable como "¿Sao Paulo viene de la misma población que Pedreira?" Supongamos que nuestro test de contraste nos da como resultado z igual a 1,74 y sabemos de antemano, mediante las tablas de valores crÃticos, que esta prueba estadÃstica es significante si z es mayor a 1,645 con un intervalo de confianza del 90 por ciento. Al buscar p en la tabla de valores crÃticos de la prueba z, evidenciamos que p es menor a 0,05, por lo tanto, es seguro afirmar que la hipótesis nula "Sao Paulo viene de la misma población que Pedreira" es falsa y la podemos rechazar. En este video aprendimos qué es el "p-test" y cómo se utiliza junto con los intervalos de confianza para rechazar y contrastar hipótesis nulas. Ahora el turno es tuyo. En este módulo te proporcionamos una lectura sobre el tema de valores p y contrastes estadÃsticos y el proceso de validar o rechazar hipótesis para argumentar tus hallazgos en la información. Sigue las herramientas de aprendizaje que te daremos a continuación y completa el ejercicio que te proponemos en los recursos disponibles.