Antes de dar prosseguimento, vamos aqui utilizar de uma pequena revisão do teste de hipóteses para proporção para duas coisas. Primeiro, retomar esses conceitos que apresentamos durante este módulo e já preparar, então, essa base para o próximo módulo. Então, nós vamos utilizar essa revisão nesses dois sentidos. Por hora, vamos relembrar que o teste de hipóteses, ele se encaixa diferentes tipos de objetivos que a gente esteja tentando verificar. Por exemplo, nós podemos verificar se a média de uma determinada população estaria dentro do que esperaria, né? Então, aqui a gente contrastando o valor que a gente espera encontrar. Então, esse é o parâmetro que a gente gostaria de encontrar com o valor que a gente tem que melhor reflete o que seria realmente o parâmetro da população. Pode ser então definido de forma empÃrica ou a partir de uma teoria. Então, que aqui é o valor que gostarÃamos de testar. A gente pode fazer, a partir dessa estrutura, dois tipos de testes. Quando o desvio padrão da população é conhecido e quando ele é desconhecido, sendo, respectivamente, os testes Z e o teste t,. Podemos também com uma simples adaptação da estrutura testarmos se a média de uma população seria igual a média de uma outra população a partir dos valores que obtivemos nas amostras respectivas. Isso também se estende para o caso de várias amostras, então k amostras. A diferença é que para k amostras utilizaremos o teste de f de Anova. Por fim, uma estrutura é viável seria a de utilizarmos aqui a proporção então, uma teoria também ou algo empÃrico que a gente gostaria de testar para validar ou não o nosso parâmetro da população. Aqui, no caso, o parâmetro sendo a proporção. Todos essas estruturas se encaixam então no que a gente tá chamando aqui de teste de hipóteses. Com relação, especificamente esse teste de proporção, nós temos que lembrar o seguinte, a gente atuava numa situação onde a quantidade de informação numérica que a gente tinha era máxima, ou seja, a gente estava falando de variáveis do tipo continua e mais do que isso, a gente também exigia que o tamanho da amostra fosse o que a gente chamava de amostra grande, ou seja, uma amostra maior do que 30 elementos. Sendo essas duas condições atendidas, o teste então, a partir daquela nossa estrutura geral que a gente adaptou para nosso caso pode ser construÃdo. E aqui, no caso, ele é a verificação da proporção da população. A gente tá chamando aqui do parâmetro pi. Qual o valor da ocorrência amostral? No caso, aqui, a proporção que a gente encontrou numa mostra, a gente vai chamar aqui o valor p. Lembrando que o valor que nós construÃmos na nossa hipótese nula e hipótese alternativa, ele tem como referência o melhor conhecimento que a gente tenha dessa população. Então, isso veio de alguma fonte ou veio de forma empÃrica ou veio de forma teórica. Esse é o status quo, o melhor conhecimento que a gente tem da população e aà a gente vai testar contra uma hipótese alternativa e essa hipótese alternativa, veja que ela mantém aqui o parâmetro da população, mantemos aqui o conhecimento que a gente tem e o valor p, ou seja, os dados amostrais entram aqui, olha. Se o número de eventos de sucesso na amostra, ou seja, qual é a proporção de observações que pertençam ao que a gente gostaria de validar. Nós vamos chamar então de casos de sucesso. Encontramos caso de sucesso, no caso aqui a gente vai chamar de x igual a 1. Quando for identificado para essa observação particular o caso de sucesso. Caso contrário, nós vamos colocar então o valor como 0 e seria o caso de fracasso, ou seja, que não pertence ao que a gente esperaria encontrar e a proporção, ela é construÃda dessa forma. Seria, então, o número de vezes que a gente encontrou sucesso na amostra. Se a gente somar os valores de x, como x = 1, teremos valor aqui que pode ser relativizado pelo tamanho da amostra, tal que o tamanho da amostra é n e é a nossa proporção, ou seja, esse valor aqui vai indicar se isso daqui é simplesmente uma diferença ou se há evidências de que realmente seja maior ou menor. Então, aqui o valor de p, ele entra nessa parte aqui da estrutura. No entanto, cabe a gente lembrar que além daquelas duas condições iniciais, que a amostra era grande e que a variável era do tipo contÃnua, para a execução do teste de proporção, nós estamos assumindo uma terceira condição. Essa aqui pelo teorema do limite central, nós vamos falar que a estrutura desse teste, ele pode ser uma estrutura baseada na distribuição do tipo normal. Estando satisfeitas essas três condições, nós vamos poder utilizar a estrutura da distribuição do tipo normal para propormos a nossa estatÃstica teste. Vai ser feita dessa seguinte forma. Você irá partir da comparação dos valores observados e esperados dentro da escala z, ou seja, dentro da estrutura da distribuição do tipo normal, onde nós vamos comparar aqui o que a gente encontrou na amostra, que era aquele nosso valor p com o que a gente tinha de conhecimento ou status quo da população, dado aqui por esse valor esperado pi, aqui pi zero, dividido pelo desvio da população. No caso, aqui, a gente tá assumindo que o desvio é conhecido e ele vai ser dado por essa fórmula aqui. Tendo, então, sido assumidas aquelas condições, podemos utilizar uma estrutura tão simples como essa que vai servir para fazermos a comparação a partir de valor crÃtico se nós temos condições de rejeitar ou não a nossa hipótese nula. E nós vamos, ao invés de utilizar a tabela da normal, que geralmente a gente encontra livro e etcetera, nós vamos usar a função do Excel inv.normp para o valor especÃfico de alfa e ela retorna o valor na tabela z e esse é o valor crÃtico associado ao nÃvel de significância. A estatÃstica teste, então, ela é comparada com o valor crÃtico. Se ela estiver ao lado direito do valor positivo, rejeita-se. Se ela estiver à esquerda do valor negativo do valor crÃtico também rejeita-se a hipótese nula. Vamos pegar exemplo: Fabricante afirma que uma remessa de pregos contém menos de 1% de peças defeituosas (parâmetro da população). Uma amostra aleatória de 200 pregos acusa 4 peças defeituosas (estatÃstica da amostra). Teste a afirmação ao nÃvel de 5%. A forma mais correta seria essa, testando o parâmetro de proporção. Aqui é o status quo, ele é repetido aqui e o valor p indica que, na verdade, a população parece ser maior, porque a gente encontrou aqui 2%, que é o valor x/n 2%, sendo que esperávamos encontrar 1. Aqui, no caso, vai inserir 1,42, que ainda não tem significado nenhum. Só lembrando que o valor crÃtico nós obtivemos pela função do Excel inv.normp a 0,05%, é o nosso alfa, o nosso nÃvel de significância, isso dá o valor de 1,64. Como a nossa estatÃstica teste deu menos do que o valor crÃtico, nós não podemos rejeitar a hipótese nula.