[MÚSICA] [MÚSICA] Nesta aula, nós vamos discutir o intervalo de confiança do nosso estimador e da previsão baseada nos estimadores. O intervalo de confiança serve, também, para testarmos hipóteses sobre os parâmetros verdadeiros. Para calcular o intervalo de confiança, nós precisamos, também, definir o nÃvel crÃtico, o "Alfa", ou probabilidade de erro. Assim se temos um erro de 5%, por exemplo, nós teremos um intervalo de confiança de 95%. O que significa esse intervalo de confiança de 95%? Imagine que tenhamos infinitas amostras aleatórias para o nosso modelo. No exemplo que vimos na aula passada, sobre a elasticidade-renda da carne, nós terÃamos infinitas amostras aleatórias dos consumidores brasileiros. Se calculássemos o intervalo de confiança do "Beta j" para cada uma dessas amostras, nós temos que o parâmetro verdadeiro estaria dentro desse intervalo de confiança em 95% dessas amostras. Mas note que nunca teremos infinitas amostras de uma mesma população, nós temos apenas uma amostra. Então a ideia do intervalo de confiança é de que essa nossa amostra seja uma desses 95% de casos e, se isso acontecer, nós podemos usar o intervalo de confiança da nossa amostra para testar hipóteses sobre o parâmetro verdadeiro. Assim, a regra de decisão será: se o "Beta j", sobre o qual estamos testando nossa hipótese nula, estiver dentro do intervalo de confiança, nós não rejeitamos a hipótese nula, ou seja, ela pode ser verdadeira. Usar um intervalo de confiança para fazer teste de hipóteses apenas é válido quando temos testes bicaudais. Isso porque sempre distribuÃmos parte do erro para cada um dos extremos da distribuição. Vamos definir, agora, como calculamos esse intervalo de confiança sabendo o valor crÃtico da estatÃstica "t" para "n" menos "k", menos 1 graus de liberdade (o que identificaremos por "t", "n" menos "k", menos 1 "Alfa"): o intervalo de confiança de 1 menos alfa por cento para "Beta j" será igual a "Beta chapéu j", menos o valor crÃtico da "t", vezes o erro-padrão do "Beta chapéu j". Então o intervalo de confiança de 1 menos "Alfa" por cento para o "Beta j" é dado pelo seguinte valor mÃnimo: "Beta chapéu j", menos o valor crÃtico, vezes o erro-padrão do "Beta chapéu j"; e o valor máximo do intervalo será "Beta chapéu j", mais o valor crÃtico, vezes o erro padrão do "Beta chapéu j". Veremos um exemplo para o modelo que explica o preço dos imóveis em São Paulo, a partir da área útil desses imóveis. Aqui temos um modelo log-nÃvel, ou seja, o preço está no logaritmo e a variável área está no nÃvel. O "Beta chapéu" aqui calculado é de 0,00729, ou seja, para cada metro quadrado de área útil a mais, nós temos um aumento no preço de 0,73%, aproximadamente. PoderÃamos testar, por exemplo, se o efeito da área útil sobre o preço é zero, ou seja, fazer um teste bicaudal usando o intervalo de confiança. O intervalo de confiança de 95%, então, para este modelo em que o "n" é 9381 e nós temos dois parâmetros estimados, (ou seja, os graus de liberdade são 9379) e sabemos que o valor crÃtico da "t" com 2,5% de um lado e 2,5% do outro, é igual a 1,96 e menos 1,96... Assim, o valor mÃnimo do intervalo será 0,00729, menos 1,96, vezes 0,00006 (que é o erro-padrão da variável), ou seja, o valor mÃnimo é igual a 0,00718, e o valor máximo do intervalo vai ser 0,00729, mais 1,96, vezes 0,0006, ou seja, 0,000741. O intervalo de confiança do efeito da área útil sobre o preço será, então, entre 0,00718 e 0,00741. Como o zero não pertence ao intervalo de confiança, nós concluÃmos que ele é estatÃsticamente diferente de zero, ou seja, a área útil influencia o preço dos imóveis em São Paulo. Outro uso bastante importante do intervalo de confiança é para a previsão do nosso "y". Quando queremos prever "y", nós precisamos assumir valores para os nossos "x" que explicam o "y". Suponha um vetor de valores "x0", que o "x1" é igual a "x1,0" e o "x2" igual a "x2,0", e assim sucessivamente, até o "xk" ser igual ao "xk,0". Nós podemos nos interessar em construir o intervalo de confiança para o salário previsto de um indivÃduo com dez anos de escolaridade e cinco anos de experiência, por exemplo. Assim nós queremos avaliar a esperança de "y", condicional a esses valores "x0". Se valem as hipóteses que temos assumido até agora, sabemos que a esperança de "y" dado "x" vai ser igual à reta de regressão populacional, ou seja, bastaria substituirmos cada "x" na reta de regressão populacional pelo valor em que queremos fazer a previsão (no exemplo que vimos, dez anos de escolaridade e cinco anos de experiência). Se tivéssemos essa regressão, nós terÃamos "Beta 0", mais 10 "Beta 1" mais 5 "Beta 2". Vamos chamar esse valor esperado de "y" condicional aos valores em que queremos fazer a previsão de "Teta 0". Para construirmos, então, o intervalo de confiança de "Teta 0", nós terÃamos que calcular a variância. O "Teta chapéu 0" será, então, a reta de regressão usando os estimadores dos "Betas". O "Teta chapéu 0" será, então, a reta de regressão usando os nossos estimadores de cada "Beta". Para construirmos o intervalo de confiança, nós precisamos derivar o erro-padrão desse estimador "Teta chapéu 0". O erro-padrão do "Teta chapéu 0" será o erro-padrão de uma combinação de estimadores, o que envolve o cálculo de várias covariâncias entre esses estimadores. Suponha que tivéssemos apenas dois estimadores, "Beta chapéu 0", mais "Beta chapéu 1" "x1"; a variância da soma desses estimadores seria a soma das variâncias de cada estimador, mais duas vezes a covariância entre eles, ou seja, precisarÃamos calcular essa covariância. Uma forma prática de derivarmos esse erro-padrão seria transformamos o nosso modelo de forma que a constante, o intercepto do modelo, reflita o "Teta 0". Veja que, se centrarmos cada "x" do modelo no valor da previsão (ou seja, o novo "x1" seria igual a "x1" menos o valor da previsão "x1,0", "x2" seria igual a "x2" menos "x2" no valor da previsão, que é "x2,0" e assim sucessivamente, para todos os "xk"), nós temos que o intercepto seria exatamente a medida do "Teta 0". Se estimarmos essa regressão centrada na previsão para os "x" por MQO, nós temos que o "Teta chapéu 0" será exatamente a combinação linear dos estimadores "Beta chapéu", e o erro-padrão será dado automaticamente no modelo. Assim, podemos calcular o intervalo de confiança na nossa previsão usando "Teta chapéu 0" e o erro-padrão do "Teta chapéu 0". Lembre-se, novamente, de que temos que escolher um erro do tipo I, um nÃvel de tolerância de erro, para construir esse intervalo de confiança. [MÚSICA] [MÚSICA] [MÚSICA]