[MÚSICA] [MÚSICA] Nesta aula, nós vamos discutir uma transformação muito utilizada nos modelos econométricos, que é o uso do logaritmo. Nós podemos aplicar o logaritmo tanto na variável "y" quanto em "x". O uso do logaritmo vai depender da hipótese que temos sobre a relação entre as variáveis "y" e "x". Note que o logaritmo vai trazer uma não linearidade na relação entre "y" e "x". Isso não vai ferir a primeira hipótese, tanto de regressão simples, quanto de regressão múltipla, que vimos, porque a linearidade necessária, aqui, para que tenhamos estimadores com boas propriedades é a linearidade nos parâmetros, e não nas variáveis. Nesse slide, nós ilustramos quatro modelos em que não usamos o logaritmo tanto em "y" quanto em "x", usamos o logaritmo apenas em "y", usamos o logaritmo apenas em "x", e usamos o logaritmo em "y" e em "x". Fizemos uma simulação, aqui, considerando que o "Beta chapéu 0" seja 2 e o "Beta chapéu 1" seja menos 1. Veja como muda a relação entre "y" e "x" dependendo do uso do logaritmo em cada uma das variáveis. Vamos discutir, em cada um desses modelos, como fica a interpretação dos nossos estimadores. Veremos, primeiro, como fica o uso do logaritmo na variável "y", na variável dependente do modelo. Considerando válidas as hipóteses que vimos, que nos garantem o efeito "ceteris paribus", nós podemos, por exemplo, derivar o nosso modelo na variável "x", em que estamos interessados, e verificar o efeito marginal dessa variável. Se derivamos, por exemplo, em "x" o nosso modelo, nós temos que o "Beta 1" mede o efeito de uma variação em "x" sobre uma variação em "y" em termos percentuais. Vejamos, aqui, o exemplo do nosso modelo de salário-educação quando usamos o logaritmo no salário, que é exatamente esse modelo que discutimos agora. Veja que o nosso "Beta chapéu 1", ou seja o nosso estimador para "Beta 1" é igual a 0,09. O que significa isso? Significa que cada ano a mais de escolaridade aumenta os salário em 9%. Lembre-se que, para fazer a interpretação em termos percentuais, nós temos aqui o número em decimais, que precisamos converter em percentuais, ou seja, 0,09 seria 9% de aumento nos salários. Mesmo tendo flexibilidade no uso do logaritmo (que, como vimos, nos dá a interpretação em termos percentuais), existem algum cuidados que temos que ter para utilizá-lo no nosso modelo. O primeiro cuidado seria quando a nossa variável "y" tem elevado número de zeros. Note que o logaritmo de zero é indeterminado, então não é muito adequado utilizar o logaritmo quando a nossa variável tem grande número de observações zero. O uso do logartimo pode ajudar, também, quando a gente tem muitos outliers, que são valores muito discrepantes da média amostral. Por exemplo, quando estamos falando de variáveis como salários, ou como retornos financeiros de uma empresa, ou faturamento, nós podemos ter uma discrepância muito grande entre as observações e o uso do logaritmo aproxima um pouco mais essas observações reduzindo o problema com outliers. O terceiro ponto importante, aqui, seria para fazermos previsão sobre o valor de "y". Quando usamos o logaritmo em "y" nós temos que fazer uma transformação para poder prever a variável "y" e não o logaritmo de "y". Veremos um pouco mais sobre isso a seguir. A quarta preocupação que temos que ter é com o R-quadrado dos modelos. Note que, no R-quadrado, nós precisamos calcular a soma dos quadrados totais, que é a variação de "y" medida pelo somatório do "yi" menos "y-barra" ao quadrado. Quando transformamos o nosso modelo usando o logaritmo, a nossa soma dos quadrados totais muda. Se ela muda, a nossa medida de R-quadrado também vai mudar, então nós não podemos comparar o R-quadrado de um modelo usando "y" como variável dependente e o R-quadrado de um modelo usando "ln de y" como variável dependente. Aqui, temos um resumo, então, da interpretação do nosso "Beta 1", por exemplo, num modelo de regressão simples, quando usamos o "log" em "y", "x", e em "y" e "x". Como vimos, o modelo que tem "log" em "y" e não em "x" é chamado de log-nÃvel, porque estamos usando o "log" do "y" e a variável no nÃvel em "x". Nesse caso, o "Beta 1" será uma variação de "x" sobre uma variação em "y" em termos percentuais. O segundo modelo é o que chamamos de nÃvel-log, ou seja, usamos "y" no nÃvel e apenas o "log" no "x". Nesse caso, o "Beta 1" vai medir uma variação em termos percentuais de "x" sobre uma variação em "y" no nÃvel. E o terceiro modelo seria o modelo log-log, que usamos o logaritmo tanto no "y" quanto no "x". O "Beta 1" nesse modelo vai medir uma variação em termos percentuais de "x" sobre "y" em termos percentuais, que é exatamente o que chamamos de elasticidade em Economia, que é uma variação percentual de uma variável sobre a variação percentual em outra. O uso do logaritmo, então, vai depender da forma funcional que existe entre as variáveis. Lembre-se sempre daquele primeiro diagrama em que mostramos a diferença entre o uso do "log" para o mesmo modelo. Note, também, que os efeitos marginais serão diferentes para cada um desses modelos. No modelo log-log, por exemplo, nós temos que o beta mede a elasticidade. Esses modelos são conhecidos por "modelos de elasticidade constante", pois, ao contrário dos demais, em que, para calcularmos a elasticidade, precisamos transformar o nosso modelo usando "x" e "y", aqui, o valor da elasticidade vai ser constante para toda a amostra. Por fim, vamos discutir como fazer a previsão de "y" quando, no nosso modelo, "y" está em logaritmo. O modelo com logaritmo na variável dependente pode ser transformado usando o exponencial, como podemos ver no slide. Nesse caso, o "y", então, vai ser igual ao exponencial de "Beta 0" mais "Beta 1" "x1", mais todos os termos até ao "Beta k" "xk", vezes o exponencial de "u", que é o nosso termo de erro. Quando passamos a esperança condicional sobre esse modelo, nós temos que a esperança de exponencial de "u" dado "x" não vai ser igual a "1", mas sim vai ser igual ao exponencial de "Sigma 2" sobre 2 (isso se utilizarmos as hipóteses que vimos nos últimos dois módulos). Para fazer previsão, nós temos que encontrar o melhor valor esperado de "y", para a esperança de "y" dado "x". Assim, nesse caso, nós temos que pegar a nossa previsão dada pelo modelo usando "ln de y" (que chamamos aqui de "ln de y chapéu"), tiramos o exponencial desse termo e multiplicamos por esse fator de correção que é dado pela esperança de exponencial de "u" ser diferente de "u". Podemos calcular facilmente esse fator de correção utilizando o estimador para o "Sigma 2" que calculamos nas aulas anteriores. Basta fazer essa correção para termos uma boa previsão para o nosso "y" usando o modelo em "log". [MÚSICA] [MÚSICA] [MÚSICA]