[MÚSICA] Devido à s dificuldades de obter dados experimentais, em geral, recorremos a uma análise de dados observados, que podem ser dados coletados, mas sem o desenho de experimento, ou podem ser dados que a chamamos de secundários, coletados por vários institutos de pesquisa ou dados administrativos de algumas empresas públicas ou privadas. No caso de dados observados, a especificação do modelo econométrico é fundamental para a obtenção da causalidade do nosso efeito. Vamos supor o seguinte modelo econométrico, mais simples, que estabelece uma relação linear entre a variável de interesse, ou variável dependente (que é a nossa variável "y"), e a variável explicativa (que é a nossa variável "x"). Temos aqui a equação em que relacionamos "y" e "x". "y" é igual a "Beta 0" mais "Beta 1" "x" mais "u". Para verificarmos o efeito da variável "x" sobre a variável "y" é importante entendermos como "y" muda a partir de uma variação de "x". Vamos simular como o nosso modelo trataria o efeito em "y" após essa variação de "x" para "x linha". O nosso modelo, então, ficaria, como vocês podem observar no slide: "y linha" é igual a "Beta 0" mais "Beta 1" "x linha" mais "u linha", isso após a variação em "x". Subtraindo a segunda equação da primeira, temos a seguinte formulação: a variação de "y" vai ser igual a "Beta 1" vezes a variação de "x" mais a variação de "u". Assim, para que o "Beta 1" seja o efeito da variação de "x" na variação de "y", terÃamos que supor que a variação dos erros seja 0, isto é, todos os demais fatores não observados que estão contidos em "u" e explicam "y" são considerados constantes após uma variação em "x". Isso significa que não há correlação estatÃstica entre "X" e "u". Assim, a mudança observada em "y" deve-se puramente à variação de "x". Dizemos, então que o "Beta 1" é o efeito causal de "x" em "y", que pode ser expresso pela seguinte equação: "Beta 1" será igual à variação de "y" sobre a variação de "x". Esse efeito causal é o que desejamos encontrar, independentemente da abordagem utilizada. Vamos ver agora um exemplo que ilustra esse argumento. Nesse exemplo, o nosso objetivo é entender o efeito da educação sobre o retorno salarial dos indivÃduos. Isto é, queremos responder à seguinte pergunta: "Será que estudar mais melhora os salários futuros dos indivÃduos?". PoderÃamos usar dados, por exemplo, da Pesquisa Nacional por Amostra de DomicÃlios, feita pelo IBGE anualmente, para fazer esse exercÃcio. Vamos verificar se conseguimos, a partir desses dados, um efeito causal com um modelo que procura encontrar o efeito de anos de escolaridade sobre o salário-hora dos indivÃduos. O salário, então, vai ser igual a um "Beta 0", mais "Beta 1" "anos de escolaridade" mais um termo de erro. Para que o "Beta 1" seja o efeito causal de uma variação de educação usando anos de escolaridade, como estamos fazendo, sobre os salários dos indivÃduos, terÃamos que supor que os demais fatores não observados que explicam os salários se mantêm constantes (que estão contidos no "u") mesmo após uma variação da educação. Ou seja, esses outros fatores que explicam o salário devem ser não-correlacionados com a educação. Mas conseguimos pensar algumas variáveis importantes que estão "u" e são potencialmente correlacionadas com a educação, como algumas habilidades cognitivas e emocionais. Ou seja, os indivÃduos que são mais hábeis, acabam estudando mais, e não conseguimos controlar esses fatores a partir dessa regressão. Assim, se estimássemos esse modelo, estarÃamos identificando uma correlação entre educação e salários, e não uma causalidade. Vamos, agora, resumir as etapas de uma análise empÃrica usando a abordagem reduzida e dados observados. Primeiro passo: a formulação da nossa questão de interesse ou seja, qual é o efeito da variável "x" sobre a variável "y"? O segundo passo seria a formulação do nosso modelo econométrico para identificar o efeito causal de "x" em "y", incluindo todas as variáveis importantes para esse modelo. O terceiro passo seria a coleta de dados primários ou obtenção de uma amostra de dados para testarmos essas informações. O quarto passo seria, então, a estimação dos parâmetros de interesse usando a amostra obtida do passo anterior. Por fim, o último passo é a realização de testes de hipóteses sobre os parâmetros desses efeitos. [MÚSICA] [MÚSICA]