[MÚSICA] [ÁUDIO_EM_BRANCO] Olá, nessa video aula nós vamos continuar praticando o cálculo da distância euclidiana usando o software excel. E nós vamos fazer exercício também simples usando uma base de dados chamado renda idade. Quando você abrir essa base você vai notar que tem, de novo, duas planilhas uma com o roteiro e uma com os dados. Vamos ver primeiro os dados depois nós voltamos ao roteiro. Nós temos aqui 3 indivíduos que a gente chama de A, B e C e as rendas que eles têm anuais medida, por exemplo, milhares de unidades monetárias e aqui temos a idade dos indivíduos medida anos. Note que aqui do lado nós temos a mesma idade medida meses, por isso se você iluminar a célula você vai ver que nada mais é do que o número de anos vezes doze. O que nós queremos com esse exercício além de continuar praticando o cálculo de distâncias euclidianas com você é mostrar se existe uma influência na hora que a gente muda a unidade de uma variável, ou seja, se a gente calcular para a variável renda de uma única forma mais a variável idade medida anos e depois repetir para a variável idade medida meses, será que isso vai afetar o cálculo da distância euclidiana? Essa é a dúvida, a inquietude que nós temos com esse exercício. Como que a gente faria o cálculo? Esse roteiro é exatamente igual ao anterior e por isso eu vou direto mostrar para você como que a gente poderia fazer. Bastaria eu fazer uma tabela, que eu posso copiar de cima, aquelas 3 unidades para cá. Vamos fazer agora a cópia dessa coluna de forma transposta usando o comando na página inicial que é o colar, colar especial, transpor. Muito bem. Agora eu calcularia aqui a distância, como a gente fez anteriormente, só para vocês lembrarem da variável renda, dela com ela mesma, daria obviamente zero. Depois nós teríamos da variável do indivíduo A, menos a variável do indivíduo B e assim por diante. Essa seria a nossa matriz de distância da variável renda. Poderia fazer a mesma coisa agora para a variável idade, ou anos ou meses. De novo, para que a gente ganhe tempo, eu vou fechar esse arquivo e abrir o outro que já tem a solução pronta, que é idade renda solução. E chamar a atenção que essa planilha roteiro é exatamente igual a anterior mas, quando a gente vai para a solução vocês estão vendo aqui a base de dados e aqui as distâncias todas calculadas. Lembre-se sempre que a diagonal é zero por que a distância do indivíduo C com C ou B com B ou A com A, a distância dele com ele mesmo é sempre zero. As distâncias são, àquelas que a gente estava mostrando para você, nada mais é do que aquela fórmula 34- 23 e assim por diante. Lembre-se também, como nós vimos na aula anterior que o lado de cima da diagonal é exatamente o reflexo do lado de baixo da diagonal. Essas são as distâncias da variável renda e essas são as distâncias da variável idade. Nesta primeira tabela a variável idade está medida anos. Eu coloquei até vermelho para você não confundir. E aqui está medida meses. A variável idade medida anos a distância é 27 para 34, estamos falando de menos 7 anos, e assim por diante. Já meses você vai ver que a distância dá 84 meses, por que eu tenho que fazer 324 menos 408, obviamente que 7 vezes 12 vai dar O que eu quero aqui é que você preste atenção agora no cálculo da distância euclidiana, ou seja, a distância combinada. Você se lembra da fórmula? Basta pegar e somar 11 ao quadrado, que é a cédula B9. Mais a célula G9 ao quadrado. Fecha o parêntese, eleva ao quadrado. E depois, tiro a raiz quadrada. Ou seja, temos a distância 13. Agora se a gente fizesse o cálculo usando a idade anos, essas seriam as distâncias, a gente ia dizer que não estão muito distantes os elementos da nossa matriz. Quando a gente faz o mesmo cálculo usando a idade meses, ou seja, agora eu vou pegar e fazer a fórmula elevando 11 ao quadrado mais menos 84 ao quadrado e depois fazendo a raiz quadrada, você vai ver que a distância ficou muito maior. Se antes era 13, agora passa a dar 84 e isso muda totalmente as nossas decisões de marketing ou também os nossos cálculos. Ou seja, as distâncias são diferentes quando a unidade da variável se altera. Por isso é que análise de cluster é fundamental a gente ter as medidas expressas unidades homogêneas, de preferência na mesma unidade ou números compatíveis e comparáveis. Nós vamos depois aprender procedimento Stata, que significa padronizar a variável para evitar qualquer distorção, uma vez que acabamos de ver que a unidade da variável pode levar sim a conclusões distintas, diferentes e muitas vezes erradas. Aqui nós terminamos essa video aula e nós estamos prontos agora para fazer cluster análises Stata.