[MÚSICA] Olá pessoal, bem vindos de volta, a mais módulo aonde a gente vai falar agora sobre similaridade, que também é uma das bases para o sistema de recomendação. Nós já vimos as regras de associação. A gente utiliza similaridade para prever e montar uma lista de produtos que cliente provavelmente vai comprar. Assim como as regras de associação, essa também é uma das bases do sistema de recomendação, dos sistemas de recomendação. Esses sistemas de recomendação eles têm se tornado cada vez mais populares, recomendando não apenas produtos, mas também filmes como por exemplo é o caso do Netflix, e músicas, como é o caso do Spotify. Para trabalhar com similaridade, a gente tem dois métodos, a filtragem colaborativa, e a filtragem baseada conteúdo. O método de filtragem colaborativa, ele é baseado comportamentos anteriores dos usuários. como, por exemplo, as páginas que eles visualizaram, os produtos que eles compraram ou as avaliações que eles deram itens diferentes. A abordagem de filtragem colaborativa usa esses dados para encontrar semelhanças entre usuários, e recomendar itens ou conteúdos mais semelhantes a outros usuários. Com base nessa suposição, se uma pessoa comprou os itens A, B, C e uma outra pessoa comprou os itens A, B e D no passado, então, a primeira pessoa provavelmente vai querer comprar o item D, e a outra pessoa provavelmente vai querer comprar o item C. Por quê? Porque esses usuários compartilham semelhanças, ou seja, filtragem colaborativa, ela busca uma similaridade entre usuários, partindo da seguinte premissa, se gostou, o outro também vai gostar, já a filtragem baseada conteúdo, ela produz uma lista de recomendações baseadas nas caracterÃsticas de item. De uma forma geral, ela analisa as palavras chaves que descrevem as caracterÃsticas de item, ou seja, os atributos. O pressuposto que está por trás do método de filtragem baseado conteúdo é que os usuários eles são propensos a visualizar ou comprar itens, semelhantes aos itens que eles compraram ou visualizaram no passado. Por exemplo, se usuário gostou de determinado tipo de música, e já ouviu essa música no passado, o método de filtragem baseado conteúdo vai recomendar músicas, que sejam de tipo semelhante, porque as músicas com conteúdo compartilham caracterÃsticas semelhantes, ou seja, filtragem baseada conteúdo foca nos atributos dos itens, se o usuário gostou de uma música tipo A, ele também vai gostar de outra música no mesmo tipo. A gente vê isso no Netflix, uma pessoa que gosta muito de filmes de ação, provavelmente a gente vai recomendar para essa pessoa outros filmes de ação. Se uma pessoa assiste muitos filmes de drama, do tipo drama, a gente recomenda para essas pessoas outros filmes que também tenham esse atributo que é o tipo, o ser do tipo drama, e a gente pode avançar para romance, para super heróis enfim, há uma infinidade aà de tags, ou de caracterÃsticas dos filmes. O Netflix tem uma equipe grande que fica somente colocando os tags nos filmes e nas séries, ou seja, atribuindo caracterÃsticas de conteúdo para cada filme. O que não deve ser nada mal, ganhar dinheiro para ficar o dia inteiro vendo filme. Muito bom. Para encerrar vamos dar uma olhada nessa ilustração, só para reforçar esse conceito da filtragem colaborativa que está do lado esquerdo e da filtragem baseada conteúdo que está do seu lado direito. Na filtragem colaborativa, a partir da leitura que ambos os usuários fazem a gente percebe que os usuários são similares, ou seja, se ela lê alguma coisa e ela gosta, a gente indica para ele, por quê? A similaridade é entre os usuários. Na filtragem baseada conteúdo, se o usuário lê documento, a gente pode oferecer para ele outro documento que é similar ao que ele já leu, e que indicou que ele gostou, ou seja, a similaridade é entre os conteúdos, os itens, não entre os usuários. Nesse módulo a gente vai focar na filtragem colaborativa, e na próxima aula a gente vai ver como é que a gente calcula a similaridade. [MÚSICA]