[MÚSICA] Olá pessoal, bem-vindos a esse módulo de mapeamento de padrão de compras com base cesta de produtos. O core, a parte central, o mais importante desse módulo é que a gente vai entender o que são as regras de associação, como a gente calcula as regras de associação, a gente cria as regras e como a gente avalia a qualidade dessas regras utilizando métricas como suporte, confiança e o lift. Depois, a gente vai pegar e colocar tudo isso prática usando Python. Mapear padrão de compras através de regras de associação é uma das bases para a gente criar sistemas de recomendação. Sistemas de recomendação, eles valem para tanto o comércio eletrônico, e-commerce, como eles valem para as lojas fÃsicas. Quando a gente está usando a gente tá num ambiente, num modelo de negócio de comércio eletrônico, a gente pode usar aquela famosa relação: quem comprou isso aqui também vai querer comprar aquilo lá. E a Amazon, ela utiliza o sistema de recomendações e conta-se que ela aumentou muito o faturamento a partir do momento que ela começou a utilizar esse recurso. Quando a gente termina uma compra, geral, ela já te oferece outras coisas e vocês vão reparar que, geral, são coisas que a gente bate o olho e a gente vê que são coisas que de alguma forma despertam o nosso interesse. Quando a gente vai para o mundo das lojas fÃsicas, a gente também consegue aplicar regras de associação, mesmo no mundo fÃsico. Não precisa ser só no mundo do comércio eletrônico. Nas lojas fÃsicas, por exemplo, a gente pode pegar, colocar produtos perto do outro. Uma coisa que a gente costuma ver muito supermercados, mercados, são aquelas ilhas que têm algum tipo de produto promoção e tal. Então, se a gente pegar e tiver as regras de associação que a gente se sabe quais produtos têm relações fortes entre eles, e a gente vai ver como calcular isso ao longo desse módulo, a gente pode, por exemplo, colocar produto promoção do lado de outro produto que tem uma relação forte. Por exemplo, a gente faz uma promoção de queijo e, ao lado, a gente coloca, por exemplo, kit que tem uma tábua e utensÃlios para você servir o queijo. Qual que é a estratégia por trás disso? A gente faz a promoção no queijo, e eventualmente a gente prejudica pouco a nossa margem, mas, por outro lado, a gente coloca produto que a gente sabe que tem uma forte relação de compra do lado com uma margem melhor na esperança de que quem pega, eventualmente, a promoção, leve também esse outro produto onde tem a margem melhor. A base desse tipo de algoritmo que a gente usa o princÃpio dele, a gente chama de apriori. Parece português, né? "À priori", e tal, mas, na verdade, não. É tudo junto: apriori. É o nome desse princÃpio desse algoritmo. E o paper seminal, ou seja, que lançou as bases para esse algoritmo é de 1994. Eu coloquei isso no material complementar de vocês. Vale a pena vocês darem uma olhada. O autor é Agrawal, como eu falei de 1994, e ele trabalhava no Centro de Pesquisa da IBM. O nome do artigo é "Fast Algorithms for Mining Association Rules in Large Databases", que basicamente é o que a gente vai fazer aqui. As regras de associação, elas estão muito relacionadas com data mining ou com mineração de dados. E existe caso, particularmente, que ele é super famoso, que é a história do caso das fraldas e das cervejas. Por que é que ele ficou famoso? Porque ele é interessante, né? Na verdade, a gente achou uma correlação, uma regra de associação entre dois produtos que ela não era esperada por ninguém. Quando a gente fala de queijo, de utensÃlio para queijo, já é exemplo didático, porque na prática já é uma coisa que é esperada. Mas essa história das fraldas e das cervejas, ele é interessante justamente porque ele era, não era uma relação, uma correlação esperada, tá? Só que, infelizmente, ele não é caso real. Ele é caso folclórico, e no material complementar, eu coloquei todas as referências e a história. Mas a gente vai utilizar isso como alguns exemplos aqui, porque, didaticamente, ele é muito bom. E como professor meu costumava dizer: "Se non è vero, almeno è ben trovato"; que italiano significa que "pode até não ser verdade, mas pelo menos é uma história boa". E, como eu falei, ele vai ser extremamente interessante para ilustrar o nosso caso. Antes da gente pegar e falar especificamente sobre as regras de associação e, particularmente, como é que a gente vai usar isso no Python, a gente precisa falar de métricas e a gente vai ver isso na próxima aula. [MÚSICA]