Ce cours se concentre sur l'intégration des caractéristiques traditionnelles des bases de données avec les capacités de recherche vectorielle afin d'optimiser les performances et la rentabilité des applications de Génération augmentée de récupération (RAG) à grande échelle. Vous apprendrez à appliquer ces techniques clés :
1. Le prĂ©filtrage et le postfiltrage : Ces techniques permettent de filtrer les rĂ©sultats en fonction de conditions spĂ©cifiques. Le prĂ©filtrage est effectuĂ© au stade de la crĂ©ation de l'index de la base de donnĂ©es, tandis que le postfiltrage est appliquĂ© aprĂšs l'exĂ©cution de la recherche vectorielle. 2. Projection : Cette technique consiste Ă sĂ©lectionner un sous-ensemble des champs renvoyĂ©s par une requĂȘte afin de minimiser la taille du rĂ©sultat. 3. Reclassement : Cette technique consiste Ă rĂ©organiser les rĂ©sultats d'une recherche en fonction d'autres champs de donnĂ©es afin de placer les rĂ©sultats les plus souhaitĂ©s plus haut dans la liste. 4. Compression des invites : Cette technique est utilisĂ©e pour rĂ©duire la longueur des invites, dont le traitement peut ĂȘtre coĂ»teux dans les applications Ă grande Ă©chelle. Vous apprendrez Ă©galement, Ă l'aide d'exercices pratiques, Ă .. : 1. Mettre en Ćuvre la recherche vectorielle pour RAG en utilisant MongoDB. 2. DĂ©velopper un pipeline d'agrĂ©gation MongoDB Ă plusieurs Ă©tapes. 3. Utiliser les mĂ©tadonnĂ©es pour affiner et limiter les rĂ©sultats de recherche renvoyĂ©s par les opĂ©rations de base de donnĂ©es, en amĂ©liorant l'efficacitĂ© et la pertinence. 4. Rationaliser les rĂ©sultats des opĂ©rations de la base de donnĂ©es en incorporant une Ă©tape de projection dans le pipeline d'agrĂ©gation MongoDB, en rĂ©duisant la quantitĂ© de donnĂ©es renvoyĂ©es et en optimisant les performances, l'utilisation de la mĂ©moire et la sĂ©curitĂ©. 5. Reranker les documents pour amĂ©liorer la pertinence et la qualitĂ© de la recherche d'informations, et utiliser les valeurs des mĂ©tadonnĂ©es pour dĂ©terminer la position de rĂ©organisation. 6. Mettre en Ćuvre la compression rapide et acquĂ©rir une intuition sur la façon de l'utiliser et les avantages opĂ©rationnels qu'elle apporte aux applications LLM. Commencez Ă optimiser l'efficacitĂ©, la sĂ©curitĂ©, la vitesse de traitement des requĂȘtes et le coĂ»t de vos applications RAG avec la compression rapide et les techniques d'optimisation des requĂȘtes.










