Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 9 modules dans ce cours
Ce cours présente les concepts nécessaires et les techniques courantes d'analyse des données. L'accent est mis sur le processus d'analyse des données, y compris la préparation des données, l'analyse descriptive, l'entraînement des modèles et l'interprétation des résultats. Le processus commence par l'élimination des distractions et des anomalies, suivie de la découverte d'idées, de la formulation de propositions, de la validation de preuves et enfin de la construction de solutions de qualité professionnelle. Suivre le processus correctement, régulièrement et de manière transparente apporte de la crédibilité et augmente l'impact des résultats.
Ce cours couvrira des sujets tels que l'Analyse exploratoire des données (AED), la sélection des caractéristiques, la segmentation, les règles d'association, les plus proches voisins, le Clustering, l'Arbre de décision, la Régression linéaire, la Régression logistique et l'évaluation des performances. En outre, ce cours passera en revue la théorie statistique, l'algèbre matricielle et les techniques de calcul si nécessaire.
Ce cours prépare les étudiants à la préparation et à l'analyse des données. Outre le développement de codes Python pour l'exécution du processus, les étudiants apprendront à régler les outils logiciels pour une mise en œuvre plus efficace et des performances optimales. À la fin de ce cours, les étudiants auront construit leur inventaire de codes d'analyse de données et leur confiance pour défendre leurs propositions auprès des parties prenantes de l'entreprise.
Manuel requis : Ce cours ne nécessite aucun manuel car les notes de cours sont autonomes.
Matériel optionnel : A Practitioner's Guide to Apprentissage automatique (abrégé PGML pour la lecture) Configuration logicielle requise : Python version 3.11 ou supérieure avec les dernières versions compatibles des bibliothèques NumPy, SciPy, Pandas, Scikit-learn et Statsmodels. Pour réussir ce cours, les apprenants doivent posséder une connaissance de base de l'algèbre linéaire et des statistiques, de la théorie des ensembles de base et de la théorie des probabilités, et avoir des compétences de base en Python et en SQL. Quelques cours qui peuvent vous aider à vous équiper avec les connaissances de base de données nécessaires pour ce cours sont : Introduction aux bases de données relationnelles, Conception de bases de données relationnelles et Mise en œuvre et applications de bases de données relationnelles.
Bienvenue dans la section Préparation et analyse des données ! Le module 1 guide les étudiants dans l'art de créer des histogrammes informatifs et visuellement attrayants, un aspect fondamental de la visualisation des données. Les étudiants apprendront des techniques pour mesurer l'emplacement et l'échelle des données, comprendre les origines et les impacts du bruit et des valeurs manquantes dans les ensembles de données. Ce module présente également le Processus CRISP-DM, une approche structurée du Data mining, ainsi que le Modèle Analytique des données de Gartner pour une analyse des données avancée. En outre, les étudiants exploreront la distinction entre les données brutes et les informations traitées, un concept clé pour une interprétation efficace des données et la prise de décision.
Inclus
10 vidéos7 lectures4 devoirs1 sujet de discussion1 laboratoire non noté
Afficher les informations sur le contenu du module
10 vidéos•Total 54 minutes
Aperçu du cours•1 minute
Présentation de l'instructeur•1 minute
Module 1 Introduction•1 minute
Pourquoi analysons-nous les données ?•6 minutes
Processus d'analyse des données - Partie 1•7 minutes
Processus d'analyse des données - Partie 2•6 minutes
La première étape de la connaissance de vos données - Partie 1•8 minutes
La première étape de la connaissance de vos données - Partie 2•5 minutes
La première étape de la connaissance de vos données - Partie 3•9 minutes
La première étape de la connaissance de vos données - Partie 4•10 minutes
7 lectures•Total 290 minutes
Syllabus•10 minutes
Fichiers de données•60 minutes
Module 1 Introduction•30 minutes
Big data et IEEE 754•60 minutes
CRISP-DM2•60 minutes
Sélection de la taille des cases d'un histogramme temporel•60 minutes
Résumé du module 1•10 minutes
4 devoirs•Total 225 minutes
Pourquoi analysons-nous les données ?•15 minutes
Quiz sur le Processus d'analyse des données•15 minutes
Quiz sur la connaissance des données•15 minutes
Module 1 Évaluation sommative•180 minutes
1 sujet de discussion•Total 60 minutes
Rencontre et discussion•60 minutes
1 laboratoire non noté•Total 60 minutes
Module 1 Python Lab - VS Code•60 minutes
Module 2 : Mesurer et visualiser la corrélation
Module 2•10 heures à terminer
Détails du module
Le module 2 plonge dans les subtilités de l'analyse statistique, en commençant par une compréhension approfondie du concept de Valeur P et de sa Significativité statistique en tant qu'indicateur d'Erreur de type I. Les étudiants apprendront à appliquer des tests statistiques en Python pour identifier les caractéristiques significativement corrélées, en explorant diverses métriques de corrélation adaptées aux caractéristiques catégorielles, de type mixte et continues. Ce module met l'accent sur l'application pratique, en dotant les étudiants des compétences nécessaires pour calculer et interpréter ces métriques en Python, améliorant ainsi leur capacité à mener des analyses de données sophistiquées et à tirer des conclusions significatives à partir d'ensembles de données complexes.
Inclus
7 vidéos5 lectures4 devoirs1 laboratoire non noté
Afficher les informations sur le contenu du module
7 vidéos•Total 54 minutes
Module 2 Introduction•2 minutes
Découvrir et mesurer les associations - Partie 1•10 minutes
Découvrir et mesurer les associations - Partie 2•10 minutes
Associations de mesures - Partie 1•8 minutes
Associations de mesures - Partie 1 (suite)•7 minutes
Associations de mesures - Partie 2•9 minutes
Associations de mesures - Partie 2 (suite)•9 minutes
5 lectures•Total 250 minutes
Module 2 Introduction•60 minutes
Données sur les courses de taxis à Chicago•60 minutes
Corrélation avec Python•60 minutes
Eta-carré•60 minutes
Résumé du module 2•10 minutes
4 devoirs•Total 225 minutes
Quiz sur la corrélation des caractéristiques continues•15 minutes
Corrélation entre les caractéristiques des types mixtes•15 minutes
Moyen d'arriver à une fin pour le Quiz sur la projection des films•15 minutes
Module 2 Évaluation sommative•180 minutes
1 laboratoire non noté•Total 60 minutes
Module 2 Python Lab - VS Code•60 minutes
Module 3 : Analyse du panier de la ménagère
Module 3•9 heures à terminer
Détails du module
Le module 3 offre une plongée profonde dans le monde des règles d'association, enseignant aux étudiants comment improviser ces règles pour identifier des combinaisons de caractéristiques précieuses qui génèrent des valeurs d'étiquettes spécifiques. Les apprenants maîtriseront la définition de seuils appropriés pour l'Assistance informatique et la Confiance et acquerront une compréhension complète de l'algorithme Apriori et de l'importance des ensembles d'éléments fréquents au sein de cet algorithme. Ce module couvre le calcul des métriques communes pour les règles d'association, en familiarisant les étudiants avec la terminologie pertinente. En outre, les apprenants exploreront l'application pratique des règles d'association dans l'analyse des paniers de marché, y compris les stratégies de vente croisée, de vente incitative et de regroupement de produits, les dotant ainsi de compétences précieuses pour la prise de décision fondée sur les données dans les contextes commerciaux.
Inclus
7 vidéos5 lectures3 devoirs1 laboratoire non noté
Afficher les informations sur le contenu du module
7 vidéos•Total 46 minutes
Module 3 Introduction•1 minute
Qu'y a-t-il dans votre panier ?•7 minutes
Qu'y a-t-il dans votre panier ? - Partie 2•6 minutes
Comment les règles de l'association sont-elles découvertes - Partie 1•9 minutes
Comment les règles de l'association sont-elles découvertes - Partie 2•8 minutes
Que peuvent m'apprendre les règles de l'association - Partie 1•8 minutes
Que peuvent m'apprendre les règles de l'association - Partie 2•6 minutes
5 lectures•Total 200 minutes
PGML Chapitre 3•60 minutes
Vente croisée•60 minutes
Algorithme Apriori et règles d'association•60 minutes
Résumé du module 3•10 minutes
Les points de vue d'un leader de l'industrie : En savoir plus sur notre programme•10 minutes
3 devoirs•Total 210 minutes
Quiz sur l'analyse du panier de consommation•15 minutes
Quiz sur la découverte des règles d'association•15 minutes
Module 3 Évaluation sommative•180 minutes
1 laboratoire non noté•Total 60 minutes
Module 3 Python Lab - VS Code•60 minutes
Module 4 : Partitionnement, segmentation et regroupement des observations
Module 4•10 heures à terminer
Détails du module
Dans le module 4, les étudiants apprendront à décrire et à interpréter les profils des clusters, en acquérant des compétences dans le déploiement des algorithmes de clustering K-Moyennes et K-Modes. Ils exploreront l'application de l'analyse de fréquence, de récence et monétaire (RFM) pour identifier les clients les plus précieux dans le secteur de la vente au détail. Le module couvre également la technique de l'Échantillonnage aléatoire simple avec la possibilité d'incorporer des variables de stratification, améliorant ainsi la précision de l'analyse des données. En outre, il souligne l'importance de la validation objective des modèles à l'aide d'une partition de test, garantissant la fiabilité et l'efficacité des modèles analytiques dans les scénarios du monde réel.
Inclus
8 vidéos5 lectures4 devoirs1 laboratoire non noté
Afficher les informations sur le contenu du module
8 vidéos•Total 70 minutes
Module 4 Introduction•1 minute
Observations de partition pour les modèles de formation - Partie 1•10 minutes
Observations de partition pour les modèles de formation - Partie 2•12 minutes
Créer des segments d'observations pour des raisons commerciales - Partie 1•10 minutes
Créer des segments d'observations pour des raisons commerciales - Partie 2•10 minutes
Placer les observations ayant des valeurs de caractéristiques similaires dans des grappes - Partie 1•10 minutes
Placer les observations ayant des valeurs de caractéristiques similaires dans des grappes - Partie 2•11 minutes
Placer les observations ayant des valeurs de caractéristiques similaires dans des grappes - Partie 3•8 minutes
5 lectures•Total 220 minutes
PGML Chapitre 4•30 minutes
Techniques d'échantillonnage•60 minutes
RFM•60 minutes
Clustering•60 minutes
Résumé du module 4•10 minutes
4 devoirs•Total 225 minutes
Partition des observations pour les modèles d'entraînement Quiz•15 minutes
Quiz sur les segments d'observation•15 minutes
Quiz sur les grappes•15 minutes
Module 4 Évaluation sommative•180 minutes
1 laboratoire non noté•Total 60 minutes
Module 4 Python Lab - VS Code•60 minutes
Module 5 : Régression linéaire
Module 5•10 heures à terminer
Détails du module
Ce module approfondit l'analyse de l'importance des caractéristiques dans l'apprentissage automatique, couvrant les valeurs de Shapley, les méthodes de sélection des caractéristiques, l'évaluation statistique, l'interaction des caractéristiques, l'aliasing, et l'algorithme des moindres carrés. Les étudiants seront capables de maîtriser ces concepts pour construire des modèles robustes et interprétables.
Inclus
8 vidéos5 lectures4 devoirs1 laboratoire non noté
Afficher les informations sur le contenu du module
8 vidéos•Total 53 minutes
Module 5 Introduction•1 minute
Modèle de régression linéaire - Partie 1•10 minutes
Modèle de régression linéaire - Partie 2•5 minutes
Sélection de l'avant - Partie 1•8 minutes
Sélection de l'avant - Partie 2•4 minutes
Importance de la fonctionnalité - Partie 1•9 minutes
Importance de la fonctionnalité - Partie 2•8 minutes
Importance de la fonctionnalité - Partie 3•7 minutes
5 lectures•Total 250 minutes
Analyse de régression linéaire•60 minutes
Régression des moindres carrés•60 minutes
Régression progressive avant et arrière•60 minutes
Valeurs de Shapley•60 minutes
Résumé du module 5•10 minutes
4 devoirs•Total 225 minutes
Quiz sur le modèle de régression linéaire•15 minutes
Sélection de caractéristiques Quiz•15 minutes
Quiz sur l'importance des fonctionnalités•15 minutes
Module 5 Évaluation sommative•180 minutes
1 laboratoire non noté•Total 60 minutes
Module 5 Python Lab - VS Code•60 minutes
Module 6 : Régression logistique binaire
Module 6•9 heures à terminer
Détails du module
Dans le module 6, les étudiants maîtriseront l'art de la sélection des caractéristiques dans l'apprentissage automatique en explorant la méthode de sélection avant et arrière, la méthode des sous-ensembles possibles et le concept de séparation complète et quasi-complète. Les étudiants découvriront également des règles d'association pour identifier les séparations, interpréteront les paramètres du modèle et les probabilités prédites, et approfondiront les concepts d'Estimation du maximum vraisemblance, de cotes et de rapports de cotes.
Inclus
6 vidéos5 lectures4 devoirs1 laboratoire non noté
Afficher les informations sur le contenu du module
6 vidéos•Total 34 minutes
Module 6 Introduction•1 minute
Régression logistique - Partie 1•6 minutes
Régression logistique - Partie 2•7 minutes
SELECT INTO•9 minutes
Interpréter le modèle et évaluer les performances - Partie 1•8 minutes
Interpréter le modèle et évaluer les performances - Partie 2•4 minutes
5 lectures•Total 220 minutes
PGML Chapitre 6•30 minutes
Analyse prédictive•60 minutes
SELECT INTO•60 minutes
Meilleur R-carré pour la régression logistique•60 minutes
Résumé du module 6•10 minutes
4 devoirs•Total 225 minutes
Quiz sur la régression logistique•15 minutes
Quiz sur la sélection de l'attaquant•15 minutes
La bénédiction et la malédiction d'un trop grand nombre de prédicteurs Quiz•15 minutes
Le module 7 donnera aux étudiants la capacité d'exploiter la puissance des modèles arborescents pour découvrir des modèles cachés dans vos données. Les étudiants seront capables de décrire efficacement les clusters, de définir intelligemment les paramètres des algorithmes, de construire des règles d'entreprise à partir des résultats des arbres, et d'utiliser les métriques de variance, les valeurs d'entropie et les indices de Gini pour une construction optimale des arbres.
Inclus
7 vidéos5 lectures4 devoirs1 laboratoire non noté
Afficher les informations sur le contenu du module
7 vidéos•Total 37 minutes
Module 7 Introduction•1 minute
Motivation des arbres décisionnels - Partie 1•6 minutes
Motivation des arbres décisionnels - Partie 2•5 minutes
L'algorithme CART - Partie 1•3 minutes
L'algorithme CART - Partie 2•9 minutes
Profilage des grappes - Partie 1•4 minutes
Profilage des grappes - Partie 2•7 minutes
5 lectures•Total 220 minutes
PGML Chapitre 5•30 minutes
CART•60 minutes
CART en tant qu'équation•60 minutes
Arbre décisionnel pour le clustering•60 minutes
Résumé du module 7•10 minutes
4 devoirs•Total 225 minutes
Quiz sur la motivation des arbres décisionnels•15 minutes
Quiz sur l'algorithme CART•15 minutes
Quiz sur le profilage des clusters•15 minutes
Module 7 Évaluation sommative•180 minutes
1 laboratoire non noté•Total 60 minutes
Module 7 Python Lab - VS Code•60 minutes
Module 8 : Évaluation de la performance des modèles
Module 8•9 heures à terminer
Détails du module
Le module 8 plonge dans le domaine des métriques d'évaluation des modèles d'apprentissage automatique. Les étudiants maîtriseront les concepts de courbes de précision et de rappel, de courbes de lift et de courbes de caractéristiques d'exploitation du récepteur (ROC). En outre, ils seront en mesure de découvrir des méthodes de calcul des seuils de probabilité à l'aide des statistiques de Kolmogorov-Smirnov et des F1-score. Ils pourront explorer des mesures telles que le taux de classification erronée, l'aire sous la courbe (AUC) et l'erreur quadratique moyenne (RMSE), ainsi que des techniques de calcul de la RMSE et de détection d'observations gravement mal ajustées à l'aide de résidus spécifiques au modèle.
Inclus
8 vidéos5 lectures4 devoirs1 laboratoire non noté
Afficher les informations sur le contenu du module
8 vidéos•Total 43 minutes
Module 8 Introduction•1 minute
Modèles de prédiction•8 minutes
Modèles de classification nominaux•6 minutes
Modèles de classification binaire - Partie 1•4 minutes
Modèles de classification binaire - Partie 2•6 minutes
Modèles de classification binaire - Partie 3•5 minutes
Modèles de classification binaire - Partie 4•6 minutes
Modèles de classification binaire - Partie 5•7 minutes
5 lectures•Total 235 minutes
PGML Chapitre 7, 8•45 minutes
Valeurs aberrantes•60 minutes
Courbe ROC•60 minutes
Utilisation de l'analyse de la vie•60 minutes
Résumé du module 8•10 minutes
4 devoirs•Total 225 minutes
Quiz sur les métriques pour les modèles de prédiction•15 minutes
Quiz sur les métriques pour les modèles de classification•15 minutes
Graphiques pour les modèles de classification Quiz•15 minutes
Module 8 Évaluation sommative•180 minutes
1 laboratoire non noté•Total 60 minutes
Module 8 Python Lab - VS Code•60 minutes
Évaluation sommative du cours
Module 9•3 heures à terminer
Détails du module
Ce module contient l'évaluation sommative du cours qui a été conçue pour évaluer votre compréhension du matériel du cours et votre capacité à appliquer les connaissances que vous avez acquises tout au long du cours. Veillez à bien réviser le matériel de cours avant de passer l'évaluation.
Inclus
1 devoir
Afficher les informations sur le contenu du module
1 devoir•Total 180 minutes
Évaluation sommative du cours•180 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par Illinois Tech. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
Consulter les diplômes éligibles
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par Illinois Tech. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
¹La réussite de la candidature et de l'inscription est requise. Les conditions d'admissibilité s'appliquent. Chaque établissement détermine le nombre de crédits reconnus en complétant ce contenu qui peut compter pour les exigences du diplôme, en tenant compte de tout crédit existant que vous pourriez avoir. Cliquez sur un cours spécifique pour plus d'informations.
Illinois Tech est une université de recherche privée de premier plan, classée au niveau national, qui propose des programmes d'ingénierie, d'informatique, d'architecture, de design, de sciences, de commerce, de sciences humaines et de droit. L'université propose des licences en sciences, des maîtrises en sciences, des maîtrises professionnelles et des doctorats, ainsi que des certificats dans les domaines très demandés des STIM et dans d'autres domaines d'innovation. Des étudiants talentueux du monde entier choisissent d'étudier à Illinois Tech en raison de l'accès aux opportunités du monde réel, des programmes académiques renommés, de la valeur élevée et des perspectives de carrière des diplômés.
OK
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.