Écrivez un programme de scraping web pour extraire des données d'un fichier HTML à l'aide de requêtes HTTP et convertissez les données en un cadre de données.
Préparez les données pour la modélisation en traitant les valeurs manquantes, en formatant et en normalisant les données, en les regroupant et en transformant les valeurs catégorielles en valeurs numériques.
Interpréter les données à l'aide de techniques d'analyse exploratoire des données en calculant des statistiques descriptives, en établissant des graphiques et en générant des statistiques de corrélation.
Créez une application Shiny contenant une carte Leaflet et un tableau de bord interactif, puis créez une présentation du projet à partager avec vos pairs.
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 6 modules dans ce cours
Dans ce cours capstone, vous appliquerez diverses compétences et techniques de science des données que vous avez apprises dans le cadre des cours précédents de la spécialisation IBM Data Science with R ou du certificat professionnel IBM Data Analytics with Excel and R. Pour ce projet, vous assumerez le rôle d'un Data Scientist qui a récemment rejoint une organisation et à qui l'on présente un défi qui nécessite la collecte de données, l'analyse, les tests d'hypothèses de base, la visualisation et la modélisation à effectuer sur des ensembles de données du monde réel. Vous collecterez et comprendrez des données provenant de sources multiples, effectuerez le traitement et la préparation des données avec Tidyverse, réaliserez une analyse exploratoire des données avec SQL, Tidyverse et ggplot2, modéliserez les données avec la régression linéaire, créerez des graphiques et des diagrammes pour visualiser les données et construirez un tableau de bord interactif. Le projet se terminera par une présentation de votre rapport d'analyse des données, avec un résumé exécutif pour les différentes parties prenantes de l'organisation.
Dans ce module, vous découvrirez le scénario du projet de référence et le problème réel que vous résoudrez tout au long de ce cours. Vous commencerez à appliquer les techniques d'acquisition de données apprises dans les cours précédents pour collecter les données du projet à partir de sources multiples. Vous collecterez des données en utilisant des méthodes de web scraping pour extraire des informations des pages HTML et vous utiliserez des requêtes API pour récupérer des données externes telles que des informations météorologiques. Les ensembles de données collectées seront organisés dans des formats structurés, ce qui les préparera à une analyse plus poussée dans les étapes suivantes du projet.
Afficher les informations sur le contenu du module
2 vidéos•Total 4 minutes
Introduction à la science des données avec R Projet Capstone•2 minutes
Collecte de données sur les conditions météorologiques et la demande de vélopartage•2 minutes
1 lecture•Total 2 minutes
Aperçu du cours•2 minutes
1 devoir•Total 6 minutes
Points de contrôle•6 minutes
3 éléments d'application•Total 180 minutes
(Facultatif) Obtenir un code de caractéristique pour IBM Cloud•60 minutes
Laboratoire pratique : Complétez la collecte de données avec le carnet de notes Web Scraping•60 minutes
Laboratoire pratique : Complétez la collecte de données avec le carnet de notes de l'API OpenWeather•60 minutes
5 plugins•Total 75 minutes
Vue d'ensemble de Capstone•15 minutes
(Facultatif) Labo pratique : Création d'un compte IBM Cloud•15 minutes
Aperçu de la collecte des données•15 minutes
(Facultatif) Labo pratique : Complétez la collecte de données avec le carnet de notes Web Scraping•15 minutes
(Facultatif) Laboratoire pratique : Complétez la collecte de données avec le carnet de notes de l'API OpenWeather•15 minutes
Module 2 - Traitement des données
Module 2•4 heures à terminer
Détails du module
Dans ce module, vous appliquerez les techniques de traitement des données apprises dans les cours précédents afin de nettoyer et de préparer les ensembles de données collectées pour l'analyse. À partir des données recueillies dans le module 1, vous transformerez les données brutes en un format structuré et prêt à être analysé. Vous nettoierez les données textuelles, normaliserez les variables, traiterez les valeurs manquantes et effectuerez des transformations de données telles que l'encodage et la normalisation. À la fin de ce module, vous aurez préparé un ensemble de données fiable qui permettra une exploration et une modélisation significatives dans les étapes ultérieures du projet.
Inclus
1 vidéo1 devoir2 éléments d'application3 plugins
Afficher les informations sur le contenu du module
1 vidéo•Total 3 minutes
Traitement des données•3 minutes
1 devoir•Total 12 minutes
Points de contrôle•12 minutes
2 éléments d'application•Total 120 minutes
Labo pratique : Bloc-notes complet sur le traitement des données à l'aide d'expressions régulières•60 minutes
Laboratoire pratique : Traitement complet des données avec dplyr Notebook•60 minutes
3 plugins•Total 125 minutes
Vue d'ensemble du traitement des données•5 minutes
(Optionnel) Labo pratique : Carnet de notes sur le Data wrangling avec les expressions régulières•60 minutes
(Optionnel) Laboratoire pratique : Data wrangling complet avec dplyr Notebook•60 minutes
Module 3 : Analyse exploratoire des données avec SQL, Tidyverse et ggplot2
Module 3•4 heures à terminer
Détails du module
A ce stade du projet, vous appliquerez les compétences en matière de collecte et de traitement des données développées dans les modules précédents, ainsi que votre expérience en matière de requêtes SQL et de visualisation des données. Ce module se concentre sur l'analyse exploratoire des données (AED) afin de mieux comprendre les modèles, les relations et les tendances au sein des ensembles de données préparés. Vous travaillerez avec les ensembles de données générés dans les modules précédents afin d'explorer les variables clés, d'identifier les informations significatives et de préparer les données pour la modélisation prédictive. Si vous avez rencontré des difficultés lors des étapes précédentes, des ensembles de données préparés sont disponibles pour vous aider à continuer à progresser dans le projet. Dans ce module, vous effectuerez une série de travaux pratiques qui vous guideront à travers les étapes essentielles de l'analyse exploratoire.
Inclus
1 vidéo1 devoir3 éléments d'application3 plugins
Afficher les informations sur le contenu du module
1 vidéo•Total 2 minutes
Analyse exploratoire des données•2 minutes
1 devoir•Total 12 minutes
Points de contrôle•12 minutes
3 éléments d'application•Total 180 minutes
Labo pratique : Complétez le laboratoire AED avec SQL en utilisant RSQLite•60 minutes
(Facultatif) Labo pratique : Complétez le laboratoire AED avec SQL en utilisant RODBC avec IBM DB2•60 minutes
Labo pratique : Complétez le laboratoire EDA avec visualisation des données•60 minutes
3 plugins•Total 45 minutes
(Optionnel) Labo pratique : Chargez des données dans Db2 sur IBM Cloud•15 minutes
(Facultatif) Labo pratique : Complétez le laboratoire AED avec SQL sur IBM Watson Studio•15 minutes
(Facultatif) Labo pratique : Complétez le laboratoire AED avec Visualisation des données•15 minutes
Module 4 : Analyse prédictive
Module 4•4 heures à terminer
Détails du module
Dans ce module, vous appliquerez des techniques de modélisation de régression pour construire des modèles prédictifs de la demande de vélos en libre-service à l'aide de l'ensemble de données préparé. En vous appuyant sur les concepts de modélisation appris précédemment, vous construirez et affinerez des modèles de régression multiple afin d'améliorer la précision de la prédiction. Vous évaluerez les performances du modèle à l'aide de mesures statistiques appropriées et interpréterez la contribution des différentes variables prédictives. Cette étape représente la transition de l'exploration des données à l'analyse prédictive dans le cadre de votre travail de fin d'études.
Inclus
1 vidéo1 devoir2 éléments d'application2 plugins
Afficher les informations sur le contenu du module
1 vidéo•Total 2 minutes
Modèles de régression•2 minutes
1 devoir•Total 12 minutes
Points de contrôle•12 minutes
2 éléments d'application•Total 120 minutes
Labo pratique : Complétez le laboratoire de construction d'un modèle de régression de base•60 minutes
Labo pratique : Complétez le laboratoire Améliorer le modèle linéaire•60 minutes
2 plugins•Total 135 minutes
Lecture : Prévoir la demande de vélos en libre-service à l'aide de modèles de régression•15 minutes
(Facultatif) Laboratoire pratique : Complétez le laboratoire "Améliorer le modèle linéaire"•120 minutes
Module 5 - Construire une application de tableau de bord R Shiny
Module 5•4 heures à terminer
Détails du module
Dans ce module, vous appliquerez vos compétences en visualisation de données et en développement d'applications pour créer un tableau de bord interactif qui présente les résultats de votre analyse prédictive. En utilisant R Shiny et des outils de visualisation, vous concevrez un tableau de bord qui permettra aux utilisateurs d'explorer la demande prédite de vélos en libre-service dans différents lieux. Ce module se concentre sur la transformation des résultats analytiques en outils visuels interactifs qui soutiennent la prise de décision basée sur les données.
Inclus
1 vidéo1 devoir1 laboratoire non noté3 plugins
Afficher les informations sur le contenu du module
1 vidéo•Total 2 minutes
Construire un tableau de bord avec R Shiny•2 minutes
1 devoir•Total 10 minutes
Points de contrôle•10 minutes
1 laboratoire non noté•Total 60 minutes
Laboratoire pratique : Construire une application de prédiction de la demande de vélos en libre-service (à l'aide des Coursera Labs)•60 minutes
3 plugins•Total 195 minutes
(Facultatif) Lab : Démarrer avec Posit Cloud•15 minutes
(Optionnel) Labo pratique (Partie A) : Construire une application de prédiction de la demande de partage de vélos avec R Shiny et Leaflet (en utilisant Posit Cloud)•90 minutes
(Facultatif) Labo pratique (Partie B) : Améliorez l'application de prédiction de la demande de vélopartage avec des parcelles de détails de la ville (en utilisant Posit Cloud)•90 minutes
Module 6 - Présentez vos idées basées sur les données
Module 6•3 heures à terminer
Détails du module
Dans ce dernier module, vous consoliderez les résultats de votre projet de base dans une présentation professionnelle qui communiquera votre flux de travail, votre analyse, vos idées et vos résultats prédictifs. Vous préparerez une présentation structurée qui mettra en évidence le problème du projet, la méthodologie, les résultats clés et les conclusions. Ce module représente le point culminant de votre parcours d'apprentissage, où vous démontrez votre capacité à appliquer des compétences en science des données pour résoudre un problème du monde réel et communiquer vos résultats de manière efficace.
Inclus
2 vidéos3 lectures1 évaluation par les pairs1 élément d'application5 plugins
Afficher les informations sur le contenu du module
2 vidéos•Total 8 minutes
Éléments d'un rapport de recherche de données réussi•5 minutes
Bonnes pratiques pour la présentation de vos résultats•3 minutes
3 lectures•Total 10 minutes
Lecture : Lignes directrices pour la soumission du projet final et éléments livrables•5 minutes
Félicitations et prochaines étapes•3 minutes
Crédits et remerciements•2 minutes
1 évaluation par les pairs•Total 60 minutes
Option 2 - Peer-To-Peer : Soumettez votre travail et évaluez vos pairs•60 minutes
1 élément d'application•Total 30 minutes
Option 1 - Noté par l'IA : Projet final - Soumission et évaluation•30 minutes
5 plugins•Total 70 minutes
Lecture : Structure d'un rapport•15 minutes
(Facultatif) Laboratoire pratique : Premiers pas avec PowerPoint pour le Web•20 minutes
(Facultatif) Laboratoire pratique : Les bases de PowerPoint•15 minutes
(Facultatif) Laboratoire pratique : Enregistrez votre présentation PowerPoint au format PDF•5 minutes
Exercice : Préparer votre présentation (avec le modèle de diapositive fourni)•15 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
Chez IBM, nous savons à quel point la technologie évolue rapidement et nous reconnaissons le besoin crucial pour les entreprises et les professionnels d'acquérir rapidement des compétences pratiques prêtes à l'emploi. En tant qu'innovateur technologique leader sur le marché, nous nous engageons à vous aider à prospérer dans ce paysage dynamique. Grâce à IBM Skills Network, nos programmes de formation conçus par des experts en IA, développement de logiciels, cybersécurité, science des données, gestion d'entreprise, et plus encore, fournissent les compétences essentielles dont vous avez besoin pour décrocher votre premier emploi, faire progresser votre carrière ou favoriser la réussite de votre entreprise. Que vous vous perfectionniez ou que vous perfectionniez votre équipe, nos cours, nos spécialisations et nos certificats professionnels développent l'expertise technique qui vous assure, ainsi qu'à votre organisation, d'exceller dans un monde compétitif.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
4.6
114 avis
5 stars
79,82 %
4 stars
9,64 %
3 stars
4,38 %
2 stars
4,38 %
1 star
1,75 %
Affichage de 3 sur 114
B
BT
5·
Révisé le 21 oct. 2023
I had the best learning experience with this course
S
SP
4·
Révisé le 12 juin 2024
Thank you 🙏 for Coursera Team ibm certificate achieved 🥰👍
Quels sont les packages R et les écosystèmes spécifiques utilisés dans le cadre de ce travail de fin d'études ?
Ce projet exige que vous maîtrisiez les principales bibliothèques pour la manipulation et la visualisation des données dans le langage de programmation R. Vous utiliserez largement l'écosystème Tidyverse pour le traitement programmatique des données, la transformation des données et le nettoyage du texte. Pour l'exploration statistique et la visualisation des données, vous utiliserez ggplot2 pour créer des graphiques et des courbes personnalisés, ainsi que SQL pour interroger et découper vos ensembles de données structurés avant de les introduire dans vos modèles prédictifs.
Comment ce projet traite-t-il les variables spatiales et environnementales complexes pour la modélisation prédictive ?
L'objectif principal de ce projet est de construire un modèle prédictif avancé pour la demande de vélos en libre-service. Vous rassemblerez et fusionnerez de manière programmatique des données provenant de sources disparates,
en utilisant le web scraping pour l'extraction HTML et en exécutant des requêtes REST API pour extraire des variables environnementales en direct comme les conditions météorologiques. À partir de là, vous appliquerez l'ingénierie des caractéristiques, comme la normalisation, le regroupement et l'encodage catégorique, pour construire et affiner un modèle de régression linéaire capable de prévoir les tendances de la demande avec une grande précision statistique.
Quel type de tableau de bord interactif vais-je créer pour afficher mes analyses ?
Vous transformerez vos modèles statistiques de base en une application web entièrement fonctionnelle en construisant un tableau de bord interactif R Shiny. Pour visualiser dynamiquement la demande basée sur la localisation, vous intégrerez une couche de carte Leaflet dans votre application, ce qui permettra aux utilisateurs d'explorer des parcelles de données spatiales du monde réel en temps réel. Le projet se termine par la livraison d'un rapport d'analyse de données de niveau exécutif, prouvant aux parties prenantes de l'organisation que vous pouvez traduire des scripts R complexes en outils de veille économique prêts à la production.
Quand aurai-je accès aux cours et aux devoirs ?
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je m'abonne à ce certificat ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.