Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 6 modules dans ce cours
Ce cours présente un ensemble puissant d'outils de science des données connu sous le nom de Tidyverse. Le Tidyverse a révolutionné la façon dont les scientifiques des données font presque tous les aspects de leur travail. Nous aborderons l'idée simple de "données bien rangées" et la manière dont cette idée sert à organiser les données pour l'analyse et la modélisation. Nous verrons également comment des données non ordonnées peuvent être transformées en données ordonnées, le cycle de vie d'un projet de science des données et l'écosystème des packages R de Tidyverse qui peuvent être utilisés pour exécuter un projet de science des données.
Si vous êtes novice en science des données, l'écosystème de packages R de Tidyverse est un excellent moyen d'apprendre les différents aspects du pipeline de la science des données, depuis l'importation des données, la mise en ordre des données dans un format facile à travailler, l'exploration et la visualisation des données, jusqu'à l'ajustement des modèles d'apprentissage automatique. Si vous avez déjà de l'expérience en science des données, le Tidyverse fournit un système puissant pour rationaliser votre flux de travail d'une manière cohérente qui peut facilement se connecter à d'autres outils de science des données.
Dans ce cours, il est important que vous soyez familier avec le langage de programmation R. Si vous n'êtes pas encore familiarisé avec R, nous vous suggérons de suivre d'abord le cours de programmation R avant de suivre ce cours.
Avant de pouvoir discuter de toutes les façons dont R facilite le travail avec des données ordonnées, nous devons d'abord nous assurer que nous savons ce que sont des données ordonnées. Les ensembles de données ordonnées sont, par conception, plus faciles à manipuler, à modéliser et à visualiser, car les principes des données ordonnées que nous aborderons dans ce cours imposent un cadre général et un ensemble cohérent de règles aux données. En fait, une citation bien connue de Hadley Wickham est que "les ensembles de données bien rangés se ressemblent tous, mais chaque ensemble de données désordonné est désordonné à sa manière" L'utilisation d'un format de données cohérent et ordonné permet de créer des outils qui fonctionnent bien dans ce cadre, ce qui simplifie en fin de compte les processus de traitement, de visualisation et d'analyse des données. Si vous commencez avec des données qui sont déjà dans un format ordonné ou si vous prenez le temps, au début d'un projet, de mettre les données dans un format ordonné, les autres étapes de votre projet de science des données seront plus faciles.
Inclus
6 lectures2 devoirs
Afficher les informations sur le contenu du module
6 lectures•Total 53 minutes
À propos de ce cours•3 minutes
Terminologie des données•10 minutes
Principes des données ordonnées•10 minutes
Les données ordonnées sont rectangulaires•10 minutes
Avantages de Tidy Data•10 minutes
Règles pour le stockage de données ordonnées•10 minutes
2 devoirs•Total 60 minutes
Quiz sur les principes du rangement des données•30 minutes
Quiz sur les règles de rangement des données•30 minutes
De non ordonné à ordonné
Module 2•1 heure à terminer
Détails du module
S'il est important de discuter de ce que sont les données ordonnées et de ce à quoi elles ressemblent, c'est parce que dans le monde, la plupart des données ne sont pas ordonnées. Si ce n'est pas vous qui saisissez les données, mais quelqu'un d'autre qui vous les remet pour réaliser un projet, le plus souvent, ces données ne seront pas ordonnées. Les données non ordonnées sont souvent appelées simplement "données désordonnées". Pour pouvoir travailler facilement avec ces données, vous devez les mettre en forme. Cela signifie que vous devez reconnaître les données désordonnées et comprendre comment les mettre en forme. Les problèmes courants suivants, observés dans les ensembles de données désordonnées, sont à nouveau tirés de l'article de Hadley Wickham sur les données ordonnées (http://vita.had.co.nz/papers/tidy-data.pdf). Après un bref rappel de chaque problème courant, nous examinerons quelques ensembles de données désordonnées. Nous aborderons enfin les concepts de rangement des données désordonnées, mais nous ne ferons pas encore d'exercices pratiques. C'est pour bientôt !
Inclus
3 lectures1 devoir
Afficher les informations sur le contenu du module
3 lectures•Total 30 minutes
Problèmes courants liés aux ensembles de données désordonnées•10 minutes
Exemples de données désordonnées•10 minutes
Mettre de l'ordre dans les données désordonnées•10 minutes
1 devoir•Total 30 minutes
Quiz sur les données désordonnées•30 minutes
Le cycle de vie de la science des données et l'écosystème Tidyverse
Module 3•1 heure à terminer
Détails du module
Avec une solide compréhension des données bien rangées et de la façon dont les données bien rangées s'intègrent dans le cycle de vie de la science des données, nous allons prendre un peu de temps pour vous présenter les paquets tidyverse et tidyverse-adjacent que nous allons enseigner et utiliser tout au long de cette spécialisation. L'ensemble de ces packages constitue ce que nous appelons l'écosystème tidyverse. Le but du reste de ce cours n'est pas que vous compreniez comment utiliser chacun de ces paquets (ce sera bientôt le cas !), mais plutôt de vous aider à vous familiariser avec quels paquets correspondent à quelle partie du cycle de vie de la science des données. Notez que les paquets officiels de tidyverse ci-dessous sont en gras. Tous les autres paquets sont adjacents à tidyverse, ce qui signifie qu'ils suivent les mêmes conventions que les paquets officiels de tidyverse et qu'ils fonctionnent bien dans le cadre et la structure tidy de l'analyse des données.
Inclus
5 lectures
Afficher les informations sur le contenu du module
5 lectures•Total 50 minutes
Le cycle de vie de la science des données•10 minutes
Lecture des données dans R•10 minutes
Rangement des données•10 minutes
Visualisation des données•10 minutes
Modélisation des données•10 minutes
Organisation des projets de science des données et flux de travail
Module 4•2 heures à terminer
Détails du module
Les projets de science des données varient considérablement et il peut donc être difficile de donner des règles universelles sur la façon dont ils devraient être organisés. Cependant, il existe quelques façons d'organiser les projets qui sont généralement utiles. En particulier, presque tous les projets doivent gérer des fichiers de différentes sortes - fichiers de données, fichiers de code, fichiers de sortie, etc. Cette section traite du fonctionnement des fichiers et de la manière dont les projets peuvent être organisés et personnalisés.
Inclus
6 lectures2 devoirs
Afficher les informations sur le contenu du module
6 lectures•Total 70 minutes
Projets RStudio•10 minutes
Chemins d'accès aux fichiers•10 minutes
Le présent paquet•10 minutes
Noms de fichiers•20 minutes
Modèle de projet : Tout est à sa place•10 minutes
Flux de travail en science des données•10 minutes
2 devoirs•Total 60 minutes
Quiz sur les noms de fichiers et les paquets ici•30 minutes
Quiz sur l'organisation des projets•30 minutes
Études de cas
Module 5•1 heure à terminer
Détails du module
Tout au long de cette spécialisation, nous allons utiliser un certain nombre d'études de cas provenant des Open Case Studies pour démontrer les concepts introduits dans le cours. Nous utiliserons généralement les mêmes études de cas tout au long de la spécialisation, assurant ainsi une continuité qui vous permettra de vous concentrer sur les concepts et les compétences enseignés (plutôt que sur le contexte) tout en travaillant avec des données intéressantes. Ces études de cas visent à répondre à une question de santé publique et utilisent toutes des données réelles.
Inclus
2 lectures2 laboratoires non notés
Afficher les informations sur le contenu du module
2 lectures•Total 20 minutes
Étude de cas n° 1 : Dépenses de santé•10 minutes
Étude de cas n° 2 : armes à feu•10 minutes
2 laboratoires non notés•Total 20 minutes
Dépenses de santé RStudio Lab•10 minutes
Étude de cas sur les armes à feu RStudio Lab•10 minutes
Projet : Organiser un nouveau projet de science des données
Module 6•1 heure à terminer
Détails du module
Ce projet vous permettra de créer un nouveau projet et d'organiser les fichiers nécessaires à une future analyse de données
Inclus
1 évaluation par les pairs
Afficher les informations sur le contenu du module
1 évaluation par les pairs•Total 60 minutes
Introduction au projet de cours Tidyverse•60 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
La mission de l'université Johns Hopkins est d'éduquer ses étudiants et de cultiver leur capacité à apprendre tout au long de leur vie, d'encourager la recherche indépendante et originale et de faire profiter le monde des avantages de la découverte.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
4.4
54 avis
5 stars
74,07 %
4 stars
12,96 %
3 stars
3,70 %
2 stars
1,85 %
1 star
7,40 %
Affichage de 3 sur 54
D
DI
5·
Révisé le 17 avr. 2024
The course is a breeze to follow because it aligns seamlessly with the book. As such, rather than watching videos, you get to read the book; it's really a convenient approach.
Bravo!
D
DM
5·
Révisé le 30 oct. 2022
Covers really important concepts and procedures for managing data science projects. Very helpful.
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.