Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 6 modules dans ce cours
L'introduction des données dans votre système d'analyse statistique peut être l'une des parties les plus difficiles de tout projet de science des données. Les données doivent être importées et harmonisées dans un format cohérent avant de pouvoir obtenir des informations. Vous apprendrez à importer des données dans R à partir de formats couramment utilisés et à harmoniser différents types d'ensembles de données provenant de différentes sources. Si vous travaillez dans une organisation où différents départements collectent des données en utilisant différents systèmes et différents formats de stockage, ce cours vous fournira des outils essentiels pour rassembler ces ensembles de données et donner un sens à la richesse de l'information dans votre organisation. Ce cours présente les outils Tidyverse pour importer des données dans R afin qu'elles puissent être préparées pour l'analyse, la visualisation et la modélisation. Les formats de données courants sont présentés, y compris les fichiers délimités, les feuilles de calcul et les bases de données relationnelles, et des techniques pour obtenir des données à partir du Web sont démontrées, telles que le web scraping et les API Web. Dans cette spécialisation, nous supposons que vous êtes familier avec le langage de programmation R. Si vous n'êtes pas encore familiarisé avec R, nous vous suggérons de suivre d'abord le cours de programmation R avant de suivre ce cours.
Le tibble est un type de données de base dans le monde de Tidy. Les tibbles stockent des données tabulaires et sont une version moderne du cadre de données R standard. Ils possèdent de nombreuses fonctionnalités conviviales qui constituent une amélioration par rapport aux cadres de données standard lorsque vous effectuez des analyses de données interactives. Le reste de ce module couvre les données tabulaires dans des formats de feuilles de calcul comme Excel, CSV, TSV et d'autres fichiers délimités.
Inclus
15 lectures1 devoir
Afficher les informations sur le contenu du module
15 lectures•Total 166 minutes
À propos de ce cours•5 minutes
Tibbles•10 minutes
Création d'un tibble•20 minutes
Sous-ensemble•10 minutes
Feuilles de calcul•1 minute
Fichiers Excel•30 minutes
Google Sheets•45 minutes
CSV•10 minutes
Téléchargement de fichiers CSV•5 minutes
Lecture de fichiers CSV dans R•10 minutes
TSV•2 minutes
Lecture de fichiers TSVs dans R•5 minutes
Fichiers délimités•3 minutes
Lecture de fichiers délimités dans R•5 minutes
Exporter des données à partir de R•5 minutes
1 devoir•Total 30 minutes
Importer et exporter des données Quiz•30 minutes
JSON, XML et bases de données
Module 2•3 heures à terminer
Détails du module
Les données peuvent se présenter sous des formats non tabulaires, en particulier les données non structurées ou les données qui n'entreraient pas dans un tableau. JSON et XML sont des formats courants pour le stockage de données arbitrairement structurées et ce module couvre les packages utilisés pour lire ces formats de données. En outre, les bases de données relationnelles sont couramment utilisées pour stocker de très grandes collections de tableaux lorsque vous n'avez pas besoin de lire l'ensemble des données en une seule fois. Il existe de nombreux formats de bases de données relationnelles et nous couvrirons le format SQLite, qui est un format compact et simple à utiliser.
Inclus
10 lectures1 devoir
Afficher les informations sur le contenu du module
10 lectures•Total 132 minutes
JSON•30 minutes
XML•15 minutes
Bases de données•2 minutes
Données relationnelles•15 minutes
Bases de données relationnelles : SQL•5 minutes
Connexion aux bases de données : RSQLite•10 minutes
Travailler avec des données relationnelles : dplyr & dbplyr•5 minutes
Mutations des jointures•30 minutes
Filtrage des jointures•10 minutes
Comment se connecter à une base de données en ligne•10 minutes
1 devoir•Total 30 minutes
Quiz sur JSON, XML et les bases de données•30 minutes
Scraping web et APIs
Module 3•2 heures à terminer
Détails du module
La lecture de données provenant de diverses sources Internet peut s'avérer utile pour élaborer des analyses qui doivent être régulièrement mises à jour. Les paquets rvest et httr sont utiles pour se connecter à des sites web, à des API web et à d'autres sources de données en ligne.
Inclus
11 lectures1 devoir
Afficher les informations sur le contenu du module
11 lectures•Total 105 minutes
Récupération de données sur le Web•10 minutes
principes de base de l'investissement•0 minutes
SelectorGadget•10 minutes
Exemple de récupération de données sur le Web•10 minutes
Une dernière remarque : SelectorGadget•2 minutes
API•5 minutes
Obtenir des données : httr•5 minutes
Exemple 1 : L'API de GitHub•30 minutes
Exemple 2 : Obtention d'un fichier CSV•20 minutes
read_csv() à partir d'une URL•3 minutes
Clés API•10 minutes
1 devoir•Total 30 minutes
Obtenir des données à partir d'Internet Quiz•30 minutes
Formats étrangers, images et googledrive
Module 4•2 heures à terminer
Détails du module
Travailler avec d'autres personnes dans le cadre d'un projet de science des données implique souvent de lire des résultats ou des données produits à l'aide d'autres progiciels d'analyse statistique ou d'autres logiciels. Ce module couvre les logiciels permettant de lire ces formats étrangers, ainsi que les images et les données provenant de Google Drive.
Inclus
3 lectures1 devoir
Afficher les informations sur le contenu du module
3 lectures•Total 65 minutes
havre•15 minutes
Images•30 minutes
googledrive•20 minutes
1 devoir•Total 30 minutes
Formats étrangers, images et googledrive Quiz•30 minutes
Études de cas
Module 5•4 heures à terminer
Détails du module
Nous allons maintenant vous montrer comment importer des données à l'aide de nos exemples d'études de cas. Lorsque vous travaillez sur les étapes des études de cas, vous pouvez utiliser soit RStudio sur votre propre ordinateur, soit les espaces de laboratoire Coursera fournis pour chaque étude de cas.
Inclus
11 lectures2 laboratoires non notés
Afficher les informations sur le contenu du module
11 lectures•Total 142 minutes
Étude de cas n° 1 : Dépenses de santé•5 minutes
Données sur la couverture des soins de santé•45 minutes
Données sur les dépenses de santé•30 minutes
Nouvelle étude de cas n° 2 : armes à feu•2 minutes
Données de recensement•5 minutes
Données comptées•5 minutes
Données sur le suicide•10 minutes
Données Brady•10 minutes
Données sur la criminalité•10 minutes
Données sur la superficie des terres•10 minutes
Données sur le chômage•10 minutes
2 laboratoires non notés•Total 120 minutes
Dépenses de santé Lab•60 minutes
Laboratoire d'étude de cas sur les armes à feu•60 minutes
Projet : Importation de données dans R
Module 6•1 heure à terminer
Détails du module
Ce projet vous donnera l'occasion de lire des données provenant de plusieurs sources et d'effectuer quelques opérations simples sur ces données.
Inclus
2 lectures1 devoir
Afficher les informations sur le contenu du module
2 lectures•Total 20 minutes
Introduction et contexte•10 minutes
Ensembles de données•10 minutes
1 devoir•Total 30 minutes
Importer des données dans un projet R•30 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
La mission de l'université Johns Hopkins est d'éduquer ses étudiants et de cultiver leur capacité à apprendre tout au long de leur vie, d'encourager la recherche indépendante et originale et de faire profiter le monde des avantages de la découverte.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
4.7
51 avis
5 stars
78 %
4 stars
18 %
3 stars
4 %
2 stars
0 %
1 star
0 %
Affichage de 3 sur 51
E
EL
5·
Révisé le 22 nov. 2022
Excellent. While there were no lectures, and it is possible to simply read the authors' book, having the quizzes makes the difference between just reading and actually learning. Thanks!
V
VM
5·
Révisé le 27 mars 2021
Great for beginners. Clearly explained, and easy to follow.
F
FC
5·
Révisé le 28 janv. 2021
Excellent tutorial for importing data into the tidyverse environment
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.