Le cours « Machine Learning with R » propose une introduction approfondie aux techniques d’apprentissage automatique à l’aide du langage de programmation R, en mettant l’accent sur les applications pratiques. Vous acquerrez les compétences nécessaires pour préparer des données, évaluer des modèles et appliquer des méthodes avancées telles que l’apprentissage par ensembles et l’apprentissage profond. Ce cours comble le fossé entre la théorie et les applications concrètes, vous permettant non seulement de comprendre les concepts, mais aussi de savoir comment les mettre en œuvre dans des situations réelles. En travaillant avec des outils tels que Spark et Hadoop, vous acquerrez de l’expérience dans le domaine du big data et développerez une compréhension globale du processus d’apprentissage automatique.

Apprentissage automatique avec R
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Expérience recommandée
Expérience recommandée
Ce que vous apprendrez
Mettre en œuvre des modèles d'apprentissage automatique, de la préparation des données au déploiement
Appliquer des techniques de classification et de régression pour résoudre des problèmes concrets
Évaluer et améliorer les performances des modèles à l'aide de méthodes avancées
Compétences que vous acquerrez
- Catégorie : Algorithmes d'apprentissage automatiqueAlgorithmes d'apprentissage automatique
- Catégorie : Modèle de formationModèle de formation
- Catégorie : Apprentissage profondApprentissage profond
- Catégorie : Tidyverse (paquet R)Tidyverse (paquet R)
- Catégorie : Apprentissage automatique appliquéApprentissage automatique appliqué
- Catégorie : Réseau bayésienRéseau bayésien
- Catégorie : Science des donnéesScience des données
- Catégorie : Manipulation de donnéesManipulation de données
- Catégorie : Apprentissage statistique des machinesApprentissage statistique des machines
- Catégorie : Analyse des donnéesAnalyse des données
- Catégorie : Apprentissage automatiqueApprentissage automatique
- Catégorie : Évaluation du modèleÉvaluation du modèle
- Catégorie : Méthodes d'apprentissage automatiqueMéthodes d'apprentissage automatique
- Catégorie : Apprentissage non superviséApprentissage non supervisé
- Catégorie : Traitement des donnéesTraitement des données
- Catégorie : Régression logistiqueRégression logistique
Outils que vous découvrirez
- Catégorie : Apache SparkApache Spark
- Catégorie : R ProgrammationR Programmation
- Catégorie : Keras (bibliothèque de réseaux neuronaux)Keras (bibliothèque de réseaux neuronaux)
- Catégorie : Algorithmes de classificationAlgorithmes de classification
Détails à connaître

Ajouter à votre profil LinkedIn
mars 2026
15 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 15 modules dans ce cours
Dans cette section, nous présentons les principes fondamentaux de l'apprentissage automatique, en explorant ses origines, ses concepts CORE, ses applications typiques, les considérations éthiques qui s'y rapportent, ainsi que les étapes pratiques permettant d'adapter les types de données aux algorithmes d'apprentissage automatique à l'aide de R.
Inclus
2 vidéos11 lectures1 devoir
2 vidéos•Total 2 minutes
- Introduction - Vidéo de présentation•1 minute
- Introduction à l'apprentissage automatique - Vidéo de présentation•1 minute
11 lectures•Total 110 minutes
- Introduction•10 minutes
- Utilisations et abus de l'apprentissage automatique•10 minutes
- Les limites de l'apprentissage automatique•10 minutes
- Note•10 minutes
- Comment les machines apprennent•10 minutes
- Abstraction•10 minutes
- Généralisation•10 minutes
- Évaluation•10 minutes
- Types d'algorithmes d'apprentissage automatique•10 minutes
- Adapter les données d'entrée aux algorithmes•10 minutes
- Pourquoi R ? Et pourquoi R maintenant ?•10 minutes
1 devoir•Total 10 minutes
- Fondements de l'apprentissage automatique•10 minutes
Dans cette section, nous gérons les données à l'aide des structures R, nous analysons statistiquement les ensembles de données et nous visualisons les caractéristiques numériques et catégorielles afin de permettre une exploration et une préparation complètes des données.
Inclus
1 vidéo13 lectures1 devoir
1 vidéo•Total 1 minute
- Gérer et comprendre les données - Vidéo de présentation•1 minute
13 lectures•Total 130 minutes
- Introduction•10 minutes
- Facteurs•10 minutes
- Listes•10 minutes
- Trames de données•10 minutes
- Matrices et tableaux•10 minutes
- Importation et enregistrement d'ensembles de données à partir de fichiers CSV•10 minutes
- Explorer et comprendre les données•10 minutes
- Mesure de la tendance centrale : moyenne et médiane•10 minutes
- Mesure des quartiles de dispersion et des cinq chiffres caractéristiques•10 minutes
- Comprendre les distributions uniformes et normales des données numériques•10 minutes
- Exploration des caractéristiques catégorielles•10 minutes
- Visualisation des relations : nuages de points•10 minutes
- Analyse des relations : tableaux croisés à deux dimensions•10 minutes
1 devoir•Total 10 minutes
- Principes de base de l'Analyse de données•10 minutes
Dans cette section, nous abordons la classification par apprentissage paresseux à l'aide de l'algorithme k-NN, nous mesurons la similarité des données à l'aide de mesures de distance, et nous préparons les ensembles de données en les normalisant et en les fractionnant afin d'obtenir une classification précise par le plus proche voisin.
Inclus
1 vidéo7 lectures1 devoir
1 vidéo•Total 1 minute
- Classification par apprentissage par inaction à l'aide des voisins les plus proches - Vidéo de présentation•1 minute
7 lectures•Total 70 minutes
- Introduction•10 minutes
- Mesurer la similarité à l'aide de la distance•10 minutes
- Préparation des données pour l'utilisation avec l'algorithme k-NN•10 minutes
- Pourquoi l'algorithme k-NN est-il « paresseux » ?•10 minutes
- Analyse et préparation des données•10 minutes
- Préparation des données : création d'ensembles de données d'entraînement et de test•10 minutes
- Évaluation des performances du modèle•10 minutes
1 devoir•Total 10 minutes
- À la découverte de l'« apprentissage paresseux » et de ses principes CORE•10 minutes
Dans cette section, nous abordons la classification probabiliste de textes à l'aide de l'algorithme de Naïve Bayes, en traitant les principes fondamentaux des probabilités, les probabilités conditionnelles à l'aide du théorème de Bayes, ainsi que la détection pratique des spams par SMS sous R.
Inclus
1 vidéo11 lectures1 devoir
1 vidéo•Total 1 minute
- Classification par apprentissage probabiliste à l'aide de l'algorithme de Naive Bayes - Vidéo de présentation•1 minute
11 lectures•Total 110 minutes
- Introduction•10 minutes
- Comprendre la Probabilité conjointe•10 minutes
- Calcul de la probabilité conditionnelle à l'aide du théorème de Bayes•10 minutes
- Points forts Points faibles•10 minutes
- L'estimateur de Laplace•10 minutes
- Exemple de filtrage des spams sur téléphone portable à l'aide de l'algorithme de Naïve Bayes•10 minutes
- Analyse et préparation des données•10 minutes
- Préparation des données : division des documents texte en mots•10 minutes
- Visualisation des données textuelles : nuages de mots•10 minutes
- Préparation des données : création d'indicateurs pour les mots fréquents•10 minutes
- Évaluation des performances du modèle•10 minutes
1 devoir•Total 10 minutes
- Principes fondamentaux de l'apprentissage probabiliste•10 minutes
Dans cette section, nous allons découvrir comment les arbres de décision et les algorithmes d'apprentissage de règles tels que C5.0, 1R et RIPPER segmentent les données à des fins de classification, comment interpréter leurs résultats et comment évaluer leurs performances dans des scénarios concrets, tels que l'évaluation du risque de crédit et la détection de la toxicité.
Inclus
1 vidéo10 lectures1 devoir
1 vidéo•Total 1 minute
- Classification par la méthode « diviser pour régner » à l'aide d'arbres de décision et de règles - Vidéo de présentation•1 minute
10 lectures•Total 100 minutes
- L'algorithme d'arbre de décision C5.0•10 minutes
- Élagage de l'arbre de décision•10 minutes
- Préparation des données : création d'ensembles de données d'apprentissage et de test aléatoires•10 minutes
- Entraînement d'un modèle à partir des données•10 minutes
- Évaluation des performances du modèle•10 minutes
- Certaines erreurs coûtent plus cher que d'autres•10 minutes
- Diviser pour mieux régner•10 minutes
- L'algorithme 1R•10 minutes
- Règles issues des arbres de décision•10 minutes
- Collecte des données•10 minutes
1 devoir•Total 10 minutes
- Principes fondamentaux de l'apprentissage automatique et principes des arbres de décision•10 minutes
Dans cette section, nous apprendrons à mettre en œuvre des modèles de régression — notamment la régression linéaire et les méthodes basées sur des arbres — afin d'estimer des résultats numériques, d'analyser les corrélations entre les caractéristiques et d'appliquer des techniques pratiques pour réaliser des prévisions efficaces fondées sur les données.
Inclus
1 vidéo19 lectures1 devoir
1 vidéo•Total 1 minute
- Méthodes de régression pour la prévision de données numériques - Vidéo de présentation•1 minute
19 lectures•Total 181 minutes
- Introduction•10 minutes
- Régression linéaire simple•10 minutes
- Estimation par les moindres carrés ordinaires•10 minutes
- Corrélations•1 minute
- Modèles linéaires généralisés et régression logistique•10 minutes
- Tableau•10 minutes
- Exemple : estimation du coût des sinistres d'assurance automobile à l'aide de la régression linéaire•10 minutes
- Analyse et préparation des données•10 minutes
- Visualisation des relations entre les caractéristiques à l'aide de la matrice de nuages de points•10 minutes
- Entraînement d'un modèle à partir des données•10 minutes
- Évaluation des performances du modèle•10 minutes
- Spécification du modèle : ajout d'effets d'interaction•10 minutes
- Réaliser des prévisions à l'aide d'un modèle de régression•10 minutes
- Aller plus loin : prédire le taux de désabonnement des assurés à l'aide de la régression logistique•10 minutes
- Comprendre les arbres de régression et les arbres de modélisation•10 minutes
- Évaluation de la qualité des vins à l'aide d'arbres de régression et d'arbres de modélisation•10 minutes
- Analyse et préparation des données•10 minutes
- Visualisation des arbres de décision•10 minutes
- Améliorer les performances du modèle•10 minutes
1 devoir•Total 10 minutes
- Principes fondamentaux de la prévision et de l'évaluation des modèles•10 minutes
Dans cette section, nous examinons comment les réseaux neuronaux et les machines à vecteurs de support (SVM) modélisent les relations complexes entre les données, en mettant l'accent sur l'entraînement des modèles, leur évaluation et le réglage des hyperparamètres pour des applications pratiques d'apprentissage automatique.
Inclus
1 vidéo14 lectures1 devoir
1 vidéo•Total 1 minute
- Méthodes « boîte noire » : réseaux neuronaux et machines à vecteurs de support - Vidéo de présentation•1 minute
14 lectures•Total 140 minutes
- Introduction•10 minutes
- Des neurones biologiques aux neurones artificiels•10 minutes
- Topologie du réseau•10 minutes
- Le sens de circulation de l'information•10 minutes
- Le nombre de nœuds dans chaque couche•10 minutes
- Phases avant et arrière•10 minutes
- Entraînement d'un modèle à partir des données•10 minutes
- Améliorer les performances du modèle•10 minutes
- Comprendre les machines à vecteurs de support•10 minutes
- Le cas des données linéairement séparables•10 minutes
- Utilisation des noyaux pour les espaces non linéaires•10 minutes
- Exemple : réalisation d'une reconnaissance optique de caractères (OCR) à l'aide de machines à vecteurs de support (SVM)•10 minutes
- Entraînement d'un modèle à partir des données•10 minutes
- Améliorer les performances du modèle•10 minutes
1 devoir•Total 10 minutes
- Exploration des techniques et des défis liés à l'apprentissage automatique•10 minutes
Dans cette section, nous appliquons l'exploration des règles d'association aux données transactionnelles, nous utilisons des indicateurs tels que le support et la confiance, et nous mettons en œuvre les algorithmes Apriori et Eclat afin de mettre en évidence et d'analyser les tendances d'achat en vue d'élaborer des stratégies de marketing et de gestion des stocks fondées sur les données.
Inclus
1 vidéo9 lectures1 devoir
1 vidéo•Total 1 minute
- Identification de tendances : analyse des paniers d'achat à l'aide de règles d'association - Vidéo de présentation•1 minute
9 lectures•Total 90 minutes
- Introduction•10 minutes
- L'algorithme Apriori pour l'apprentissage des règles d'association•10 minutes
- Évaluation du soutien et de la confiance envers le gouvernement•10 minutes
- Exemple : identification des produits alimentaires fréquemment achetés à l'aide de règles d'association•10 minutes
- Représentation graphique de la fréquence des éléments de support•10 minutes
- Entraînement d'un modèle à partir des données•10 minutes
- Évaluation des performances du modèle•10 minutes
- Améliorer les performances du modèle•10 minutes
- Enregistrement des règles d'association dans un fichier ou un DataFrame•10 minutes
1 devoir•Total 10 minutes
- Explorer les tendances dans les données•10 minutes
Dans cette section, nous présentons l'algorithme de regroupement par k-moyennes (k-means) pour regrouper des données non étiquetées. Nous aborderons les concepts de regroupement, de préparation des données, d'évaluation des modèles et d'affinement, afin de mettre en évidence des tendances exploitables dans les ensembles de données.
Inclus
1 vidéo9 lectures1 devoir
1 vidéo•Total 1 minute
- Identification de groupes de données par le regroupement (clustering) avec l'algorithme k-means - Vidéo de présentation•1 minute
9 lectures•Total 90 minutes
- Introduction•10 minutes
- Groupes d'algorithmes de regroupement•10 minutes
- L'algorithme de regroupement K-Means•10 minutes
- Choisir le nombre approprié de clusters•10 minutes
- Collecte des données•10 minutes
- Préparation des données, codage fictif, valeurs manquantes•10 minutes
- Entraînement d'un modèle à partir des données•10 minutes
- Évaluation des performances du modèle•10 minutes
- Améliorer les performances du modèle•10 minutes
1 devoir•Total 10 minutes
- Exploration du regroupement et de la normalisation des données•10 minutes
Dans cette section, nous évaluons des modèles d'apprentissage automatique à l'aide d'indicateurs de classification, nous analysons des matrices de confusion et nous appliquons des méthodes de validation afin d'estimer les performances potentielles de ces modèles sur des données futures.
Inclus
1 vidéo11 lectures1 devoir
1 vidéo•Total 1 minute
- Évaluation des performances d'un modèle - Vidéo de présentation•1 minute
11 lectures•Total 110 minutes
- Introduction•10 minutes
- Zoom sur les matrices de confusion•10 minutes
- Au-delà de la précision : d'autres indicateurs de performance•10 minutes
- Le coefficient de corrélation de Matthews•10 minutes
- Sensibilité et spécificité•10 minutes
- La mesure F•10 minutes
- Comparaison des courbes ROC•10 minutes
- L'aire sous la courbe ROC•10 minutes
- Estimation des performances futures•10 minutes
- Validation croisée•10 minutes
- L'échantillonnage Bootstrap•10 minutes
1 devoir•Total 10 minutes
- Principes fondamentaux de l'évaluation des performances des modèles•10 minutes
Dans cette section, nous examinons les facteurs essentiels à la réussite de l'apprentissage automatique, en mettant l'accent sur l'exploration efficace des données, les stratégies de conception de projets et la compréhension des impacts concrets, afin de faire le lien entre la théorie et la pratique.
Inclus
1 vidéo11 lectures1 devoir
1 vidéo•Total 1 minute
- Réussir grâce à l'apprentissage automatique - Vidéo de présentation•1 minute
11 lectures•Total 110 minutes
- Introduction•10 minutes
- Qu'est-ce qui fait le succès d'un modèle d'apprentissage automatique ?•10 minutes
- Éviter les prédictions évidentes•10 minutes
- Réaliser des évaluations équitables•10 minutes
- Prendre en compte les répercussions concrètes•10 minutes
- Renforcer la confiance dans le modèle•10 minutes
- La science au cœur de la science des données•10 minutes
- Utilisation des notebooks R et de R Markdown•10 minutes
- Exploration avancée des données•10 minutes
- Faire face aux valeurs aberrantes : un écueil concret•10 minutes
- Exemple d'utilisation de ggplot2 pour l'exploration visuelle des données•10 minutes
1 devoir•Total 10 minutes
- Maîtriser les principes fondamentaux de l'apprentissage automatique•10 minutes
Dans cette section, nous abordons les tâches complexes de préparation des données sous R, en mettant l'accent sur la combinaison de sources de données et de techniques d'ingénierie des caractéristiques afin de soutenir les objectifs d'apprentissage automatique.
Inclus
1 vidéo12 lectures1 devoir
1 vidéo•Total 1 minute
- Préparation avancée des données - Vidéo de présentation•1 minute
12 lectures•Total 120 minutes
- Introduction•10 minutes
- L'impact du Big Data et de l'apprentissage profond•10 minutes
- L'ingénierie des caractéristiques en pratique•10 minutes
- Astuce n° 2 : Découvrez les informations cachées dans le texte•10 minutes
- Transformer des plages de valeurs numériques•10 minutes
- Utiliser les lignes associées•10 minutes
- Ajouter des données externes•10 minutes
- À la découverte de Tidyverse dans R•10 minutes
- Lire plus rapidement des fichiers Rectangular grâce à readr et readxl•10 minutes
- Préparation et acheminement des données avec dplyr•10 minutes
- Transformation de texte avec stringr•10 minutes
- Dates de nettoyage avec Lubridate•10 minutes
1 devoir•Total 10 minutes
- Maîtriser la préparation des données dans le domaine de l'apprentissage automatique•10 minutes
Dans cette section, nous abordons les défis liés aux données utilisées en apprentissage automatique en appliquant des techniques de sélection et d'extraction de caractéristiques, en traitant les valeurs manquantes ou clairsemées par imputation, et en utilisant des techniques visant à rééquilibrer les ensembles de données déséquilibrés afin d'améliorer les performances des modèles.
Inclus
1 vidéo17 lectures1 devoir
1 vidéo•Total 1 minute
- Les défis liés aux données : trop, pas assez, trop complexes - Vidéo de présentation•1 minute
17 lectures•Total 170 minutes
- Introduction•10 minutes
- Sélection de caractéristiques•10 minutes
- Méthodes d'encapsulation et méthodes intégrées•10 minutes
- Exemple d'utilisation de la régression par étapes pour la sélection des caractéristiques•10 minutes
- Exemple d'utilisation de Boruta pour la sélection de caractéristiques•10 minutes
- Comprendre l'analyse en composantes principales•10 minutes
- Exemple d'utilisation de l'ACP pour réduire des données issues des réseaux sociaux à haute dimension•10 minutes
- Exploiter les données clairsemées•10 minutes
- Exemple de remappage de données catégorielles clairsemées•10 minutes
- Exemple de regroupement de données numériques clairsemées•10 minutes
- Traitement des données manquantes•10 minutes
- Réalisation de l'imputation des valeurs manquantes•10 minutes
- Modèles de valeurs manquantes•10 minutes
- Le problème des données déséquilibrées•10 minutes
- Génération d'un ensemble de données synthétiques équilibré à l'aide de SMOTE•10 minutes
- Exemple d'application de l'algorithme SMOTE sous R•10 minutes
- Se demander si l'équilibre est toujours préférable•10 minutes
1 devoir•Total 10 minutes
- Gérer la complexité des données dans l'apprentissage automatique•10 minutes
Dans cette section, nous apprenons à optimiser les modèles d'apprentissage automatique en ajustant systématiquement les hyperparamètres et en appliquant des méthodes d'ensemble telles que le bagging, le boosting et le stacking, afin d'améliorer les performances prédictives.
Inclus
1 vidéo13 lectures1 devoir
1 vidéo•Total 1 minute
- « Former de meilleurs apprenants » - Vidéo de présentation•1 minute
13 lectures•Total 130 minutes
- Introduction•10 minutes
- Détermination de la portée du réglage des hyperparamètres•10 minutes
- Exemple d'utilisation de « caret » pour l'accordage automatique•10 minutes
- Création d'un modèle accordé simple•10 minutes
- Personnalisation du processus de réglage•10 minutes
- Améliorer les performances des modèles grâce aux ensembles•10 minutes
- Algorithmes populaires basés sur des ensembles•10 minutes
- Renforcer•10 minutes
- Forêts aléatoires•10 minutes
- Renforcement du gradient•10 minutes
- Boosting à gradient extrême avec XGBoost•10 minutes
- Pourquoi les ensembles basés sur des arbres sont-ils si populaires ?•10 minutes
- Méthodes pratiques pour le mélange et l'empilement dans R•10 minutes
1 devoir•Total 10 minutes
- Maîtrise des méthodes d'ensemble et de l'optimisation des modèles•10 minutes
Dans cette section, nous examinons comment appliquer des modèles d'apprentissage profond sous R à l'aide de frameworks tels que Keras et TensorFlow, traiter des volumes importants de données non structurées et mettre en œuvre le calcul parallèle pour des solutions d'apprentissage automatique évolutives.
Inclus
1 vidéo16 lectures1 devoir
1 vidéo•Total 1 minute
- Exploiter le Big Data - Vidéo de présentation•1 minute
16 lectures•Total 160 minutes
- Introduction•10 minutes
- Choisir des tâches adaptées à l'apprentissage profond•10 minutes
- Les frameworks d'apprentissage profond TensorFlow et Keras•10 minutes
- Comprendre les réseaux neuronaux convolutifs•10 minutes
- Apprentissage par transfert et réglage fin•10 minutes
- Apprentissage non supervisé et mégadonnées•10 minutes
- Comprendre les emboîtements de mots•10 minutes
- Exemple d'utilisation de word2vec pour l'analyse de textes sous R•10 minutes
- Visualisation de données à haute dimension•10 minutes
- Comprendre l'algorithme t-SNE•10 minutes
- Exemple : visualisation des regroupements naturels des données à l'aide de t-SNE•10 minutes
- Adapter R pour traiter des ensembles de données volumineux•10 minutes
- Utilisation d'un backend de base de données pour dplyr avec dbplyr•10 minutes
- Activation du traitement parallèle dans R•10 minutes
- Le calcul parallèle avec les concepts MapReduce via Apache Spark•10 minutes
- Apprentissage à l'aide d'algorithmes distribués et évolutifs avec H2O•10 minutes
1 devoir•Total 10 minutes
- Exploration des méthodes d'apprentissage profond et d'analyse de données•10 minutes
Instructeur

Offert par
En savoir plus sur Apprentissage automatique
Statut : Essai gratuitEssai gratuit
Statut : Essai gratuitEssai gratuit
Statut : Essai gratuitEssai gratuitCours
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Oui, vous pouvez visionner la première vidéo et le syllabus avant de vous inscrire. Vous devez acheter le cours pour accéder au contenu qui n'est pas inclus dans l'aperçu.
Si vous décidez de vous inscrire au cours avant la date de début de la session, vous aurez accès à toutes les vidéos et à toutes les lectures du cours. Vous pourrez soumettre vos travaux dès le début de la session.
Une fois que vous vous serez inscrit et que votre session aura commencé, vous aurez accès à toutes les vidéos et autres ressources, y compris les lectures et le forum de discussion du cours. Vous pourrez consulter et soumettre des évaluations pratiques, et effectuer les devoirs notés requis pour obtenir une note et un certificat de cours.
Si vous terminez le cours avec succès, votre certificat de cours électronique sera ajouté à votre page de réalisations - de là, vous pouvez imprimer votre certificat de cours ou l'ajouter à votre profil LinkedIn.
Ce cours n'est actuellement accessible qu'aux apprenants qui ont payé ou reçu une aide financière, le cas échéant.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.
Plus de questions
Aide financière disponible,





