Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
3.1
79 avis
niveau Intermédiaire
Expérience recommandée
Expérience recommandée
Niveau intermédiaire
Expérience de l'utilisation de Python pour explorer les données et former des modèles d'apprentissage automatique avec des frameworks open-source, tels que Scikit-Learn, PyTorch, et TensorFlow.
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
3.1
79 avis
niveau Intermédiaire
Expérience recommandée
Expérience recommandée
Niveau intermédiaire
Expérience de l'utilisation de Python pour explorer les données et former des modèles d'apprentissage automatique avec des frameworks open-source, tels que Scikit-Learn, PyTorch, et TensorFlow.
Exploitez la puissance d'Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail de science des données.
Effectuez de l'apprentissage automatique avec Azure Databricks. Travailler avec des fonctions définies par l'utilisateur (UDF) dans Azure Databricks
Travaillez avec des DataFrames dans Azure Databricks. Utilisez Azure Databricks et le notebook Apache Spark pour traiter de grandes quantités de données
Construire et interroger un lac Delta
Compétences que vous acquerrez
Catégorie : Modèle de formation
Modèle de formation
Catégorie : Apprentissage automatique
Apprentissage automatique
Catégorie : Méthodes d'apprentissage automatique
Méthodes d'apprentissage automatique
Catégorie : Big Data
Big Data
Catégorie : Informatique distribuée
Informatique distribuée
Catégorie : Manipulation de données
Manipulation de données
Catégorie : Analyse exploratoire des données
Analyse exploratoire des données
Catégorie : Apprentissage profond
Apprentissage profond
Catégorie : MLOps (Machine Learning Operations)
MLOps (Machine Learning Operations)
Catégorie : Traitement des données
Traitement des données
Catégorie : Évaluation du modèle
Évaluation du modèle
Catégorie : Transformation des données
Transformation des données
Catégorie : Pipelines de données
Pipelines de données
Outils que vous découvrirez
Catégorie : Databricks
Databricks
Catégorie : Apache Spark
Apache Spark
Catégorie : PySpark
PySpark
Catégorie : Lacs de données
Lacs de données
Catégorie : Microsoft Azure
Microsoft Azure
Catégorie : Déploiement du modèle
Déploiement du modèle
Détails à connaître
Certificat partageable
Ajouter à votre profil LinkedIn
Évaluations
31 devoirs
Enseigné en Anglais
91% of learners achieved a positive career outcome
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable auprès de Microsoft
Il y a 6 modules dans ce cours
Dans ce cours, vous apprendrez à exploiter la puissance d'Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail de science des données dans le nuage. Il s'agit du quatrième cours d'un programme de cinq cours qui vous prépare à passer l'examen de certification DP-100, Conception et mise en œuvre d'une solution de science des données sur Azure : L'examen de certification est l'occasion de prouver vos connaissances et votre expertise dans l'exploitation de solutions d'apprentissage automatique à l'échelle du nuage à l'aide d'Azure Machine Learning. Cette spécialisation vous apprend à tirer parti de vos connaissances existantes en Python et en apprentissage automatique pour gérer l'ingestion et la préparation des données, l'entraînement et le déploiement des modèles, ainsi que la surveillance des solutions d'apprentissage automatique dans Microsoft Azure. Chaque cours vous enseigne les concepts et les compétences qui sont mesurés par l'examen.
Cette Specializations est destinée aux data scientists ayant une connaissance existante de Python et des frameworks d'apprentissage automatique comme Scikit-Learn, PyTorch et Tensorflow, qui souhaitent construire et exploiter des solutions d'apprentissage automatique dans le cloud. Il enseigne aux scientifiques des données comment créer des solutions de bout en bout dans Microsoft Azure. Les étudiants apprendront à gérer les ressources Azure pour l'apprentissage automatique, à exécuter des expériences et à former des modèles, à déployer et à rendre opérationnelles des solutions d'apprentissage automatique et à mettre en œuvre un apprentissage automatique responsable. Ils apprendront également à utiliser Azure Databricks pour explorer, préparer et modéliser les données, et à intégrer les processus d'apprentissage automatique de Databricks à Azure Machine Learning.
Dans ce module, vous découvrirez les capacités d'Azure Databricks et du notebook Apache Spark pour le traitement de fichiers volumineux. Vous comprendrez la plateforme Azure Databricks et identifierez les types de tâches qui conviennent à Apache Spark. Vous serez également initié à l'architecture d'un Azure Databricks Spark Cluster et des Spark Jobs.
Inclus
7 vidéos5 lectures4 devoirs1 sujet de discussion
Afficher les informations sur le contenu du module
7 vidéos•Total 21 minutes
Introduction au cours•3 minutes
Expliquez Azure Databricks•5 minutes
Résumé de la leçon•2 minutes
Introduction à la leçon•2 minutes
Comprendre l'architecture du cluster Spark d'Azure Databricks•4 minutes
Comprendre l'architecture de spark job•4 minutes
Résumé de la leçon•1 minute
5 lectures•Total 72 minutes
Plan de cours•30 minutes
Comment réussir ce cours•5 minutes
Créer un espace de travail et un cluster Azure Databricks•4 minutes
Créer et exécuter un carnet de notes•3 minutes
Exercice : Travailler avec des carnets•30 minutes
4 devoirs•Total 68 minutes
Exercice quiz•2 minutes
Contrôle des connaissances•18 minutes
Contrôle des connaissances•18 minutes
Préparation aux tests•30 minutes
1 sujet de discussion•Total 30 minutes
Rencontre et accueil•30 minutes
Travailler avec des données dans Azure Databricks
Module 2•6 heures à terminer
Détails du module
Azure Databricks prend en charge les fonctions quotidiennes de traitement des données, telles que les lectures, les écritures et les requêtes. Dans ce module, vous travaillerez avec de grandes quantités de données provenant de sources multiples dans différents formats bruts. Vous apprendrez également à utiliser la classe de colonne DataFrame Azure Databricks pour appliquer des transformations au niveau des colonnes, telles que des tris, des filtres et des agrégations. Vous utiliserez également les opérations avancées des fonctions DataFrame pour manipuler les données, appliquer des agrégats et effectuer des opérations sur la date et l'heure dans Azure Databricks.
Inclus
4 vidéos10 lectures4 devoirs
Afficher les informations sur le contenu du module
4 vidéos•Total 6 minutes
Introduction à la leçon•1 minute
Résumé de la leçon•1 minute
Introduction à la leçon•2 minutes
Résumé de la leçon•1 minute
10 lectures•Total 280 minutes
Lire les données au format CSV•10 minutes
Lire les données au format JSON•30 minutes
Lire les données au format Parquet•30 minutes
Lire les données stockées dans les tables et les vues•30 minutes
Données d'écriture•30 minutes
Exercices : Lire et écrire des données•30 minutes
Décrire un DataFrame•30 minutes
Utiliser les méthodes courantes des DataFrame•30 minutes
Utiliser la fonction d'affichage•30 minutes
Exercice : Articles distincts•30 minutes
4 devoirs•Total 62 minutes
Exercice quiz•2 minutes
Contrôle des connaissances•12 minutes
Contrôle des connaissances•18 minutes
Préparation aux tests•30 minutes
Traitement des données dans Azure Databricks
Module 3•4 heures à terminer
Détails du module
Azure Databricks prend en charge une gamme de fonctions SQL intégrées, mais vous devez parfois écrire une fonction personnalisée, connue sous le nom de User-Defined Function (UDF). Dans ce module, vous apprendrez à enregistrer et à invoquer des UDF. Vous apprendrez également à utiliser Delta Lake pour créer, ajouter et réinsérer des données dans des tables Apache Spark, en tirant parti de la fiabilité et des optimisations intégrées.
Inclus
4 vidéos7 lectures6 devoirs
Afficher les informations sur le contenu du module
4 vidéos•Total 11 minutes
Décrivez le lac Delta open source•7 minutes
Résumé de la leçon•1 minute
Introduction à la leçon•2 minutes
Résumé de la leçon•1 minute
7 lectures•Total 165 minutes
Démarrez avec Delta en utilisant les API Spark•30 minutes
Exercice : Travaillez avec les fonctionnalités de base du lac Delta•30 minutes
Exercice : Utilisez la machine à voyager dans le temps du lac Delta et effectuez une optimisation•30 minutes
Écrire des fonctions définies par l'utilisateur•10 minutes
Exercice : Effectuez des opérations d'extraction, de transformation et de chargement (ETL) à l'aide de fonctions définies par l'utilisateur•30 minutes
Ressources complémentaires•5 minutes
6 devoirs•Total 60 minutes
Exercice quiz•2 minutes
Exercice quiz•2 minutes
Contrôle des connaissances•18 minutes
Exercice quiz•2 minutes
Contrôle des connaissances•15 minutes
Préparation aux tests•21 minutes
Démarrez avec Databricks et l'apprentissage automatique
Module 4•5 heures à terminer
Détails du module
Dans ce module, vous apprendrez à utiliser le package d'apprentissage automatique de PySpark pour construire les composants clés des flux de travail d'apprentissage automatique qui comprennent l'analyse exploratoire des données, l'entraînement des modèles et l'évaluation des modèles. Vous apprendrez également à construire des pipelines pour les tâches courantes de caractérisation des données.
Inclus
4 vidéos11 lectures8 devoirs
Afficher les informations sur le contenu du module
4 vidéos•Total 6 minutes
Introduction à la leçon•2 minutes
Résumé de la leçon•2 minutes
Introduction à la leçon•2 minutes
Résumé de la leçon•1 minute
11 lectures•Total 220 minutes
Comprendre l'apprentissage automatique•15 minutes
Exercice : Entraînez un modèle et créez des prédictions•30 minutes
Comprendre les données à l'aide de l'analyse exploratoire des données•5 minutes
Exercice : Effectuez une analyse exploratoire des données•30 minutes
Décrire les flux de travail de l'apprentissage automatique•10 minutes
Exercice : Construisez et évaluez un modèle d'apprentissage automatique de base•30 minutes
Effectuer la featurisation de l'ensemble de données•20 minutes
Exercice : Terminez la featurisation de l'ensemble de données•30 minutes
Comprendre la modélisation de la régression•10 minutes
Exercice : Construire et interpréter un modèle de régression•30 minutes
Ressources complémentaires•10 minutes
8 devoirs•Total 85 minutes
Exercice quiz•2 minutes
Exercice Quiz•2 minutes
Exercice quiz•2 minutes
Contrôle des connaissances•15 minutes
Exercice quiz•2 minutes
Exercice quiz•2 minutes
Contrôle des connaissances•15 minutes
Préparation aux tests•45 minutes
Gérer les cycles de vie de l'apprentissage automatique et affiner les modèles
Module 5•4 heures à terminer
Détails du module
Dans ce module, vous apprendrez à utiliser MLflow pour suivre les expériences d'apprentissage automatique et à utiliser les modules de la bibliothèque d'apprentissage automatique de Spark pour l'ajustement des hyperparamètres et la sélection des modèles.
Inclus
4 vidéos5 lectures5 devoirs
Afficher les informations sur le contenu du module
4 vidéos•Total 5 minutes
Introduction à la leçon•2 minutes
Résumé de la leçon•1 minute
Introduction à la leçon•2 minutes
Résumé de la leçon•1 minute
5 lectures•Total 130 minutes
Utilisez MLflow pour suivre les expériences, enregistrer les mesures et comparer les exécutions•30 minutes
Exercice : Travaillez avec MLflow pour suivre les métriques, les paramètres, les artefacts et les modèles de l'expérience•30 minutes
Décrire la sélection de modèles et l'ajustement des hyperparamètres•30 minutes
Exercice : Sélectionnez le modèle optimal en ajustant les hyperparamètres•30 minutes
Ressources complémentaires•10 minutes
5 devoirs•Total 79 minutes
Quiz sur l'exercice•2 minutes
Contrôle des connaissances•15 minutes
Quiz sur l'exercice•2 minutes
Contrôle des connaissances•15 minutes
Préparation aux tests•45 minutes
Entraînez un réseau neuronal distribué et servez des modèles avec Azure Machine Learning
Module 6•4 heures à terminer
Détails du module
Dans ce module, vous apprendrez à utiliser le framework Horovod d'Uber ainsi que la bibliothèque Petastorm pour exécuter des tâches d'apprentissage profond distribuées sur Spark en utilisant des ensembles de données d'apprentissage au format Apache Parquet. Vous apprendrez également à utiliser MLflow et le service Azure Machine Learning pour enregistrer, empaqueter et déployer un modèle entraîné dans Azure Container Instance et Azure Kubernetes Service en tant que service web de notation.
Inclus
5 vidéos6 lectures4 devoirs1 sujet de discussion
Afficher les informations sur le contenu du module
5 vidéos•Total 7 minutes
Introduction à la leçon•2 minutes
Résumé de la leçon•1 minute
Introduction à la leçon•2 minutes
Résumé de la leçon•1 minute
Félicitations•1 minute
6 lectures•Total 140 minutes
Utilisez Horovod pour entraîner un modèle d'apprentissage profond•30 minutes
Utilisez Petastorm pour lire les données au format Apache Parquet avec Horovod pour l'apprentissage distribué des modèles•10 minutes
Exercice : Travaillez avec Horovod et Petastorm pour former un modèle d'apprentissage profond•30 minutes
Utilisez Azure Machine Learning pour déployer des modèles de service•30 minutes
Ressources complémentaires•10 minutes
Prochaines étapes•30 minutes
4 devoirs•Total 77 minutes
Quiz sur l'exercice•2 minutes
Contrôle des connaissances•15 minutes
Contrôle des connaissances•15 minutes
Préparation aux tests•45 minutes
1 sujet de discussion•Total 30 minutes
Réfléchir à l'apprentissage•30 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
L'objectif de Microsoft est de permettre à chaque individu et à chaque organisation de la planète d'aller plus loin. Dans cette nouvelle révolution de la transformation numérique, la croissance est tirée par la technologie. Notre approche intégrée du cloud crée une plateforme inégalée pour la transformation numérique. Nous répondons aux besoins réels des clients en intégrant de manière transparente Microsoft 365, Dynamics 365, LinkedIn, GitHub, Microsoft Power Platform et Azure afin de libérer de la valeur commerciale pour toutes les organisations, des grandes entreprises aux entreprises familiales. Azure en est l'épine dorsale et le fondement.
OK
En savoir plus sur Développement de logiciels
RecommandéCertificats ProfessionnelsSpécialisationsEn rapport
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
3.1
79 avis
5 stars
40,50 %
4 stars
6,32 %
3 stars
10,12 %
2 stars
12,65 %
1 star
30,37 %
Affichage de 3 sur 79
A
AM
5·
Révisé le 29 août 2024
This is absolutely great opportunity for all students
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je m'abonne à ce certificat ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.