Packt

Spécialisation "Big Data Foundations with Hadoop and Spark"

Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues. Consultez les langues disponibles.
Packt

Spécialisation "Big Data Foundations with Hadoop and Spark"

Master Big Data with Hadoop and Spark.

Learn Hadoop, Spark, Scala, and Kafka to process, analyze, and stream massive datasets in real time.

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet

des 15 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet

des 15 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Install and configure Hadoop and Spark to manage large-scale datasets effectively.

  • Apply Scala and Spark to build, query, and optimize complex big data pipelines.

  • Process and analyze real-time streaming data using Spark Streaming.

  • Implement Kafka producers, consumers, and advanced operations for scalable solutions.

Compétences que vous acquerrez

  • Catégorie : Applied Machine Learning
  • Catégorie : Big Data
  • Catégorie : Data Integration
  • Catégorie : Data Pipelines
  • Catégorie : Data Processing
  • Catégorie : Distributed Computing
  • Catégorie : Java
  • Catégorie : Real Time Data
  • Catégorie : System Design and Implementation
  • Catégorie : Systems Design

Outils que vous découvrirez

  • Catégorie : Apache Cassandra
  • Catégorie : Apache Hadoop
  • Catégorie : Apache Hive
  • Catégorie : Apache Kafka
  • Catégorie : Apache Spark
  • Catégorie : AWS Kinesis
  • Catégorie : Command-Line Interface
  • Catégorie : IntelliJ IDEA
  • Catégorie : Query Languages
  • Catégorie : Scala Programming

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais

91%

of learners achieved a positive career outcome

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Packt

Spécialisation - série de 4 cours

The Ultimate Hands-On Hadoop

The Ultimate Hands-On Hadoop

COURS 1, 20 heures

Ce que vous apprendrez

  • Remember Hadoop setup and configuration steps.

  • Understand the Hadoop ecosystem, including HDFS, MapReduce, and YARN.

  • Apply queries using Pig, Hive, and Spark.

  • Evaluate Hadoop cluster performance and optimize it.

Compétences que vous acquerrez

Catégorie : System Design and Implementation
Catégorie : Data Import/Export
Catégorie : Real Time Data
Catégorie : NoSQL
Catégorie : AWS Kinesis
Catégorie : MongoDB
Catégorie : Apache Kafka
Catégorie : Data Processing
Catégorie : Data Pipelines
Catégorie : Data Integration
Catégorie : Apache Hadoop
Catégorie : Apache Spark
Catégorie : Apache Hive
Catégorie : Applied Machine Learning
Catégorie : Query Languages
Catégorie : Systems Design
Catégorie : Big Data
Catégorie : SQL
Catégorie : Scalability
Catégorie : Distributed Computing
Apache Spark with Scala – Hands-On with Big Data!

Apache Spark with Scala – Hands-On with Big Data!

COURS 2, 11 heures

Ce que vous apprendrez

  • Design and implement advanced Spark applications tailored to complex data processing needs.

  • Develop and execute Spark scripts to process large datasets and stream real-time data.

  • Compare and optimize Spark algorithms for better performance in big data applications.

  • Assess machine learning models' effectiveness using Spark MLlib for accurate predictions.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Graph Theory
Catégorie : Distributed Computing
Catégorie : Real Time Data
Catégorie : Data Manipulation
Catégorie : IntelliJ IDEA
Catégorie : Software Development Tools
Catégorie : Development Environment
Catégorie : Integrated Development Environments
Catégorie : Data Processing
Catégorie : Programming Principles
Catégorie : Performance Tuning
Catégorie : Big Data
Catégorie : Applied Machine Learning
Catégorie : Scala Programming
Catégorie : Data Transformation

Ce que vous apprendrez

  • Identify key components of the Spark and Scala development environment.

  • Explain the core concepts of Scala and Spark, including Resilient Distributed Datasets (RDDs) and windowing mechanisms.

  • Differentiate between various data integration techniques with Spark Streaming, such as Kafka, Flume, and Cassandra.

  • Assess the performance and reliability of Spark Streaming applications in production environments.

Compétences que vous acquerrez

Catégorie : Apache Cassandra
Catégorie : Apache Kafka
Catégorie : Apache Spark
Catégorie : Real Time Data
Catégorie : Application Deployment
Catégorie : Cloud Deployment
Catégorie : Development Environment
Catégorie : Scala Programming
Catégorie : Distributed Computing
Catégorie : Programming Principles
Catégorie : Big Data
Catégorie : Applied Machine Learning
Catégorie : Data Structures
Catégorie : Apache Hadoop
Catégorie : Data Processing

Ce que vous apprendrez

  • Explain the architecture and core concepts of Apache Kafka.

  • Set up a personal Kafka development environment.

  • Develop Java applications to produce and consume messages in Kafka.

Compétences que vous acquerrez

Catégorie : Apache Kafka
Catégorie : Performance Tuning
Catégorie : Java
Catégorie : Real Time Data
Catégorie : Software Installation
Catégorie : Data Pipelines
Catégorie : Command-Line Interface
Catégorie : Data Integration
Catégorie : Java Programming
Catégorie : Distributed Computing
Catégorie : Unix Commands
Catégorie : Enterprise Application Management

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Packt - Course Instructors
Packt
1 893 Cours522 372 apprenants

Offert par

Packt

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions