Generative AI Part 1

Generative AI Part 1

Instructor: Ramin Mohammadi

Access provided by Birlasoft

7 modules

Gain insight into a topic and learn the fundamentals.

Intermediate level

Recommended experience

3 weeks to complete

at 10 hours a week

Flexible schedule

Learn at your own pace

7 modules

Gain insight into a topic and learn the fundamentals.

Intermediate level

Recommended experience

3 weeks to complete

at 10 hours a week

Flexible schedule

Learn at your own pace

Details to know

Shareable certificate

Add to your LinkedIn profile

Assessments

18 assignments

Taught in English

See how employees at top companies are mastering in-demand skills

Learn more about Coursera for Business

logos of Petrobras, TATA, Danone, Capgemini, P&G and L'Oreal

There are 7 modules in this course

Introduces the theoretical foundations and advanced concepts of neural networks, generative models, transformers, and large language models. Students will explore how these AI systems create new data, process information, and learn through feedback, while analyzing their applications across various fields. The course emphasizes key principles in model building, optimization, and real-world generative AI use cases.

In this module, you will explore the foundations of neural networks, including perceptrons, architectures, and learning algorithms. You will dive deeply into optimization methods critical for efficient training, focusing on advanced techniques like Newton’s and quasi-Newton methods, momentum, RMSProp, and Adam optimization algorithms.

What's included

6 videos17 readings2 assignments

6 videosTotal 29 minutes

Neural Networks Part 1: Perceptron6 minutes
Neural Networks Part 2: How Neural Networks Learn6 minutes
Neural Networks Part 3: Back Propagation7 minutes
Optimization Technique Overview Part 13 minutes
Optimization Technique Overview Part 24 minutes
Optimization Technique Overview Part 33 minutes

17 readingsTotal 257 minutes

Course Introduction1 minute
Meet Your Faculty1 minute
Syllabus - Generative AI Part 110 minutes
Recommended Prior Knowledge100 minutes
Academic Integrity1 minute
Perceptron In-Depth10 minutes
Neural Network Breakdown15 minutes
Neural Network Structure5 minutes
How Neural Networks Learn: Deep Dive10 minutes
Backpropagation & SGD20 minutes
Module Overview3 minutes
Matrices15 minutes
Newton's Methods15 minutes
Quasi-Newton Methods15 minutes
Root-Mean-Square Propagation15 minutes
Adaptive Moment Estimation20 minutes
Module Wrap-Up1 minute

2 assignmentsTotal 20 minutes

Module 1- Assess Your Learning 110 minutes
Module 1- Assess Your Learning 210 minutes

This module guides you through the mathematical approaches to regularization techniques that enhance neural network generalization and prevent overfitting. You will analyze concepts including Stein’s unbiased risk estimator, eigen decomposition, ensemble methods, dropout mechanisms, and advanced normalization techniques such as batch normalization.

What's included

4 videos17 readings2 assignments

4 videosTotal 23 minutes

Regularization: Model Selection and Complexity5 minutes
Regularization Techniques8 minutes
Introduction to Dropout4 minutes
Introduction to Batch Normalization6 minutes

17 readingsTotal 160 minutes

Module Overview1 minute
Stein’s Unbiased Risk Estimator15 minutes
Stein's Lemma15 minutes
Regularization10 minutes
Why Does Regularization Work?15 minutes
Eigen Decomposition and Singular Value Decomposition15 minutes
Understanding the Search Space5 minutes
Regularization Techniques15 minutes
Bagging and Other Ensemble Methods5 minutes
Deep Dive Into Dropout15 minutes
Applying Dropout to Linear Regression15 minutes
Deep Dive Into Batch Normalization2 minutes
Internal Covariate Shift and Domain Adaptation10 minutes
New Batch Normalization Techniques15 minutes
Batch Normalization Effects5 minutes
Alternatives to Batch Normalization1 minute
Module Wrap-Up1 minute

2 assignmentsTotal 20 minutes

Module 2- Assess Your Learning 110 minutes
Module 2- Assess Your Learning 210 minutes

In this module, you will examine convolutional neural networks (CNNs), including convolution operations, parameter sharing, kernel methods, and multi-dimensional data structures. You'll explore advanced CNN architectures, regularization, normalization techniques, and the implications of random kernels on network learning behavior.

What's included

5 videos31 readings2 assignments

5 videosTotal 46 minutes

Convolutional Neural Networks Part 1: The First Principles10 minutes
Convolutional Neural Networks Part 2: 1D Input8 minutes
Convolutional Neural Networks Part 3: Multiple Dimensions9 minutes
Convolutional Neural Networks Part 4: Backpropagation12 minutes
Convolutional Neural Networks Part 5: PixelCNN7 minutes

31 readingsTotal 270 minutes

Module Overview1 minute
Introduction to Convolutional Neural Networks2 minutes
Invariance and Equivariance5 minutes
Convolution5 minutes
Translation5 minutes
Kernel Flipping5 minutes
Convolution vs. Cross-Correlation5 minutes
Edge Detection15 minutes
Types of Kernels5 minutes
Parameter Sharing and Filters2 minutes
CNNs for 1D Inputs10 minutes
Padding5 minutes
Stride, Kernel Size, and Dilation2 minutes
Convolutional Layers as Fully Connected Layers10 minutes
Convolution in Multidimensional Arrays5 minutes
Architecture of Convolutional NNs10 minutes
Downsampling15 minutes
Upsampling and Layers5 minutes
End-to-End Visualization of CNNs30 minutes
Backpropagation15 minutes
Convolutional Layers25 minutes
Kernel Weights15 minutes
Applications of CNNs20 minutes
Residual Neural Networks20 minutes
Recap on Regularization2 minutes
Ideas to Get Around the Optimization Problem5 minutes
Layer Normalization Formulas5 minutes
Filter Response Normalization (FRN)10 minutes
Normalizer-Free Networks5 minutes
Why Random Kernels Learn Different Things5 minutes
Module Wrap-Up1 minute

2 assignmentsTotal 13 minutes

Module 3- Assess Your Learning 110 minutes
Module 3- Assess Your Learning 23 minutes

In this module, you will analyze the maths underpinning generative models and maximum likelihood estimation (MLE). You will explore divergence metrics such as Kullback-Leibler divergence, Bayesian network structures, and autoregressive modeling methods, focusing on their theoretical foundations and practical implications.

What's included

6 videos32 readings3 assignments

6 videosTotal 53 minutes

Intro to Maximum Likelihood Learning9 minutes
Divergence Methods & Gradient Descent11 minutes
Representation Part 1: Distributions10 minutes
Representation Part 2: Discriminative vs General Models9 minutes
Autoregressive Models General Principles9 minutes
Autoregressive Models Continued7 minutes

32 readingsTotal 225 minutes

Module Overview1 minute
Learning a Generative Model8 minutes
Goal of Learning3 minutes
What is “Best?"2 minutes
Learning as Density Estimation1 minute
Kullback-Leibler (KL-Divergence)3 minutes
Detour on KL-Divergence3 minutes
Expected Log-Likelihood5 minutes
Monte Carlo Estimation8 minutes
Extending the MLE Principle to Autoregressive Models5 minutes
MLE Learning: Gradient Descent3 minutes
MLE Learning: Stochastic Gradient Descent4 minutes
Empirical Risk and Overfitting10 minutes
Learning a Generative Model Part 25 minutes
Basic Discrete Distributions10 minutes
Structure Through Independence3 minutes
Key Notion: Conditional Independence15 minutes
Bayesian Networks5 minutes
Examples10 minutes
Naive Bayes8 minutes
Discriminative vs. Generative Models10 minutes
Generative Models Are Still Useful8 minutes
Bayesian Networks vs. Neural Models20 minutes
Motivating Example: MNIST2 minutes
Introduction to Autoregressive Models10 minutes
Fully Visible Sigmoid Belief Networks (FVSBN)10 minutes
NADE: Neural Autoregressive Density Estimation25 minutes
General Discrete Distributions5 minutes
Real-Valued Neural Autoregressive Density-Estimator (RNADE)5 minutes
Autoregressive Models vs. Autoencoder15 minutes
Summary of Autoregressive Models2 minutes
Module Wrap-Up1 minute

3 assignmentsTotal 30 minutes

Module 4- Assess Your Learning 110 minutes
Module 4- Assess Your Learning 210 minutes
Module 4- Assess Your Learning 310 minutes

In this module, you will rigorously examine the foundations and implementation details of Recurrent Neural Networks (RNNs) for modeling sequential data. You will study the structure, dynamics, training procedures, and limitations of standard RNNs, explore gated architectures like LSTM and GRU mathematically, and extend these models with bidirectional and multilayer approaches.

What's included

4 videos14 readings3 assignments

4 videosTotal 31 minutes

Introduction to Recurrent Neural Networks11 minutes
Training RNNs7 minutes
Long Short-Term Memory8 minutes
Gated Recurrent Unit (GRU)5 minutes

14 readingsTotal 93 minutes

Module Overview10 minutes
Introduction to Recurrent Neural Networks5 minutes
Dynamic Systems5 minutes
Computing Gradient in RNNs10 minutes
Training an RNN Language Model8 minutes
Problems with RNNs8 minutes
Potential Solutions to RNN Issues10 minutes
Gated RNNs and LSTM10 minutes
Gated Recurrent Unit: In-Depth10 minutes
Extension of Residual Networks to RNNs5 minutes
Motivation1 minute
Intro to Bidirectional RNNs5 minutes
Multilayer RNNs5 minutes
Module Wrap-Up1 minute

3 assignmentsTotal 9 minutes

Module 5- Assess Your Learning 13 minutes
Module 5- Assess Your Learning 23 minutes
Module 5- Assess Your Learning 33 minutes

You will explore techniques essential to sequence-to-sequence modeling, with special emphasis on attention mechanisms. The module will guide you through the motivations behind attention, how attention weights are calculated, and how attention significantly improves sequence models in practical tasks.

What's included

3 videos8 readings2 assignments

3 videosTotal 20 minutes

Sequence to Sequence Models7 minutes
Attention in Seq2Seq: Dynamic Attention9 minutes
Attention in Translation: Decoding4 minutes

8 readingsTotal 38 minutes

Module Overview2 minutes
Motivation for Attention Mechanism2 minutes
Seq2Seq7 minutes
Challenges of Seq2Seq5 minutes
Attention Mechanism10 minutes
Computing Attention Weights5 minutes
Detailed Attention in Seq2Seq & Decoding5 minutes
Module Wrap-Up2 minutes

2 assignmentsTotal 6 minutes

Module 6- Assess Your Learning 13 minutes
Module 6- Assess Your Learning 23 minutes

This module offers a deep investigation into Transformer architectures, focusing on self-attention mechanisms, positional encodings, multi-head attention, and various Transformer configurations. You will analyze how Transformers structurally differ from RNNs, and mathematically explore their capabilities and limitations.