As large language models revolutionize business operations, sophisticated attackers exploit AI systems through prompt injection, jailbreaking, and content manipulation—vulnerabilities that traditional security tools cannot detect. This intensive course empowers AI developers, cybersecurity professionals, and IT managers to systematically identify and mitigate LLM-specific threats before deployment. Master red-teaming methodologies using industry-standard tools like PyRIT, NVIDIA Garak, and Promptfoo to uncover hidden vulnerabilities through adversarial testing. Learn to design and implement multi-layered content-safety filters that block sophisticated bypass attempts while maintaining system functionality. Through hands-on labs, you'll establish resilience baselines, implement continuous monitoring systems, and create adaptive defenses that strengthen over time.

Secure AI: Red-Teaming & Safety Filters
Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

Secure AI: Red-Teaming & Safety Filters
Dieser Kurs ist Teil von Spezialisierung „AI Security: Security in the Age of Artificial Intelligence“


Dozenten: Brian Newman
Bei enthalten
Empfohlene Erfahrung
Was Sie lernen werden
Design red-teaming scenarios to identify vulnerabilities and attack vectors in large language models using structured adversarial testing.
Implement content-safety filters to detect and mitigate harmful outputs while maintaining model performance and user experience.
Evaluate and enhance LLM resilience by analyzing adversarial inputs and developing defense strategies to strengthen overall AI system security.
Kompetenzen, die Sie erwerben
- Kategorie: Continuous Monitoring
- Kategorie: Vulnerability Assessments
- Kategorie: Cyber Security Assessment
- Kategorie: Exploitation techniques
- Kategorie: Security Testing
- Kategorie: Security Controls
- Kategorie: Responsible AI
- Kategorie: Large Language Modeling
- Kategorie: AI Personalization
- Kategorie: Security Strategy
- Kategorie: Threat Modeling
- Kategorie: AI Security
- Kategorie: System Implementation
- Kategorie: Vulnerability Scanning
- Kategorie: LLM Application
Werkzeuge, die Sie lernen werden
- Kategorie: Prompt Engineering
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufĂĽgen
Dezember 2025
Erfahren Sie, wie Mitarbeiter fĂĽhrender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 3 Module
Erwerben Sie ein Karrierezertifikat.
FĂĽgen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
von
Mehr von Computer Security and Networks entdecken
Warum entscheiden sich Menschen fĂĽr Coursera fĂĽr ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle UnterstĂĽtzung verfĂĽgbar,
Âą Einige Aufgaben in diesem Kurs werden mit AI bewertet. FĂĽr diese Aufgaben werden Ihre Daten in Ăśbereinstimmung mit Datenschutzhinweis von Courseraverwendet.





