Aktualisiert im Mai 2025. Dieser Kurs enthält jetzt den Coursera Coach! Eine intelligentere Art zu lernen mit interaktiven Unterhaltungen in Echtzeit, die Ihnen helfen, Ihr Wissen zu testen, Annahmen in Frage zu stellen und Ihr Verständnis zu vertiefen, während Sie im Kurs vorankommen. Schöpfen Sie das volle Potenzial unstrukturierter Daten aus, indem Sie Techniken zur Vorverarbeitung für LLMs und Retrieval-Augmented Generation (RAG) Systeme beherrschen. Dieser umfassende Kurs vermittelt Ihnen die Fähigkeiten, unstrukturierte Daten für fortgeschrittene KI-Anwendungen vorzubereiten und so einen hochwertigen Input für bessere Ergebnisse zu gewährleisten. Vom Verständnis der Komplexität der Datenvorverarbeitung bis hin zu praktischen Projekten erhalten Sie wertvolle Einblicke in modernste Frameworks und Tools. Ihre Reise beginnt mit der Einrichtung einer robusten Entwicklungsumgebung, einschließlich API-Konten und wichtiger Integrationen. Anschließend tauchen Sie in die Feinheiten der Vorverarbeitung unstrukturierter Daten ein und stellen sich Herausforderungen wie der Normalisierung von Daten, dem Chunking und der Extraktion von Metadaten. Mit dem Unstructured Framework als Leitfaden werden Sie HTML-, PDF- und PPTX-Dokumente effizient vorverarbeiten und eine optimale Datenstrukturierung sicherstellen. Der Kurs legt den Schwerpunkt auf reale Anwendungen und bietet praktische Erfahrungen mit semantischer Ähnlichkeit, Vektor-Datenbanken und hybriden Suchstrategien. Sie lernen fortgeschrittene Techniken zur Erkennung von Dokumentenlayouts kennen und nutzen Werkzeuge wie Visual Transformers und LangChain, um komplexe Dokumente vorzuverarbeiten und aussagekräftige Erkenntnisse zu gewinnen. Abschließend wenden Sie all diese Fähigkeiten beim Aufbau eines voll funktionsfähigen RAG-Systems an und integrieren die erlernten Techniken zur dynamischen Dateninteraktion. Dieser Kurs ist ideal für Data Engineers, KI-Praktiker und Entwickler, die ihre Fähigkeiten zur Vorverarbeitung verfeinern möchten. Obwohl Vertrautheit mit Python und der Nutzung grundlegender APIs hilfreich ist, ist der Kurs sowohl für Fortgeschrittene als auch für diejenigen, die fortgeschrittene Kenntnisse suchen, strukturiert.

Vorverarbeitung unstrukturierter Daten für LLMs und RAG-Systeme

Vorverarbeitung unstrukturierter Daten für LLMs und RAG-Systeme

Dozent: Packt - Course Instructors
Bei enthalten
Empfohlene Erfahrung
Was Sie lernen werden
Meistertechniken für die Vorverarbeitung unstrukturierter Daten für LLM- und RAG-Systeme.
Extrahieren und Normalisieren von Daten aus komplexen Dokumenttypen wie PDFs und HTML.
Umsetzung der semantischen Ähnlichkeit und der Extraktion von Metadaten mit Hilfe von Vektor-Datenbanken.
Erstellen Sie ein RAG-System zur dynamischen Interaktion mit Ihren vorverarbeiteten Daten.
Kompetenzen, die Sie erwerben
- Kategorie: Abruf-erweiterte Erzeugung
- Kategorie: Qualität der Daten
- Kategorie: Einbettungen
- Kategorie: LLM-Bewerbung
Werkzeuge, die Sie lernen werden
- Kategorie: Vektordatenbanken
- Kategorie: LangChain
- Kategorie: Anwendungs-Rahmenwerke
- Kategorie: Vision Transformer (ViT)
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
8 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

In diesem Kurs gibt es 8 Module
Dozent

von
Mehr von Datenverwaltung entdecken
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,




