Aktualisiert im Mai 2025. Dieser Kurs enthält jetzt den Coursera Coach! Eine intelligentere Art zu lernen mit interaktiven Unterhaltungen in Echtzeit, die Ihnen helfen, Ihr Wissen zu testen, Annahmen in Frage zu stellen und Ihr Verständnis zu vertiefen, während Sie im Kurs vorankommen. Schöpfen Sie das volle Potenzial unstrukturierter Daten aus, indem Sie Techniken zur Vorverarbeitung für LLMs und Retrieval-Augmented Generation (RAG) Systeme beherrschen. Dieser umfassende Kurs vermittelt Ihnen die Fähigkeiten, unstrukturierte Daten für fortgeschrittene KI-Anwendungen vorzubereiten und so einen hochwertigen Input für bessere Ergebnisse zu gewährleisten. Vom Verständnis der Komplexität der Datenvorverarbeitung bis hin zu praktischen Projekten erhalten Sie wertvolle Einblicke in modernste Frameworks und Tools. Ihre Reise beginnt mit der Einrichtung einer robusten Entwicklungsumgebung, einschließlich API-Konten und wichtiger Integrationen. Anschließend tauchen Sie in die Feinheiten der Vorverarbeitung unstrukturierter Daten ein und stellen sich Herausforderungen wie der Normalisierung von Daten, dem Chunking und der Extraktion von Metadaten. Mit dem Unstructured Framework als Leitfaden werden Sie HTML-, PDF- und PPTX-Dokumente effizient vorverarbeiten und eine optimale Datenstrukturierung sicherstellen. Der Kurs legt den Schwerpunkt auf reale Anwendungen und bietet praktische Erfahrungen mit semantischer Ähnlichkeit, Vektor-Datenbanken und hybriden Suchstrategien. Sie lernen fortgeschrittene Techniken zur Erkennung von Dokumentenlayouts kennen und nutzen Werkzeuge wie Visual Transformers und LangChain, um komplexe Dokumente vorzuverarbeiten und aussagekräftige Erkenntnisse zu gewinnen. Abschließend wenden Sie all diese Fähigkeiten beim Aufbau eines voll funktionsfähigen RAG-Systems an und integrieren die erlernten Techniken zur dynamischen Dateninteraktion. Dieser Kurs ist ideal für Data Engineers, KI-Praktiker und Entwickler, die ihre Fähigkeiten zur Vorverarbeitung verfeinern möchten. Obwohl Vertrautheit mit Python und der Nutzung grundlegender APIs hilfreich ist, ist der Kurs sowohl für Fortgeschrittene als auch für diejenigen, die fortgeschrittene Kenntnisse suchen, strukturiert.

Genießen Sie unbegrenztes Wachstum mit einem Jahr Coursera Plus für 199 $ (regulär 399 $). Jetzt sparen.

Vorverarbeitung unstrukturierter Daten für LLMs und RAG-Systeme

Dozent: Packt - Course Instructors
Bei enthalten
Empfohlene Erfahrung
Was Sie lernen werden
Meistertechniken für die Vorverarbeitung unstrukturierter Daten für LLM- und RAG-Systeme.
Extrahieren und Normalisieren von Daten aus komplexen Dokumenttypen wie PDFs und HTML.
Umsetzung der semantischen Ähnlichkeit und der Extraktion von Metadaten mit Hilfe von Vektor-Datenbanken.
Erstellen Sie ein RAG-System zur dynamischen Interaktion mit Ihren vorverarbeiteten Daten.
Kompetenzen, die Sie erwerben
- Kategorie: LangChain
- Kategorie: Einbettungen
- Kategorie: Abruf-erweiterte Erzeugung
- Kategorie: Datenqualität
- Kategorie: Daten in Echtzeit
- Kategorie: Vektor-Datenbanken
- Kategorie: Vision Transformer (ViT)
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
8 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

In diesem Kurs gibt es 8 Module
In diesem Modul führen wir Sie in den Kurs ein und zeigen Ihnen die Ziele des Kurses, die Fähigkeiten und Kenntnisse, die Sie für den Erfolg benötigen, sowie den Aufbau des Inhalts auf, um Sie durch den Prozess der Vorbereitung unstrukturierter Daten für große Sprachmodelle (LLMs) und Retrieval-Augmented Generation (RAG) Systeme zu führen.
Das ist alles enthalten
2 Videos1 Lektüre
In diesem Modul führen wir Sie durch die Einrichtung der erforderlichen Entwicklungsumgebung, einschließlich der Erstellung und Konfiguration von API-Konten, der Integration des Unstructured Frameworks und der Durchführung eines Testlaufs, um sicherzustellen, dass alles funktioniert, bevor Sie mit der Datenvorverarbeitung fortfahren.
Das ist alles enthalten
4 Videos1 Aufgabe
In diesem Modul werden wir die Feinheiten der Datenvorverarbeitung für LLMs erforschen und dabei auf die Herausforderungen eingehen, die unstrukturierte Daten mit sich bringen, sowie auf die Techniken, die erforderlich sind, um diese zu bewältigen. Sie lernen den gesamten Workflow kennen - von der Datenbereinigung und -normalisierung bis hin zur Strukturierung und Chunking - und erhalten schließlich einen umfassenden Überblick über das Unstructured Framework.
Das ist alles enthalten
6 Videos1 Aufgabe
In diesem Modul werden wir in praktische Übungen eintauchen und das Unstructured Framework zur Vorverarbeitung verschiedener Dokumenttypen verwenden. Sie werden die Schritte zur Extraktion und Normalisierung von Daten aus PDFs, PPTX-Dateien und HTML erkunden und entdecken, wie diese Prozesse die Datenqualität für nachgelagerte Anwendungsfälle in LLMs und RAG-Systemen verbessern.
Das ist alles enthalten
4 Videos1 Aufgabe
In diesem Modul konzentrieren wir uns auf das Chunking und die Extraktion von Metadaten und untersuchen, wie man den Inhalt von Dokumenten in logische Einheiten aufteilt und mit Metadaten für fortgeschrittene Anwendungen wie semantische Ähnlichkeit und hybride Suche anreichert. Anhand praktischer Übungen lernen Sie, wie Sie Workflows zur Dokumentenverarbeitung optimieren, Dokumentelemente effektiv strukturieren und die Ergebnisse in eine Vektor-Datenbank integrieren können.
Das ist alles enthalten
8 Videos1 Aufgabe
In diesem Modul werden wir die Herausforderungen der Vorverarbeitung komplexer Dokumente, einschließlich PDFs und Bilder, angehen, indem wir fortschrittliche Werkzeuge wie DLD und ViT nutzen. Sie lernen praktische Methoden zum Extrahieren und Zusammenfassen von Tabelleninhalten kennen, erhalten Einblicke in die effiziente Vorverarbeitung von HTML- und PDF-Dateien und bewerten die Kompromisse zwischen verschiedenen Vorverarbeitungstechniken.
Das ist alles enthalten
7 Videos1 Aufgabe
In diesem Modul werden wir die im Kurs erlernten Fähigkeiten und Techniken zusammenführen, um ein komplettes RAG-System aufzubauen. Von der Vorverarbeitung und Strukturierung komplexer Dokumente bis hin zur Erstellung einer durchsuchbaren Datenbank und der Ermöglichung von Konversationsinteraktionen mit Ihren Dokumenten werden Sie praktische Erfahrungen bei der Bereitstellung einer End-to-End-Lösung sammeln, die für reale Anwendungen zugeschnitten ist.
Das ist alles enthalten
6 Videos1 Aufgabe
In diesem Modul werden wir den Kurs abschließen, indem wir die wichtigsten Meilensteine und erworbenen Fähigkeiten wiederholen. Sie erhalten Anleitung zur Anwendung Ihres Wissens auf reale Szenarien und entdecken Ressourcen, um Ihre Reise in der fortgeschrittenen Datenvorverarbeitung und RAG-Systementwicklung fortzusetzen.
Das ist alles enthalten
1 Video2 Aufgaben
Dozent

von
Mehr von Datenmanagement entdecken
Status: KostenlosDeepLearning.AI
Status: Vorschau
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?





Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Ja, Sie können das erste Video in der Vorschau ansehen und den Lehrplan einsehen, bevor Sie sich anmelden. Sie müssen den Kurs kaufen, um auf Inhalte zuzugreifen, die nicht in der Vorschau enthalten sind.
Wenn Sie sich vor dem Beginn der Sitzung in den Kurs einschreiben, haben Sie Zugang zu allen Vorlesungsvideos und Lesestoff für den Kurs. Sobald die Sitzung beginnt, können Sie die Aufgaben einreichen.
Sobald Sie sich angemeldet haben und Ihre Sitzung beginnt, haben Sie Zugang zu allen Videos und anderen Ressourcen, einschließlich der Lektüre und dem Diskussionsforum des Kurses. Sie können Übungsaufgaben ansehen und einreichen und die erforderlichen benoteten Aufgaben erledigen, um eine Note und ein Kurszertifikat zu erhalten.
Weitere Fragen
Finanzielle Unterstützung verfügbar,

