Multimodale Modelle wie Gemini verschieben die Grenzen des Machbaren, indem sie traditionell getrennte Datenmodalitäten zusammenführen. Mit Gemini können Sie Anwendungen entwickeln, die nahtlos Text, Bilder und Videos verstehen und schlussfolgern und so eine neue Klasse intelligenter Systeme ermöglichen. So können Sie z. B. einen virtuellen Innenarchitekten erstellen, der die Raumbilder eines Benutzers analysiert, seine Stilvorlieben anhand einer Textbeschreibung erkennt und personalisierte Designempfehlungen generiert. Oder die Erstellung einer intelligenten Dokumentenverarbeitungspipeline, die strukturierte Daten aus komplexen PDFs extrahieren, Fragen auf der Grundlage des Inhalts beantworten und menschenähnliche Zusammenfassungen generieren kann. Sie lernen Prompt Engineering-Techniken kennen, um das Verhalten von Gemini zu steuern und seine Leistung für verschiedene Anwendungsfälle zu optimieren, von der Erstellung kreativer Geschichten bis hin zum Schreiben analytischer Berichte. Außerdem erfahren Sie, wie Sie Gemini mit Hilfe von Funktionsaufrufen in externe APIs und Datenbanken integrieren können, um Ihre Anwendungen mit Echtzeitdaten und dynamischen Inhalten zu versorgen. Was Sie im Einzelnen lernen werden:
Großes multimodales Modell Prompting mit Gemini

(31 Bewertungen)
Empfohlene Erfahrung
Was Sie lernen werden
Lernen Sie modernste Techniken kennen, um das Beste aus der multimodalen KI mit der Gemini-Modellfamilie von Google herauszuholen.
Nutzen Sie die Leistung der cross-modalen Aufmerksamkeit von Gemini, um Informationen aus Text, Bild und Video für komplexe Denkaufgaben zusammenzuführen.
Erweitern Sie die Möglichkeiten von Gemini mit externem Wissen und Live-Daten über Funktionsaufrufe und API-Integration.
Kompetenzen, die Sie festigen
- Kategorie: Werkzeuganrufe
- Kategorie: LLM-Bewerbung
- Kategorie: Multimodale Aufforderungen
- Kategorie: Prompt-Muster
- Kategorie: Bildanalyse
- Kategorie: Token-Optimierung
- Kategorie: Modellierung großer Sprachen
Tools, die Sie verwenden werden
- Kategorie: Zwillinge
- Kategorie: Google Gemini
- Kategorie: Anwendungsprogrammierschnittstelle (API)
- Kategorie: Schnelles Engineering
Wichtige Details
Nur als Desktop-Version verfügbar
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Lernen, Üben und Anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden
- Nehmen Sie an Schulungen von Branchenexperten teil
- Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung

Über dieses Projekt
Dozent

Was Sie beim Lernen erwartet
Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

