Les modèles multimodaux comme Gemini repoussent les limites du possible en unifiant des modalités de données traditionnellement cloisonnées. Avec Gemini, vous pouvez créer des applications qui comprennent et raisonnent de manière transparente à partir de textes, d'images et de vidéos, ce qui permet de créer une nouvelle catégorie de systèmes intelligents. Par exemple, créer un architecte d'intérieur virtuel capable d'analyser les images de la pièce d'un utilisateur, de comprendre ses préférences en matière de style à partir d'une description textuelle et de générer des recommandations personnalisées en matière de design. Vous apprendrez les techniques d'ingénierie de requête pour guider le comportement de Gemini et optimiser ses performances pour divers cours d'utilisation, de la génération d'histoires créatives à la rédaction de rapports analytiques. Vous découvrirez également comment intégrer Gemini avec des API et des bases de données externes en utilisant l'appel de fonction, avec la possibilité d'intégrer à vos applications des données en temps réel et du contenu dynamique. Ce que vous apprendrez, en détail :
Grand modèle multimodal avec Gemini
Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

(32 avis)
Expérience recommandée
Ce que vous apprendrez
Apprenez les techniques de pointe pour tirer le meilleur parti de l'IA multimodale avec la famille de modèles Gemini de Google.
Exploitez la puissance de l'attention multimodale de Gemini pour fusionner des informations provenant de textes, d'images et de vidéos dans le cadre de tâches de raisonnement complexes.
Étendez les capacités de Gemini avec des connaissances externes et des données en direct via l'appel de fonctions et l'intégration d'API.
Compétences que vous pratiquerez
- Catégorie : Appel d'outils
- Catégorie : Candidature au LLM
- Catégorie : Invitations multimodales
- Catégorie : Motifs de l'invitation
- Catégorie : Analyse d'images
- Catégorie : Optimisation des jetons
- Catégorie : Modélisation des grandes langues
Outils que vous utiliserez
- Catégorie : Gémeaux
- Catégorie : Google Gemini
- Catégorie : Interface de programmation d'applications (API)
- Catégorie : Ingénierie rapide
Détails à connaître
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Apprendre, pratiquer et appliquer des compétences prêtes à l’emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel

À propos de ce projet
Instructeur

Offert par
Méthode d’apprentissage
Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.



