La visión por computador es una destreza indispensable en el mercado laboral, catalizando avances significativos en campos como la inteligencia artificial, la robótica y la automatización. Su uso transforma nuestra interacción con la tecnología, optimizando sistemas de producción y fomentando la innovación en la interacción humano-computadora. Nuestro curso brinda una comprensión detallada de esta tecnología, destacando su capacidad para procesar información visual en diversas tareas.
Daremos un enfoque profundo a la composición y procesamiento de imágenes desde una perspectiva computacional, concentrándonos en aprendizaje profundo y Redes Neuronales Convolucionales (CNN) para la clasificación de imágenes. Exploraremos modelos avanzados como los Transformer Visuales y técnicas como aprendizaje auto-supervisado, Few-Shot learning, y Masked Autoencoders, abarcando la detección de objetos, segmentación de imágenes y calibración de cámaras. En etapas avanzadas, nos enfocaremos en la reconstrucción 3D, análisis de movimiento, flujo óptico y temas emergentes como el metaverso y la realidad aumentada. El curso se basa en un aprendizaje teórico, el cual es reforzado con un enfoque práctico basado en casos y aplicaciones de la visión por computador en el mundo real. Los estudiantes accederán a recursos variados como videos, lecturas y actividades, promoviendo un aprendizaje integral y aplicado de esta tecnología revolucionaria.
¿Para quién es este curso?: (qué perfil de entrada debería tener el estudiante que toma este curso)
Este curso se dirige a cualquier persona que tenga interés en conocer de manera introductoria el área de la visión por computador y los avances contemporáneos que esta rama ha tenido en diferentes aplicaciones. Principalmente, está pensado para personas con por lo menos un título de pregrado en ingeniería y ciencias de la computación y es deseable que los estudiantes cuenten con conocimientos de básicos de programación. Sin embargo, cualquier persona que quiera estudiar esta área para aplicarla en su contexto puede tomar el curso.
Este módulo ofrece una introducción a la visión por computador, abarcando desde su conceptualización hasta sus aplicaciones prácticas. Exploraremos las tareas fundamentales que constituyen este campo, la evolución histórica de la tecnología y los principios de cómo las máquinas interpretan las imágenes. Nos adentraremos en la naturaleza de las imágenes digitales, cómo se forman y cómo se estructuran los conjuntos de datos para su análisis. Introduciremos el uso del aprendizaje profundo para la clasificación de imágenes y desglosaremos los conceptos y la arquitectura detrás de las Redes Neuronales Convolucionales (CNN). Al final de este módulo, los participantes podrán construir su propia CNN y tendrán una comprensión sólida de los fundamentos de la visión por computador, preparándolos para sumergirse en aplicaciones más complejas.
Das ist alles enthalten
4 Videos6 Lektüren1 Aufgabe2 Plug-ins
Infos zu Modulinhalt anzeigen
4 Videos•Insgesamt 52 Minuten
Bienvenida al curso•7 Minuten
Historia de la visión por computador•13 Minuten
Estructura del conjunto de datos•13 Minuten
Aprendizaje Profundo para Clasificación•19 Minuten
6 Lektüren•Insgesamt 115 Minuten
Programa del curso•20 Minuten
¿Qué es la visión por computador?•20 Minuten
¿Qué es una imagen?•20 Minuten
¿Cómo se conforma una imagen?•20 Minuten
¿Qué es una CNN?•15 Minuten
Construcción de una CNN•20 Minuten
1 Aufgabe•Insgesamt 20 Minuten
Evaluación de la semana•20 Minuten
2 Plug-ins•Insgesamt 30 Minuten
Tareas principales de la visión•15 Minuten
Arquitectura Básica de una CNN•15 Minuten
Transformers Visuales en Reconocimiento, Detección y Segmentación
Modul 2•2 Stunden abzuschließen
Moduldetails
En este módulo exploramos los Transformers Visuales, su impacto en el campo de la visión por computador y sus aplicaciones en escenarios reales. Comenzaremos con una visión general de este sistema, introduciendo su arquitectura innovadora y cómo se diferencia de otros modelos en el procesamiento de imágenes. Además, examinaremos los componentes clave que permiten abordar tareas como la clasificación, detección y segmentación de imágenes. Además, introduciremos distintos métodos de supervisión del aprendizaje automático que darán al participante herramientas necesarias en escenarios donde no hay suficientes anotaciones. Finalizado este módulo, habremos estudiado también los fundamentos de la segmentación y sus inicios como tarea de visión por computador.
Das ist alles enthalten
2 Videos4 Lektüren1 Aufgabe2 Plug-ins
Infos zu Modulinhalt anzeigen
2 Videos•Insgesamt 21 Minuten
¿Cómo funciona un transformer visual?•7 Minuten
Supervisión•13 Minuten
4 Lektüren•Insgesamt 58 Minuten
Aprendizaje auto-supervisado•15 Minuten
Aprendizaje débilmente supervisado•15 Minuten
Few-shot learning•8 Minuten
Fundamentos de la segmentación•20 Minuten
1 Aufgabe•Insgesamt 20 Minuten
Evaluación de la semana •20 Minuten
2 Plug-ins•Insgesamt 25 Minuten
Aplicaciones de Transformers Visuales en Visión por Computadora•10 Minuten
La tarea de detección•15 Minuten
De la Reconstrucción 3D a la Visión Dinámica y Egocéntrica
Modul 3•2 Stunden abzuschließen
Moduldetails
En este módulo exploraremos los principios básicos de la reconstrucción 3D, el análisis de movimiento y la visión egocéntrica. Iniciaremos con una revisión de los parámetros esenciales para la calibración de cámaras, los cuales son cruciales para el análisis de imágenes en diversas aplicaciones de la visión por computadora. Proseguiremos con el estudio de las técnicas para la reconstrucción tridimensional y el análisis del movimiento, además de revisar algunas de sus aplicaciones prácticas en escenarios reales. Posteriormente, nos enfocaremos en la visión egocéntrica, examinando su evolución y algunas de las principales bases de datos que impulsan el progreso en este campo. Al finalizar este módulo, los participantes tendrán una comprensión sólida de los principios y técnicas que fundamentan la calibración de cámaras, el análisis de movimiento y la visión egocéntrica, preparándolos para aplicar estos conocimientos en el desarrollo de tecnologías de realidad aumentada, realidad mixta y entornos virtuales.
Das ist alles enthalten
1 Video4 Lektüren1 Aufgabe2 Plug-ins
Infos zu Modulinhalt anzeigen
1 Video•Insgesamt 20 Minuten
EGO4D y Aria Project•20 Minuten
4 Lektüren•Insgesamt 57 Minuten
Calibración de la cámara•15 Minuten
Análisis de movimiento y flujo óptico•15 Minuten
¿Qué es embodied vision?•12 Minuten
Metaverso, Realidad aumentada y Realidad Mixta•15 Minuten
1 Aufgabe•Insgesamt 20 Minuten
Evaluación de la semana •20 Minuten
2 Plug-ins•Insgesamt 30 Minuten
Multi-view stereo & Structure from Motion•20 Minuten
Aplicaciones de la reconstrucción•10 Minuten
Generación de datos visuales y modelos fundacionales
Modul 4•4 Stunden abzuschließen
Moduldetails
Este módulo ofrece una introducción a la creciente área de la generación y a los modelos fundacionales en la visión por computador. Exploraremos herramientas de gran utilidad en la generación de imágenes sintéticas, como lo son las redes generativas y los modelos de difusión. Asimismo, los participantes aprenderán a reconocer las limitaciones de estos modelos y el funcionamiento del estado del arte. Exploraremos los elementos esenciales de los modelos fundacionales y cómo éstos permiten combinar datos de distinta naturaleza. Al finalizar, los participantes tendrán el conocimiento necesario para reconocer las piezas clave del desarrollo de herramientas de inteligencia artificial y estarán listos para aplicarlas en tareas de visión por computador.
Das ist alles enthalten
3 Videos3 Lektüren1 Aufgabe1 Unbewertetes Labor
Infos zu Modulinhalt anzeigen
3 Videos•Insgesamt 45 Minuten
Autoencoders Variacionales•17 Minuten
Modelos de difusión•14 Minuten
Conclusiones del curso•14 Minuten
3 Lektüren•Insgesamt 45 Minuten
Redes Generativas Adversarias•15 Minuten
Fundamentos de modelos fundacionales•15 Minuten
Resolución de problemas utilizando inteligencia artificial•15 Minuten
1 Aufgabe•Insgesamt 20 Minuten
Evaluación de la semana •20 Minuten
1 Unbewertetes Labor•Insgesamt 120 Minuten
Tutorial PytorchWildLife•120 Minuten
Auf einen Abschluss hinarbeiten
Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von Universidad de los Andesangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, können Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte können mit Ihnen übertragen werden.¹
Mögliche Abschüsse anzeigen
Auf einen Abschluss hinarbeiten
Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von Universidad de los Andesangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, können Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte können mit Ihnen übertragen werden.¹
¹Erfolgreiche Bewerbung und Einschreibung sind erforderlich. Es gelten die Zulassungsbedingungen. Jede Einrichtung legt die Anzahl der Credits fest, die durch die Absolvierung dieser Inhalte anerkannt werden und auf die Abschlussanforderungen angerechnet werden können, wobei bereits vorhandene Credits berücksichtigt werden. Klicken Sie auf einen bestimmten Kurs, um weitere Informationen zu erhalten.
La Universidad de los Andes es una institución autónoma, independiente e innovadora que propicia el pluralismo, la tolerancia y el respeto de las ideas; que busca la excelencia académica e imparte a sus estudiantes una formación crítica y ética para afianzar en ellos la conciencia de sus responsabilidades sociales y cívicas, así como su compromiso con el entorno.
OK
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
When will I have access to the lectures and assignments?
To access the course materials, assignments and to earn a Certificate, you will need to purchase the Certificate experience when you enroll in a course. You can try a Free Trial instead, or apply for Financial Aid. The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
What will I get if I purchase the Certificate?
When you purchase a Certificate you get access to all course materials, including graded assignments. Upon completing the course, your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile.
Is financial aid available?
Yes. In select learning programs, you can apply for financial aid or a scholarship if you can’t afford the enrollment fee. If fin aid or scholarship is available for your learning program selection, you’ll find a link to apply on the description page.