¿Qué hace un ingeniero de fiabilidad del sitio? Tu guía

Written by Coursera • Updated on

Un ingeniero de fiabilidad de sitios web se encarga de que las aplicaciones y los sitios web funcionen sin problemas y de forma confiable. Obtén más información sobre esta carrera emergente y las habilidades que necesitarás para empezar.

[Imagen destacada] Un ingeniero de fiabilidad de sitios (SRE) trabaja en su ordenador de sobremesa.

Read in English. (Leer en inglés.)

Un ingeniero de fiabilidad del sitio (site reliability engineer, SRE) garantiza que los sitios web sean más fiables, eficientes y escalables. Ayudan a crear soluciones automatizadas para mejorar los aspectos operativos del sitio. Como cada vez realizamos más tareas en línea en nuestra vida cotidiana, es cada vez más importante mantener estas tecnologías en funcionamiento. Echemos un vistazo a esta carrera emergente, incluyendo las habilidades que necesitas para empezar.

¿Sabías que…?

Los SREs empezaron a aparecer en 2003 cuando Google formó un equipo de ingenieros de software con el único propósito de mejorar la fiabilidad y la escalabilidad de los sitios de la empresa. El enfoque fue tan eficaz que otras empresas tecnológicas líderes, como Netflix y Amazon, pronto siguieron su ejemplo.

Placeholder

¿Qué es un ingeniero de fiabilidad de sitios? 

El papel de un site reliability engineer garantiza que un sitio tenga las funciones necesarias para proporcionar a los usuarios los servicios solicitados. En el mundo automatizado de hoy, esto incluye la creación de herramientas de autoservicio que proporcionen mayor disponibilidad, rendimiento y eficiencia a los usuarios.

Según el vicepresidente de ingeniería de Google, Ben Treynor, SRE es "lo que ocurre cuando se pide a un ingeniero de software que diseñe una función de operaciones". La mayoría de los SREs dedican su tiempo a tareas de operaciones y proyectos de desarrollo (desarrollo de nuevas funciones, automatización de procesos, escalado de sistemas, etc.).

Las tareas y deberes de los roles de ingeniería de fiabilidad del sitio podrían incluir:

  • Asesorar y entrenar a los ingenieros junior

  • Realizar revisiones después de los incidentes

  • Codificación de la automatización dentro de la infraestructura del sitio

  • Documentar su trabajo para convertir los hallazgos en acciones repetibles

  • Anticiparse a los posibles problemas antes de que se produzcan (y proponer soluciones)

  • Colaborar con los desarrolladores de software, los ingenieros y los equipos de operaciones

  • Supervisar los sitios y el software para asegurarse de que funcionan correctamente (incluidos los turnos de guardia)

SRE vs. DevOps: ¿Cuál es la diferencia?

Las disciplinas de los site reliability engineers y DevOps se solapan en muchos aspectos, pero también tienen una diferencia clave. Los equipos de DevOps definen lo que hay que hacer para minimizar las diferencias entre el desarrollo de software y las operaciones. Los equipos de SRE traducen los pilares de DevOps en prácticas. Si DevOps es el "qué", SRE es el "cómo".

Placeholder

Habilidades del ingeniero de fiabilidad del sitio

El éxito en este papel a menudo implica ser un solucionador de problemas proactivo con un ojo para la ingeniería y el desarrollo de software. Estas son algunas de las habilidades que te servirán en este trabajo:

  • Comprensión del desarrollo y las operaciones

  • Familiaridad con los sistemas de supervisión de la producción

  • Atención al detalle

  • Habilidades analíticas y de resolución de problemas

  • Capacidad para colaborar con equipos multifuncionales

  • Codificación en Java, Python, Perl o Ruby

  • Capacidad de redacción técnica

Carrera profesional del ingeniero de fiabilidad de sitios web

La ingeniería de fiabilidad del sitio es típicamente un papel de nivel medio, una buena opción para aquellos con algunos años de experiencia como administrador de sistemas o desarrollador de software. La mayoría de las empresas exigen una licenciatura en informática o un campo relacionado. También son ventajosas las certificaciones adicionales y la experiencia con diferentes códigos de funcionamiento y programación.

Si estás empezando, un puesto de nivel junior en un equipo de ingeniería de fiabilidad de sitios es una buena manera de aprender y crecer. En este entorno de colaboración, puedes trabajar con otros para resolver problemas mientras desarrollas tus habilidades. A medida que ganes experiencia y conocimientos técnicos, podrás avanzar en tu carrera hacia puestos más altos.

Empieza con Coursera

Desarrolla las habilidades que necesitarás como SRE con Site Reliability Engineering: Measuring and Managing Reliability, ofrecido por Google Cloud en Coursera. Desarrolla una comprensión más profunda de cómo se utilizan los indicadores de nivel de servicio (service level indicators, SLI) y los objetivos de nivel de servicio (service level objectives, SLO) para gestionar y medir la fiabilidad. Al finalizar el curso, tendrás un certificado para compartir en tu currículum.

Keep reading

Updated on
Written by:

Coursera

Writer

Coursera is the global online learning platform that offers anyone, anywhere access to online course...

This content has been made available for informational purposes only. Learners are advised to conduct additional research to ensure that courses and other credentials pursued meet their personal, professional, and financial goals.