Site Reliability Engineers (SRE) se encuentra en la intersección de la ingeniería de software y la ingeniería de sistemas. Si bien existen permutaciones y combinaciones potencialmente infinitas de cómo se pueden combinar los componentes de infraestructura y software para lograr un objetivo, centrarse en las habilidades fundamentales permite a los SRE trabajar con sistemas y software complejos, independientemente de si estos sistemas son sistemas abiertos, propietarios y de terceros. , ejecutarse en la nube/infraestructura local, etc. En particular, es importante obtener una comprensión profunda de cómo estas áreas de sistemas e infraestructura se relacionan entre sí e interactúan entre sí. La combinación de habilidades de ingeniería de sistemas y software es poco común y generalmente se construye con el tiempo con la exposición a una amplia variedad de infraestructura, sistemas y software.
Los SRE incorporan prácticas de ingeniería para mantener el sitio en funcionamiento. Cada sistema distribuido es una aglomeración de muchos componentes. Los SRE validan los requisitos comerciales, los convierten en SLA para cada uno de los componentes que constituyen el sistema distribuido, monitorean y miden el cumplimiento de los SLA, rediseñan o escalan para mitigar o evitar violaciones de SLA, agregan estos aprendizajes como retroalimentación a nuevos sistemas o proyectos. y así reducir el trabajo operativo. Por lo tanto, los SRE desempeñan un papel vital desde el día 0 del diseño del sistema.
A principios de 2019, comenzamos a visitar campus en toda la India para reclutar a las mentes mejores y más brillantes para asegurarnos de que LinkedIn y todos los servicios que componen su complejo conjunto de tecnología estén siempre disponibles para todos. Esta función crítica en LinkedIn es competencia del equipo de Ingeniería del Sitio y de los Ingenieros de Confiabilidad del Sitio (SRE), que son ingenieros de software especializados en confiabilidad.
A medida que continuamos en este viaje, comenzamos a recibir muchas preguntas de estos campus sobre qué implica exactamente la función de ingeniería de confiabilidad del sitio. Y, ¿cómo podría alguien aprender las habilidades y disciplinas necesarias para convertirse en un ingeniero de confiabilidad del sitio exitoso? Unos meses más tarde, algunos de estos estudiantes del campus se habían unido a LinkedIn como pasantes o como ingenieros de tiempo completo para formar parte del equipo de ingeniería del sitio; También tuvimos algunas contrataciones laterales que se unieron a nuestra organización y que no tenían experiencia tradicional en SRE. Fue entonces cuando algunos de nosotros nos reunimos y comenzamos a pensar en cómo podemos incorporar nuevos ingenieros graduados al equipo de ingeniería de sitio.
Existen muy pocos recursos que guíen a alguien sobre las habilidades básicas que uno debe adquirir como SRE principiante. Debido a la falta de estos recursos, sentimos que a las personas les resulta difícil ocupar puestos vacantes en la industria. Creamos la Escuela de SRE como punto de partida para cualquiera que quiera desarrollar su carrera como SRE. En este curso, nos centramos en desarrollar habilidades fundamentales sólidas. El curso está estructurado de manera que proporcione más ejemplos de la vida real y cómo aprender cada uno de estos temas puede desempeñar un papel importante en las responsabilidades laborales diarias de un SRE. Actualmente, estamos cubriendo los siguientes temas en la Escuela de SRE:
Nivel 101
Nivel 102
Creemos que el aprendizaje continuo le ayudará a adquirir conocimientos y competencias más profundos para ampliar sus habilidades; cada módulo tiene referencias agregadas que podrían ser una guía para un mayor aprendizaje. Nuestra esperanza es que al completar estos módulos podamos desarrollar las habilidades esenciales necesarias para un ingeniero de confiabilidad del sitio.
En LinkedIn, utilizamos este plan de estudios para incorporar a nuestros empleados no tradicionales y nuevos graduados universitarios al rol de SRE. Tuvimos varias rondas de experiencias de incorporación exitosas con nuevos empleados y el curso los ayudó a ser productivos en un período de tiempo muy corto. Esto nos motivó a abrir el contenido de código abierto para ayudar a otras organizaciones a incorporar nuevos ingenieros al puesto y brindar orientación a los aspirantes a asumir el puesto. Nos damos cuenta de que el contenido inicial que creamos es solo un punto de partida y esperamos que la comunidad pueda ayudar en el viaje de perfeccionamiento y expansión del contenido. Consulte la guía de contribución para comenzar.