Site Reliability Engineers (SREs) befinden sich an der Schnittstelle zwischen Software-Engineering und System-Engineering. Während es potenziell unendlich viele Permutationen und Kombinationen gibt, wie Infrastruktur- und Softwarekomponenten zusammengestellt werden können, um ein Ziel zu erreichen, ermöglicht die Konzentration auf grundlegende Fähigkeiten SREs, mit komplexen Systemen und Software zu arbeiten, unabhängig davon, ob es sich bei diesen Systemen um proprietäre, offene Systeme von Drittanbietern handelt , auf Cloud-/On-Prem-Infrastruktur usw. laufen. Insbesondere ist es wichtig, ein tiefes Verständnis dafür zu erlangen, wie diese Bereiche von Systemen und Infrastruktur miteinander in Beziehung stehen und miteinander interagieren. Die Kombination von Software- und Systemtechnikkompetenzen ist selten und wird im Allgemeinen im Laufe der Zeit durch den Kontakt mit einer Vielzahl von Infrastrukturen, Systemen und Software aufgebaut.
SREs bringen technische Verfahren ein, um die Website aufrechtzuerhalten. Jedes verteilte System ist eine Ansammlung vieler Komponenten. SREs validieren Geschäftsanforderungen, wandeln sie in SLAs für jede der Komponenten um, aus denen das verteilte System besteht, überwachen und messen die Einhaltung von SLAs, führen eine Neuarchitektur oder Skalierung durch, um SLA-Verletzungen abzuschwächen oder zu vermeiden, und fügen diese Erkenntnisse als Feedback zu neuen Systemen oder Projekten hinzu und reduzieren dadurch den Arbeitsaufwand. Daher spielen SREs vom ersten Tag des Systementwurfs an eine entscheidende Rolle.
Anfang 2019 haben wir begonnen, Universitäten in ganz Indien zu besuchen, um die besten und klügsten Köpfe zu rekrutieren und sicherzustellen, dass LinkedIn und alle Dienste, aus denen sich sein komplexer Technologie-Stack zusammensetzt, immer für alle verfügbar sind. Diese wichtige Funktion bei LinkedIn fällt in den Zuständigkeitsbereich des Site Engineering-Teams und der Site Reliability Engineers (SREs), bei denen es sich um Software-Ingenieure handelt, die auf Zuverlässigkeit spezialisiert sind.
Als wir diese Reise fortsetzten, bekamen wir viele Fragen von diesen Standorten dazu, was genau die Rolle des Site Reliability Engineering mit sich bringt. Und wie könnte jemand die erforderlichen Fähigkeiten und Disziplinen erlernen, um ein erfolgreicher Site Reliability Engineer zu werden? Ein paar Monate später waren einige dieser Campus-Studenten LinkedIn entweder als Praktikanten oder als Vollzeit-Ingenieure beigetreten, um Teil des Site Engineering-Teams zu werden; Wir hatten auch einige Quereinsteiger, die unserer Organisation beitraten und nicht über einen traditionellen SRE-Hintergrund verfügten. Da kamen einige von uns zusammen und begannen darüber nachzudenken, wie wir neue Diplom-Ingenieure in das Site Engineering-Team integrieren können.
Es gibt nur sehr wenige Ressourcen, die jemanden zu den grundlegenden Fähigkeiten führen, die man als SRE-Anfänger erwerben muss. Aufgrund des Mangels an diesen Ressourcen hatten wir das Gefühl, dass es für Einzelpersonen schwierig ist, in offene Positionen in der Branche zu gelangen. Wir haben die School of SRE als Ausgangspunkt für alle gegründet, die ihre Karriere als SRE aufbauen möchten. In diesem Kurs konzentrieren wir uns auf den Aufbau starker Grundkompetenzen. Der Kurs ist so strukturiert, dass er mehr Beispiele aus dem wirklichen Leben bietet und zeigt, wie das Erlernen jedes dieser Themen eine wichtige Rolle bei der täglichen Arbeit eines SRE spielen kann. Derzeit behandeln wir im Rahmen der School of SRE die folgenden Themen:
Stufe 101
Stufe 102
Wir glauben, dass kontinuierliches Lernen dabei helfen wird, tiefere Kenntnisse und Kompetenzen zu erwerben, um Ihre Fähigkeiten zu erweitern. Zu jedem Modul sind Referenzen hinzugefügt, die als Leitfaden für weiteres Lernen dienen können. Wir hoffen, dass wir durch die Absolvierung dieser Module in der Lage sein werden, die wesentlichen Fähigkeiten zu erwerben, die für einen Site Reliability Engineer erforderlich sind.
Bei LinkedIn verwenden wir diesen Lehrplan, um unsere unkonventionellen Mitarbeiter und neuen Hochschulabsolventen in die SRE-Rolle einzubinden. Wir hatten mehrere Runden erfolgreicher Onboarding-Erfahrungen mit neuen Mitarbeitern und der Kurs half ihnen, in sehr kurzer Zeit produktiv zu sein. Dies hat uns dazu motiviert, die Inhalte als Open-Source-Lösung bereitzustellen, um anderen Organisationen bei der Einarbeitung neuer Ingenieure in die Rolle zu helfen und angehenden Einzelpersonen Anleitungen für den Einstieg in die Rolle zu geben. Wir sind uns bewusst, dass die von uns erstellten anfänglichen Inhalte nur ein Ausgangspunkt sind, und wir hoffen, dass die Community bei der Verfeinerung und Erweiterung der Inhalte helfen kann. Schauen Sie sich den Beitragsleitfaden an, um loszulegen.