Инженеры по надежности объектов (SRE) находятся на стыке разработки программного обеспечения и системной разработки. Хотя существует потенциально бесконечное количество вариантов и комбинаций того, как компоненты инфраструктуры и программного обеспечения могут быть объединены для достижения цели, сосредоточение внимания на базовых навыках позволяет SRE работать со сложными системами и программным обеспечением, независимо от того, являются ли эти системы проприетарными, сторонними, открытыми системами. , работать в облачной/локальной инфраструктуре и т. д. В частности, важно получить глубокое понимание того, как эти области систем и инфраструктуры связаны друг с другом и взаимодействуют друг с другом. Сочетание навыков разработки программного обеспечения и систем встречается редко и обычно формируется с течением времени при работе с широким спектром инфраструктуры, систем и программного обеспечения.
SRE используют инженерные методы для поддержания сайта в рабочем состоянии. Каждая распределенная система представляет собой агломерацию множества компонентов. SRE проверяют бизнес-требования, преобразуют их в соглашения об уровне обслуживания для каждого из компонентов, составляющих распределенную систему, отслеживают и измеряют соблюдение соглашений об уровне обслуживания, изменяют архитектуру или масштабируют для смягчения или предотвращения нарушений соглашений об уровне обслуживания, добавляют эти знания в качестве обратной связи в новые системы или проекты. и тем самым сократить операционный труд. Следовательно, SRE играют жизненно важную роль с самого начала проектирования системы.
В начале 2019 года мы начали посещать кампусы по всей Индии, чтобы нанять лучших и ярких умов, чтобы LinkedIn и все сервисы, составляющие его сложный технологический стек, всегда были доступны для всех. Эта важнейшая функция в LinkedIn находится в ведении команды разработчиков сайта и инженеров по надежности сайта (SRE), которые являются инженерами-программистами и специализируются на надежности.
Продолжая этот путь, мы начали получать много вопросов из этих кампусов о том, что именно влечет за собой роль инженера по обеспечению надежности объектов? И как можно освоить навыки и дисциплины, необходимые для того, чтобы стать успешным инженером по надежности объектов? Перенесемся на несколько месяцев вперед: некоторые из этих студентов кампуса присоединились к LinkedIn либо в качестве стажеров, либо в качестве штатных инженеров, чтобы стать частью команды разработки сайта; у нас также было несколько дополнительных сотрудников, которые присоединились к нашей организации, но не из традиционного опыта SRE. Именно тогда некоторые из нас собрались вместе и начали думать о том, как мы можем привлечь новых дипломированных инженеров в команду инженеров объекта.
Существует очень мало ресурсов, которые помогут кому-то овладеть базовыми навыками, которые необходимо приобрести начинающему SRE. Мы чувствовали, что из-за нехватки этих ресурсов людям трудно попасть на открытые позиции в отрасли. Мы создали Школу SRE как отправную точку для всех, кто хочет построить свою карьеру в качестве SRE. В этом курсе мы концентрируемся на формировании сильных базовых навыков. Курс построен таким образом, чтобы предоставить больше примеров из реальной жизни и показать, как изучение каждой из этих тем может сыграть важную роль в повседневных должностных обязанностях SRE. В настоящее время в рамках Школы SRE мы рассматриваем следующие темы:
Уровень 101
Уровень 102
Мы считаем, что непрерывное обучение поможет получить более глубокие знания и компетенции для расширения вашего набора навыков. В каждый модуль добавлены ссылки, которые могут стать руководством для дальнейшего обучения. Мы надеемся, что, пройдя эти модули, мы сможем приобрести необходимые навыки, необходимые для инженера по надежности объекта.
В LinkedIn мы используем эту учебную программу для адаптации наших нетрадиционных сотрудников и новых выпускников колледжей к роли SRE. У нас было несколько раундов успешного опыта адаптации новых сотрудников, и этот курс помог им добиться продуктивной работы за очень короткий период времени. Это побудило нас открыть исходный код контента, чтобы помочь другим организациям в привлечении новых инженеров на эту должность, а также предоставить рекомендации для желающих войти в эту должность. Мы понимаем, что созданный нами первоначальный контент — это лишь отправная точка, и мы надеемся, что сообщество сможет помочь в его усовершенствовании и расширении. Чтобы начать, ознакомьтесь с руководством по участию.