system design 101 Télécharger - system design 101 Téléchargement du code source

system design 101

Autre code source

1.0.0

Télécharger

【 ??‍ YouTube | ? Bulletin 】

Conception du système 101

Expliquez les systèmes complexes à l’aide de visuels et de termes simples.

Que vous vous prépariez à un entretien de conception de système ou que vous souhaitiez simplement comprendre comment les systèmes fonctionnent sous la surface, nous espérons que ce référentiel vous aidera à y parvenir.

Table des matières

Protocoles de communication
- API REST contre GraphQL
- Comment fonctionne gRPC ?
- Qu'est-ce qu'un webhook ?
- Comment améliorer les performances des API ?
- HTTP 1.0 -> HTTP 1.1 -> HTTP 2.0 -> HTTP 3.0 (QUIC)
- SOAP contre REST contre GraphQL contre RPC
- Code d’abord vs API d’abord
- Codes d'état HTTP
- À quoi sert la passerelle API ?
- Comment concevoir des API efficaces et sûres ?
- Encapsulation TCP/IP
- Pourquoi Nginx est-il appelé un proxy « inverse » ?
- Quels sont les algorithmes d’équilibrage de charge courants ?
- URL, URI, URN – Connaissez-vous les différences ?
CI/CD
- Le pipeline CI/CD expliqué en termes simples
- Pile technologique Netflix (pipeline CI/CD)
Modèles d'architecture
- MVC, MVP, MVVM, MVVM-C et VIPER
- 18 modèles de conception clés que tout développeur devrait connaître
Base de données
- Une belle aide-mémoire de différentes bases de données dans les services cloud
- 8 structures de données qui alimentent vos bases de données
- Comment une instruction SQL est-elle exécutée dans la base de données ?
- Théorème du CAP
- Types de mémoire et de stockage
- Visualiser une requête SQL
- Langage SQL
Cache
- Les données sont mises en cache partout
- Pourquoi Redis est-il si rapide ?
- Comment Redis peut-il être utilisé ?
- Principales stratégies de mise en cache
Architecture des microservices
- À quoi ressemble une architecture de microservice typique ?
- Meilleures pratiques en matière de microservices
- Quelle pile technologique est couramment utilisée pour les microservices ?
- Pourquoi Kafka est-il rapide
Systèmes de paiement
- Comment apprendre les systèmes de paiement ?
- Pourquoi la carte de crédit est-elle qualifiée de « produit le plus rentable dans les banques » ? Comment VISA/Mastercard gagne-t-elle de l’argent ?
- Comment fonctionne VISA lorsque nous glissons une carte de crédit dans la boutique d'un commerçant ?
- Série sur les systèmes de paiement dans le monde (partie 1) : Interface de paiement unifiée (UPI) en Inde
DevOps
- DevOps contre SRE contre ingénierie de plate-forme. Quelle est la différence ?
- Qu'est-ce que k8s (Kubernetes) ?
- Docker contre Kubernetes. Lequel devrions-nous utiliser ?
- Comment fonctionne Docker ?
GIT
- Comment fonctionnent les commandes Git
- Comment fonctionne Git ?
- Fusion Git vs rebase Git
Services cloud
- Une belle aide-mémoire des différents services cloud (édition 2023)
- Qu’est-ce que le cloud natif ?
Outils de productivité des développeurs
- Visualisez les fichiers JSON
- Transformez automatiquement le code en diagrammes d'architecture
Linux
- Système de fichiers Linux expliqué
- 18 commandes Linux les plus utilisées que vous devriez connaître
Sécurité
- Comment fonctionne le HTTPS ?
- Oauth 2.0 expliqué avec des termes simples.
- Les 4 principales formes de mécanismes d'authentification
- Session, cookie, JWT, jeton, SSO et OAuth 2.0 : qu'est-ce que c'est ?
- Comment stocker les mots de passe en toute sécurité dans la base de données et comment valider un mot de passe ?
- Expliquer le jeton Web JSON (JWT) à un enfant de 10 ans
- Comment fonctionne Google Authenticator (ou d'autres types d'authentificateurs à 2 facteurs) ?
Études de cas du monde réel
- La pile technologique de Netflix
- Architecture Twitter 2022
- Évolution de l'architecture des microservices d'Airbnb au cours des 15 dernières années
- Monorepo contre Microrepo.
- Comment allez-vous concevoir le site Web Stack Overflow ?
- Pourquoi la surveillance d'Amazon Prime Video est-elle passée du sans serveur au monolithique ? Comment peut-il économiser 90 % des coûts ?
- Comment Disney Hotstar capture-t-il 5 milliards d'Emojis lors d'un tournoi ?
- Comment Discord stocke des milliards de messages
- Comment fonctionnent les streamings vidéo en direct sur YouTube, TikTok live ou Twitch ?

Protocoles de communication

Les styles d'architecture définissent la manière dont les différents composants d'une interface de programmation d'application (API) interagissent les uns avec les autres. En conséquence, ils garantissent l'efficacité, la fiabilité et la facilité d'intégration avec d'autres systèmes en fournissant une approche standard pour la conception et la création d'API. Voici les styles les plus utilisés :

SAVON:
Mature, complet, basé sur XML
Idéal pour les applications d'entreprise
Reposant:
Méthodes HTTP populaires et faciles à mettre en œuvre
Idéal pour les services Web
GraphQL :
Langage de requête, demande de données spécifiques
Réduit la surcharge du réseau et des réponses plus rapides
gRPC :
Tampons de protocole modernes et performants
Adapté aux architectures de microservices
WebSocket :
Connexions en temps réel, bidirectionnelles et persistantes
Idéal pour l'échange de données à faible latence
Webhook :
Pilotés par les événements, rappels HTTP, asynchrones
Avertit les systèmes lorsque des événements se produisent

API REST contre GraphQL

En matière de conception d'API, REST et GraphQL ont chacun leurs propres forces et faiblesses.

Le diagramme ci-dessous montre une comparaison rapide entre REST et GraphQL.

REPOS

Utilise des méthodes HTTP standard telles que GET, POST, PUT, DELETE pour les opérations CRUD.
Fonctionne bien lorsque vous avez besoin d’interfaces simples et uniformes entre des services/applications distincts.
Les stratégies de mise en cache sont simples à mettre en œuvre.
L’inconvénient est que plusieurs allers-retours peuvent être nécessaires pour rassembler les données associées à partir de points de terminaison distincts.

GraphQL

Fournit un point de terminaison unique permettant aux clients d’interroger précisément les données dont ils ont besoin.
Les clients spécifient les champs exacts requis dans les requêtes imbriquées et le serveur renvoie des charges utiles optimisées contenant uniquement ces champs.
Prend en charge les mutations pour modifier les données et les abonnements pour les notifications en temps réel.
Idéal pour agréger des données provenant de plusieurs sources et fonctionne bien avec les exigences frontales en évolution rapide.
Cependant, cela déplace la complexité du côté client et peut permettre des requêtes abusives si elles ne sont pas correctement protégées.
Les stratégies de mise en cache peuvent être plus compliquées que REST.

Le meilleur choix entre REST et GraphQL dépend des exigences spécifiques de l'application et de l'équipe de développement. GraphQL convient parfaitement aux besoins frontaux complexes ou changeants, tandis que REST convient aux applications où des contrats simples et cohérents sont préférés.

Aucune des deux approches API n’est une solution miracle. Il est important d’évaluer soigneusement les exigences et les compromis pour choisir le bon style. REST et GraphQL sont tous deux des options valables pour exposer des données et alimenter des applications modernes.

Comment fonctionne gRPC ?

RPC (Remote Procedure Call) est appelé « distant » car il permet les communications entre des services distants lorsque les services sont déployés sur différents serveurs sous une architecture de microservices. Du point de vue de l'utilisateur, cela agit comme un appel de fonction locale.

Le diagramme ci-dessous illustre le flux de données global pour gRPC .

Étape 1 : Un appel REST est effectué depuis le client. Le corps de la requête est généralement au format JSON.

Étapes 2 à 4 : Le service de commande (client gRPC) reçoit l'appel REST, le transforme et effectue un appel RPC au service de paiement. gRPC code le stub client au format binaire et l'envoie à la couche de transport de bas niveau.

Étape 5 : gRPC envoie les paquets sur le réseau via HTTP2. En raison du codage binaire et des optimisations du réseau, gRPC serait 5 fois plus rapide que JSON.

Étapes 6 à 8 : Le service de paiement (serveur gRPC) reçoit les paquets du réseau, les décode et appelle l'application serveur.

Étapes 9 à 11 : le résultat est renvoyé par l'application serveur, codé et envoyé à la couche de transport.

Étapes 12 à 14 : Le service de commande reçoit les paquets, les décode et envoie le résultat à l'application client.

Qu'est-ce qu'un webhook ?

Le diagramme ci-dessous montre une comparaison entre l'interrogation et le Webhook.

Supposons que nous gérions un site Web de commerce électronique. Les clients envoient des commandes au service de commande via la passerelle API, qui va au service de paiement pour les opérations de paiement. Le service de paiement s'adresse ensuite à un prestataire de services de paiement (PSP) externe pour finaliser les transactions.

Il existe deux manières de gérer les communications avec la PSP externe.

1. Sondage court

Après avoir envoyé la demande de paiement au PSP, le service de paiement continue de demander au PSP l'état du paiement. Après plusieurs tours, la PSP revient enfin avec le statut.

Les sondages courts présentent deux inconvénients :

L'interrogation constante du statut nécessite des ressources de la part du service de paiement.
Le service Externe communique directement avec le service de paiement, créant des failles de sécurité.

2. Webhook

Nous pouvons enregistrer un webhook auprès du service externe. Cela signifie : rappelez-moi à une certaine URL lorsque vous avez des mises à jour sur la demande. Lorsque le PSP aura terminé le traitement, il invoquera la requête HTTP pour mettre à jour le statut du paiement.

De cette façon, le paradigme de programmation est modifié et le service de paiement n'a plus besoin de gaspiller des ressources pour interroger l'état du paiement.

Et si la PSP ne rappelle jamais ? Nous pouvons organiser un travail de ménage pour vérifier l'état des paiements toutes les heures.

Les webhooks sont souvent appelés API inversées ou API push, car le serveur envoie des requêtes HTTP au client. Nous devons prêter attention à 3 choses lorsque nous utilisons un webhook :

Nous devons concevoir une API appropriée que le service externe devra appeler.
Nous devons configurer des règles appropriées dans la passerelle API pour des raisons de sécurité.
Nous devons enregistrer l'URL correcte auprès du service externe.

Comment améliorer les performances des API ?

Le diagramme ci-dessous montre 5 astuces courantes pour améliorer les performances de l'API.

Pagination

Il s'agit d'une optimisation courante lorsque la taille du résultat est grande. Les résultats sont renvoyés au client pour améliorer la réactivité du service.

Journalisation asynchrone

La journalisation synchrone traite le disque pour chaque appel et peut ralentir le système. La journalisation asynchrone envoie d'abord les journaux vers un tampon sans verrouillage et les renvoie immédiatement. Les journaux seront vidés périodiquement sur le disque. Cela réduit considérablement la surcharge d’E/S.

Mise en cache

Nous pouvons stocker les données fréquemment consultées dans un cache. Le client peut d'abord interroger le cache au lieu de visiter directement la base de données. En cas d'échec du cache, le client peut interroger la base de données. Les caches comme Redis stockent les données en mémoire, l'accès aux données est donc beaucoup plus rapide que la base de données.

Compression de la charge utile

Les demandes et les réponses peuvent être compressées à l'aide de gzip, etc. afin que la taille des données transmises soit beaucoup plus petite. Cela accélère le téléchargement et le téléchargement.

Pool de connexions

Lors de l'accès aux ressources, nous devons souvent charger des données à partir de la base de données. L'ouverture des connexions de fermeture de la base de données ajoute une surcharge importante. Nous devrions donc nous connecter à la base de données via un pool de connexions ouvertes. Le pool de connexions est responsable de la gestion du cycle de vie des connexions.

HTTP 1.0 -> HTTP 1.1 -> HTTP 2.0 -> HTTP 3.0 (QUIC)

Quel problème chaque génération de HTTP résout-elle ?

Le diagramme ci-dessous illustre les principales caractéristiques.

HTTP 1.0 a été finalisé et entièrement documenté en 1996. Chaque requête adressée au même serveur nécessite une connexion TCP distincte.
HTTP 1.1 a été publié en 1997. Une connexion TCP peut être laissée ouverte pour être réutilisée (connexion persistante), mais cela ne résout pas le problème de blocage HOL (tête de ligne).
Blocage HOL - lorsque le nombre de requêtes parallèles autorisées dans le navigateur est épuisé, les requêtes suivantes doivent attendre que les précédentes soient terminées.
HTTP 2.0 a été publié en 2015. Il résout le problème HOL via le multiplexage des requêtes, qui élimine le blocage HOL au niveau de la couche application, mais HOL existe toujours au niveau de la couche transport (TCP).
Comme vous pouvez le voir sur le schéma, HTTP 2.0 a introduit le concept de « flux » HTTP : une abstraction qui permet de multiplexer différents échanges HTTP sur la même connexion TCP. Chaque flux n'a pas besoin d'être envoyé dans l'ordre.
La première version de HTTP 3.0 a été publiée en 2020. Il s'agit du successeur proposé de HTTP 2.0. Il utilise QUIC au lieu de TCP pour le protocole de transport sous-jacent, supprimant ainsi le blocage HOL dans la couche de transport.

QUIC est basé sur UDP. Il introduit les flux en tant que citoyens de première classe au niveau du transport. Les flux QUIC partagent la même connexion QUIC, donc aucune poignée de main supplémentaire ni démarrage lent n'est nécessaire pour en créer de nouveaux, mais les flux QUIC sont livrés indépendamment de telle sorte que dans la plupart des cas, la perte de paquets affectant un flux n'affecte pas les autres.

SOAP contre REST contre GraphQL contre RPC

Le diagramme ci-dessous illustre la comparaison de la chronologie de l'API et des styles d'API.

Au fil du temps, différents styles architecturaux d'API sont publiés. Chacun d'eux a ses propres modèles de normalisation de l'échange de données.

Vous pouvez consulter les cas d’utilisation de chaque style dans le diagramme.

Code d’abord vs API d’abord

Le diagramme ci-dessous montre les différences entre le développement axé sur le code et le développement axé sur l'API. Pourquoi voulons-nous considérer la conception d’API en premier ?

Les microservices augmentent la complexité du système et nous disposons de services distincts pour servir différentes fonctions du système. Bien que ce type d’architecture facilite le découplage et la séparation des tâches, nous devons gérer les diverses communications entre les services.

Il est préférable de réfléchir à la complexité du système avant d'écrire le code et de définir soigneusement les limites des services.

Des équipes fonctionnelles distinctes doivent parler le même langage et les équipes fonctionnelles dédiées sont uniquement responsables de leurs propres composants et services. Il est recommandé que l'organisation parle le même langage via la conception d'API.

Nous pouvons simuler des requêtes et des réponses pour valider la conception de l'API avant d'écrire du code.

Améliorer la qualité des logiciels et la productivité des développeurs Puisque nous avons éliminé la plupart des incertitudes au démarrage du projet, le processus de développement global est plus fluide et la qualité des logiciels est grandement améliorée.

Les développeurs sont également satisfaits du processus car ils peuvent se concentrer sur le développement fonctionnel au lieu de négocier des changements soudains.

La possibilité d'avoir des surprises vers la fin du cycle de vie du projet est réduite.

Comme nous avons d'abord conçu l'API, les tests peuvent être conçus pendant le développement du code. D'une certaine manière, nous avons également TDD (Test Driven Design) lorsque nous utilisons le premier développement d'API.

Codes d'état HTTP

Les codes de réponse pour HTTP sont divisés en cinq catégories :

Informatif (100-199) Réussite (200-299) Redirection (300-399) Erreur client (400-499) Erreur de serveur (500-599)

À quoi sert la passerelle API ?

Le diagramme ci-dessous montre les détails.

Étape 1 - Le client envoie une requête HTTP à la passerelle API.

Étape 2 : La passerelle API analyse et valide les attributs de la requête HTTP.

Étape 3 : La passerelle API effectue des vérifications de liste d'autorisation/liste de refus.

Étape 4 : La passerelle API communique avec un fournisseur d'identité pour l'authentification et l'autorisation.

Étape 5 - Les règles de limitation de débit sont appliquées à la demande. Si la limite est dépassée, la demande est rejetée.

Étapes 6 et 7 : Maintenant que la requête a réussi les vérifications de base, la passerelle API trouve le service pertinent vers lequel acheminer par correspondance de chemin.

Étape 8 - La passerelle API transforme la requête dans le protocole approprié et l'envoie aux microservices backend.

Étapes 9 à 12 : la passerelle API peut gérer correctement les erreurs et traite les erreurs si la récupération de l'erreur prend plus de temps (coupure de circuit). Il peut également exploiter la pile ELK (Elastic-Logstash-Kibana) pour la journalisation et la surveillance. Nous mettons parfois en cache des données dans la passerelle API.

Comment concevoir des API efficaces et sûres ?

Le diagramme ci-dessous montre des conceptions d'API typiques avec un exemple de panier d'achat.

Notez que la conception d’API ne se limite pas à la conception de chemins d’URL. La plupart du temps, nous devons choisir les noms de ressources, les identifiants et les modèles de chemin appropriés. Il est tout aussi important de concevoir des champs d’en-tête HTTP appropriés ou de concevoir des règles efficaces de limitation de débit au sein de la passerelle API.

Encapsulation TCP/IP

Comment les données sont-elles envoyées sur le réseau ? Pourquoi avons-nous besoin de tant de couches dans le modèle OSI ?

Le diagramme ci-dessous montre comment les données sont encapsulées et désencapsulées lors de la transmission sur le réseau.

Étape 1 : Lorsque le périphérique A envoie des données au périphérique B via le réseau via le protocole HTTP, un en-tête HTTP lui est d'abord ajouté au niveau de la couche application.

Étape 2 : Ensuite, un en-tête TCP ou UDP est ajouté aux données. Il est encapsulé dans des segments TCP au niveau de la couche transport. L'en-tête contient le port source, le port de destination et le numéro de séquence.

Étape 3 : Les segments sont ensuite encapsulés avec un en-tête IP au niveau de la couche réseau. L'en-tête IP contient les adresses IP source/destination.

Étape 4 : Le datagramme IP reçoit un en-tête MAC au niveau de la couche liaison de données, avec des adresses MAC source/destination.

Étape 5 : Les trames encapsulées sont envoyées à la couche physique et envoyées sur le réseau en bits binaires.

Étapes 6 à 10 : lorsque le périphérique B reçoit les bits du réseau, il exécute le processus de désencapsulation, qui est un traitement inverse du processus d'encapsulation. Les en-têtes sont supprimés couche par couche et, finalement, le périphérique B peut lire les données.

Nous avons besoin de couches dans le modèle de réseau car chaque couche se concentre sur ses propres responsabilités. Chaque couche peut s'appuyer sur les en-têtes pour les instructions de traitement et n'a pas besoin de connaître la signification des données de la dernière couche.

Pourquoi Nginx est-il appelé un proxy « inverse » ?

Le schéma ci-dessous montre les différences entre un ??????? ????? et un ??????? ??????.

Un proxy de transfert est un serveur situé entre les appareils des utilisateurs et Internet.

Un proxy direct est couramment utilisé pour :

Protéger les clients
Contourner les restrictions de navigation
Bloquer l'accès à certains contenus

Un proxy inverse est un serveur qui accepte une demande du client, transmet la demande aux serveurs Web et renvoie les résultats au client comme si le serveur proxy avait traité la demande.

Un proxy inverse est utile pour :

Protection des serveurs
Équilibrage de charge
Mise en cache du contenu statique
Cryptage et déchiffrement des communications SSL

Quels sont les algorithmes d’équilibrage de charge courants ?

Le diagramme ci-dessous montre 6 algorithmes courants.

Algorithmes statiques

Tournoi à la ronde
Les demandes des clients sont envoyées à différentes instances de service dans un ordre séquentiel. Les services doivent généralement être apatrides.
Tournoi à la ronde collant
Il s’agit d’une amélioration de l’algorithme round-robin. Si la première requête d'Alice va au service A, les requêtes suivantes vont également au service A.
Tournoi circulaire pondéré
L'administrateur peut spécifier le poids de chaque service. Ceux avec un poids plus élevé traitent plus de demandes que les autres.
Hacher
Cet algorithme applique une fonction de hachage sur l'IP ou l'URL des requêtes entrantes. Les requêtes sont acheminées vers les instances pertinentes en fonction du résultat de la fonction de hachage.

Algorithmes dynamiques

Moins de connexions
Une nouvelle demande est envoyée à l'instance de service avec le moins de connexions simultanées.
Temps de réponse minimum
Une nouvelle demande est envoyée à l'instance de service avec le temps de réponse le plus rapide.

URL, URI, URN – Connaissez-vous les différences ?

Le diagramme ci-dessous montre une comparaison de l'URL, de l'URI et de l'URN.

URI

URI signifie Uniform Resource Identifier. Il identifie une ressource logique ou physique sur le Web. L'URL et l'URN sont des sous-types d'URI. L'URL localise une ressource, tandis que l'URN nomme une ressource.

Un URI est composé des parties suivantes : schéma :[//autorité]chemin[?query][#fragment]

URL

URL signifie Uniform Resource Locator, le concept clé de HTTP. C'est l'adresse d'une ressource unique sur le web. Il peut être utilisé avec d'autres protocoles comme FTP et JDBC.

URNE

URN signifie Nom de ressource uniforme. Il utilise le schéma de l'urne. Les URN ne peuvent pas être utilisés pour localiser une ressource. Un exemple simple donné dans le diagramme est composé d'un espace de noms et d'une chaîne spécifique à l'espace de noms.

Si vous souhaitez en savoir plus sur le sujet, je recommanderais les éclaircissements du W3C.

CI/CD

Le pipeline CI/CD expliqué en termes simples

Section 1 – SDLC avec CI/CD

Le cycle de vie du développement logiciel (SDLC) comprend plusieurs étapes clés : développement, tests, déploiement et maintenance. CI/CD automatise et intègre ces étapes pour permettre des versions plus rapides et plus fiables.

Lorsque le code est poussé vers un référentiel git, il déclenche un processus de construction et de test automatisé. Des cas de test de bout en bout (e2e) sont exécutés pour valider le code. Si les tests réussissent, le code peut être automatiquement déployé en préparation/production. Si des problèmes sont détectés, le code est renvoyé au développement pour correction des bogues. Cette automatisation fournit un retour rapide aux développeurs et réduit le risque de bugs en production.

Section 2 - Différence entre CI et CD

L'intégration continue (CI) automatise le processus de création, de test et de fusion. Il exécute des tests chaque fois que le code est validé pour détecter rapidement les problèmes d'intégration. Cela encourage des validations de code fréquentes et des commentaires rapides.

La livraison continue (CD) automatise les processus de publication tels que les modifications d'infrastructure et le déploiement. Il garantit que les logiciels peuvent être publiés de manière fiable à tout moment grâce à des flux de travail automatisés. Le CD peut également automatiser les étapes de test manuel et d'approbation requises avant le déploiement en production.

Section 3 - Pipeline CI/CD

Un pipeline CI/CD typique comporte plusieurs étapes connectées :

Le développeur valide les modifications de code dans le contrôle de code source
Le serveur CI détecte les modifications et déclenche la build
Le code est compilé et testé (tests unitaires, d'intégration)
Résultats des tests signalés au développeur
En cas de succès, les artefacts sont déployés dans des environnements de test
Des tests supplémentaires peuvent être effectués sur la mise en scène avant la publication
Le système CD déploie les modifications approuvées en production

Pile technologique Netflix (pipeline CI/CD)

Planification : Netflix Engineering utilise JIRA pour la planification et Confluence pour la documentation.

Codage : Java est le langage de programmation principal du service backend, tandis que d'autres langages sont utilisés pour différents cas d'utilisation.

Build : Gradle est principalement utilisé pour la construction, et les plugins Gradle sont conçus pour prendre en charge divers cas d'utilisation.

Emballage : le package et les dépendances sont emballés dans une Amazon Machine Image (AMI) pour la publication.

Tests : les tests mettent l'accent sur l'accent mis par la culture de production sur la création d'outils de chaos.

Déploiement : Netflix utilise son Spinnaker auto-construit pour le déploiement du déploiement Canary.

Surveillance : Les métriques de surveillance sont centralisées dans Atlas et Kayenta est utilisé pour détecter les anomalies.

Rapport d'incident : les incidents sont répartis selon la priorité et PagerDuty est utilisé pour la gestion des incidents.

Modèles d'architecture

MVC, MVP, MVVM, MVVM-C et VIPER

Ces modèles d'architecture sont parmi les plus couramment utilisés dans le développement d'applications, que ce soit sur les plateformes iOS ou Android. Les développeurs les ont introduits pour surmonter les limitations des modèles antérieurs. Alors, en quoi diffèrent-ils ?

MVC, le modèle le plus ancien, remonte à près de 50 ans
Chaque modèle a une "vue" (V) chargée d'afficher le contenu et de recevoir les entrées de l'utilisateur.
La plupart des modèles incluent un « modèle » (M) pour gérer les données métiers
« Contrôleur », « présentateur » et « modèle de vue » sont des traducteurs qui servent d'intermédiaire entre la vue et le modèle (« entité » dans le modèle VIPER)

18 modèles de conception clés que tout développeur devrait connaître

Les modèles sont des solutions réutilisables à des problèmes de conception courants, permettant un processus de développement plus fluide et plus efficace. Ils servent de modèles pour créer de meilleures structures logicielles. Voici quelques-uns des modèles les plus populaires :

Abstract Factory: Family Creator - Crée des groupes d'éléments liés.
Constructeur : Lego Master - Construit des objets étape par étape, en séparant la création et l'apparence.
Prototype : Clone Maker - Crée des copies d'exemples entièrement préparés.
Singleton : One and Only – Une classe spéciale avec une seule instance.
Adaptateur : prise universelle - connecte les objets avec différentes interfaces.
Bridge : Connecteur de fonction - Relie le fonctionnement d'un objet à ce qu'il fait.
Composite : Tree Builder - Forme des structures arborescentes de pièces simples et complexes.
Décorateur : Personnalisateur - Ajoute des fonctionnalités aux objets sans modifier leur noyau.
Façade : One-Stop-Shop - Représente un système complet avec une interface unique et simplifiée.
Flyweight : Space Saver - Partage efficacement les petits objets réutilisables.
Proxy : Acteur suppléant – Représente un autre objet, contrôlant l'accès ou les actions.
Chaîne de responsabilité : relais de demande – transmet une demande à travers une chaîne d'objets jusqu'à ce qu'elle soit traitée.
Commande : Task Wrapper - Transforme une requête en un objet, prêt à l'action.
Itérateur : Explorateur de collections – Accès aux éléments d'une collection un par un.
Médiateur : Communication Hub - Simplifie les interactions entre les différentes classes.
Memento : Time Capsule – Capture et restaure l'état d'un objet.
Observateur : News Broadcaster - Informe les classes des modifications apportées à d'autres objets.
Visiteur : Invité habile - Ajoute de nouvelles opérations à une classe sans la modifier.

Base de données

Une belle aide-mémoire de différentes bases de données dans les services cloud

Choisir la bonne base de données pour votre projet est une tâche complexe. De nombreuses options de bases de données, chacune adaptée à des cas d’utilisation distincts, peuvent rapidement conduire à une lassitude décisionnelle.

Nous espérons que cette aide-mémoire fournira des instructions de haut niveau pour identifier le bon service qui correspond aux besoins de votre projet et éviter les pièges potentiels.

Remarque : Google dispose d'une documentation limitée pour ses cas d'utilisation de bases de données. Même si nous avons fait de notre mieux pour examiner ce qui était disponible et sommes parvenus à la meilleure option, certaines entrées devront peut-être être plus précises.

8 structures de données qui alimentent vos bases de données

La réponse variera en fonction de votre cas d'utilisation. Les données peuvent être indexées en mémoire ou sur disque. De même, les formats de données varient, tels que les nombres, les chaînes, les coordonnées géographiques, etc. Le système peut être lourd en écriture ou en lecture. Tous ces facteurs affectent votre choix de format d'index de base de données.

Voici quelques-unes des structures de données les plus couramment utilisées pour l'indexation des données :

Skiplist : un type d'index en mémoire courant. Utilisé dans Redis
Hash index : une implémentation très courante de la structure de données « Map » (ou « Collection »)
SSTable : implémentation de « Map » immuable sur disque
Arbre LSM : Skiplist + SSTable. Débit d'écriture élevé
B-tree : solution basée sur disque. Performances de lecture/écriture constantes
Index inversé : utilisé pour l'indexation des documents. Utilisé à Lucène
Arbre de suffixes : pour la recherche de modèles de chaîne
R-tree : recherche multidimensionnelle, comme trouver le voisin le plus proche

Comment une instruction SQL est-elle exécutée dans la base de données ?

Le diagramme ci-dessous montre le processus. Notez que les architectures des différentes bases de données sont différentes, le diagramme montre certaines conceptions courantes.

Étape 1 - Une instruction SQL est envoyée à la base de données via un protocole de couche transport (par exemple TCP).

Étape 2 - L'instruction SQL est envoyée à l'analyseur de commandes, où elle passe par une analyse syntaxique et sémantique, et une arborescence de requêtes est ensuite générée.

Étape 3 - L'arborescence des requêtes est envoyée à l'optimiseur. L'optimiseur crée un plan d'exécution.

Étape 4 - Le plan d'exécution est envoyé à l'exécuteur testamentaire. L'exécuteur récupère les données de l'exécution.

Étape 5 - Les méthodes d'accès fournissent la logique de récupération des données requise pour l'exécution, en récupérant les données du moteur de stockage.

Étape 6 - Les méthodes d'accès décident si l'instruction SQL est en lecture seule. Si la requête est en lecture seule (instruction SELECT), elle est transmise au gestionnaire de tampon pour un traitement ultérieur. Le gestionnaire de tampon recherche les données dans le cache ou les fichiers de données.

Étape 7 - Si l'instruction est une UPDATE ou un INSERT, elle est transmise au gestionnaire de transactions pour un traitement ultérieur.

Étape 8 - Lors d'une transaction, les données sont en mode verrouillé. Ceci est garanti par le gestionnaire de serrures. Il garantit également les propriétés ACID de la transaction.

Théorème du CAP

Le théorème CAP est l’un des termes les plus connus en informatique, mais je parie que différents développeurs ont des compréhensions différentes. Examinons de quoi il s'agit et pourquoi cela peut prêter à confusion.

Le théorème CAP stipule qu'un système distribué ne peut pas fournir simultanément plus de deux de ces trois garanties.

Cohérence : la cohérence signifie que tous les clients voient les mêmes données en même temps, quel que soit le nœud auquel ils se connectent.

Disponibilité : la disponibilité signifie que tout client qui demande des données obtient une réponse même si certains nœuds sont en panne.

Partition Tolerance : une partition indique une rupture de communication entre deux nœuds. La tolérance de partition signifie que le système continue de fonctionner malgré les partitions réseau.

La formulation « 2 sur 3 » peut être utile, mais cette simplification pourrait être trompeuse .

Choisir une base de données n’est pas facile. Justifier notre choix uniquement sur la base du théorème de la PAC ne suffit pas. Par exemple, les entreprises ne choisissent pas Cassandra pour les applications de chat simplement parce qu'il s'agit d'un système AP. Il existe une liste de bonnes caractéristiques qui font de Cassandra une option souhaitable pour stocker les messages de discussion. Nous devons creuser plus profondément.
« Le CAP n'interdit qu'une infime partie de l'espace de conception : disponibilité et cohérence parfaites en présence de cloisons, qui sont rares ». Extrait de l'article : CAP douze ans plus tard : comment les « règles » ont changé.
Le théorème est d’environ 100 % de disponibilité et de cohérence. Une discussion plus réaliste porterait sur les compromis entre latence et cohérence lorsqu'il n'y a pas de partition réseau. Voir le théorème PACELC pour plus de détails.

Le théorème du CAP est-il réellement utile ?

Je pense que cela reste utile car cela ouvre notre esprit à une série de discussions de compromis, mais ce n’est qu’une partie de l’histoire. Nous devons creuser plus profondément lors du choix de la bonne base de données.

Types de mémoire et de stockage

Visualiser une requête SQL

Les instructions SQL sont exécutées par le système de base de données en plusieurs étapes, notamment :

Analyser l'instruction SQL et vérifier sa validité
Transformer le SQL en une représentation interne, comme l'algèbre relationnelle
Optimiser la représentation interne et créer un plan d'exécution qui utilise les informations d'index
Exécuter le plan et renvoyer les résultats

L'exécution de SQL est très complexe et implique de nombreuses considérations, telles que :

L'utilisation d'index et de caches
L'ordre des jointures de table
Contrôle de concurrence
Gestion des transactions

Langage SQL

En 1986, SQL (Structured Query Language) est devenu un standard. Au cours des 40 années suivantes, il est devenu le langage dominant pour les systèmes de gestion de bases de données relationnelles. La lecture de la dernière norme (ANSI SQL 2016) peut prendre beaucoup de temps. Comment puis-je l'apprendre ?

Il existe 5 composants du langage SQL :

DDL : langage de définition de données, tel que CREATE, ALTER, DROP
DQL : langage de requête de données, tel que SELECT
DML : langage de manipulation de données, tel que INSERT, UPDATE, DELETE
DCL : langage de contrôle des données, tel que GRANT, REVOKE
TCL : langage de contrôle des transactions, tel que COMMIT, ROLLBACK

Pour un ingénieur backend, vous devrez peut-être en connaître la plupart. En tant qu'analyste de données, vous devrez peut-être avoir une bonne compréhension de DQL. Sélectionnez les sujets qui vous intéressent le plus.

Cache

Les données sont mises en cache partout

Ce diagramme illustre où nous mettons en cache les données dans une architecture typique.

Il y a plusieurs couches le long du flux.

Applications clientes : les réponses HTTP peuvent être mises en cache par le navigateur. Nous demandons des données via HTTP pour la première fois, et elles sont renvoyées avec une politique d'expiration dans l'en-tête HTTP ; nous demandons à nouveau des données et l'application client essaie d'abord de récupérer les données du cache du navigateur.
CDN : CDN met en cache les ressources Web statiques. Les clients peuvent récupérer des données à partir d'un nœud CDN à proximité.
Load Balancer : L’équilibreur de charge peut également mettre en cache des ressources.
Infrastructure de messagerie : les courtiers de messages stockent d'abord les messages sur le disque, puis les consommateurs les récupèrent à leur propre rythme. En fonction de la politique de rétention, les données sont mises en cache dans les clusters Kafka pendant un certain temps.
Services : il existe plusieurs couches de cache dans un service. Si les données ne sont pas mises en cache dans le cache du processeur, le service tentera de récupérer les données de la mémoire. Parfois, le service dispose d'un cache de deuxième niveau pour stocker les données sur le disque.
Cache distribué : le cache distribué comme Redis contient des paires clé-valeur pour plusieurs services en mémoire. Il offre de bien meilleures performances de lecture/écriture que la base de données.
Recherche en texte intégral : nous devons parfois utiliser des recherches en texte intégral comme Elastic Search pour la recherche de documents ou la recherche de journaux. Une copie des données est également indexée dans le moteur de recherche.
Base de données : Même dans la base de données, nous avons différents niveaux de caches :

WAL (Write-ahead Log) : les données sont écrites dans WAL avant de construire l'index de l'arborescence B
Bufferpool : une zone mémoire allouée aux résultats des requêtes en cache
Vue matérialisée : précalculez les résultats des requêtes et stockez-les dans les tables de base de données pour de meilleures performances de requête.
Journal des transactions : enregistre toutes les transactions et mises à jour de la base de données
Journal de réplication : utilisé pour enregistrer l'état de réplication dans un cluster de base de données

Pourquoi Redis est-il si rapide ?

Il y a 3 raisons principales comme le montre le schéma ci-dessous.

Redis est un magasin de données basé sur la RAM. L'accès à la RAM est au moins 1 000 fois plus rapide que l'accès aléatoire au disque.
Redis exploite le multiplexage des E/S et la boucle d'exécution monothread pour l'efficacité de l'exécution.
Redis exploite plusieurs structures de données efficaces de niveau inférieur.

Question : Memcached est un autre magasin de mémoire populaire. Connaissez-vous les différences entre Redis et Memcached ?

Vous avez peut-être remarqué que le style de ce diagramme est différent de mes messages précédents. S'il vous plaît laissez-moi savoir lequel vous préférez.

Comment redis peut-il être utilisé?

Il y a plus à redis que la simple mise en cache.

Redis peut être utilisé dans une variété de scénarios comme indiqué dans le diagramme.

Session
Nous pouvons utiliser Redis pour partager les données de session utilisateur entre différents services.
Cache
Nous pouvons utiliser Redis pour mettre en cache des objets ou des pages, en particulier pour les données Hotspot.
Verrouillage distribué
Nous pouvons utiliser une chaîne Redis pour acquérir des verrous entre les services distribués.
Comptoir
Nous pouvons compter combien de likes ou combien de lectures pour les articles.
Limiteur de taux
Nous pouvons appliquer un limiteur de taux pour certains IP utilisateur.
Générateur d'identité global
Nous pouvons utiliser Redis int pour Global ID.
Panier
Nous pouvons utiliser Redis Hash pour représenter les paires de valeurs clés dans un panier d'achat.
Calculer la rétention des utilisateurs
Nous pouvons utiliser Bitmap pour représenter quotidiennement la connexion de l'utilisateur et calculer la rétention des utilisateurs.
File d'attente de messages
Nous pouvons utiliser la liste pour une file d'attente de messages.
Classement
Nous pouvons utiliser ZSET pour trier les articles.

Stratégies de mise en cache supérieures

La conception de systèmes à grande échelle nécessite généralement une attention particulière à la mise en cache. Vous trouverez ci-dessous cinq stratégies de mise en cache qui sont fréquemment utilisées.

Architecture des microservices

À quoi ressemble une architecture de microservice typique?

Le diagramme ci-dessous montre une architecture de microservice typique.

Balancer de charge: Cela distribue un trafic entrant sur plusieurs services backend.
CDN (Network de livraison de contenu): CDN est un groupe de serveurs géographiquement distribués qui détiennent un contenu statique pour une livraison plus rapide. Les clients recherchent d'abord du contenu dans CDN, puis progressent vers des services backend.
API Gateway: Cela gère les demandes entrantes et les achemine vers les services pertinents. Il parle au fournisseur d'identité et à la découverte de services.
Proviseur d'identité: Cela gère l'authentification et l'autorisation pour les utilisateurs.
Registre et découverte des services: l'enregistrement et la découverte des microservices se produisent dans ce composant, et la passerelle API recherche des services pertinents dans ce composant pour parler.
Gestion: Ce composant est responsable du suivi des services.
Microservices: Les microservices sont conçus et déployés dans différents domaines. Chaque domaine a sa propre base de données. La passerelle API parle aux microservices via l'API REST ou d'autres protocoles, et les microservices dans le même domaine se parlent mutuellement en utilisant RPC (appel de procédure distante).

Avantages des microservices:

Ils peuvent être rapidement conçus, déployés et à l'échelle horizontalement.
Chaque domaine peut être maintenu indépendamment par une équipe dédiée.
Les exigences de l'entreprise peuvent être personnalisées dans chaque domaine et mieux prises en charge.

Meilleures pratiques de microservice

Une image vaut mille mots: 9 meilleures pratiques pour développer des microservices.

Lorsque nous développons des microservices, nous devons suivre les meilleures pratiques suivantes:

Utilisez un stockage de données séparé pour chaque microservice
Gardez le code à un niveau de maturité similaire
Build séparé pour chaque microservice
Attribuez chaque microservice avec une seule responsabilité
Déploier dans des conteneurs
Concevoir des services apatrides
Adopter la conception axée sur le domaine
Design Micro Frontend
Orchestrer les microservices

Quelle pile technologique est couramment utilisée pour les microservices?

Ci-dessous, vous trouverez un diagramme montrant la pile technologique de microservice, à la fois pour la phase de développement et pour la production.

▶️ ??? - ??????????

Définir l'API - Cela établit un contrat entre frontend et backend. Nous pouvons utiliser Postman ou OpenAPI pour cela.
Développement - Node.js ou React est populaire pour le développement frontal et Java / Python / Go pour le développement du backend. De plus, nous devons modifier les configurations dans la passerelle API en fonction des définitions de l'API.
Intégration continue - Junit et Jenkins pour les tests automatisés. Le code est emballé dans une image Docker et déployé sous forme de microservices.

▶️ ??????????

Nginx est un choix courant pour les équilibreurs de charge. CloudFlare fournit CDN (Content Delivery Network).
API Gateway - Nous pouvons utiliser Spring Boot pour la passerelle et utiliser Eureka / ZooKeeper pour la découverte de service.
Les microservices sont déployés sur des nuages. Nous avons des options entre AWS, Microsoft Azure ou Google GCP. Cache et recherche de texte complet - Redis est un choix courant pour la mise en cache des paires de valeurs clés. Elasticsearch est utilisé pour la recherche en texte intégral.
Communications - Pour que les services se parlent, nous pouvons utiliser Messaging Infra Kafka ou RPC.
Persistance - Nous pouvons utiliser MySQL ou PostgreSQL pour une base de données relationnelle et Amazon S3 pour Object Store. Nous pouvons également utiliser Cassandra pour le magasin de colonnes larges si nécessaire.
Gestion et surveillance - Pour gérer autant de microservices, les outils OPS communs incluent Prometheus, Elastic Stack et Kubernetes.

Pourquoi Kafka est-il rapide

Il existe de nombreuses décisions de conception qui ont contribué à la performance de Kafka. Dans cet article, nous nous concentrerons sur deux. Nous pensons que ces deux-là ont le plus de poids.

Le premier est la dépendance de Kafka à l'égard des E / S séquentielles.
Le deuxième choix de conception qui donne à Kafka son avantage de performance est son accent sur l'efficacité: principe de copie zéro.

Le diagramme illustre comment les données sont transmises entre le producteur et le consommateur, et ce que signifie la copie zéro.

Étape 1.1 - 1.3: le producteur écrit des données sur le disque
Étape 2: Le consommateur lit les données sans copie zéro

2.1 Les données sont chargées du disque au cache OS

2.2 Les données sont copiées du Cache OS à l'application Kafka

2.3 L'application Kafka copie les données dans le tampon de socket

2.4 Les données sont copiées du tampon de socket à la carte réseau

2.5 La carte réseau envoie des données au consommateur

Étape 3: Le consommateur lit les données avec une copie zéro

3.1: Les données sont chargées du disque au Cache du système d'exploitation 3.2 Cache OS Cache directement les données de la carte réseau via SendFile () Commande 3.3 La carte réseau envoie des données au consommateur

Zero Copy est un raccourci pour enregistrer les multiples copies de données entre le contexte de l'application et le contexte du noyau.

Systèmes de paiement

Comment apprendre les systèmes de paiement?

Pourquoi la carte de crédit est-elle appelée «le produit le plus rentable des banques»? Comment Visa / MasterCard gagne-t-il de l'argent?

Le diagramme ci-dessous montre l'économie du flux de paiement par carte de crédit.

1. Le titulaire de la carte paie 100 $ marchand pour acheter un produit.

2. Le commerçant bénéficie de l'utilisation de la carte de crédit avec un volume de vente plus élevé et doit compenser l'émetteur et le réseau de cartes pour fournir le service de paiement. La banque acquéreuse fixe des frais avec le marchand, appelé «frais de réduction des marchands».

3 - 4. La banque acquéreuse conserve 0,25 $ en tant que majoration acquise, et 1,75 $ est versé à la banque émettrice en tant que frais d'échange. Les frais de réduction des marchands devraient couvrir les frais d'échange.

Les frais d'interchange sont fixés par le réseau de cartes car il est moins efficace pour chaque banque émettrice de négocier des frais avec chaque commerçant.

5. Le réseau de cartes met en place les évaluations et les frais de réseau avec chaque banque, qui paie le réseau de cartes pour ses services chaque mois. Par exemple, Visa facture une évaluation de 0,11%, plus des frais d'utilisation de 0,0195 $, pour chaque balayage.

6. Le titulaire de la carte paie la banque émettrice pour ses services.

Pourquoi la banque émettrice devrait-elle être indemnisée?

L'émetteur paie le marchand même si le titulaire de la carte ne paie pas l'émetteur.
L'émetteur paie le marchand avant que le titulaire de la carte ne paie l'émetteur.
L'émetteur a d'autres frais d'exploitation, notamment la gestion des comptes clients, la fourniture de déclarations, la détection de fraude, la gestion des risques, la compensation et le règlement, etc.

Comment fonctionne le visa lorsque nous glisserons une carte de crédit dans un magasin de marchand?

Visa, MasterCard et American Express agissent comme des réseaux de cartes pour la compensation et le règlement des fonds. La banque d'acquisition de carte et la banque émettrice de la carte peuvent être - et sont souvent - différentes. Si les banques devaient régler les transactions une par une sans intermédiaire, chaque banque devrait régler les transactions avec toutes les autres banques. C'est assez inefficace.

Le diagramme ci-dessous montre le rôle de Visa dans le processus de paiement par carte de crédit. Il y a deux flux impliqués. Le flux d'autorisation se produit lorsque le client glisse la carte de crédit. Le flux de capture et de règlement se produit lorsque le marchand veut obtenir l'argent à la fin de la journée.

Flux d'autorisation

Étape 0: La carte émettant la banque émet des cartes de crédit à ses clients.

Étape 1: Le titulaire de la carte souhaite acheter un produit et glisser la carte de crédit au terminal de point de vente (POS) dans la boutique du marchand.

Étape 2: Le terminal POS envoie la transaction à la banque acquéreuse, qui a fourni le terminal POS.

Étapes 3 et 4: La banque acquéreuse envoie la transaction au réseau de cartes, également appelé le schéma de cartes. Le réseau de cartes envoie la transaction à la banque émettrice pour approbation.

Étapes 4.1, 4.2 et 4.3: La banque émettrice gèle l'argent si la transaction est approuvée. L'approbation ou le rejet est renvoyé à l'acquéreur, ainsi que le terminal POS.

Flux de capture et de tassement

Étapes 1 et 2: Le marchand veut collecter l'argent à la fin de la journée, alors ils ont frappé «capture» sur le terminal POS. Les transactions sont envoyées à l'acquéreur en lot. L'acquéreur envoie le fichier batch avec des transactions au réseau de cartes.

Étape 3: Le réseau de cartes effectue une compensation pour les transactions collectées auprès de différents acquéreurs et envoie les fichiers de compensation à différentes banques émettrices.

Étape 4: Les banques émettrices confirment l'exactitude des dossiers de compensation et transfèrent de l'argent aux banques acquéreuses concernées.

Étape 5: La banque acquéreuse transfère ensuite de l'argent à la banque du marchand.

Étape 4: Le réseau de cartes clarifie les transactions de différentes banques acquéreuses. La compensation est un processus dans lequel les transactions de décalage mutuel sont effectuées, de sorte que le nombre de transactions totales est réduite.

Dans le processus, le réseau de cartes prend le fardeau de parler à chaque banque et reçoit des frais de service en retour.

Systèmes de paiement à travers les World Series (Partie 1): Interface de paiement unifiée (UPI) en Inde

Qu'est-ce que UPI? UPI est un système de paiement en temps réel instantané développé par la National Payments Corporation of India.

Il représente aujourd'hui 60% des transactions de vente au détail numérique en Inde.

UPI = Langue de balisage de paiement + norme pour les paiements interopérables

DevOps

DevOps vs Sre vs Plateforme Engineering. Quelle est la différence ?

Les concepts de DevOps, SRE et de l'ingénierie de la plate-forme ont émergé à différents moments et ont été développés par diverses individus et organisations.

DevOps en tant que concept a été introduit en 2009 par Patrick Debois et Andrew Shafer lors de la conférence Agile. Ils ont cherché à combler le fossé entre le développement de logiciels et les opérations en promouvant une culture collaborative et une responsabilité partagée pour l'ensemble du cycle de vie du développement logiciel.

SRE, ou Ingénierie de fiabilité du site, a été lancé par Google au début des années 2000 pour relever les défis opérationnels dans la gestion des systèmes complexes à grande échelle. Google a développé des pratiques et des outils SRE, tels que le système de gestion des cluster Borg et le système de surveillance Monarch, pour améliorer la fiabilité et l'efficacité de leurs services.

L'ingénierie de la plate-forme est un concept plus récent, en s'appuyant sur les bases de l'ingénierie SRE. Les origines précises de l'ingénierie des plateformes sont moins claires, mais elle est généralement considérée comme une extension des pratiques DevOps et SRE, en mettant l'accent sur la fourniture d'une plate-forme complète pour le développement de produits qui soutient toute la perspective commerciale.

Il convient de noter que si ces concepts ont émergé à différents moments. Ils sont tous liés à la tendance plus large de l'amélioration de la collaboration, de l'automatisation et de l'efficacité du développement et des opérations logicielles.

Qu'est-ce que K8S (Kubernetes)?

K8S est un système d'orchestration de conteneurs. Il est utilisé pour le déploiement et la gestion des conteneurs. Sa conception est grandement affectée par le système interne de Google Borg.

Un cluster K8S se compose d'un ensemble de machines de travailleurs, appelées nœuds, qui exécutent des applications conteneurisées. Chaque cluster a au moins un nœud de travailleur.

Le ou les nœuds de travailleur hébergent les pods qui sont les composants de la charge de travail de l'application. Le plan de contrôle gère les nœuds de travailleur et les gousses du cluster. Dans les environnements de production, le plan de contrôle passe généralement sur plusieurs ordinateurs, et un cluster exécute généralement plusieurs nœuds, offrant une tolérance aux défauts et une haute disponibilité.

Composants du plan de contrôle

Serveur API
Le serveur API parle à tous les composants du cluster K8S. Toutes les opérations sur les pods sont exécutées en parlant au serveur API.
Planificateur
Le planificateur regarde les charges de travail de pod et attribue des charges sur les pods nouvellement créés.
Responsable du contrôleur
Le gestionnaire de contrôleur exécute les contrôleurs, y compris le contrôleur de nœud, le contrôleur de travail, le contrôleur EndPointSlice et le contrôleur ServiceAccount.
Etcd
etcd est un magasin de valeurs de clé utilisé comme magasin de support de Kubernetes pour toutes les données de cluster.

Nœuds

Gousses
Un pod est un groupe de conteneurs et est la plus petite unité que K8s administre. Les pods ont une seule adresse IP appliquée à chaque conteneur dans le pod.
Kublet
Un agent qui s'exécute sur chaque nœud dans le cluster. Il garantit que les conteneurs fonctionnent dans un pod.
Proxy kube
Kube-Proxy est un proxy de réseau qui s'exécute sur chaque nœud de votre cluster. Il achemine le trafic dans un nœud du service. Il transmet des demandes de travail dans les conteneurs corrects.

Docker contre Kubernetes. Lequel devons-nous utiliser?

Qu'est-ce que Docker?

Docker est une plate-forme open source qui vous permet de former, de distribuer et d'exécuter des applications dans des conteneurs isolés. Il se concentre sur la conteneurisation, fournissant des environnements légers qui encapsulent les applications et leurs dépendances.

Qu'est-ce que Kubernetes?

Kubernetes, souvent appelée K8S, est une plate-forme d'orchestration de conteneurs open source. Il fournit un cadre pour automatiser le déploiement, la mise à l'échelle et la gestion des applications conteneurisées sur un groupe de nœuds.

En quoi les deux sont-elles différentes les unes des autres?

Docker: Docker fonctionne au niveau du conteneur individuel sur un seul hôte du système d'exploitation.

Vous devez gérer manuellement chaque hôte et configurer les réseaux, les politiques de sécurité et le stockage pour plusieurs conteneurs associés peuvent être complexes.

Kubernetes: Kubernetes fonctionne au niveau du cluster. Il gère plusieurs applications conteneurisées sur plusieurs hôtes, offrant une automatisation pour des tâches telles que l'équilibrage de charge, la mise à l'échelle et la garantie de l'état des applications souhaité.

En bref, Docker se concentre sur la conteneurisation et l'exécution de conteneurs sur des hôtes individuels, tandis que Kubernetes est spécialisée dans la gestion et l'orchestration des conteneurs à grande échelle dans un groupe d'hôtes.

Comment fonctionne Docker?

Le diagramme ci-dessous montre l'architecture de Docker et comment il fonctionne lorsque nous exécutons «Docker Build», «Docker Pull» et «Docker Run».

Il y a 3 composants dans l'architecture Docker:

Client docker
Le client Docker parle au démon Docker.
Hôte docker
Le démon Docker écoute les demandes de l'API Docker et gère des objets Docker tels que des images, des conteneurs, des réseaux et des volumes.
Registre Docker
Un registre Docker stocke des images Docker. Docker Hub est un registre public que n'importe qui peut utiliser.

Prenons l'exemple de la commande «Docker Run».

Docker tire l'image du registre.
Docker crée un nouveau conteneur.
Docker alloue un système de fichiers en lecture au conteneur.
Docker crée une interface réseau pour connecter le conteneur au réseau par défaut.
Docker démarre le conteneur.

GIT

Comment fonctionnent les commandes GIT

Pour commencer, il est essentiel d'identifier où notre code est stocké. L'hypothèse commune est qu'il n'y a que deux emplacements - l'un sur un serveur distant comme GitHub et l'autre sur notre machine locale. Cependant, ce n'est pas entièrement exact. Git maintient trois stockages locaux sur notre machine, ce qui signifie que notre code peut être trouvé à quatre endroits:

Répertoire de travail: où nous modifions des fichiers
Zone de mise en scène: un emplacement temporaire où les fichiers sont conservés pour le prochain engagement
Référentiel local: contient le code qui a été engagé
Référentiel distant: le serveur distant qui stocke le code

La plupart des commandes GIT déplacent principalement les fichiers entre ces quatre emplacements.