apprentissage
Un journal des choses que j'apprends pour développer de solides compétences de base en génie logiciel tout en élargissant un peu chaque jour mes connaissances des technologies adjacentes.
Mise à jour : Une fois par mois | Focus actuel : IA générative
Compétences de base
Programmation Python
Ressource | Progrès |
---|
Datacamp : écrire du code Python efficace | ✅ |
Datacamp : écriture de fonctions en Python | ✅ |
Datacamp : programmation orientée objet en Python | ✅ |
Datacamp : programmation orientée objet intermédiaire en Python | ✅ |
Datacamp : Importer des données en Python (Partie 1) | ✅ |
Datacamp : Importer des données en Python (Partie 2) | ✅ |
Datacamp : Python intermédiaire pour la science des données | ✅ |
Datacamp : Boîte à outils Python Data Science (Partie 1) | ✅ |
Datacamp : Boîte à outils Python Data Science (Partie 2) | ✅ |
Datacamp : développement de packages Python | ✅ |
Datacamp : les essentiels de Conda | ✅ |
Youtube : Tutoriel : Sebastian Witowski - Boîte à outils du développeur Python moderne | ✅ |
Datacamp : Travailler avec des dates et des heures en Python | ✅ |
Datacamp : automatisation de la ligne de commande en Python | ⬜ |
Datacamp : tests unitaires pour la science des données en Python | ✅ |
Livre : Python 201 | ⬜ |
Livre : Écrire du Python idiomatique 3 | ⬜ |
Livre : Développement piloté par les tests avec Python | ⬜ |
Article : Les nombreux utilitaires de ligne de commande de Python | ⬜ |
Article : Introduction d'un programmeur à Unicode | ⬜ |
Article : Introduction au profilage de la mémoire en Python | ✅ |
Article : Profilage du code Python avec memory_profiler | ✅ |
Article : Comment utiliser « memory_profiler » pour profiler l'utilisation de la mémoire par le code Python ? | ✅ |
Structures de données et algorithmes
Ressource | Progrès |
---|
Livre : Algorithmes de Grokking | ✅ |
Livre : Le CV technique à l'envers | ✅ |
Neetcode : algorithmes et structures de données pour les débutants | ✅ |
Udacity : introduction aux structures de données et aux algorithmes | ✅ |
Linux et ligne de commande
Ressource | Progrès |
---|
Datacamp : Introduction à Shell pour la science des données | ✅ |
Datacamp : Introduction aux scripts Bash | ✅ |
Datacamp : traitement des données dans Shell | ✅ |
MIT : le semestre manquant | ✅ |
Udacity : bases de la ligne de commande Linux | ✅ |
Udacity : Atelier Shell | ✅ |
Udacity : configuration des serveurs Web Linux | ✅ |
Contrôle des versions
Ressource | Progrès |
---|
Udacity : contrôle de version avec Git | ✅ |
Datacamp : Introduction à Git pour la science des données | ✅ |
Udacity : GitHub et collaboration | ✅ |
Udacity : Comment utiliser Git et GitHub | ✅ |
Bases de données
Ressource | Progrès |
---|
Udacity : Introduction à la base de données relationnelle | ✅ |
Udacity : concepts et conception de systèmes de bases de données | ⬜ |
Datacamp : conception de bases de données | ⬜ |
Datacamp : Introduction aux bases de données en Python | ⬜ |
Datacamp : Introduction à SQL pour la science des données | ✅ |
Datacamp : SQL intermédiaire | ⬜ |
Datacamp : joindre des données dans PostgreSQL | ⬜ |
Udacity : SQL pour l'analyse des données | ⬜ |
Datacamp : analyse exploratoire des données en SQL | ⬜ |
Datacamp : appliquer SQL à des problèmes du monde réel | ⬜ |
Datacamp : analyser des données commerciales en SQL | ⬜ |
Datacamp : création de rapports en SQL | ⬜ |
Datacamp : Prise de décision basée sur les données en SQL | ⬜ |
Datacamp : concepts NoSQL | ⬜ |
Datacamp : Introduction à MongoDB en Python | ⬜ |
Ingénierie back-end
Ressource | Progrès |
---|
Udacity : Authentification et autorisation : OAuth | ⬜ |
Udacity : serveurs HTTP et Web | ⬜ |
Udacity : communication client-serveur | ⬜ |
Udacity : concevoir des API RESTful | ⬜ |
Datacamp : Introduction aux API en Python | ⬜ |
Udacity : réseautage pour les développeurs Web | ⬜ |
Conception du système de production
Ressource | Progrès |
---|
Livre : Concevoir des systèmes d'apprentissage automatique | ✅ |
Neetcode : conception de systèmes pour les débutants | ✅ |
Neetcode : Entretien de conception de système | ✅ |
Datacamp : analyse client et tests A/B en Python | ✅ |
Datacamp : tests A/B en Python | ⬜ |
Udacity : tests A/B | ⬜ |
Datacamp : concepts MLOps | ✅ |
Datacamp : Concepts de surveillance du Machine Learning | ✅ |
Mathématiques
Ressource | Progrès |
---|
Datacamp : fondements de la probabilité en Python | ✅ |
Datacamp : Introduction aux statistiques | ✅ |
Datacamp : Introduction aux statistiques en Python | ✅ |
Datacamp : tests d'hypothèses en Python | ✅ |
Datacamp : Pensée statistique en Python (Partie 1) | ✅ |
Datacamp : Pensée statistique en Python (Partie 2) | ✅ |
Datacamp : conception expérimentale en Python | ✅ |
Datacamp : Pratiquer les questions d'entretien sur les statistiques en Python | ⬜ |
edX : Statistiques essentielles pour l'analyse de données à l'aide d'Excel | ✅ |
Udacity : introduction aux statistiques inférentielles | ✅ |
MIT 18.06 Algèbre linéaire, printemps 2005 | ✅ |
Udacity : vecteurs propres et valeurs propres | ✅ |
Udacity : rafraîchissement de l'algèbre linéaire | ⬜ |
Youtube : l'essence de l'algèbre linéaire | ⬜ |
Connaissance de base du front-end
HTML
Ressource | Progrès |
---|
Codecademy : apprendre le HTML | ✅ |
Codecademy : Créer un site Web | ✅ |
Article : Texte alternatif | ⬜ |
CSS
Ressource | Progrès |
---|
Pluralsight : positionnement CSS | ✅ |
Pluralsight : introduction au CSS | ✅ |
Pluralsight : CSS : spécificité, modèle de boîte et bonnes pratiques | ✅ |
Pluralsight : CSS : Utilisation de Flexbox pour la mise en page | ✅ |
École de code : décoller avec Bootstrap | ✅ |
Pluralsight : principes fondamentaux de l'UX | ✅ |
Codecademy : Apprenez le SASS | ✅ |
CSS pour les développeurs Javascript | ✅ |
Article : Créer une illustration dans le design Figma | ✅ |
Livre : Refactorisation de l'interface utilisateur | ⬜ |
Youtube : Comment rendre votre site Web pas laid : UX de base pour les programmeurs | ⬜ |
Javascript
Ressource | Progrès |
---|
Udacity : ES6 - JavaScript amélioré | ✅ |
Udacity : introduction à Javascript | ✅ |
Udacity : JS 1 orienté objet | ✅ |
Udacity : JS 2 orienté objet | ✅ |
Udemy : Comprendre Typescript | ✅ |
Codecademy : apprendre JavaScript | ✅ |
Codecademy : piste Jquery | ✅ |
Pluralsight : utilisation des outils de développement Chrome | ✅ |
Sujets spécialisés
Apprentissage automatique
Ressource | Progrès |
---|
Article : Un aperçu des algorithmes d'optimisation de descente de gradient | ✅ |
Livre : Apprentissage automatique pratique avec Scikit-Learn, Keras et TensorFlow, 2e édition | ⬜ |
Livre : Une introduction à l'apprentissage automatique | ✅ |
Livre : Créez votre propre réseau neuronal | ✅ |
Livre : Apprentissage automatique Grokking | ✅ |
Livre : Le guide illustré StatQuest de l'apprentissage automatique | ✅ |
Fast.ai : apprentissage profond pratique pour les codeurs (partie 1) | ✅ |
Fast.ai : apprentissage profond pratique pour les codeurs (partie 2) | ⬜ |
Datacamp : méthodes d'ensemble en Python | ✅ |
Datacamp : Amplification de dégradé extrême avec XGBoost | ⬜ |
Datacamp : méthodes de clustering avec SciPy | ✅ |
Datacamp : apprentissage non supervisé en Python | ✅ |
Udacity : segmentation et clustering | ✅ |
Datacamp : Introduction à Python pour la science des données | ✅ |
edX : implémentation de l'analyse prédictive avec Spark dans Azure HDInsight | ✅ |
Datacamp : apprentissage supervisé avec scikit-learn | ✅ |
Datacamp : apprentissage automatique avec des modèles arborescents en Python | ✅ |
Datacamp : classificateurs linéaires en Python | ✅ |
Datacamp : réseaux de neurones convolutifs pour le traitement d'images | ✅ |
Datacamp : validation de modèle en Python | ✅ |
Datacamp : réglage des hyperparamètres en Python | ✅ |
Datacamp : HR Analytics en Python : prédire le taux de désabonnement des employés | ✅ |
Datacamp : prédire le taux de désabonnement des clients en Python | ✅ |
Datacamp : réduction de la dimensionnalité en Python | ✅ |
Datacamp : Prétraitement pour le Machine Learning en Python | ✅ |
Datacamp : types de données pour la science des données | ✅ |
Datacamp : nettoyer les données en Python | ✅ |
Datacamp : ingénierie de fonctionnalités pour l'apprentissage automatique en Python | ✅ |
Datacamp : Prédire le CTR avec le Machine Learning en Python | ✅ |
Datacamp : Introduction aux concepts financiers avec Python | ✅ |
Datacamp : Détection de fraude en Python | ✅ |
Karpathy : Réseaux de neurones : de zéro à héros | ✅ |
Article : Initialisation du poids dans les réseaux de neurones : un voyage des bases à Kaiming | ⬜ |
Traitement du langage naturel
Ressource | Progrès |
---|
Livre : Traitement du langage naturel avec des transformateurs | ✅ |
Stanford CS224U : Compréhension du langage naturel | Printemps 2019 | ✅ |
Stanford CS224N : Stanford CS224N : PNL avec Deep Learning | Hiver 2019 | ✅ |
CMU : Bootcamp PNL à faibles ressources 2020 | ✅ |
CMU PNL multilingue 2020 | ✅ |
Datacamp : Ingénierie de fonctionnalités pour le NLP en Python | ✅ |
Datacamp : principes fondamentaux du traitement du langage naturel en Python | ✅ |
Datacamp : expressions régulières en Python | ✅ |
Datacamp : RNN pour la modélisation du langage | ✅ |
Datacamp : génération de langage naturel en Python | ✅ |
Datacamp : créer des chatbots en Python | ✅ |
Datacamp : analyse des sentiments en Python | ✅ |
Datacamp : traduction automatique en Python | ✅ |
Article : L’efficacité déraisonnable des collocations | ⬜ |
Article : FuzzyWuzzy : correspondance de chaînes floues en Python | ✅ |
Article : Mamba expliqué | ⬜ |
Article : Un guide visuel des modèles Mamba et State Space | ⬜ |
Article : Les principes fondamentaux de la quantification avec un visage câlin | ✅ |
IA générative
Théorie du LLM
Ressource | Progrès |
---|
Article : SolidGoldMagikarp (plus, génération d'invites) | ⬜ |
DeepLearning.AI : LLM de pré-formation | ✅ |
DeepLearning.AI : Comment fonctionnent les modèles de diffusion | ⬜ |
Karpathy : introduction aux grands modèles de langage [ 1hr ] | ✅ |
Karpathy : construisons le tokenizer GPT [ 2hr13m ] | ✅ |
Karpathie : reproduisons GPT-2 (124 M) [ 4hr1m ] | ⬜ |
Youtube : guide des hackers sur les modèles linguistiques [ 1hr30m ] | ✅ |
Youtube : 5 ans de GPT avec Finbarr Timbers | ⬜ |
Article : Échantillonnage pour la génération de texte | ⬜ |
DeepLearning.AI : apprentissage par renforcement à partir de la rétroaction humaine | ✅ |
Youtube : LLaMA expliqué : KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query Attention, SwiGLU [ 1h10m ] | ⬜ |
Recherche d'informations / RAG
Ressource | Progrès |
---|
Modèles de langage de transformateur pré-entraînés pour la recherche - partie 1 | ⬜ |
Modèles de langage de transformateur pré-entraînés pour la recherche - Partie 2 | ⬜ |
Modèles de langage de transformateur pré-entraînés pour la recherche - PARTIE 3 | ⬜ |
Modèles de langage de transformateur pré-entraînés pour la recherche - PARTIE 4 | ⬜ |
Comprendre l'indice IVF-PQ de LanceDB | ⬜ |
Un peu de pooling est très utile pour les représentations multi-vecteurs | ✅ |
Cours de récupération Fullstack | |
Article : Niveaux de complexité : applications RAG | ✅ |
Article : Améliorer systématiquement votre RAG | ⬜ |
Article : Arrêtez d'utiliser LGTM@Few comme métrique (Better RAG) | ⬜ |
Article : Fruits à portée de main pour la recherche RAG | ⬜ |
Article : Ce que les ingénieurs en IA devraient savoir sur la recherche | ✅ |
Article : Évaluation des stratégies de fragmentation pour la récupération | ⬜ |
Article : Incorporations de phrases. Introduction aux intégrations de phrases | ⬜ |
DeepLearning.AI : création et évaluation d'applications RAG avancées | ✅ |
DeepLearning.AI : bases de données vectorielles : des intégrations aux applications | ✅ |
DeepLearning.AI : récupération avancée pour l'IA avec Chroma | ✅ |
DeepLearning.AI : compression des invites et optimisation des requêtes | ✅ |
DeepLearning.AI : Grands modèles linguistiques avec recherche sémantique [ 1hr ] | ✅ |
DeepLearning.AI : création d'applications avec des bases de données vectorielles | ✅ |
DeepLearning.AI : Créer une recherche multimodale et RAG | ⬜ |
DeepLearning.AI : graphiques de connaissances pour RAG | ⬜ |
DeepLearning.AI : Fonctions, outils et agents avec LangChain | ⬜ |
DeepLearning.AI : Créer un RAG agentique avec LlamaIndex | ⬜ |
DeepLearning.AI : systèmes multi-agents IA avec CrewAI | ⬜ |
DeepLearning.AI : modèles de conception agentique d'IA avec AutoGen | ⬜ |
DeepLearning.AI : agents IA dans LangGraph | ⬜ |
DeepLearning.AI : créer votre propre agent de base de données | ⬜ |
DeepLearning.AI : prétraitement des données non structurées pour les applications LLM | ⬜ |
DeepLearning.AI : intégration de modèles : de l'architecture à la mise en œuvre | ✅ |
Pinecone : bases de données vectorielles en production pour les ingénieurs occupés | ⬜ |
Pinecone : génération augmentée de récupération | ⬜ |
Pinecone : Manuel d'IA LangChain | ⬜ |
Pinecone : méthodes d'intégration pour la recherche d'images | ⬜ |
Pinecone : Faiss : Le manuel manquant | ⬜ |
Pinecone : recherche de vecteurs dans la nature | ⬜ |
Pinecone : traitement du langage naturel pour la recherche sémantique | ⬜ |
Youtube : améliorer systématiquement les applications RAG | ✅ |
Youtube : Retour aux sources pour RAG avec Jo Bergum | ✅ |
Youtube : Au-delà des bases de la récupération pour la génération croissante (avec Ben Clavié) | ✅ |
Youtube : RAG à partir de zéro | 0/14 |
Article : LambdaMART en profondeur | ⬜ |
Article : Génération guidée avec contours | ✅ |
Ingénierie rapide
Ressource | Progrès |
---|
Article : Ingénierie des invites OpenAI | ⬜ |
Article : Principes fondamentaux d’incitation et comment les appliquer efficacement | ✅ |
Cours anthropiques | ⬜ |
Article : Ingénierie rapide (Liliang Weng) | ✅ |
Article : Prompt Engineering 201 : méthodes et boîtes à outils avancées | ✅ |
Article : Optimiser les LLM pour plus de précision | ✅ |
Article : Introductions • Ingénierie rapide | ⬜ |
Article : Anyscale Endpoints : fonctionnalités d'appel de mode et de fonction JSON | ⬜ |
Article : Génération de texte guidée avec de grands modèles linguistiques | ⬜ |
Article : Alternatives à la vision GPT-4 | ⬜ |
DeepLearning.AI : ingénierie d'invite ChatGPT pour les développeurs | ⬜ |
DeepLearning.AI : ingénierie rapide pour les modèles de vision | ⬜ |
DeepLearning.AI : Ingénierie rapide avec Llama 2 et 3 | ⬜ |
Wandb : Ingénierie LLM : résultats structurés | ⬜ |
DeepLearning.AI : appel de fonctions et extraction de données avec des LLM | ⬜ |
Série : Injection rapide | ⬜ |
Youtube : Présentation rapide de l'ingénierie [ 1hr4m ] | ✅ |
Youtube : génération structurée avec des LLM | ⬜ |
LLMOps
Ressource | Progrès |
---|
Article : Modèles pour la création de systèmes et de produits basés sur le LLM | ✅ |
Article : Architectures émergentes pour les applications LLM | ✅ |
Article : Comment accélérer les LLM | ⬜ |
Article : Sur la voie rapide ! Décodage spéculatif - Modèle 10x plus grand, sans frais supplémentaires | ⬜ |
Article : Harmonisation des multi-GPU : mise à l'échelle efficace de l'inférence LLM | ⬜ |
Article : L'attention multi-requêtes est tout ce dont vous avez besoin | ⬜ |
Article : Ensemble d'outils d'optimisation d'inférence de Transformers | ⬜ |
DeepLearning.AI : servir efficacement les LLM | ✅ |
DeepLearning.AI : tests automatisés pour LLMOps | ✅ |
DeepLearning.AI : Applications LLM Red Teaming | ✅ |
DeepLearning.AI : évaluation et débogage de modèles d'IA génératifs à l'aide de pondérations et de biais | ⬜ |
DeepLearning.AI : qualité et sécurité pour les applications LLM | ⬜ |
DeepLearning.AI : LLMOps | ⬜ |
DeepLearning.AI : applications LLM sans serveur avec Amazon Bedrock | ⬜ |
DeepLearning.AI : Quantification en profondeur | ⬜ |
DeepLearning.AI : Introduction à l'IA sur appareil | ⬜ |
Article : Un guide visuel de la quantification | ⬜ |
Article : QLoRA et quantification 4 bits | ⬜ |
Article : Comprendre la quantification AI/LLM grâce à des visualisations interactives | ⬜ |
Article : Série d'inférences LLM : 3. Explication de la mise en cache KV | ⬜ |
Article : Série d'inférences LLM : 4. Mise en cache KV, un examen plus approfondi | ⬜ |
Article : Série d'inférences LLM : 5. Dissection des performances du modèle | ⬜ |
Youtube : SBTB 2023 : Charles Frye, Processeurs parallèles : connexions passées et futures entre les LLM et les noyaux du système d'exploitation | ⬜ |
Article : Arithmétique d'inférence de transformateur | ⬜ |
Construire des systèmes basés sur LLM
Ressource | Progrès |
---|
Article : Ce que nous avons appris d'une année de construction avec des LLM | ⬜ |
Article : Comment générer et utiliser des données synthétiques pour le réglage fin | ✅ |
Article : Votre produit d'IA a besoin d'évaluations | ✅ |
Article : Évaluations LLM spécifiques à des tâches qui fonctionnent et ne fonctionnent pas | ✅ |
Article : Volants de données pour les applications LLM | ⬜ |
Article : LLM From the Trenches : 10 leçons apprises pour opérationnaliser les modèles chez GoDaddy | ✅ |
Article : Évaluation et détection d'hallucinations pour les résumés abstraits | ✅ |
Article : Modèles UX émergents pour les applications et les copilotes d'IA générative | ✅ |
Article : Le guide de formation LLM pour les novices | ⬜ |
Article : Pousser la prise en charge des données structurées de ChatGPT jusqu'à ses limites | ✅ |
Article : GPTed : utiliser GPT-3 pour la vérification sémantique de la prose | ✅ |
Article : Ne vous inquiétez pas pour les LLM | ⬜ |
DeepLearning.AI : peaufiner les grands modèles de langage | ✅ |
DeepLearning.AI : créer des systèmes avec l'API ChatGPT | ⬜ |
DeepLearning.AI : LangChain pour le développement d'applications LLM | ⬜ |
DeepLearning.AI : LangChain : discutez avec vos données | ⬜ |
DeepLearning.AI : créer des applications d'IA générative avec Gradio | ✅ |
DeepLearning.AI : modèles open source avec visage câlin | ⬜ |
DeepLearning.AI : Démarrer avec Mistral | ⬜ |
Datacamp : développer des applications LLM avec LangChain | ⬜ |
LLMOps : Construire avec les LLM | ⬜ |
Bootcamp LLM - Printemps 2023 | ✅ |
Youtube : une enquête sur les techniques pour maximiser les performances du LLM | ✅ |
Youtube : Éléments de base pour les systèmes et produits LLM : Eugene Yan | ✅ |
Youtube : Affiner les modèles OpenAI – Meilleures pratiques | ✅ |
Youtube : Cours : LLM Fine-Tuning avec Axolotl | 0/4 |
Youtube : mise au point des LLM | 1/5 |
Youtube : évaluations LLM | 0/5 |
Youtube : Créer des applications LLM | 0/8 |
Compétences techniques (Bibliothèques/Frameworks/Outils)
AWS
Ressource | Progrès |
---|
Udemy : Développeur certifié AWS - Associé 2018 | ✅ |
Django
Ressource | Progrès |
---|
Article : Django, HTMX et Alpine.js : Sites Web modernes, JavaScript en option | ✅ |
Matplotlib
Ressource | Progrès |
---|
Datacamp : Introduction à Seaborn | ✅ |
Datacamp : Introduction à Matplotlib | ✅ |
MLFlow
Ressource | Progrès |
---|
Datacamp : Introduction à MLFlow | ✅ |
Nextxt.JS
Ressource | Progrès |
---|
Docs : Commencez à créer avec Next.js | |
Pandas
Ressource | Progrès |
---|
Datacamp : Fondations Pandas | ✅ |
Datacamp : Pandas Joins pour les utilisateurs de feuilles de calcul | ✅ |
Datacamp : Manipuler des DataFrames avec des pandas | ✅ |
Datacamp : Fusionner des DataFrames avec des pandas | ✅ |
Datacamp : Manipulation de données avec des pandas | ✅ |
Datacamp : Optimiser le code Python avec des pandas | ✅ |
Datacamp : Ingestion de données rationalisée avec les pandas | ✅ |
Datacamp : Analyser les campagnes marketing avec les pandas | ✅ |
Datacamp : Analyser l'activité policière avec des pandas | ✅ |
PyTorch
Ressource | Progrès |
---|
Article : composants internes de PyTorch | ⬜ |
Article : Prendre PyTorch pour acquis | ⬜ |
Datacamp : Introduction au Deep Learning avec PyTorch | ✅ |
Datacamp : Deep Learning intermédiaire avec PyTorch | ⬜ |
Datacamp : Deep Learning pour le texte avec PyTorch | ⬜ |
Datacamp : Deep Learning pour les images avec PyTorch | ⬜ |
Deeplizard : Programmation de réseaux neuronaux - Deep Learning avec PyTorch | ✅ |
RéagirJS
Ressource | Progrès |
---|
Codecademy : Apprenez ReactJS : Partie I | ✅ |
Codecademy : Apprenez ReactJS : Partie II | ✅ |
NexxtJS : Fondations React | ⬜ |
Spacieux
Ressource | Progrès |
---|
Datacamp : PNL avancée avec spaCy | ✅ |
Tensorflow et Keras
Ressource | Progrès |
---|
Datacamp : Introduction à TensorFlow en Python | ✅ |
Datacamp : apprentissage profond en Python | ✅ |
Datacamp : Introduction au Deep Learning avec Keras | ✅ |
Datacamp : Deep Learning avancé avec Keras | ✅ |
Deeplizard : Keras - API de réseau neuronal Python Deep Learning | ✅ |
Udacity : introduction à TensorFlow pour le Deep Learning | ✅ |