Voici les rubriques :
Cette section contient des aide-mémoire sur les concepts de base de la science des données qui seront abordés lors des entretiens :
Cette section contient des livres que j'ai lus sur la science des données et l'apprentissage automatique :
Cette section contient des exemples de questions qui ont été posées lors d'entretiens réels de science des données :
Cette section contient des questions d'études de cas concernant la conception de systèmes d'apprentissage automatique pour résoudre des problèmes pratiques.
Cette section contient un portefeuille de projets de science des données que j'ai réalisés à des fins académiques, d'auto-apprentissage et de loisirs.
Pour une expérience visuellement plus agréable pour parcourir le portefeuille, consultez jameskle.com/data-portfolio
Transfer Rec : Mes travaux de recherche en cours qui croisent les systèmes d'apprentissage profond et de recommandation.
Recommandation de film : conception de 4 modèles différents qui recommandent des éléments sur l'ensemble de données MovieLens.
Outils : PyTorch, TensorBoard, Keras, Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-Learn, Surprise, Wordcloud
Trip Optimizer : utilisation de XGBoost et d'algorithmes évolutifs pour optimiser le temps de trajet des véhicules de taxi à New York.
Analyse du panier de marché Instacart : résolution du défi d'analyse du panier de marché Instacart pour prédire quels produits figureront dans la prochaine commande d'un utilisateur.
Outils : Pandas, NumPy, Matplotlib, XGBoost, Geopy, Scikit-Learn
Recommandation de mode : création d'un modèle basé sur ResNet qui classe et recommande les images de mode dans la base de données DeepFashion en fonction de la similarité sémantique.
Classification de la mode : développement de 4 réseaux de neurones convolutifs différents qui classent les images dans l'ensemble de données Fashion MNIST.
Classification des races de chiens : conception d'un réseau neuronal convolutif qui identifie la race de chien.
Segmentation routière : mise en œuvre d'un réseau entièrement convolutif pour la tâche de segmentation sémantique dans l'ensemble de données Kitty Road.
Outils : TensorFlow, Keras, Pandas, NumPy, Matplotlib, Scikit-Learn, TensorBoard
Analyse des équipes de la Coupe du monde 2018 : analyse et visualisation de l'ensemble de données FIFA 18 pour prédire les meilleures compositions d'équipes internationales possibles pour 10 équipes lors de la Coupe du monde 2018 en Russie.
Analyse des artistes Spotify : analyse et visualisation des styles musicaux de 50 artistes différents avec un large éventail de genres sur Spotify.
Outils : Pandas, NumPy, Matplotlib, Rspotify, httr, dplyr, Tidyr, Radarchart, ggplot2
Cette section contient un portefeuille d'articles de journalisme de données rédigés par moi pour des clients indépendants et à des fins d'auto-apprentissage.
Pour une expérience visuellement plus agréable pour parcourir le portfolio, consultez jameskle.com/data-journalism
Les 10 techniques statistiques que les data scientists doivent maîtriser
Tutoriel de régression logistique
Tutoriel sur les arbres de décision
Tutoriel sur les machines à vecteurs de support
Une introduction conviviale au marketing basé sur les données pour les chefs d'entreprise
Les 10 algorithmes que les ingénieurs en apprentissage automatique doivent connaître
12 choses utiles à savoir sur l'apprentissage automatique
Une visite guidée des 10 meilleurs algorithmes pour les débutants en apprentissage automatique
Les 10 techniques d'exploration de données dont les data scientists ont besoin pour leur boîte à outils
Clustering et classification dans le commerce électronique
L'ABC de l'apprentissage du classement
6 façons de déboguer un modèle d'apprentissage automatique
8 cheminements de carrière en apprentissage automatique à poursuivre aujourd'hui
Les 10 méthodes d’apprentissage profond que les praticiens de l’IA doivent appliquer
Les 8 architectures de réseaux neuronaux que les chercheurs en ML doivent apprendre
Les 5 cadres d'apprentissage profond que tout apprenant automatique sérieux devrait connaître
Les 5 techniques de vision par ordinateur qui changeront votre façon de voir le monde
Réseaux de neurones convolutifs : le modèle d'inspiration biologique
Réseaux de neurones récurrents : la puissance de la modélisation du langage
Les 7 techniques de PNL qui changeront votre façon de communiquer à l'avenir
Les 5 tendances dominant la vision par ordinateur en 2018
Les 3 cadres d'apprentissage profond pour la reconnaissance vocale de bout en bout qui alimentent vos appareils
Les 5 algorithmes pour une inférence efficace de Deep Learning sur les petits appareils
Les 4 techniques de recherche pour former plus efficacement des modèles de réseaux neuronaux profonds
Les 2 architectures matérielles pour une formation et une inférence efficaces des réseaux profonds
10 meilleures pratiques de Deep Learning à garder à l’esprit en 2020
Ces aide-mémoire PDF proviennent de BecomingHuman.AI.