Hier sind die Abschnitte:
Dieser Abschnitt enthält Spickzettel zu grundlegenden Konzepten der Datenwissenschaft, die in Interviews gefragt werden:
Dieser Abschnitt enthält Bücher, die ich über Datenwissenschaft und maschinelles Lernen gelesen habe:
Dieser Abschnitt enthält Beispielfragen, die in tatsächlichen Data-Science-Interviews gestellt wurden:
Dieser Abschnitt enthält Fallstudienfragen, die sich mit dem Entwurf maschineller Lernsysteme zur Lösung praktischer Probleme befassen.
Dieser Abschnitt enthält ein Portfolio von Data-Science-Projekten, die ich für akademische, selbstlernende und Hobbyzwecke abgeschlossen habe.
Für ein optisch ansprechenderes Erlebnis beim Durchsuchen des Portfolios besuchen Sie jameskle.com/data-portfolio
Transfer Rec: Meine laufende Forschungsarbeit, die Deep Learning und Empfehlungssysteme überschneidet.
Filmempfehlung: Entwarf 4 verschiedene Modelle, die Elemente im MovieLens-Datensatz empfehlen.
Tools: PyTorch, TensorBoard, Keras, Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-Learn, Surprise, Wordcloud
Trip Optimizer: Verwendet XGBoost und evolutionäre Algorithmen, um die Reisezeit für Taxifahrzeuge in New York City zu optimieren.
Instacart-Warenkorbanalyse: Wir haben die Herausforderung der Instacart-Warenkorbanalyse gemeistert, um vorherzusagen, welche Produkte in der nächsten Bestellung eines Benutzers enthalten sein werden.
Werkzeuge: Pandas, NumPy, Matplotlib, XGBoost, Geopy, Scikit-Learn
Modeempfehlung: Entwickelte ein ResNet-basiertes Modell, das Modebilder in der DeepFashion-Datenbank basierend auf semantischer Ähnlichkeit klassifiziert und empfiehlt.
Modeklassifizierung: Entwicklung von 4 verschiedenen Convolutional Neural Networks, die Bilder im Fashion MNIST-Datensatz klassifizieren.
Hunderassenklassifizierung: Entwickelte ein Faltungs-Neuronales Netzwerk, das die Hunderasse identifiziert.
Straßensegmentierung: Implementierung eines vollständig Faltungsnetzwerks für semantische Segmentierungsaufgaben im Kitty Road-Datensatz.
Werkzeuge: TensorFlow, Keras, Pandas, NumPy, Matplotlib, Scikit-Learn, TensorBoard
Mannschaftsanalyse der Weltmeisterschaft 2018: Analyse und Visualisierung des FIFA 18-Datensatzes zur Vorhersage der bestmöglichen internationalen Kaderaufstellungen für 10 Mannschaften bei der Weltmeisterschaft 2018 in Russland.
Spotify-Künstleranalyse: Analyse und Visualisierung von Musikstilen von 50 verschiedenen Künstlern mit einem breiten Spektrum an Genres auf Spotify.
Tools: Pandas, NumPy, Matplotlib, Rspotify, httr, dplyr, Tidyr, Radarchart, ggplot2
Dieser Abschnitt enthält ein Portfolio von Datenjournalismus-Artikeln, die ich für freiberufliche Kunden und zum Selbstlernen erstellt habe.
Für ein visuell angenehmeres Erlebnis beim Durchsuchen des Portfolios besuchen Sie jameskle.com/data-journalism
Die 10 statistischen Techniken, die Datenwissenschaftler beherrschen müssen
Tutorial zur logistischen Regression
Entscheidungsbaum-Tutorial
Support Vector Machines-Tutorial
Eine freundliche Einführung in datengesteuertes Marketing für Führungskräfte
Die 10 Algorithmen, die Ingenieure für maschinelles Lernen kennen müssen
12 nützliche Dinge, die Sie über maschinelles Lernen wissen sollten
Eine Tour durch die Top 10 Algorithmen für Einsteiger in maschinelles Lernen
Die 10 Data-Mining-Techniken, die Datenwissenschaftler für ihre Toolbox benötigen
Clustering und Klassifizierung im E-Commerce
Das ABC des Erlernens des Rankings
6 Möglichkeiten zum Debuggen eines Modells für maschinelles Lernen
8 Karrierewege im Bereich maschinelles Lernen, die Sie heute verfolgen können
Die 10 Deep-Learning-Methoden, die KI-Praktiker anwenden müssen
Die 8 neuronalen Netzwerkarchitekturen, die ML-Forscher lernen müssen
Die 5 Deep-Learning-Frameworks, mit denen jeder ernsthafte maschinelle Lerner vertraut sein sollte
Die 5 Computer-Vision-Techniken, die Ihre Sicht auf die Welt verändern werden
Faltungs-Neuronale Netze: Das biologisch inspirierte Modell
Wiederkehrende neuronale Netze: Das Kraftpaket der Sprachmodellierung
Die 7 NLP-Techniken, die Ihre Kommunikation in Zukunft verändern werden
Die 5 Trends, die Computer Vision im Jahr 2018 dominieren
Die 3 Deep-Learning-Frameworks für die End-to-End-Spracherkennung, die Ihre Geräte antreiben
Die 5 Algorithmen für effiziente Deep-Learning-Inferenz auf kleinen Geräten
Die 4 Forschungstechniken zum effizienteren Trainieren tiefer neuronaler Netzwerkmodelle
Die 2 Hardware-Architekturen für effizientes Training und Inferenz von Deep Nets
10 Best Practices für Deep Learning, die Sie im Jahr 2020 im Hinterkopf behalten sollten
Diese PDF-Cheatsheets stammen von BecomingHuman.AI.