? Ranked as one of the top data science repositories on GitHub!
Techniken, Tools, Best Practices und alles, was Sie zum Erlernen von maschinellem Lernen benötigen!
Das Complete Machine Learning Package ist ein umfassendes Repository mit 35 Notebooks zu Python-Programmierung, Datenmanipulation, Datenanalyse, Datenvisualisierung, Datenbereinigung, klassischem maschinellem Lernen, Computer Vision und Natural Language Processing (NLP).
Alle Notizbücher wurden mit Blick auf die Leser erstellt. Jedes Notizbuch beginnt mit einem allgemeinen Überblick über alle behandelten spezifischen Algorithmen/Konzepte. Wo immer möglich, werden zur Verdeutlichung visuelle Darstellungen eingesetzt.
10. Mai 2023: Ein umfassender Leitfaden zu MLOps hinzugefügt. Viel Spaß mit der Anleitung!!
23. Juni 2022: Viele Menschen haben gefragt, wie sie das Paket unterstützen können. Ihr könnt uns gerne einen Kaffee spendieren ☕️
18. Mai 2022: Das vollständige Paket für maschinelles Lernen ist jetzt im Internet verfügbar. Es ist jetzt ganz einfach, alle Notizbücher anzuzeigen!
9. April 2022: Transfer Learning with Pretrained Convolutional Neural Networks mit zusätzlichen Dingen aktualisiert und weitere Ressourcen hinzugefügt.
25. November 2021: Aktualisierte Grundlagen des maschinellen Lernens: Einführungshinweise, ML-Systemdesign-Workflow und Herausforderungen von Lernsystemen hinzugefügt.
Im Folgenden sind die Tools aufgeführt, die im Komplettpaket für maschinelles Lernen behandelt werden. Sie sind beliebte Werkzeuge, die die meisten Ingenieure und Datenwissenschaftler für maschinelles Lernen auf die eine oder andere Weise und täglich benötigen.
Python ist eine Programmiersprache auf hohem Niveau, die sich in der Daten-Community großer Beliebtheit erfreut, und angesichts des schnellen Wachstums der Bibliotheken und Frameworks ist dies die richtige Programmiersprache für ML.
NumPy ist ein wissenschaftliches Rechentool, das für Array- oder Matrixoperationen verwendet wird.
Pandas ist ein großartiges und einfaches Tool zum Analysieren und Bearbeiten von Daten aus verschiedenen Quellen.
Matplotlib ist ein umfassendes Datenvisualisierungstool zum Erstellen statischer, animierter und interaktiver Visualisierungen in Python.
Seaborn ist ein weiteres Datenvisualisierungstool, das auf Matplotlib aufbaut und recht einfach zu verwenden ist.
Scikit-Learn: Anstatt Modelle für maschinelles Lernen von Grund auf zu erstellen, erleichtert Scikit-Learn die einfache Verwendung klassischer Modelle in wenigen Codezeilen. Dieses Tool wird von fast der gesamten ML-Community und -Branche übernommen, von Start-ups bis hin zu großen Technologieunternehmen.
TensorFlow und Keras für Deep Learning: TensorFlow ist ein beliebtes Deep-Learning-Framework, das zum Erstellen von Modellen verwendet wird, die für verschiedene Bereiche wie Computer Vision und Natural Language Processing geeignet sind. Keras ist eine High-Level-API für neuronale Netzwerke, die das Entwerfen von Deep-Learning-Modellen erleichtert. TensorFlow und Keras verfügen über eine großartige Community und ein großartiges Ökosystem, das Tools wie TensorBoard, TF Datasets, TensorFlow Lite, TensorFlow Extended, TensorFlow Hub, TensorFlow.js, TensorFlow GNN und vieles mehr umfasst.
[ Detaillierte Hinweise zu NumPy finden Sie hier ]
Explorative Datenanalyse
Einführung in die Datenvorbereitung
Umgang mit kategorialen Features
Funktionsskalierung
Umgang mit fehlenden Werten
Einführung in Scikit-Learn für maschinelles Lernen
Lineare Modelle für die Regression
Lineare Modelle zur Klassifizierung
Support Vector Machines: Einführung und Regression
Unterstützen Sie Vektormaschinen zur Klassifizierung
Entscheidungsbäume: Einführung und Regression
Entscheidungsbäume zur Klassifizierung
Zufällige Wälder: Einführung und Regression
Zufällige Wälder zur Klassifizierung
Jenseits zufälliger Wälder: Weitere Ensemble-Modelle
Einführung in unüberwachtes Lernen mit KMeans-Clustering
Eine praktische Einführung in die Hauptkomponentenanalyse
Einführung in künstliche neuronale Netze
Warum Deep Learning
Ein einschichtiges neuronales Netzwerk
Aktivierungsfunktionen
Arten von Deep-Learning-Architekturen
Herausforderungen beim Training tiefer neuronaler Netze
Einführung in TensorFlow für Deep Learning
Neuronale Netze für die Regression mit TensorFlow
Neuronale Netze zur Klassifizierung mit TensorFlow
Einführung in Computer Vision mit Convolutional Neural Networks (CNNs)
ConvNets für reale Daten- und Bilderweiterung
Transferlernen mit vortrainierten Faltungs-Neuronalen Netzen
[Aktualisiertes Notizbuch zum Transferlernen finden Sie hier]
Einführung in NLP und Textverarbeitung mit TensorFlow
Verwendung von Worteinbettungen zur Darstellung von Texten
Wiederkehrende neuronale Netze (RNNs)
Verwendung von Faltungs-Neuronalen Netzen zur Textklassifizierung
Verwendung von vorab trainiertem BERT zur Textklassifizierung
Viele der für dieses Repository verwendeten Datensätze stammen aus den folgenden Quellen:
Die Community für maschinelles Lernen ist sehr lebendig. Das Komplettpaket für maschinelles Lernen kann Ihnen den Einstieg erleichtern, reicht aber nicht aus. Glücklicherweise gibt es viele tolle Lernressourcen, von denen einige kostenpflichtig oder kostenlos verfügbar sind. Hier ist eine Liste von Kursen, die oft von vielen Menschen empfohlen werden. Beachten Sie, dass sie nicht in der Reihenfolge aufgeführt sind, in der sie eingenommen werden sollen.
Maschinelles Lernen von Coursera : Dieser Kurs wurde von Andrew Ng geleitet. Es ist einer der beliebtesten Kurse für maschinelles Lernen und wurde von über 4 Millionen Menschen besucht. Der Kurs konzentriert sich mehr auf die Grundlagen maschineller Lerntechniken und Algorithmen. Es ist kostenlos auf Coursera.
Deep-Learning-Spezialisierung : Deep-Learning-Spezialisierung wird ebenfalls von Andrew Ng. unterrichtet und ist ebenfalls ein Grundlagenkurs. Es vermittelt gute Grundlagen wichtiger Deep-Learning-Architekturen wie Faltungs-Neuronale Netze und wiederkehrende Neuronale Netze. Der vollständige Kurs kann auf Coursera eingesehen oder kostenlos auf YouTube angesehen werden.
MIT-Einführung in Deep Learning : Dieser Kurs vermittelt in relativ kurzer Zeit die Grundlagen des Deep Learning. Jede Vorlesung dauert eine Stunde oder weniger, aber die Materialien sind immer noch die besten im Unterricht. Sehen Sie sich hier die Kursseite und hier die Vorlesungsvideos an.
MIT-Einführung in datenzentrierte KI : Dies ist der allererste Kurs zu DCAI. In dieser Klasse werden Algorithmen behandelt, um häufige Probleme in ML-Daten zu finden und zu beheben und bessere Datensätze zu erstellen. Dabei liegt der Schwerpunkt auf Daten, die bei überwachten Lernaufgaben wie der Klassifizierung verwendet werden. Das gesamte in diesem Kurs vermittelte Material ist sehr praxisorientiert und konzentriert sich auf wirkungsvolle Aspekte realer ML-Anwendungen und nicht auf mathematische Details der Funktionsweise bestimmter Modelle. In diesem Kurs können Sie praktische Techniken erlernen, die in den meisten ML-Kursen nicht behandelt werden. Dies wird dazu beitragen, das „Garbage in, Garbage out“-Problem zu mildern, das viele reale ML-Anwendungen plagt. Schauen Sie sich hier die Kursseite, hier die Vorlesungsvideos und hier die Laboraufgaben an.
NYU Deep Learning Spring 2021 : Dieser Kurs wird an der NYU von Yann LeCun und Alfredo Canziani unterrichtet und ist einer der kreativsten Kurse überhaupt. Die Materialien werden auf erstaunliche Weise präsentiert. Sehen Sie sich hier die Vorlesungsvideos und hier das Kursrepo an.
CS231N: Convolutional Neural Networks for Visual Recognition von Stanford : CS231N ist einer der besten Kurse für Deep Learning und Computer Vision. Die Version 2017 wurde von Fei-Fei Li, Justin Johnson und Serena Yeung unterrichtet. Die Version 2016 wurde von Fei-Fei, Johnson und Andrej Karpathy unterrichtet. Sehen Sie sich hier die Vorlesungsvideos 2017 und hier weitere Materialien an.
CS224N: Verarbeitung natürlicher Sprache mit Deep Learning von Stanford : Wenn Sie sich für die Verarbeitung natürlicher Sprache interessieren, ist dies ein großartiger Kurs. Es wird von Christopher Manning unterrichtet, einem der Weltklasse-NLP-Stars. Sehen Sie sich hier die Vortragsvideos an.
Praktisches Deep Learning für Programmierer von fast.ai : Dies ist auch ein intensiver Deep-Learning-Kurs, der das gesamte Spektrum von Deep-Learning-Architekturen und -Techniken abdeckt. Die Vorlesungsvideos und andere Ressourcen wie Notizbücher sind die Kursseite.
Spezialisierung auf Machine Learning Engineering for Production (MLOps) : Dieser Kurs wird von Andrew Ng., Laurence Moroney und Robert Crowe unterrichtet und ist einer der besten ML-Engineering-Kurse. Es vermittelt, wie man End-to-End-Produktionssysteme für maschinelles Lernen entwirft, effiziente Daten- und Modellierungspipelines aufbaut und Modelle in der Produktion einsetzt. Den Kurs finden Sie auf Coursera und weitere Kursmaterialien auf Github.
Full Stack Deep Learning : Während sich die meisten Kurse für maschinelles Lernen auf die Modellierung konzentrieren, konzentriert sich dieser Kurs auf die Bereitstellung von Systemen für maschinelles Lernen. Es vermittelt, wie man Projekte für maschinelles Lernen entwirft, Daten verwaltet (Speicherung, Zugriff, Verarbeitung, Versionierung und Kennzeichnung), Schulungen, Debugging und Modelle für maschinelles Lernen bereitstellt. Sehen Sie sich hier die Version 2021 und hier die Version 2019 an. Sie können auch die Projektpräsentationen durchblättern, um die Art der Kursergebnisse durch die Projekte der Lernenden zu sehen.
Nachfolgend finden Sie einige großartige Bücher zum maschinellen Lernen.
Das hundertseitige Buch über maschinelles Lernen : Verfasst von Andriy Burkov, ist dies eines der kürzesten, aber prägnantesten und gut geschriebenen Bücher, die Sie jemals im Internet finden werden. Hier können Sie das Buch kostenlos lesen.
Machine Learning Engineering : Ebenfalls von Andriy Burkov verfasst, ist dies ein weiteres großartiges Buch über maschinelles Lernen, das jeden Schritt des maschinellen Lernworkflows aufdeckt, von der Datenerfassung über die Vorbereitung bis hin zur Modellbereitstellung und -wartung. Das Buch gibt es hier auch kostenlos.
Sehnsucht nach maschinellem Lernen : Das von Andrew Ng. verfasste Buch enthält verschiedene Strategien zum Aufbau effektiver Lernsysteme. Es ist in kleine Teile unterteilt, was das Lesen erleichtert und für Ingenieure des maschinellen Lernens kein Problem darstellt. Jeder, der mit Data-Science- und Machine-Learning-Teams arbeitet, kann das Buch hilfreich finden. Das offizielle Buch ist hier kostenlos erhältlich, aber Sie können es hier lesen oder herunterladen, ohne sich anzumelden.
Praktisches maschinelles Lernen mit Scikit-Learn, Keras und TensorFlow : Verfasst von Aurelion Geron, ist dies eines der besten Bücher über maschinelles Lernen. Es ist klar geschrieben und voller Ideen und Best Practices. Sie können das Buch hier herunterladen oder das Repository hier einsehen.
Deep Learning : Verfasst von den drei Deep-Learning-Legenden Ian Goodfellow, Yoshua Bengio und Aaron Courville, ist dies eines der großartigen Deep-Learning-Bücher, das frei verfügbar ist. Sie können es hier bekommen.
Deep Learning mit Python : Verfasst von Francois Chollet, dem Keras-Designer, ist dies ein sehr umfassendes Deep-Learning-Buch. Sie können das Buch hier und das Buch-Repo hier erhalten.
Tauchen Sie ein in Deep Learning : Dies ist auch ein großartiges Deep-Learning-Buch, das frei verfügbar ist. Das Buch verwendet sowohl PyTorch als auch TensorFlow. Das gesamte Buch können Sie hier lesen.
Neuronale Netze und Deep Learning : Dies ist auch ein weiteres großartiges Online-Buch zum Thema Deep Learning von Michael Nielsen. Das gesamte Buch können Sie hier lesen.
Wenn Sie an weiteren Ressourcen für maschinelles Lernen und Deep Learning interessiert sind, finden Sie diese hier, hier und hier
@article{Nyandwi2021MLPackage,
title = "Complete Machine Learning Package",
author = "Nyandwi, Jean de Dieu",
journal = "GitHub",
year = "2021",
url = "https://nyandwi.com/machine_learning_complete",
}
Dieses Repository wurde von Jean de Dieu Nyandwi erstellt. Sie finden ihn auf Twitter, LinkedIn, Medium und Instagram.