Erstellt von Tang Yudi
Die ursprüngliche Absicht bei der Organisation dieses Projekts besteht darin, den Studierenden den schnellen Einstieg in den Selbststudienplan für künstliche Intelligenz zu erleichtern, Umwege im Lernprozess zu vermeiden und so schnell wie möglich mit KI zu beginnen und praktische Projekte zu starten. Es bietet fast 200 praktische KI-Fälle und Projekte sind nicht online. Was ich gesammelt habe, sind die Fälle, die ich in den letzten fünf Jahren des Online- und Offline-Unterrichts entwickelt und gesammelt habe. Man kann sagen, dass sie wiederholt und iterativ aktualisiert wurden und für die Schüler geeignet sind, Schritt für Schritt zu lernen und zu üben. Studierende, die hierher kommen, denken daran, auf einen Stern zu klicken, um ihn zu speichern!
Ende 2019 habe ich das begleitende Lehrbuch für den Kurs „Python-Datenanalyse und maschinelles Lernen mit Diego“ veröffentlicht. Der Stil ist immer noch leicht zu verstehen. Es hat zwei Jahre und mehr als zehn Überarbeitungen gedauert, bis ich Sie endlich kennengelernt habe . Um mehr Studierenden den schnellen Start ihres Studienplans zu erleichtern, habe ich beschlossen , Ihnen die elektronische Version dieses Buches kostenlos zur Verfügung zu stellen . Ich hoffe, dass es allen Lerngewinne bringen kann! Sie können die PDF-Version auf der Homepage dieses Projekts herunterladen. Wenn Ihnen die Lehrmaterialien gefallen, können Sie sie auch bei JD.com erwerben.
„Lernen Sie Python-Datenanalyse und maschinelles Lernen mit Diego“ PDF-Original-Download :
(Link zur Netzwerkfestplatte: https://pan.baidu.com/s/19wzJeyPmwTBDp9ASEWBvFQ Extraktionscode: tece)
Der folgende Katalog stellt den Lernweg dar. Anfängern wird empfohlen, die im Katalog angegebene Reihenfolge einzuhalten. Studierende, die bereits begonnen haben, können nach ihren eigenen Vorlieben wählen.
Bei den in diesem Fall beteiligten Daten handelt es sich ausschließlich um echte Datensätze, und das direkte Hochladen auf Github wird für alle sehr langsam sein. Ich werde nach und nach die Netzwerkfestplatten-Links jedes Moduls hochladen, die Daten und Code enthalten , PPT und andere Lernressourcen. Wenn Sie unterstützende Videoerklärungen benötigen, fügen Sie bitte WeChat hinzu: digexiaozhushou (Pinyin von Di Ges kleiner Assistent)
Wenn Sie in verschiedenen Aspekten Kooperations-, Kommunikations- oder Projektprobleme haben, können Sie WeChat direkt hinzufügen: digexiaozhushou (Pinyin of Dige Assistant)
Um künstliche Intelligenz (Datenwissenschaft) zu erlernen, benötigen Sie noch einige Grundkenntnisse. Die grundlegendsten und grundlegendsten sind Python und Mathematik ! Für diese beiden Brüder ist der Einstieg nicht schwer. Es ist in Ordnung, zuerst die Grundlagen zu beherrschen und zu lernen, während man sie anwendet!
Wenn Sie mit Python nicht vertraut sind, empfehle ich Ihnen, sich meinen Python-Einführungsvideokurs anzusehen, um schnell loszulegen! Portal
Die direkteste Erklärung ist, dass jeder es nutzt! Früher war es objektorientierte Programmierung, aber später bevorzugten die Leute die Copy-and-Paste-Programmierung, und jetzt sind sie zu faul, um für GitHub zu programmieren. Es stimmt, man muss faul sein, wenn man faul sein sollte, und Python macht das ! Alle nachfolgenden praktischen Inhalte basieren auf Python, Sie haben also keine Wahl!
Anaconda reicht! Anaconda reicht! Anaconda reicht! Okay, ich habe es dreimal gesagt. Eine ausführliche Erklärung finden Sie im obigen Portalkurs.
Das Toolkit bedeutet, dass andere alle Funktionen geschrieben haben, wir können sie direkt aufrufen und das war’s! Für die Datenverarbeitung, Analyse, Modellierung etc. gibt es entsprechende Toolkits. Zum Lernen ist es nicht erforderlich, sich diese Toolkits zu merken. Sie müssen sich zunächst mit ihnen vertraut machen und sie auf jeden Fall später verwenden und überprüfen.
Name des Toolkits | Funktionsübersicht |
---|---|
Numpy | Ein Muss für Matrizenberechnungen! Es ist der Kern aller nachfolgenden Berechnungen und das zentrale Toolkit im Bereich Data Science. |
Pandas | Unverzichtbar für die Datenverarbeitung! Das Lesen von Daten, das Verarbeiten von Daten und das Analysieren von Daten muss von ihm durchgeführt werden! |
Matplotlib | Visualisierung ist ein Muss! Die Funktion ist sehr leistungsfähig. Es gibt kein Bild, das nicht auf sie angewendet werden kann. |
Seaborn | Ein einfacheres Visualisierungstool! Mit einer Codezeile erhalten Sie eine visuelle Darstellung der Ergebnisse |
Die Studierenden müssen sich darüber im Klaren sein, wie wichtig Mathematik ist, insbesondere im Bereich der künstlichen Intelligenz (Datenwissenschaft). Viele Studierende haben mir die Frage gestellt, ob so viel Mathematik wirklich in der Arbeit eingesetzt werden kann ? Lassen Sie mich Ihnen erklären, dass sich die Branche der künstlichen Intelligenz sehr schnell entwickelt. Bei der tatsächlichen Arbeit müssen Sie lernen. Es muss sich um einige der derzeit herausragenden Arbeiten handeln. Wenn Sie nicht einmal grundlegende mathematische Formeln verstehen, besteht kein Grund, über High-End-Technologie zu sprechen. Studenten in diesem Bereich werden auf jeden Fall auf diese Idee kommen. Die sogenannte künstliche Intelligenz führt lediglich verschiedene mathematische Berechnungen an Daten durch!
Ich glaube nicht, dass man bei Null anfangen und viel Zeit damit verbringen muss, Schritt für Schritt zu lernen. Meine Kollegen und Freunde machen das zum Beispiel schon seit langer Zeit Ich habe zeitweise unzählige Fragen gelöst, aber auch ich werde auf dieses Problem stoßen. Viele Wissenspunkte werden schnell vergessen, wenn ich sie eine Weile nicht angeschaut habe. Eines der Dinge, die ich am häufigsten mache, ist, nach dem zu suchen, was ich verwende. Der Suchprozess ist eigentlich ein Prozess des Lernens und Fortschritts. Es wird empfohlen, dass Sie die allgemeinen Wissenspunkte (fortgeschrittene Mathematik, Linearität, Grundlagen der Wahrscheinlichkeitstheorie) schnell durchgehen. Schauen Sie sich dabei weder die verschiedenen Problemlösungsprozesse an, noch müssen Sie sich um die spezifischen Lösungsmethoden kümmern Um es ganz klar auszudrücken: Verstehen Sie einfach, was eine Formel bewirkt und wofür sie verwendet wird. Ähnlich wie die Übungen im Lehrbuch und die Lösungen im Übungsbuch werden Sie sie in Zukunft nicht mehr benötigen Ein Stift zum Berechnen dieser mühsamen Dinge. Sparen Sie Zeit beim Lernen von Algorithmen.
Wissenspunkte | Inhalt | Wirkung |
---|---|---|
Fortgeschrittene Mathematik | Grundlagen der fortgeschrittenen Mathematik, Analysis, Taylor-Formel und Lagrange, | Unverzichtbar für die Ableitung von Formeln für maschinelles Lernen |
lineare Algebra | Grundlagen der linearen Algebra, Eigenwerte und Matrixzerlegung, | Notwendig für die Algorithmuslösung |
Wahrscheinlichkeitstheorie | Grundlagen der Wahrscheinlichkeitstheorie, Zufallsvariablen und Wahrscheinlichkeitsschätzung, häufig verwendete Verteilungen | Beim maschinellen Lernen werden diese Wörter oft erwähnt |
Statistische Analyse | Regressionsanalyse, Hypothesentest, Korrelationsanalyse, Varianzanalyse | Unverzichtbar für die Datenanalyse |
Der Kern des Bereichs der künstlichen Intelligenz ist maschinelles Lernen. Egal welche Richtung Sie in Zukunft einschlagen möchten, Sie müssen mit maschinellem Lernen beginnen! Die erste besteht darin, die Prinzipien klassischer Algorithmen zu beherrschen, und die zweite darin, das Python-Toolkit für die praktische Modellierung zu beherrschen!
Was kann man über Algorithmen lernen? Um zu verstehen, wie Algorithmen für maschinelles Lernen Daten verarbeiten, um den Modellierungs- und Lösungsprozess abzuschließen, müssen Sie mit der Verwendung von Mathematik in Algorithmen vertraut sein. Das Wichtigste ist, zu verstehen! Verweilen Sie nicht endlos bei einem Problem, das ist Zeitverschwendung und Sie können es im anschließenden Lernprozess möglicherweise in kürzester Zeit lösen. Ich denke, dass man Algorithmen mehr als einmal studieren muss, insbesondere für Studenten, die sich auf Vorstellungsgespräche vorbereiten. Es ist normal, den Algorithmus zwei- oder dreimal zu studieren (ein Klassenkamerad erzählte mir einmal, dass er den Kurs vor dem Vorstellungsgespräch insgesamt sechs Mal studiert hat )
Wird beim Deep Learning noch maschinelles Lernen benötigt?
Man kann sagen, dass Deep Learning eine Art maschineller Lernalgorithmus ist. Dies bedeutet nicht, dass bei neuronalen Netzen nicht der am besten geeignete Algorithmus ausgewählt werden muss Tatsächlich ist es wirklich einfach, neuronale Netze zu betrachten, nachdem man diese klassischen Algorithmen beherrscht!
Wissenspunkte | Inhalt | Überblick |
---|---|---|
Klassifizierungsalgorithmus | Logistische Regression, Entscheidungsbaum, Support-Vektor-Maschine, Ensemble-Algorithmus, Bayesianischer Algorithmus | Studierende, die sich auf Vorstellungsgespräche vorbereiten, müssen beherrschen |
Regressionsalgorithmus | Lineare Regression, Entscheidungsbäume, Ensemble-Algorithmen | Einige Algorithmen können sowohl Klassifizierung als auch Regression durchführen |
Clustering-Algorithmus | k-means, dbscan usw. | Unsupervised kommt nur dann in Betracht, wenn wirklich kein Label vorhanden ist. |
Algorithmus zur Dimensionsreduktion | Hauptkomponentenanalyse, lineare Diskriminanzanalyse usw. | Konzentrieren Sie sich darauf, die Idee der Dimensionsreduktion zu verstehen |
Erweiterte Algorithmen | GBDT-Boosting-Algorithmus, Lightgbm, EM-Algorithmus, Hidden-Markov-Modell | Studierende, die Zeit und Energie haben, können fortgeschrittene Algorithmen herausfordern |
Analysieren Sie den Einfluss klassischer Algorithmusmodellierungsmethoden und -parameter auf Ergebnisse durch Vergleichsexperimente und verstehen Sie die Parameter und Anwendungsbeispiele in den Algorithmen durch Experimente und visuelle Darstellungen.
Fallname | Inhaltsübersicht |
---|---|
Experimentelle Analyse der linearen Regression | Beherrschen Sie die univariate und multiple lineare Regression, nichtlineare Regressionsmethoden und die Rolle der Regularisierungsstrafe |
Modellbewertungsmethode | Vergleich häufig verwendeter Bewertungsmethoden für Klassifizierungs- und Regressionsalgorithmen, Beispiele für die Segmentierung von Datensätzen |
Experimentelle Analyse der logistischen Regression | Klassische Methode zum Erstellen eines Klassifizierungsmodells, Methode zum Zeichnen von Entscheidungsbaumgrenzen |
Experimentelle Analyse des Clustering-Algorithmus | Beispiele für unbeaufsichtigte Modellierung, Bewertungsmethoden für Clustering-Algorithmen, unbeaufsichtigte Rollen- und Anwendungsbeispiele |
Experimentelle Entscheidungsbaumanalyse | Beispiele für die Visualisierung von Baummodellen und Konstruktionsmethoden, Klassifizierungs- und Regressionsanwendungen von Baummodellen |
Integrierte Algorithmus-Experimentalanalyse | Anwendungsbeispiele und Wirkungsanalyse von Integrationsmethoden, Vergleich gängiger Integrationsstrategien |
Unterstützt die experimentelle Analyse von Vektormaschinen | SVM umfasst Parameter und Modellierungsvergleichsexperimente |
Praktische Analyse von Assoziationsregeln | Grundlegende Wissenspunkte und Modellierungsanalysebeispiele für Assoziationsregeln |
Um den Mechanismus des Algorithmus besser zu verstehen, reproduzieren wir den klassischen Algorithmus von Grund auf, halten uns an das Prinzip ohne Paketverlust und vervollständigen alle für den Algorithmus erforderlichen Module Schritt für Schritt.
Der Hauptzweck besteht darin, das Funktionsprinzip des Algorithmus besser zu verstehen, und der Schwerpunkt liegt auf der Praxis! Studierende, die Zeit haben, können es selbst reproduzieren, Studierende, die wenig Zeit haben, müssen es jedoch nicht selbst machen.
Fallname | Inhaltsübersicht |
---|---|
Implementierung des linearen Regressionscodes | Häufig verwendete Funktionen von Modulbildungsalgorithmen |
Implementierung des logistischen Regressionscodes | Beispielinterpretation der Implementierungsmethode der logistischen Regression |
Kmeans-Code-Implementierung | Sehr einfacher und leicht verständlicher unbeaufsichtigter Algorithmus |
Implementierung des Entscheidungsbaumcodes | Das Baummodell ist eigentlich eine rekursive Implementierung |
Implementierung des neuronalen Netzwerkcodes | Die Codemenge ist etwas groß, daher wird empfohlen, den Debug-Modus zu erlernen. |
Bayesianische Code-Implementierung | Bayes lässt sich in Textaufgaben immer noch einfacher erklären |
Implementierung des Assoziationsregelcodes | Häufig verwendete Datenanalysealgorithmen |
Erstellen Sie ein Musikempfehlungssystem | Erstellen Sie ein Empfehlungssystemmodell von Grund auf |
Im tatsächlichen Kampf können die mathematischen Wissenspunkte geschwächt sein, da wir die meiste Zeit vorgefertigte Werkzeugsätze verwenden, um Aufgaben zu erledigen (Pakettransfermann). Es gibt viele Energiesparfunktionen, die jeder beherrschen muss. Die erste besteht darin, diese gängigen Toolkits zu beherrschen. Datenvorverarbeitung, Feature-Engineering, Parameteranpassung und Überprüfung sind allesamt sehr wichtige Schritte. Zusammenfassend lässt sich sagen, dass die Prozesse und Routinen, die zur Erledigung verschiedener Aufgaben erforderlich sind, ähnlich sind, die verwendeten Methoden und Algorithmen jedoch unterschiedlich sein können, was erfordert, dass sich jeder kontinuierlich ansammelt, um praktische Erfahrungen zu bereichern. Diese den Studierenden zur Verfügung gestellten Fälle können als eigene praktische Vorlagen verwendet werden!
Das Wichtigste ist, zu lernen, wie man verschiedene Daten (numerische Werte, Text, Bilder) vorverarbeitet und analysiert, die wichtigsten Kernfunktionen des Toolkits geschickt anwendet, um an der Vorverarbeitung teilzunehmen, mehrere Lösungen für verschiedene Aufgaben vorzuschlagen und experimentelle Analysen durchzuführen. Zusammenfassend lässt sich sagen: Machen Sie mehr Experimente und machen Sie mehr praktische Arbeit. Je mehr Sie Code schreiben, desto kompetenter werden Sie!
Fallname | Inhaltsübersicht |
---|---|
K-Algorithmus für den nächsten Nachbarn in der Praxis | Einführungsfall zum maschinellen Lernen, Beherrschung des auf Modellierungsmethoden angewendeten Toolkits |
Erkennung von Transaktionsdatenanomalien | Sehr wichtige, detaillierte Analyse und Vergleich von Datenverarbeitungs- und Modellierungsstrategien |
Integrierte Algorithmusmodellierungspraxis | Zur Integration muss ich nicht mehr sagen, sie ist eine unverzichtbare Kernstrategie. |
Temperaturvorhersage basierend auf zufälligem Wald | Random Forest ist der am häufigsten verwendete Algorithmus für maschinelles Lernen. Detaillierte Analyse und Vergleich |
Praxis der Nachrichtenklassifizierung | Textdatenanalyse und -verarbeitung sowie praktische Modellierung basierend auf dem Bayes'schen Algorithmus |
Analyse der Clustering-Praxis | Beispiele für unbeaufsichtigte Anwendungen |
Zeitreihenanalyse | Methode zur Erzeugung von Zeitreihendaten, Modellierung basierend auf Sequenzdaten |
Warnung zur Benutzerabwanderung | Ich sage oft, dass Benutzer von Fantasy Westward Journey verlieren, dies ist nur eine DEMO |
Verwenden Sie lightgbm für die Vorhersage des Hotelverkehrs | Ein weiterer großer Killer, noch schlimmer als xgboost |
Praxis-Einkommensprognose des Zensus-Datensatzprojekts | Kernvorlagen, Datenanalyse, Visualisierung usw. sind alle vorhanden. |
Bayesianische Optimierung in der Praxis | Schwierigere Beispiele für die Verwendung des Bayes'schen Optimierungs-Toolkits |
Vergleich von Textmerkmalsmethoden | Vergleich häufig verwendeter Methoden zur Merkmalsextraktion für Textdaten |
Stellen Sie Ihr eigenes Werkzeugset zusammen | Basteln Sie zum Spaß Ihre eigene Tasche |
Fallname | Inhaltsübersicht |
---|---|
Praktische Assoziationsregeln für Python | Es ist so einfach, mit dem Toolkit Assoziationsregeln zu erstellen |
Analyse und Modellierung von Airbnb-Datensätzen | Beispiele für die Analyse und Modellierung von Immobilienpreisdatensätzen |
Hotelempfehlungssystem basierend auf Ähnlichkeit | Aufbau eines Empfehlungssystems zur Vervollständigung von Hotelempfehlungen |
Regressionsanalyse der Produktverkäufe | Umsatzprognosen, eine sehr routinemäßige Aufgabe, können mit Routinemethoden durchgeführt werden |
Analyse und Modellierung der PUBG-Datensatzexploration | Der Battlegrounds-Datensatz von PlayerUnknown. Mal sehen, wer dich getötet hat |
Modellinterpretationsmethode in der Praxis | Wie interpretiert man das Modell nach der Modellierung? Diese Toolkits können Ihnen dabei helfen. |
Wesentliches Toolkit für die Verarbeitung natürlicher Sprache in der Praxis | Interpretation gängiger NLP-Toolkits und praktische Beispiele |
Prognose der Rückzahlungswahrscheinlichkeit von Bankkunden | Bankkundendaten zur Vorhersage der Wahrscheinlichkeit einer Rückzahlung |
Praxis der Clusteranalyse von Bildmerkmalen | Wie gruppiere ich Bilddaten? |
Praxis-Einkommensprognose des Zensus-Datensatzprojekts | Kernvorlagen, Datenanalyse, Visualisierung usw. sind alle vorhanden. |
Jeder hört jeden Tag das Wort Datenanalyse, aber was sollen wir tun? Es geht um nichts anderes, als aus Daten wertvolle Informationen zu gewinnen, und es gibt noch viele Methoden und Routinen. Diese Richtung erfordert keine theoretische Anhäufung, nutzen Sie einfach die Daten und machen Sie es! Die Anhäufung von Fällen ist der Lernprozess!
Einfach ausgedrückt ist Data Mining die Anwendung von Algorithmen des maschinellen Lernens auf riesige Datenmengen, um die gewünschten Ergebnisse zu erzielen. Der Schwerpunkt beim Data Mining liegt nicht auf der Wahl des Algorithmus für maschinelles Lernen, sondern darauf, wie die Daten verarbeitet werden, um bessere Vorhersageergebnisse zu erzielen. Hier werden Feature-Engineering und Vorverarbeitung zur Kernlösung.
Fallname | Inhaltsübersicht |
---|---|
Vorhersagen zur Rettung der Titanic | Klassischer Kaggle-Wettbewerbsfall, das erste praktische Projekt für Data Mining auf Einstiegsniveau |
Konstruktion von Datenmerkmalen | Feature Engineering ist der Kern des Data Mining. Basierend auf sklearn werden verschiedene Feature-Konstruktionsmethoden erläutert. |
Praxis für Benutzerporträts | Jeder muss von Benutzerporträts gehört haben. Wie werden Daten angewendet, um das Porträt zu vervollständigen? |
Beispiel einer Integrationsstrategie | Beim Data Mining werden in der Regel Integrationsstrategien gewählt, um die Wirkung besser zu verbessern. |
Xgboost tatsächlicher Kampf | Ein typischer Vertreter der Integration und eine Killerwaffe im Wettbewerb |
JD.com-Kaufabsichtsprognose | Klassisches Vorhersageproblem, vollständige Vorhersageaufgabe basierend auf historischen Verhaltensdaten des Benutzers |
Kaggle Data Science-Umfrage | Stellen Sie die Teilnehmer des Kaggle-Wettbewerbs visuell dar |
Hauspreisprognose | Data-Mining-Einstiegsfälle zur schnellen Beherrschung der Routinen |
Leistungssensible Benutzeranalyse | Wettbewerbsbeispiele, die hauptsächlich die Rolle des Feature Engineering erläutern |
fbprophet-Zeitreihenvorhersage | Ein sehr praktischer Algorithmus für die Zeitreihenvorhersage, sehr einfach zu verwenden |
Wir haben groß angelegte Wettbewerbsfälle wie Tianchi, Kaggle und Rongji ausgewählt, und die bereitgestellten Codes und Lösungen sind die Lösungsideen der Gewinner während des Wettbewerbs. Genau wie wenn Sie Schach spielen lernen möchten, müssen Sie mit den besten Spielern spielen, um sich zu verbessern. In jedem Fall werden die Ideen und die Gesamtlösung des Gewinners erläutert und eine Code-Implementierung bereitgestellt. Sehr hilfreich für alle, um sich zu verbessern!
Fallname | Inhaltsübersicht |
---|---|
Kurze Video-Benutzeraktivitätsanalyse von Kuaishou | Prognostizieren Sie die nächste Aktivität basierend auf Benutzerverhaltensdaten |
Prognose zur industriellen Chemieproduktion | Analysieren Sie Daten und Modelle der chemischen Industrie, um die Produktionseffizienz vorherzusagen |
Intelligente Vorhersage der Fahrzeit zwischen Stadt und Straße | Ein sehr bodenständiger Wettbewerb, bei dem die Reisezeit anhand von Straßendaten vorhergesagt wird |
Interpretierbares Feature-Engineering-Modellierungs-Toolkit | Einer der schwierigsten Aspekte des Data Mining ist die Funktionsinterpretation. Diese Toolkits sind sehr nützlich. |
Medizinische Diabetesdaten werden als Entitätserkennung bezeichnet | Erklärung des Erkennungsalgorithmus für benannte Entitäten und Analyse von Anwendungsbeispielen |
Modell-Feature-Engineering für die Risikokontrolle der Kreditplattform | Die Verwendung grafischer Modelle zum Erstellen von Feature-Engineering ist eine weit verbreitete Idee. |
Modell zur Extraktion von Nachrichtenschlüsselwörtern | Man kann sagen, dass die Schlüsselwortextraktion eine wesentliche Fähigkeit für NLP ist |
Praktische Vorlage für ein maschinelles Lernprojekt | Die Vorlage finden Sie hier. Sie können sie auf zukünftige Aufgaben anwenden. |
Leistungssensible Benutzeranalyse | Wettbewerbsbeispiele, die hauptsächlich die Rolle des Feature Engineering erläutern |
Beim Data Mining werden hauptsächlich Modellierungen zur Erstellung von Vorhersagen verwendet, während sich die Datenanalyse auf die visuelle Darstellung und Analyse der Auswirkungen verschiedener Indikatoren auf die Ergebnisse konzentriert. Wir haben für Sie einige klassische Analysefälle ausgewählt, von denen viele direkt als Vorlage verwendet werden können.
Fallname | Inhaltsübersicht |
---|---|
Techniken zum Zeichnen von Streudiagrammen | Es wurde gesagt, dass die Visualisierung der entscheidende Punkt ist und das Zeichnen definitiv ein Muss ist. |
Analyse und Modellierung des New Yorker Taxibetriebs | Nachdem Sie viele Toolkits verwendet haben, können Sie sich mit der Analyse und Anzeige geografischer Daten vertraut machen. |
Filmempfehlungsaufgabe basierend auf statistischer Analyse | Häufig verwendete Methoden zur statistischen Analyse und Empfehlungen |
Vorlagen für Datenanalyse und maschinelles Lernen | Diese Vorlage ist wirklich umfassend, einschließlich Analyse, Anzeige, Modellierung und Auswertung. |
Reduzierung der Datendimensionalität | Vergleichende Analyse und Darstellung mehrerer häufig verwendeter Algorithmen zur Dimensionsreduktion |
Visuelle Produktdarstellung und Textverarbeitung | Textdatenvorverarbeitung und visuelle Anzeige |
Multivariate Analyse | Auch die multivariate Analyse ist eine gängige Methode in der Datenanalyse |
Analyse des Produktauftragsdatensatzes | Auftragsdatensatzanalyse |
KIVA-Kreditdatenanalyse | Analyse des Kreditdatensatzes |
Man kann sagen, dass Deep Learning derzeit der nützlichste Algorithmus ist und in verschiedenen Bereichen eingesetzt werden kann. Tatsächlich liegt der Kern immer noch in der Computer Vision und der Verarbeitung natürlicher Sprache, da neuronale Netzwerkalgorithmen besser für Bild- und Textdaten geeignet sind. Die wichtigsten Dinge, die Sie beherrschen müssen, sind Algorithmen und Frameworks. Algorithmen sind klassische Netzwerkmodelle wie CNN und RNN, und Frameworks sind praktische Tools wie Tenorflow, Pytorch usw., auf die später noch näher eingegangen wird.
Es scheint, dass viele Freunde, wenn sie jetzt eine Aufgabe bekommen, zuerst daran denken, Deep Learning direkt zu nutzen. Wenn Deep Learning schwierig und umständlich wäre, wäre es dann immer noch so beliebt? Im Gegenteil, ich denke, Deep Learning ist wirklich viel einfacher als maschinelles Lernen. Beim maschinellen Lernen müssen wir unterschiedliche Vorverarbeitungsmethoden und Feature-Engineering-Konstruktionsmethoden für unterschiedliche Daten wählen. Die Routinen beim Deep Learning sind relativ fester, und bei diesen Open-Source-Frameworks und großen klassischen Netzwerkarchitekturen müssen wir sie normalerweise nur anwenden. Der Gesamtschwierigkeitsgrad ist einfacher als die maschinelle Lernaufgabe (relativ gesehen!).
Name des Algorithmus | Inhaltsübersicht |
---|---|
neuronales Netzwerk | Das neuronale Netzwerk ist das grundlegendste Netzwerk, das gleichbedeutend damit ist, den Grundstein für das Lernen nachfolgender Netzwerke zu legen. |
Faltungs-Neuronales Netzwerk | Das kommt jedem bekannt vor, der große Bruder des Deep Learning! Kernnetzwerk für Computer Vision |
wiederkehrendes neuronales Netzwerk | Bei Qiao Feng und Nan Murong sind die großen Brüder in der Verarbeitung natürlicher Sprache! |
kontradiktorisches generatives Netzwerk | Es ist mittlerweile ein beliebtes Modell, es macht Spaß, damit zu spielen und kann für verschiedene Bildfusionen verwendet werden. |
Sequenznetzwerkmodell | Häufig verwendete Architekturen in NLP, Übersetzungsmodelle für maschinelles Lernen, haben viele Anwendungspunkte |
Wichtige klassische Netzwerkarchitekturen | Die gerade erwähnten CNN und RNN sind relativ grundlegende Netzwerkmodelle, und es gibt viele darauf basierende Erweiterungen, die jeder beherrschen muss. |
Das Framework ähnelt der Aussage, dass Sie ein Netzwerkmodell entwerfen, es wäre jedoch zu mühsam, alle spezifischen Berechnungsprozesse selbst durchzuführen. Das Framework bietet eine effiziente Berechnungsmethode und erfordert nicht, dass wir eine Reihe vollautomatischer Berechnungen durchführen. Das ist gleichbedeutend damit, dass wir nur die Struktur entwerfen und ihr die spezifische Konstruktion überlassen müssen. Um Deep Learning spielen zu können, ist ein Framework erforderlich.
Tensorflow, Pytorch, Keras, Caffe usw., es gibt so viele Frameworks, welches soll ich wählen? Gibt es große Unterschiede zwischen verschiedenen Frameworks? Die derzeit am weitesten verbreiteten sind Tensorflow und PyTorch, die KFC und McDonald's entsprechen. Beide sind sehr stark, was Sie wählen sollten, richten Sie sich bitte nach den Anforderungen Ihres jeweiligen Projektteams und Ihrer Aufgabe. Wenn ich eines empfehlen müsste, würde ich PyTorch jedem empfehlen, weil es übersichtlicher und beliebter ist. Ich habe alle diese Frameworks verwendet. Der Hauptgrund dafür ist, dass ich in meiner Arbeit häufig auf Veröffentlichungen und Open-Source-Projekte zurückgreifen muss. Im Allgemeinen werde ich die Sekundärentwicklung aller Frameworks durchführen, die andere Leute in ihren Veröffentlichungen verwenden Jeder wird diese Frameworks früher oder später nutzen!
Es gibt keine Theorie, um über das Framework zu sprechen, und es besteht keine Notwendigkeit, alle möglichen langen Erklärungen zu lesen. Verwenden Sie es einfach! Tatsächlich handelt es sich um ein Toolkit, das Sie lernen können, während Sie es verwenden, und die Fälle können als Vorlagen zum Zusammenfassen verwendet werden!
Rahmenname | Inhaltsübersicht |
---|---|
Caffe-Framework | Der Rahmen auf Gottesebene in der Antike ist jetzt vom Altar gefallen. Der erste Rahmen, den ich gelernt habe |
Tensorflow2-Version | Version 2 hat viele Verbesserungen mit sich gebracht und ist endlich benutzerfreundlicher als Version 1. |
Keras | In einem Satz ist es ganz einfach! Einfach! Einfach! Man muss es nicht lernen, es ist sehr leicht zu verstehen, wenn man sich den Code anschaut |
PyTorch | Das derzeit beliebteste Framework. Ich schätze, es wird auch dieses Jahr (2020) das beliebteste Framework sein. Empfohlen! |
Wir stellen Ihnen eine Fülle praktischer Fälle für jedes wichtige Deep-Learning-Framework zur Verfügung. Welches Sie verwenden, hängt von Ihren Vorlieben ab!
Ich muss nicht erklären, dass es von Google erstellt wird. Daher müssen viele Open-Source-Projekte von Google auf dem TF-Framework basieren. Wenn Sie die Open-Source-Projekte und -Papiere anderer Leute studieren oder darauf verweisen möchten, müssen Sie TF lernen. Es ist auch in der Industrie weit verbreitet. Diese Welle wird sich auf jeden Fall auszahlen!
Fallname | Inhaltsübersicht |
---|---|
Tensorflow-Installation und Einführung | Version 2 wird in der Installationsmethode eingeführt, gehen Sie sie einfach kurz durch. |
Interpretation der Prinzipien neuronaler Netzwerke und der Gesamtarchitektur | Überprüfen Sie die Architektur neuronaler Netzwerke |
Bauen Sie ein neuronales Netzwerk für Klassifizierungs- und Regressionsaufgaben auf | Verwenden Sie TF, um grundlegende Klassifizierungs- und Regressionsaufgaben abzuschließen und die Anwendungsmethoden zu beherrschen |
Prinzipien des Faltungs-Neuronalen Netzwerks und Parameterinterpretation | Die Architektur von CNN wird für jeden Parameter ausführlich erläutert. |
Praxis zur Identifizierung von Katzen und Hunden | Über die klassische Bildklassifizierungsaufgabe gibt es hier viel zu besprechen, sie ist sehr wichtig |
Beispiele zur Bilddatenverbesserung | Man kann sagen, dass die Datenverbesserung mittlerweile eine unverzichtbare Fähigkeit ist. |
Trainingsstrategie-Transferlernen in der Praxis | Der Effekt des Transferlernens ist immer noch recht gut. |
Interpretation der Prinzipien rekursiver neuronaler Netze und Wortvektoren | Interpretation des RNN-Modells |
Implementierung von word2vec basierend auf TensorFlow | Interpretation und Implementierung des Wortvektormodells basierend auf TF |
Textklassifizierungsaufgabe basierend auf dem RNN-Modell | Komplette Textklassifizierungsaufgaben basierend auf TF |
tfrecord erstellt eine Datenquelle | Beispiel für die Datenquellenproduktion |
Wenden Sie das CNN-Netzwerk auf die Textklassifizierungspraxis an | CNN kann auch eine Textklassifizierung durchführen |
Zeitreihenvorhersage | Beispiele für die Verarbeitung und Modellierung von Zeitreihendaten |
Kontroverse generative Netzwerke in der Praxis | GAN ist da, das macht so viel Spaß |
Praktische Bildfusion basierend auf dem Open-Source-Projekt CycleGan | Mein Lieblings-GAN zum Spielen, der Effekt ist ziemlich amüsant! |
Klassische Netzwerkarchitektur Resnet in der Praxis | Sie können die Netzwerkarchitektur erlernen, die Sie verstehen müssen! |
Ende 2019 hat die Anzahl der Benutzer das Tensorflow-Framework übertroffen und ist derzeit das beliebteste Framework. Der Grund dafür ist eigentlich sehr einfach. Das Gesamtgefühl ist in der Tat einfacher zu verwenden als Tensorflow und sehr bequem zu debuggen. Anfängern wird außerdem empfohlen, dem Pytorch-Framework den Vorzug zu geben.
Fallname | Inhaltsübersicht |
---|---|
Grundlegende Verarbeitungsvorgänge des PyTorch-Frameworks | Machen Sie sich einfach mit PyTorch vertraut und der Einstieg ist ganz einfach. |
Praktische Klassifizierungs- und Regressionsaufgaben für neuronale Netze | Die Verwendung von PyTorch zum Erstellen eines neuronalen Netzwerkmodells ist in der Tat einfacher zu verwenden als TF |
Prinzipien des Faltungs-Neuronalen Netzwerks und Parameterinterpretation | CNN-Modellarchitektur und Parameterbuchinterpretation |
Praktische Interpretation des Kernmoduls der Bilderkennung | Sehr wichtig, das Bildverarbeitungs-Kernmodul in PyTorch |
Die Rolle und Anwendungsbeispiele des Transferlernens | Laden von Modellen in PyTorch für Transferlernen |
Interpretation der Prinzipien rekursiver neuronaler Netze und Wortvektoren | Interpretation der RNN-Modellarchitektur |
Praktische Praxis zur Textklassifizierung von Nachrichtendatensätzen | Erstellen Sie ein Textklassifizierungsmodell basierend auf PyTorch |
Prinzipien und praktische Analyse der kontradiktorischen generativen Netzwerkarchitektur | Beliebte Interpretation des GAN-Modells |
Praktische Bildfusion basierend auf dem Open-Source-Projekt CycleGan | PyTorch-Version von CYCLEGAN, dieses Open-Source-Projekt ist sehr gut geschrieben |
Prinzip der OCR-Texterkennung | Das Prinzip der OCR ist eigentlich sehr einfach und erfordert die Unterstützung mehrerer Modelle, um es zu vervollständigen. |
Projektpraxis zur OCR-Texterkennung | Erstellen Sie ein OCR-Netzwerkmodell |
Videoanalyse und Aktionserkennung basierend auf 3D-Faltung | Verwenden Sie die 3D-Faltung, um Videodaten zu verarbeiten und die Verhaltenserkennung abzuschließen |
Praktisches BERT-Modell basierend auf PyTorch | Die Architektur von BERT ist so beliebt, dass sie eines der unverzichtbaren Modelle ist. |
Interpretation praktischer Vorlagen des PyTorch-Frameworks | Stellen Sie eine Vorlage bereit, damit zukünftige Aufgaben anhand der Vorlage verbessert werden können |
Das allgemeine Gefühl ist, dass Sie nichts lernen müssen, sondern es einfach direkt aus dem Gehäuse heraus verwenden können. Die TF2-Version ist Keras tatsächlich sehr ähnlich. Geeignet zum Experimentieren und Schreiben von Hausarbeiten, einfach und schnell!
Fallname | Inhaltsübersicht |
---|---|
Installation und Einführung | Keras ist basierend auf tf einfach zu installieren und zu starten |
Erstellen Sie ein neuronales Netzwerkmodell | Erstellen Sie ein neuronales Netzwerkmodell, um das Wasser zu testen |
Ein weiterer Kampf mit Faltungsnetzwerken | CNN -Modelle sind auch sehr einfach zu bauen |
LSTM -Zeitreihenprognoseaufgabe | LSTM -Modell, das auf Zeitreihenaufgaben angewendet wird |
Textklassifizierungspraxis | Beispiel für Textklassifizierung |
Mehrere Etiketten und mehrere Ausgänge | Multi-Label-Aufgaben sind sehr häufig und haben einen hervorragenden Lernwert |
Praktische Praxis zur Textklassifizierung von Nachrichtendatensätzen | Textklassifizierungsaufgabe basierend auf Keras |
Datenvergrößerung | Interpretation von Beispielen für Datenvergrößerung |
Gegentes generatives Netzwerk | Gan Architektur, es ist einfacher, Keras zu verwenden |
Transfer Learning und Resnet Residual Network | Sie müssen selbst mit dem Resnet -Modell spielen |
Adresspostcode Mehrfachsequenzaufgabe | Beispiel für Textmodell |
SEQ2SEQ -Netzwerkpraxis | Das Sequenznetzwerkmodell wird weiterhin weit verbreitet. |
Zusammenfassung der praktischen Vorlagen | Die Keras -Vorlage ist für alle bereitgestellt. |
Ich denke, TensorFlow und Pytorch sind bereits in dieser Phase erhältlich, und es ist nicht an der Reihe, es an Anfänger zu erscheint. Es kann einige Papiere und Aufgaben geben, die immer noch den Kaffe -Rahmen erfordern.
Fallname | Inhaltsübersicht |
---|---|
Interpretation von Kaffe -Konfigurationsdateien | Interpretation von häufig verwendeten Konfigurationsdateien des Caffe -Frameworks |
Verschiedene Datensatzkonstruktionsmethoden | Datensatzkonstruktionsmethode, dies ist sehr wichtig |
Interpretation von häufig verwendeten Werkzeugen in Kaffe | Es sind viele kleine Werkzeuge eingebaut, um die Aufgaben schnell zu erledigen |
Gesichtserkennung in der Praxis | Erstellen Sie ein Gesichtserkennungsmodell basierend auf dem Caffe -Framework |
Praktische Praxis der Positionierung von Gesichtszählpunkten | Vollständiges Modell für das Gesichtsausstattungskennzeichen basierend auf dem Caffe -Framework |
Ich muss nicht viel über die Computer -Vision -Branche sagen, es ist momentan die beliebteste. Was müssen Sie also lernen? Der Kern besteht tatsächlich aus zwei Teilen, einer ist Bildverarbeitung und die andere Bildmodellierung. Die sogenannte Bildverarbeitung ist das, was OpenCV macht. Die Bildmodellierung verwendet hauptsächlich Deep Learning, um Aufgaben wie Erkennung und Erkennung zu erledigen. In dieser Phase des Studiums müssen Sie nicht über traditionelle Bildverarbeitungsalgorithmen lesen. .
Es wird empfohlen, die Python -Version zu wählen, um sie zu lernen und zu verwenden. Wenn Sie etwas begegnen, mit dem Sie nicht vertraut sind, überprüfen Sie die API und lernen Sie, wie Sie es verwenden. Grundsätzlich sind alle Funktionen in OpenCV viele mathematische Formeln.
Wir haben viele Lernressourcen für alle vorbereitet.
Fallname | Inhaltsübersicht |
---|---|
OpenCV -Einführung und Umgebungskonfiguration | Umgebungsinstallation und Konfiguration |
Grundlegende Bildvorgänge | Verwenden Sie OpenCV, um grundlegende Bildverarbeitungsvorgänge zu vervollständigen und zu üben! |
Schwellenwert und Glätten | Die am häufigsten verwendeten Verarbeitungsvorgänge können mit nur wenigen Codezeilen durchgeführt werden |
Bildmorphologieoperationen | Machen Sie diese morphologischen Operationen einfach vertraut |
Bildgradientenberechnung | Beispiel für Bildgradientenberechnung |
Kantenerkennung | Die Kantenerkennung hat eine Vielzahl von Anwendungen |
Bildpyramide und Konturerkennung | Beispiel für Konturerkennungen, der Effekt ist immer noch gut |
Histogramm und Fourier -Transformation | Machen Sie sich einfach damit vertraut |
Digitale Identifizierung von Projektpraxis-Kredite-Kartenkarten | Führen Sie ein praktisches Projekt durch, um Kreditkartennummern zu erkennen und zu identifizieren |
Project Practice-Dokument-Scan-OCR-Erkennung | Scan -Dokumentdaten zur OCR -Erkennung scannen |
Bildfunktionen Harris | Der Algorithmus ist häufig verwendete Merkmalextraktionsmethoden und ist einfach und vertraut |
Bildfunktionen-Sift | Die älteste Merkmalsextraktionsmethode erfordert immer noch viele Mathematik. |
Fallpraxis-panoramische Bildstiche | Jeder muss mit Panoramablickkamera gespielt haben, wie kann man es erreichen? |
Projektpraxis-Parken-Raumidentifikation | Hochleistungsprojekt, ein Parkplatzerkennungsmodell von Grund auf neu erstellen |
Identifizierung und Beurteilung des Projektpraxis-Antwork-Kartenkartens | Lassen Sie uns auch Spaß mit automatischer Markierung haben |
Hintergrundmodellierung | Konventionelle Behandlungsmethoden |
Optische Durchflussschätzung | Sei einfach damit vertraut |
OpenCV DNN -Modul | Laden Sie das ausgebildete Modell zur Erkennung |
Projektpraxis - Zielverfolgung | Der Tracking -Effekt ist sehr interessant. |
Faltungsprinzipien und Operationen | Wo immer die Faltung geht, ist es der Kern. |
Erkennung von Projektpraxis-Fatigue | Erkennung von Müdigkeit basierend auf der Kamera erkennen |
Ich empfehle, dass Schüler, die sich auf Interviews und Beschäftigung vorbereiten, alle durchlesen. Der Code in der Menge ist relativ groß, so
Wir empfehlen das Mask-RCNN Practical Project. Die Anwendungsszenarien sind sehr breit und sind auch für die Sekundärentwicklung und Verbesserung geeignet. Ich werde mich darauf konzentrieren, das Projekt zu erklären und es auf mich selbst anzuwenden.
Projektname | Inhaltsübersicht |
---|---|
Bildstiltransfer (Stiltransfer) | Hauptsächlich, um seine Ideen zu lernen, ist der Effekt immer noch sehr interessant |
Füllen Sie automatisch fehlende Bilder ab | Es gibt viele Anwendungsszenarien für das GAN -Netzwerk, und Bilder können auch selbst repariert werden. |
Überauflösung Rekonstruktion | Als einer der wichtigsten Forschungsbereiche in den letzten Jahren sind die Ergebnisse dieses Papiers bereits sehr gut. |
Objekterkennungsrahmen-Maskrcnn-Projekt | Dies ist das Open-Source-Projekt, das ich hervorhebt, ein Muss! Ein Muss! Ein Muss! |
Detaillierte Erläuterung des Quellcode von MaskRCNN -Netzwerk -Framework -Quellcode | Der Quellcode ist sehr wichtig, Sie müssen jede Zeile verstehen! |
Trainieren Sie Ihre eigenen Daten basierend auf dem Mask-RCNN-Framework | Wie kenne ich Bilddaten und trainiere sie? Hier ist Ihre Antwort |
Demo der menschlichen Haltungerkennung | Es gibt viele Anwendungsszenarien für Maskrcnn |
Objekterkennung fasteRcnn -Serie | Eine klassische Arbeit zur Objekterkennung, die als Lernressource verwendet werden kann |
Praktische Bildfusion basierend auf Cyclegan Open Source -Projekt | Pytorch -Version von Cyclegan, dieses Open -Source -Projekt ist sehr gut geschrieben |
OCR -Texterkennungsprinzip | Das OCR -Prinzip ist eigentlich sehr einfach und erfordert die Unterstützung mehrerer Modelle, um es zu vervollständigen. |
OCR -Texterkennungsprojektpraxis | OCR -Netzwerkmodell erstellen |
Videoanalyse und Aktionserkennung basierend auf 3D -Faltung | Verwenden Sie die 3D -Faltung, um Videodaten zu verarbeiten und Verhaltenserkennung zu verarbeiten |
Es kann gesagt werden, dass die Schwierigkeit ziemlich hoch ist. Aber Textdaten sind nicht so fest, und manchmal ist es für Menschen nicht einfach zu verstehen, geschweige denn Computer. Hohe Herausforderungen sind auch hohe Vorteile.
Im Jahr 2018 kam ein Google -Papier heraus, Bert! Es entspricht einem allgemeinen Lösungsrahmen für die Verarbeitung natürlicher Sprache und kann im Grunde alle Aufgaben ausführen! Dies erfordert, dass sich jeder auf das Lernen konzentriert, und es kann als Projekt in Ihrem Lebenslauf geschrieben werden.
Projektname | Inhaltsübersicht |
---|---|
Sprachmodell | Das Sprachmodell erfordert, dass jeder mit der Grundlage nachfolgender Wortvektoren vertraut ist. |
Verwenden Sie Gemsim, um Wortvektoren zu erstellen | Gensim ist ein wirklich nützliches Paket! |
Klassifizierungsaufgabe basierend auf Word2VEC | Verwenden wir zuerst dieses Beispiel, um zu verstehen, wie Sie Word -Vektoren verwenden |
Vergleich von NLP-Text-Feature-Methoden | Es gibt so viele Möglichkeiten, Textmerkmale zu konstruieren, welches ist besser? |
LSTM -Stimmungsanalyse | Verwenden Sie dieses Projekt, um zu verstehen, wie die Eingabe von einem RNN -Modell erforderlich ist |
NLP-Ähnlichkeitsmodell | Berechnungsmethode für Text Ähnlichkeit |
Konversationsroboter | Erstellen Sie einen Chatbot basierend auf dem TensorLfow -Framework |
Erstellen Sie Ihre eigene Eingabemethode | Können Sie Ihre eigene Eingabemethode erstellen? Hilf dir, es zu erledigen! |
Roboter schreibt Tang Poesie | Schauen Sie sich die vom Modell geschriebene Tang -Poesie an! |
NMT -Maschinenübersetzungsbox | Open -Source -Projekt, sekundäre Entwicklung in der Lage |
Adresspostcode Mehrfachsequenzaufgabe | Klassische Textklassifizierungsaufgaben |
Prinzip von Bert, ein allgemeiner Rahmen für die Verarbeitung natürlicher Sprache | Dies ist der oben erwähnte Bert, der Punkt! Der Punkt! Der Punkt! |
Interpretation des Quellcode des Open -Source -Projekts von Google Bert | Quellcode ist sehr wichtig, jede Zeile muss verstanden werden |
Chinesische Stimmungsanalyse basierend auf Bert | Modellentwicklung basierend auf Open Source -Projekten |
Chinesische genannte Entitätserkennung basierend auf Bert | Genannte Entitätserkennung basierend auf Open Source -Projekten |
Durch Online -Kurse und Offline -Unternehmenstraining in den letzten Jahren habe ich viele Freunde getroffen. Jeder kennt mich im Grunde über Videokurse, und ich freue mich sehr, dass ich jedem Vorteile bringen kann. Vielen Dank an so viele Freunde für ihre Unterstützung, komm schon, du bist alles am besten!