Eine Person, die auf dem Gebiet der KI arbeitet und keine Mathematikkenntnisse hat, ist wie ein Politiker, der nicht weiß, wie man überzeugt. Beide haben einen unumgänglichen Arbeitsbereich!
Vor einer Woche habe ich einen Artikel über den Einstieg in die Datenwissenschaft im Jahr 2021 geschrieben und seitdem mehrere E-Mails von Menschen auf der ganzen Welt erhalten, in denen ich gefragt habe, wie viel Mathematik in der Datenwissenschaft erforderlich ist.
Ich werde nicht lügen: Es ist eine Menge Mathematik .
Und das ist einer der Gründe, die viele Anfänger abschrecken. Nach vielen Recherchen und Gesprächen mit mehreren Veteranen auf diesem Gebiet habe ich diesen sachlichen Leitfaden zusammengestellt, der alle Grundlagen der Mathematik abdeckt, die Sie wissen müssen . Die unten genannten Konzepte werden in der Regel über mehrere Semester an der Hochschule behandelt, aber ich habe sie auf die Kernprinzipien reduziert, auf die Sie sich konzentrieren können.
Dieser Leitfaden ist ein absoluter Lebensretter für Anfänger, damit Sie die Themen studieren können, die am wichtigsten sind, und eine noch bessere Ressource für Praktiker wie mich, die einen schnellen Überblick über diese Konzepte benötigen.
Hinweis : Sie müssen nicht alle Konzepte (unten) kennen, um Ihren ersten Job im Bereich Data Science zu bekommen. Alles, was Sie brauchen, ist ein solides Verständnis der Grundlagen. Konzentrieren Sie sich auf diese und festigen Sie sie.
Kenntnisse der Algebra sind vielleicht von grundlegender Bedeutung für die Mathematik im Allgemeinen. Neben mathematischen Operationen wie Addition, Subtraktion, Multiplikation und Division müssen Sie Folgendes wissen:
Exponenten
Radikale
Fakultäten
Zusammenfassungen
Wissenschaftliche Notationen
Die lineare Algebra ist das wichtigste mathematische Berechnungswerkzeug in der künstlichen Intelligenz und in vielen Bereichen der Wissenschaft und Technik. Dabei müssen 4 primäre mathematische Objekte und ihre Eigenschaften verstanden werden:
Skalare – eine einzelne Zahl (kann reell oder natürlich sein).
Vektoren – eine Liste von Zahlen, geordnet in der richtigen Reihenfolge. Betrachten Sie sie als Punkte im Raum, wobei jedes Element die Koordinate entlang einer Achse darstellt.
Matrizen – ein zweidimensionales Array von Zahlen, wobei jede Zahl durch zwei Indizes identifiziert wird.
Tensoren – ein ND-Array von Zahlen (N>2), angeordnet auf einem regelmäßigen Gitter mit N-Achsen. Wichtig im maschinellen Lernen, Deep Learning und Computer Vision
Eigenvektoren und Eigenwerte – spezielle Vektoren und ihre entsprechende Skalargröße. Verstehen Sie die Bedeutung und wie Sie sie finden.
Singularwertzerlegung – Faktorisierung einer Matrix in 3 Matrizen. Verstehen Sie die Eigenschaften und Anwendungen.
Hauptkomponentenanalyse (PCA) – verstehen Sie die Bedeutung, Eigenschaften und Anwendungen.
Eigenschaften wie das Punktprodukt, das Vektorprodukt und das Hadamard-Produkt sind ebenfalls nützlich zu wissen.
In der Analysis geht es um Änderungen von Parametern, Funktionen, Fehlern und Näherungen. Kenntnisse in mehrdimensionaler Analysis sind in der Datenwissenschaft unerlässlich. Im Folgenden sind die wichtigsten Konzepte (wenn auch nicht erschöpfend) in der Analysis aufgeführt:
Ableitungen – Regeln (Addition, Produkt, Kettenregel usw.), hyperbolische Ableitungen (tanh, cosh usw.) und partielle Ableitungen.
Vektor-/Matrixrechnung – verschiedene Ableitungsoperatoren (Gradient, Jacobian, Hessian und Laplace)
Gradientenalgorithmen – lokale/globale Maxima und Minima, Sattelpunkte, konvexe Funktionen, Batches und Mini-Batches, stochastischer Gradientenabstieg und Leistungsvergleich.
Grundlegende Statistiken – Mittelwert, Median, Modus, Varianz, Kovarianz usw
Grundregeln der Wahrscheinlichkeitsrechnung – Ereignisse (abhängig und unabhängig), Stichprobenräume, bedingte Wahrscheinlichkeit.
Zufallsvariablen – kontinuierlich und diskret, Erwartung, Varianz, Verteilungen (gemeinsam und bedingt).
Das Bayes-Theorem – berechnet die Gültigkeit von Überzeugungen. Bayesianische Software hilft Maschinen, Muster zu erkennen und Entscheidungen zu treffen.
Maximum Likelihood Estimation (MLE) – Parameterschätzung. Erfordert Kenntnisse grundlegender Wahrscheinlichkeitskonzepte (gemeinsame Wahrscheinlichkeit und Unabhängigkeit von Ereignissen).
Häufige Verteilungen – Binomial, Poisson, Bernoulli, Gauß, Exponentiell.
Ein wichtiger Bereich, der bedeutende Beiträge zu KI und Deep Learning geleistet hat und vielen noch unbekannt ist. Man kann es sich als eine Verschmelzung von Analysis, Statistik und Wahrscheinlichkeit vorstellen.
Entropie – auch Shannon-Entropie genannt. Wird verwendet, um die Unsicherheit eines Experiments zu messen.
Kreuzentropie – vergleicht zwei Wahrscheinlichkeitsverteilungen und sagt uns, wie ähnlich sie sind.
Kullback-Leibler-Divergenz – ein weiteres Maß dafür, wie ähnlich zwei Wahrscheinlichkeitsverteilungen sind.
Viterbi-Algorithmus – weit verbreitet in der Verarbeitung natürlicher Sprache (NLP) und Sprache
Encoder-Decoder – wird in maschinellen Übersetzungs-RNNs und anderen Modellen verwendet.
In der Künstlichen Intelligenz ist Mathematik sehr wichtig. Ohne sie ist es vergleichbar mit einem menschlichen Körper ohne Seele. Sie können die mathematischen Konzepte wie eine Umlage behandeln: Wann immer ein fremdes Konzept auftaucht, schnappen Sie es sich und verschlingen Sie es! Der obige Leitfaden stellt eine minimale, aber umfassende Ressource dar, um alle Arten von Themen oder Konzepten in der KI zu verstehen.
Viel Glück!
Wenn Sie der Meinung sind, dass diese Roadmap verbessert werden kann, öffnen Sie bitte eine PR mit etwaigen Aktualisierungen und melden Sie etwaige Probleme. Wir werden dies weiter verbessern. Vielleicht möchten Sie dieses Repository ansehen/markieren, um es in Zukunft noch einmal zu besuchen.
Sehen Sie sich den Beitragsleitfaden an, um zu erfahren, wie Sie die Roadmap aktualisieren.
Öffnen Sie eine Pull-Anfrage mit Verbesserungen
Besprechen Sie Ideen in Themen
Verbreiten Sie es weiter
Melden Sie sich bei Feedback
Diese Roadmap wurde von Jason Dsouza erstellt und unter der MIT-Lizenz öffentlich zugänglich gemacht.