Hallo, ich bin Karan, ein Gymnasiast aus Singapur. Nachdem ich das letzte Jahr damit verbracht habe, mich mit den Bereichen Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) zu beschäftigen, glaube ich, dass es in diesem Bereich keinen Lernpfad gibt, der speziell für Oberstufenschüler entwickelt wurde. Dies ist mein Versuch, eines zu erstellen.
Seit ich meine Reise in dieses Gebiet begonnen habe, versuche ich, jeden Tag ein paar Stunden damit zu verbringen, so viel wie möglich zu verstehen, sei es durch das Ansehen von YouTube-Videos, die Durchführung persönlicher Projekte oder einfach durch das Lesen von Büchern. Ich habe mich von älteren Kollegen beraten lassen, die viel mehr Erfahrung hatten als ich, aber ich weiß, dass eine solche Anleitung nicht für jeden verfügbar ist – daher ist dies mein Versuch, alle Erkenntnisse in einem konkreten Dokument zusammenzufassen.
Alle Informationen, die ich in diesem Leitfaden zusammengestellt habe, richten sich an Oberstufenschüler, die in diesem aufstrebenden Bereich hervorragende Leistungen erbringen möchten. Es soll chronologisch befolgt werden und erfordert im Gegensatz zu den meisten Leitfäden/Lernpfaden, die ich kenne, kein Verständnis von linearer Algebra, partiellen Ableitungen und anderen komplexen mathematischen Konzepten, die man in den Lehrplänen der Highschool nicht finden kann. Es enthält jedoch einen Kurs, der die Grundlagen der wesentlichen Mathematik für maschinelles Lernen abdeckt – deren Niveau ich als vergleichbar mit dem der Mathematik an der High School bezeichnen würde. Wenn Sie diesen Weg regelmäßig absolvieren, glaube ich, dass Sie in etwa drei Monaten ein einigermaßen kompetentes Niveau erreichen könnten. Dieser Lernpfad bietet jedoch Inhalte, mit denen Sie für den Rest Ihrer Schulzeit weiterlernen können.
Also, lasst uns loslegen.
Ich empfehle dringend Python als Ausgangspunkt, da es sich um eine Sprache handelt, die die meisten Anforderungen erfüllt, wenn es um den Einsatz im KI/ML-Bereich geht – sie ist nicht nur extrem einfach zu erlernen, sie bietet auch Bibliotheken und Frameworks für so ziemlich jeden grundlegenden Algorithmus im Fachgebiet bekannt. Während R nützlich ist, finde ich, dass Python aufgrund seiner Lesbarkeit und Erlernbarkeit weitaus besser für Oberstufenschüler geeignet ist. Neben der grundlegenden Programmierung sind Numpy, Pandas und Matplotlib insbesondere für maschinelles Lernen die nützlichsten Bibliotheken.
Für diejenigen unter Ihnen, die noch nie zuvor programmiert haben, empfehle ich den Besuch eines Kurses der University of Toronto (derzeit eine der besten Universitäten für KI/ML). Es wird ein paar Wochen dauern, aber die Zeit lohnt sich auf jeden Fall – die meisten Kenntnisse, die Sie in diesem Kurs erwerben, können auf jede andere Programmiersprache angewendet werden, der einzige Unterschied besteht in der Syntax. Der Kurs ist kostenlos und kann hier gefunden werden.
Für diejenigen unter Ihnen, die Programmiererfahrung in einer anderen Sprache als Python haben, überfliegen Sie einfach dieses Tutorial, um ein grundlegendes Verständnis der Python-Syntax zu erlangen – es sollte nicht länger als einen Tag dauern.
ML und KI basieren auf mathematischen Prinzipien wie Analysis, linearer Algebra, Wahrscheinlichkeit, Statistik und Optimierung – viele hoffnungsvolle KI-Praktiker (wie ich) finden dies entmutigend. Dieser Kurs zu edX Essential Math for Machine Learning: Python Edition von Microsoft ist nicht dazu gedacht, Sie zum Mathematiker zu machen. Vielmehr soll es Ihnen dabei helfen, einige wesentliche Grundkonzepte und die Notation, mit der sie ausgedrückt werden, zu erlernen. Der Kurs bietet einen praktischen Ansatz für die Arbeit mit Daten und die Anwendung der erlernten Techniken in realen Problemsituationen. Für diejenigen, die sie benötigen, gibt es finanzielle Unterstützung.
Nachdem Sie nun die Grundlagen von Python erlernt haben, müssen Sie die beiden grundlegenden Bibliotheken verstehen, die in diesem Bereich verwendet werden – Numpy und Pandas, die hauptsächlich zur Datenbearbeitung, -darstellung und -speicherung verwendet werden. Matplotlib, die dritte „Kern“-Bibliothek in diesem Bereich, wird verwendet, um diese Daten durch Grafiken und Diagramme zu visualisieren – aber dazu kommen wir später. Diese beiden Kurse zusammen sollten nicht länger als ein paar Tage dauern: Numpy und Pandas.
Wenn Sie dies in der Tasche haben, sollten Sie nun mit der Kernprogrammierung vertraut sein, die zum Erlernen von maschinellem Lernen und künstlicher Intelligenz erforderlich ist.
Wenn es einen universellen Kurs für maschinelles Lernen gibt, dann ist es der von Andrew Ng. Für Oberstufenschüler mag es etwas schwierig erscheinen, da es sich auf Konzepte wie partielle Ableitungen bezieht
Ich bin jedoch fest davon überzeugt, dass das Verständnis dieser Punkte nicht erforderlich ist, um aus dem Kurs konkrete Kenntnisse zu erlangen. Ich fand es besonders hilfreich, einige Vorträge in den Wochen 3 bis 5 noch einmal anzuschauen – diese Themen sind fortgeschritten, daher kann es sein, dass es beim ersten Ansehen etwas schnell wirkt. Machen Sie sich keine allzu großen Sorgen, wenn Sie die Kernmathematik nicht vollständig beherrschen, insbesondere im Hinblick auf die Infinitesimalrechnung – einige davon erfordern sicherlich Mathematikkenntnisse auf Universitätsniveau. Wichtiger ist, dass Sie den Denkprozess verfolgen können, den Prof. Ng bei der Weitergabe seines Wissens anwendet, da Sie so ein Verständnis dafür gewinnen können, was unter der Haube von maschinellen Lernprozessen vor sich geht.
Ich empfehle Ihnen, sich während des Kurses Notizen zu machen, da das Aufschreiben des Gelernten dazu beiträgt, sicherzustellen, dass Sie die weitergegebenen Informationen wirklich verstehen. Das Absolvieren der Programmier-Tutorials und -Übungen ist nicht unbedingt erforderlich, da diese in Matlab durchgeführt werden – was (meiner Erfahrung nach) schwierig zu verstehen sein kann, da es sich um eine Matrix-basierte Sprache handelt. Aber keine Sorge, wir werden in kurzer Zeit dieselben (und weitaus fortgeschritteneren) Algorithmen in Python ausführen.
Den kostenlosen Kurs finden Sie hier.
Die Implementierung von ML-Algorithmen ohne universitäre Mathematikkenntnisse, die diesen Algorithmen zugrunde liegen, klingt wie eine paradoxe Aufgabe – doch ein Team aus Australien hat sich genau dies vorgenommen.
Kirill Eremenko und Hadelin de Ponteves, ein Forscherpaar des „SuperDataScience“-Teams, sind absolut fantastisch darin, relevante Wege zu finden, einfache Algorithmen im wirklichen Leben anzuwenden. Darüber hinaus gehen sie ausreichend in die Tiefe, um die Funktionsweise des Algorithmus zu verstehen, allerdings ohne die komplexe Mathematik, die ein Oberstufenschüler nicht verstehen könnte. Ihr Kurs deckt sowohl Python als auch R ab, obwohl ich mir an dieser Stelle keine Sorgen um R machen würde – gehen Sie einfach die Python-Tutorials durch. Wenn Sie außerdem feststellen, dass sie etwas zu langsam sind, spielen Sie diesen Platz mit 1,25-facher Geschwindigkeit (das habe ich gemacht und fand, dass er für mein Lernen viel besser geeignet ist).
Ihr Kurs ist auf Udemy und wird nur als kostenpflichtige Version angeboten, obwohl Udemy regelmäßig Rabatte von 90 % oder mehr auf seine Kurse gewährt. Es kann hier gefunden werden und kostet normalerweise etwa 10 $. Es deckt alles ab, von grundlegenden Regressionsalgorithmen bis hin zu tiefen neuronalen Netzen. Letzteres ist die Kernarchitektur, die in vielen modernen Anwendungen wie ChatGPT und AlphaFold verwendet wird. Wenn Sie noch fortgeschrittenere Bereiche erkunden möchten, wird der Deep-Learning-Kurs am Ende des Machine Learning mit einem Rabatt von 90 % angeboten.
Wenn Sie nicht bereit sind, für diesen Kurs zu bezahlen, können Sie sich hier den kostenlosen Deep Learning-Kurs von Google oder hier den kostenlosen Kurs der University of Michigan ansehen. Meiner Meinung nach sind diese jedoch bei weitem nicht so umfassend wie die Kurse des SuperDataScience-Teams.
Für diese Kurse ist es nicht notwendig, sich Notizen zu machen – es gibt jede Menge „Algorithmus-Spickzettel“ online, die einen schnellen Einblick in ihre Funktionsweise geben. Diese Website listet einige auf.
Nachdem Sie nun ein breites Spektrum an Konzepten des maschinellen Lernens abgedeckt haben, ist es an der Zeit, dieses Wissen unabhängig zu nutzen, um einige Projekte abzuschließen. Ich würde vorschlagen, Kaggle und das UCI Machine Learning Repository zu erkunden – finden Sie einen Datensatz, der Sie interessiert, und modellieren Sie einige Lösungen für Probleme, mit denen sie zusammenhängen. Spielen Sie mit verschiedenen Algorithmen herum und arbeiten Sie an der Optimierung der Leistung.
Stellen Sie sicher, dass die von Ihnen verwendeten Datensätze einfach und sauber sind, d. h. sie sollten nicht zu viel Vorverarbeitung oder domänenspezifische Kenntnisse erfordern, um damit zu arbeiten. Einige einfache Datensätze, die mir spontan einfallen, sind die Datensätze „Iris“, „Wein“, „Brustkrebs Wisconsin“, „Autismus-Screening“, „Kongressabstimmung“, „Handschriftliche Ziffern MNIST“ und „Mode MNIST“.
Wenn Sie jemals auf eine Hürde stoßen, ist Stack Overflow Ihr bester Freund – sie haben eine Antwort auf fast jede Frage, die Sie haben. Wenn dies nicht der Fall ist, posten Sie einfach eine – Sie sollten innerhalb weniger Stunden Antworten erhalten! Zu diesem Schritt gehört nichts weiter – wenn Sie feststellen, dass Sie mit dem gesamten Modellierungsprozess von hinten bis vorne vertraut sind, können Sie ruhig weitermachen!
Jetzt sollten Sie nicht nur über ein umfassendes Verständnis aller Grundlagen verfügen, sondern auch in der Lage sein, diese auf einige reale Datenprobleme anzuwenden. Es ist jedoch wichtig zu verstehen, dass diese Grundlagen nicht die gesamte Welt von ML/KI umfassen – vielmehr sind viele von ihnen seit Jahren bekannte Methoden zur Lösung solcher Datenprobleme, aber leider waren Computer erst in jüngerer Zeit leistungsfähig genug, um sie wirklich zu nutzen Sie können sie in einer angemessenen Laufzeit ausführen. Die meisten modernen Arbeiten in diesem Bereich konzentrieren sich darauf, diese auf vielfältige Weise zu verbessern und angrenzende Systeme zu entwickeln, die die zugrunde liegenden Algorithmen nutzen, sie aber auf vielfältige Weise verbessern, erweitern und erweitern. Daher schlage ich vor, dass Sie ein Interessengebiet im breiteren Bereich des maschinellen Lernens finden und sich tiefer damit befassen, um mehr Erfahrung mit dem heutigen Stand der Technik auf diesem Gebiet zu sammeln. Sie werden wahrscheinlich nicht die Zeit haben, in allen Bereichen, die ich während Ihrer High-School-Zeit beschrieben habe, Experten zu werden, aber versuchen Sie, ein oder zwei davon zu meistern.
Bevor ich mich mit diesen Bereichen befasse, würde ich empfehlen, sich wirklich damit auseinanderzusetzen – eine einfache YouTube-Suche nach einer ausführlichen Erklärung wird Ihnen alles geben, was Sie brauchen. Also lasst uns loslegen.
Computer Vision: In diesem Bereich geht es darum, Computer mithilfe eines speziellen neuronalen Netzwerks dazu zu bringen, Dinge zu sehen und zu verstehen. Stanford veröffentlicht seinen Kurs dazu online hier, wobei Vorlesungen, Kursnotizen und Aufgaben online verfügbar sind. Gehen Sie das durch, aber machen Sie sich keine Sorgen, dass die Mathematik manchmal zu kompliziert sein könnte – der Kurs soll in erster Linie Ihr Wissen vertiefen, was er zwangsläufig auch tun wird. Sie können sich auch OpenCV ansehen, eine Computer-Vision-Bibliothek, die viele komplexe Aufgaben für Sie erledigt. Ein tolles Tutorial finden Sie hier. Wenn Sie damit fertig sind, schauen Sie sich erweiterte Bilddatensätze zu Kaggle und UCI an oder nehmen Sie sogar an einigen Kaggle-Wettbewerben teil.
Verarbeitung natürlicher Sprache: Zu verstehen, wie Computer sprechen lernen, ist heute ebenfalls ein wichtiges Thema. Wieder einmal bietet Stanford einen großartigen Kurs an, der online ist und hier gefunden werden kann. Wenn Sie einige der mathematischen Konzepte nicht verstehen, machen Sie sich keine Sorgen, machen Sie sich einfach ein Bild davon, wie dieser Bereich funktioniert. Für Implementierungen können Sie diesen Udemy-Kurs belegen. Alternativ können Sie sich jedoch auch einige der Videos des bekannten Machine Learner Siraj Raval ansehen. Wenn Sie dies getan haben, versuchen Sie es mit einfachen, bekannten Projekten wie dem Aufbau eines Chatbots, einer Stimmungsanalyse oder dem Verfassen eines Liedtextes – einfache YouTube-Suchen sollten Ihnen dabei helfen. Modernere Anwendungen wie ChatGPT und Claude basieren auf einem auf neuronalen Netzwerken basierenden System namens Large Language Models, das hauptsächlich auf der Transformer-Architektur basiert – dieser Kurs von Andrew Ng ist ein guter Ausgangspunkt.
Reinforcement Learning: Dieser Bereich konzentriert sich darauf, wie Maschinen lernen, sich in einer bestimmten Umgebung zu verhalten. Die beliebteste Anwendung findet sich im Bereich Videospiele. Siraj Raval hat dazu eine ziemlich gute Playlist, die hier zu finden ist. Wenn Sie nach umsetzungsbasierten Tutorials suchen, die speziell ein High-Level-Paket wie Tensorflow verwenden, bietet Denny Britz eine solide Auswahl an Tutorials, die Sie hier finden können. Der UCL-Kurs von David Silver ist ebenfalls großartig, auch wenn er für Anfänger vielleicht etwas knifflig ist – ihn finden Sie hier. Sobald Sie damit fertig sind, ist es ziemlich logisch, einfach mit dem Herunterladen von Basisprojekten oder Spielen aus dem Internet zu beginnen und ein KI-Element hinzuzufügen, um zu steuern, wie die Agenten agieren. Einfache Komplettlösungen können wiederum über eine einfache Youtube-Suche gefunden werden.
Data Science & Analytics: Dieser Bereich ist ein aufstrebender Bereich mit unzähligen spannenden Beschäftigungsmöglichkeiten und wird in den meisten modernen Unternehmen intensiv genutzt, um Erkenntnisse aus den Unmengen an gesammelten Daten abzuleiten und so Geschäftsentscheidungen zu treffen. Ich empfehle, entweder den kostenpflichtigen Kurs von SuperDataScience oder den kostenlosen Python-basierten Kurs der UC San Diego zu absolvieren, obwohl Sie mit einer einfachen Google-Suche spezifische Lernpfade für Data Science finden können. Sie können auch die folgenden Links verwenden, um SQL und Matplotlib zu erlernen, bei denen es sich um Tangentialsprachen handelt, die für viele moderne Datenanalysen verwendet werden. Der Vorteil, dies auf Schülerebene zu lernen, ist die Beschäftigungsfähigkeit – ich habe zahlreiche Freunde in der High School, denen ein Praktikum im Bereich Datenwissenschaft angeboten wurde, da die Erkenntnisse, die bei der Arbeit in dieser Disziplin gewonnen werden, von Unternehmen sofort monetarisiert werden können. Datengesteuerte Entscheidungsfindung ist tatsächlich die einzige Form der Entscheidungsfindung in der heutigen Unternehmenswelt.
Es gibt auch Bereiche wie Boltzmann-Maschinen (wird für Empfehlungssysteme verwendet), Adversial Networks (KI verbessert die KI) und genetische Algorithmen (die eine Lösung eines Problems auf eine Weise verbessern, die der natürlichen Evolution ähnelt), aber meiner Meinung nach ist die Kombination ihrer Nische Ihre Anwendbarkeit und das Erfordernis fortgeschrittenerer Mathematikkenntnisse machen sie als Ausgangspunkt weniger wünschenswert. Probieren Sie diese gerne aus, wenn Sie eine besondere Leidenschaft für einen dieser Bereiche haben. Allerdings sind sie auch nicht so gut dokumentiert wie die anderen Bereiche, was es etwas schwieriger machen kann, sie zu meistern.
Wenn Sie auf lange Sicht in diesem Bereich arbeiten möchten, ist es wichtig, es aus einer ganzheitlicheren Perspektive zu verstehen. Damit meine ich, etwas über bahnbrechende Entdeckungen, den Diskurs darüber, wie sie angewendet werden sollten, und ihre allgemeinen Auswirkungen auf die Gesellschaft zu lernen. Sie sollten mit den in diesem Abschnitt aufgeführten Dingen beginnen, sobald Sie das nötige Verständnis dafür haben, wie die Technologie funktioniert. Ich glaube, ein guter Ausgangspunkt ist, wenn Sie mit Abschnitt 4 dieses Lernpfads beginnen. Diese Art von Informationen hilft vielleicht nicht speziell bei der Implementierung von Algorithmen für Datenprobleme, aber für eine Technologie, die in der heutigen Welt so wichtig ist, tragen sie wirklich dazu bei, ein fundierteres Verständnis ihrer Rolle, ihres wahren Potenzials und ihrer Grenzen zu entwickeln.
Es gibt ein paar Dinge, die ein Oberstufenschüler tun kann, um sein allgemeines Verständnis des Fachgebiets zu vertiefen und sein Wissen zu verbessern:
Beginnen Sie mit dem Lesen von Forschungsarbeiten: Ich möchte betonen, dass diese nicht so anspruchsvoll sind, wie sie klingen. Auch wenn die Mathematik, die modernen Techniken zugrunde liegt, sehr fortgeschritten sein mag, ist es nie eine schlechte Sache, sich einfach mit dem vertraut zu machen, was an vorderster Front in der Branche vor sich geht. Wenn Sie jemals auf etwas stoßen, das Sie nicht verstehen, legen Sie es einfach weg – es gibt mehr als genug Alternativen, um Sie zu beschäftigen. Auf dieser Website finden Sie zunächst eine Menge toller Artikel. Wenn Sie diese jedoch durchgelesen haben, finden Sie hier eine längere Liste. Lesen Sie einfach diejenigen aus Abschnitt 5, die Sie interessieren oder mit Ihrem „Fachgebiet“ in Zusammenhang stehen. Es ist hilfreich, sie aufzubewahren ein kleines Tagebuch mit den Erkenntnissen aus jeder Arbeit. Wenn Sie nicht in der Lage sind, viele dieser Forschungsarbeiten wirklich zu verstehen, versuchen Sie, diesen von mir verfassten Leitfaden durchzulesen, der eine leichter verständliche Aufschlüsselung einiger neuerer Innovationen bietet. Dieser Youtube-Kanal bietet außerdem eine Vielzahl weiterer einführender Erläuterungen zu den Aufsätzen, die jeweils in nur zwei Minuten behandelt werden.
Folgen Sie Pionieren: Menschen wie Andrew Ng, Ian Goodfellow und Yann LeCunn werden regelmäßig interviewt und liefern die Perspektive der „Gründer“ dessen, was wir heute als KI und ML kennen. Dieser Youtube-Kanal sammelt die besten dieser Vorträge und fasst sie in einer zentralen Ressource zusammen – schauen Sie sich jeden Abend einen an, und ich garantiere Ihnen, dass Sie sich innerhalb weniger Wochen wie ein Experte fühlen werden.
Bleiben Sie auf dem Laufenden: Wired ist eine der besten Plattformen für alle, die sich für Technik interessieren. Es veröffentlicht jeden Tag mehrere KI-bezogene Geschichten (obwohl das heutzutage nicht jeder tut?), die hier zu finden sind. Es ist eine schnelle und ansprechende Möglichkeit, die Trends der Zeit zu verstehen. Alternativ können Sie den Facebook Messenger-Bot von TechCrunch abonnieren – er enthält häufig interessante Artikel zum Thema KI und sendet Ihnen täglich Informationen.
Verstehen Sie die Auswirkungen: Es gibt keinen besseren Weg, dies zu tun, als sich TED-Vorträge anzuhören. Ihre Redner sind auf diesem Gebiet äußerst sachkundig und in ihren Reden wird zunehmend Wert auf KI gelegt. Eine Sammlung von Videos finden Sie hier.
Die Philosophie: KI hat ihre Befürworter und ihre Gegner. Die Philosophie dahinter ist jedoch faszinierend. Zu meinen Lieblingsbüchern, die sich mit diesem Bereich befassen und für Oberstufenschüler geeignet sind, gehören „How to Create a Mind“ von Ray Kurzweil und „Life 3.0“ von Max Tegmark – probieren Sie sie doch mal aus. Sie betrachten die längerfristige Entwicklung der KI, die im Alltag vielleicht nicht so relevant erscheint, aber dabei hilft, den breiteren Kontext der Technologie als Ganzes zu verstehen.
Mitwirken: Wenn Sie zu der Art von Person gehören, die gerne aus den Erfahrungen anderer lernt, schauen Sie sich Diskursmöglichkeiten wie diese Facebook-Gruppe an, in der regelmäßig aufschlussreiche Artikel und Aufsätze zu Fortschritten in diesem Bereich veröffentlicht werden. Alternativ können Sie sich für lockerere Gespräche auch Subreddits zum Thema KI wie diesen hier ansehen.
Tauchen Sie ein in die Mathematik: Ja, dafür benötigen Sie mathematische Grundlagen auf Universitätsniveau, aber wenn Sie ein guter Mathematikstudent sind, hindert Sie nichts daran, einige Online-Kurse zu belegen. Microsoft bietet einen kostenlosen Kurs an, von dem ich viel Gutes gehört habe und der nur Mathematik auf High-School-Niveau erfordert. Dieser Quora-Thread enthält auch einige großartige Ressourcen, die Sie sich ansehen sollten. 3Blue1Brown ist auch in der Community ein berühmter Name, da seine Youtube-Videos fantastisch zum Erlernen der Mathematik (hauptsächlich lineare Algebra und Infinitesimalrechnung) hinter einigen der komplizierteren Konzepte sind.
Ich habe viel zu viele Leute sagen hören, dass das Erlernen von maschinellem Lernen und künstlicher Intelligenz für einen Gymnasiasten zu mühsam ist, um dies nicht zu schreiben – mit einem gut gepflasterten Lernpfad kann es von jedem studiert werden. Und damit wünsche ich allen viel Glück auf diesem Lernweg.
Wenn Sie Ergänzungen oder mögliche Verbesserungen zu diesem Handbuch haben, können Sie gerne eine PR für dieses Repository erstellen. Und für Feedback, Kooperationen oder einfach nur allgemeine Fragen schreiben Sie mir gerne unter [email protected].