Hai, saya Karan, seorang siswa SMA yang tinggal di Singapura. Setelah menghabiskan setahun terakhir mendalami bidang Artificial Intelligence (AI) dan Machine Learning (ML), saya yakin tidak ada jalur pembelajaran di bidang ini yang dibangun khusus untuk siswa SMA . Ini adalah upaya saya untuk membuatnya.
Sejak saya memulai perjalanan saya ke bidang ini, saya telah mencoba menghabiskan beberapa jam setiap hari untuk memahami sebanyak yang saya bisa, apakah itu menonton video Youtube, mengerjakan proyek pribadi atau sekadar membaca buku. Saya telah dibimbing oleh rekan-rekan yang lebih tua yang memiliki lebih banyak pengalaman daripada saya, namun ketahuilah bahwa bimbingan tersebut tidak tersedia untuk semua orang - jadi ini adalah upaya saya untuk menyampaikan semua pembelajaran ke dalam satu dokumen konkret.
Semua informasi yang saya kumpulkan dalam panduan ini ditujukan untuk siswa sekolah menengah yang ingin unggul dalam bidang yang sedang naik daun ini. Hal ini dimaksudkan untuk diikuti secara kronologis, dan tidak seperti kebanyakan panduan/jalur pembelajaran yang pernah saya temui, tidak memerlukan pemahaman tentang aljabar linier, turunan parsial, dan konsep matematika kompleks lainnya yang tidak dapat ditemukan dalam silabus sekolah menengah mereka. Namun, kursus ini mencakup kursus yang mencakup dasar-dasar matematika penting untuk Pembelajaran Mesin - yang tingkatannya menurut saya sebanding dengan matematika sekolah menengah. Jika Anda mengerjakan jalur ini secara rutin, saya yakin Anda dapat mencapai tingkat yang cukup mahir dalam waktu sekitar tiga bulan. Namun, jalur pembelajaran ini memang menyediakan konten yang dapat membuat Anda terus belajar selama sisa waktu Anda di sekolah menengah.
Jadi, mari kita mulai.
Saya sangat menyarankan Python sebagai titik awal, karena ini adalah bahasa yang paling cocok untuk digunakan dalam domain AI/ML - tidak hanya sangat mudah dipelajari, tetapi juga menyediakan perpustakaan dan kerangka kerja untuk hampir semua algoritma dasar. dikenal di lapangan. Meskipun R berguna, menurut saya Python jauh lebih cocok untuk siswa sekolah menengah karena keterbacaan dan pembelajarannya. Selain pemrograman dasar, khususnya untuk Machine Learning, perpustakaan yang paling berguna adalah Numpy, Pandas dan Matplotlib.
Bagi Anda yang belum pernah coding sebelumnya, saya sarankan untuk mengikuti kursus yang disediakan oleh University of Toronto (salah satu universitas terbaik untuk AI/ML saat ini). Ini akan memakan waktu beberapa minggu, namun ini sepadan dengan waktu Anda - sebagian besar pengetahuan yang Anda peroleh melalui kursus ini dapat diterapkan ke bahasa pemrograman lain, satu-satunya perbedaan adalah sintaksisnya. Kursus ini gratis dan dapat ditemukan di sini.
Bagi Anda yang memiliki pengalaman coding dalam bahasa selain Python, cukup baca tutorial ini untuk memahami dasar sintaksis Python - tidak akan memakan waktu lebih dari satu hari.
ML dan AI dibangun berdasarkan prinsip-prinsip matematika seperti Kalkulus, Aljabar Linier, Probabilitas, Statistik, dan Optimasi - banyak praktisi AI yang penuh harapan (seperti saya) menganggap hal ini menakutkan. Kursus tentang edX Essential Math for Machine Learning: Python Edition oleh Microsoft ini tidak dirancang untuk menjadikan Anda seorang ahli matematika. Sebaliknya, ini bertujuan untuk membantu Anda mempelajari beberapa konsep dasar penting dan notasi yang digunakan untuk mengekspresikannya. Kursus ini memberikan pendekatan langsung untuk bekerja dengan data dan menerapkan teknik yang telah Anda pelajari dalam situasi masalah dunia nyata. Bantuan keuangan tersedia bagi mereka yang membutuhkannya.
Sekarang, setelah Anda mempelajari dasar-dasar Python, Anda perlu memahami dua perpustakaan dasar yang digunakan di lapangan - Numpy dan Pandas, yang digunakan terutama untuk manipulasi, representasi, dan penyimpanan data. Matplotlib, perpustakaan 'inti' ketiga di area tersebut, digunakan untuk memvisualisasikan data ini melalui grafik dan diagram - namun kita akan membahasnya nanti. Kedua kursus ini bersama-sama tidak akan memakan waktu lebih dari beberapa hari: Numpy dan Pandas.
Dengan ini di saku belakang Anda, Sekarang Anda harus menguasai pemrograman inti yang diperlukan untuk mempelajari Pembelajaran Mesin dan Kecerdasan Buatan.
Jika ada satu kursus universal untuk Pembelajaran Mesin, itu pasti kursus Andrew Ng. Ini mungkin tampak sedikit menantang bagi siswa sekolah menengah, karena mengacu pada konsep seperti turunan parsial
tapi saya sangat yakin bahwa memahami hal ini tidak diperlukan untuk mendapatkan pengetahuan nyata dari kursus ini. Saya merasa sangat bermanfaat untuk menonton kembali beberapa ceramah di Minggu 3 hingga 5 - topik ini merupakan topik lanjutan, jadi mungkin terasa agak cepat saat pertama kali Anda menontonnya. Jangan terlalu khawatir jika Anda tidak dapat sepenuhnya mengikuti inti matematika, terutama yang berkaitan dengan kalkulus - beberapa di antaranya tentu memerlukan pengetahuan matematika tingkat universitas. Yang lebih penting adalah Anda dapat mengikuti proses berpikir yang digunakan Prof. Ng saat menyampaikan pengetahuannya, karena hal ini memungkinkan Anda memperoleh pemahaman tentang apa yang terjadi di balik proses Pembelajaran Mesin.
Saya mendorong Anda untuk membuat catatan selama kursus, karena menuliskan apa yang Anda pelajari membantu memastikan bahwa Anda benar-benar memahami informasi yang disampaikan. Menyelesaikan tutorial dan latihan pemrograman tidaklah penting, karena ini dilakukan di Matlab - yang (menurut pengalaman saya) mungkin sulit untuk dipahami, karena ini adalah bahasa berbasis matriks. Namun jangan khawatir, kami akan melakukan algoritma yang sama (dan jauh lebih canggih) dengan Python hanya dalam waktu singkat.
Kursus gratis ini dapat ditemukan di sini.
Menerapkan algoritma ML tanpa pengetahuan matematika tingkat universitas yang mendasari algoritma ini terdengar seperti tugas yang paradoks - namun, sebuah tim dari Australia bertekad untuk melakukan hal ini.
Kirill Eremenko dan Hadelin de Ponteves, sepasang peneliti yang merupakan bagian dari tim 'SuperDataScience', benar-benar hebat dalam menemukan cara relevan untuk menerapkan algoritma sederhana dalam kehidupan nyata. Selain itu, mereka membahas secara mendalam untuk memahami fungsi algoritme, tetapi tanpa matematika rumit yang tidak akan dapat dipahami oleh siswa sekolah menengah. Kursus mereka mencakup Python dan R, meskipun saya tidak akan khawatir tentang R saat ini - cukup ikuti tutorial Python. Selain itu, jika menurut Anda kursusnya berjalan agak terlalu lambat, mainkan kursus ini dengan kecepatan 1,25x (Saya melakukannya dan merasa lebih cocok untuk pembelajaran saya).
Kursus mereka ada di Udemy, dan hanya ditawarkan sebagai versi berbayar, meskipun Udemy secara rutin memberikan diskon sebesar 90% atau lebih untuk kursus mereka. Itu dapat ditemukan di sini, dan biasanya sekitar $10. Ini mencakup semuanya, mulai dari algoritme regresi dasar hingga jaringan saraf dalam, yang terakhir merupakan arsitektur inti yang digunakan di banyak aplikasi modern seperti ChatGPT dan AlphaFold. Jika Anda ingin menjelajahi area yang lebih maju, kursus Pembelajaran Mendalam mereka ditawarkan di akhir Pembelajaran Mesin dengan diskon 90%.
Jika Anda tidak bersedia membayar untuk kursus ini, Anda dapat melihat kursus Deep Learning gratis dari Google di sini atau kursus gratis Universitas Michigan di sini. Namun menurut pendapat saya, kursus ini masih jauh dari sebaik kursus tim SuperDataScience.
Untuk kursus ini, membuat catatan bukanlah suatu keharusan - ada banyak sekali 'lembar contekan algoritma' online, yang menawarkan intuisi singkat tentang cara kerjanya. Situs web ini mencantumkan beberapa.
Sekarang setelah Anda mempelajari berbagai konsep pembelajaran mesin, inilah saatnya bagi Anda untuk menggunakan pengetahuan ini secara mandiri untuk menyelesaikan beberapa proyek. Saya sarankan menjelajahi Kaggle dan Repositori Pembelajaran Mesin UCI - temukan kumpulan data yang Anda minati, dan buat model beberapa solusi untuk masalah yang terkait dengannya. Bermain-main dengan berbagai algoritme dan berupaya mengoptimalkan kinerja.
Pastikan bahwa kumpulan data yang Anda gunakan bersifat sederhana dan bersih - yaitu kumpulan data tersebut tidak memerlukan terlalu banyak pra-pemrosesan atau pengetahuan khusus domain untuk digunakan. Beberapa kumpulan data mudah yang terlintas di benak saya adalah Iris, Anggur, Kanker Payudara Wisconsin, Pemeriksaan Autisme, Pemungutan Suara Kongres, MNIST Digit Tulisan Tangan, dan MNIST Mode.
Jika Anda pernah menemui hambatan, Stack Overflow adalah teman terbaik Anda - mereka memiliki jawaban untuk hampir semua pertanyaan yang Anda miliki. Jika tidak, posting saja satu - Anda akan mendapat balasan dalam beberapa jam! Tidak ada yang lebih dari langkah ini - ketika Anda merasa nyaman dengan seluruh proses pemodelan dari belakang ke depan, silakan lanjutkan!
Sekarang Anda tidak hanya harus memiliki pemahaman yang baik dan luas tentang semua dasar-dasarnya, namun juga memiliki kemampuan untuk menerapkannya pada beberapa masalah data dunia nyata. Namun, penting untuk dipahami bahwa dasar-dasar ini tidak mencakup seluruh dunia ML/AI - bahkan banyak di antaranya yang telah dikenal sebagai cara mengatasi masalah data selama bertahun-tahun, namun sayangnya baru belakangan ini komputer cukup kuat untuk benar-benar memanfaatkannya. mereka dalam jumlah runtime yang wajar. Sebagian besar pekerjaan modern di bidang ini berfokus pada peningkatan hal ini dalam berbagai cara baru, dan membangun sistem yang bersinggungan dengan hal ini yang memanfaatkan algoritma yang mendasarinya namun memperbaiki, memperluas, dan menyempurnakannya dalam berbagai cara. Oleh karena itu, saya menyarankan Anda menemukan bidang minat di bidang Pembelajaran Mesin yang lebih luas, dan mempelajarinya lebih dalam agar lebih berpengalaman dengan kecanggihan bidang tersebut seperti saat ini. Anda mungkin tidak akan punya waktu untuk menjadi ahli di semua bidang yang saya uraikan selama masa sekolah menengah Anda, tapi cobalah dan taklukkan satu atau dua bidang.
Sebelum masuk ke area ini, saya sarankan untuk benar-benar memahami apa yang dimaksud dengan hal ini - pencarian sederhana di Youtube untuk mendapatkan penjelasan tingkat tinggi akan memberikan semua yang Anda butuhkan. Jadi mari kita mulai.
Visi Komputer: Area ini berkaitan dengan membuat komputer melihat dan memahami berbagai hal menggunakan jenis jaringan saraf khusus. Stanford menerbitkan kursus mereka secara online di sini, dengan ceramah, catatan kursus, dan tugas tersedia online. Pelajarilah hal ini, namun jangan khawatir jika matematika terkadang menjadi terlalu rumit - kursus ini terutama dimaksudkan untuk memperdalam pengetahuan Anda, dan hal ini pasti akan berhasil. Anda juga dapat melihat OpenCV, perpustakaan visi komputer yang melakukan banyak hal rumit untuk Anda. Tutorial yang bagus dapat ditemukan di sini. Setelah Anda selesai melakukannya, lihat kumpulan data gambar tingkat lanjut di Kaggle dan UCI, atau bahkan ikuti beberapa Kompetisi Kaggle.
Pemrosesan Bahasa Alami: Memahami bagaimana komputer belajar berbicara juga merupakan topik yang menonjol saat ini. Sekali lagi, Stanford menawarkan kursus online yang bagus dan dapat ditemukan di sini. Jika Anda tidak memahami beberapa konsep matematika, jangan khawatir, pahami saja cara kerja domain ini. Untuk implementasinya, Anda bisa mengikuti kursus Udemy ini. Namun, Anda juga dapat melihat beberapa video Machine Learner Siraj Raval yang terkenal. Setelah Anda melakukannya, cobalah melakukan proyek sederhana dan terkenal seperti membuat chatbot, analisis sentimen, atau membuat lirik lagu - penelusuran Youtube sederhana akan membantu Anda. Aplikasi yang lebih modern seperti ChatGPT dan Claude dibangun pada sistem berbasis Jaringan Neural yang disebut Model Bahasa Besar, yang terutama didasarkan pada arsitektur Transformer - kursus oleh Andrew Ng ini adalah titik awal yang baik.
Pembelajaran Penguatan: Domain ini berfokus pada bagaimana mesin belajar bertindak dalam lingkungan tertentu, dan penerapannya yang paling populer adalah dalam bidang video game. Siraj Raval memiliki playlist yang cukup bagus tentang ini, yang dapat ditemukan di sini. Jika Anda mencari tutorial berbasis implementasi khususnya menggunakan paket tingkat tinggi seperti Tensorflow, Denny Britz memiliki serangkaian tutorial lengkap yang dapat ditemukan di sini. Kursus UCL David Silver juga bagus, meskipun pemula mungkin merasa agak rumit - kursus ini dapat ditemukan di sini. Setelah Anda selesai melakukannya, cukup logis untuk mulai mengunduh proyek atau game dasar dari online, dan menambahkan elemen AI untuk mengatur cara agen bertindak. Panduan sederhana dapat ditemukan lagi melalui pencarian Youtube sederhana.
Ilmu Data & Analisis: Bidang ini adalah domain pemula dengan banyak peluang kerja yang menarik, dan digunakan secara luas di sebagian besar perusahaan modern untuk mendapatkan wawasan dari kumpulan data yang dikumpulkan untuk menginformasikan keputusan bisnis. Saya menyarankan untuk mengikuti kursus berbayar SuperDataScience atau kursus gratis berbasis Python di UC San Diego, meskipun Anda dapat menemukan jalur pembelajaran khusus untuk ilmu data dengan pencarian Google yang sederhana. Anda juga dapat menggunakan tautan berikut untuk mempelajari SQL dan Matplotlib, yang merupakan bahasa tangensial yang digunakan untuk banyak analisis data modern. Keuntungan mempelajari hal ini di tingkat siswa adalah kemampuan kerja - Saya punya banyak teman di sekolah menengah yang telah ditawari magang ilmu data, karena wawasan yang diperoleh dari pekerjaan dalam disiplin ini dapat langsung dimonetisasi oleh perusahaan. Pengambilan keputusan berdasarkan data adalah satu-satunya bentuk pengambilan keputusan di dunia korporat saat ini.
Ada juga area seperti Mesin Boltzmann (digunakan untuk sistem rekomendasi), Jaringan Adversial (AI yang meningkatkan AI) dan Algoritma Genetika (meningkatkan solusi suatu masalah dengan cara yang mirip dengan evolusi alami), tetapi menurut saya, kombinasi dari niche mereka penerapannya dan memerlukan tingkat matematika yang lebih tinggi menjadikannya kurang diminati sebagai titik awal. Jangan ragu untuk mengeksplorasi hal ini jika Anda memiliki minat khusus pada salah satu bidang tersebut, meskipun bidang tersebut juga tidak terdokumentasi dengan baik dibandingkan bidang lainnya, sehingga mungkin membuat penguasaannya sedikit lebih rumit.
Jika Anda ingin bekerja di bidang ini dalam jangka panjang, penting untuk memahaminya dari sudut pandang yang lebih holistik - yang saya maksud adalah mempelajari penemuan-penemuan inovatif, wacana mengenai bagaimana hal tersebut harus diterapkan, dan implikasi umumnya terhadap masyarakat. Anda harus mulai melakukan hal-hal yang tercantum di bagian ini segera setelah Anda memiliki pemahaman yang diperlukan tentang cara kerja teknologi - Saya yakin titik awal yang baik adalah saat Anda memulai Bagian 4 dari jalur pembelajaran ini. Informasi semacam ini mungkin tidak secara khusus membantu penerapan algoritme untuk masalah data, namun untuk teknologi yang sangat penting dalam dunia saat ini, informasi ini sangat membantu membentuk pemahaman yang lebih kuat tentang peran, potensi, dan batasan sebenarnya.
Ada beberapa hal yang dapat dilakukan siswa sekolah menengah untuk memperdalam pemahaman umum mereka tentang bidang tersebut dan menjadikan mereka lebih berpengetahuan:
Mulailah membaca makalah penelitian: Saya ingin menekankan bahwa ini sebenarnya tidak sesulit kedengarannya. Meskipun ilmu matematika yang mengatur teknik-teknik modern mungkin sudah sangat maju, mendapatkan paparan terhadap apa yang terjadi di garis depan industri bukanlah hal yang buruk. Jika Anda pernah menemukan sesuatu yang tidak Anda pahami, letakkan saja - ada lebih dari cukup alternatif untuk membuat Anda sibuk. Situs web ini menawarkan sejumlah makalah bagus untuk memulai, meskipun setelah Anda menyelesaikannya, situs ini menawarkan daftar yang lebih panjang - cukup baca makalah yang Anda minati atau terkait dengan bidang 'keahlian' Anda dari Bagian 5. Akan sangat membantu jika Anda menyimpannya catatan harian kecil pembelajaran dari setiap makalah. Jika Anda tidak dapat benar-benar memahami banyak dari makalah penelitian ini, cobalah membaca panduan yang saya tulis ini yang memberikan rincian lebih mudah dicerna dari beberapa inovasi terbaru. Saluran Youtube ini juga memiliki sejumlah penjelasan pengantar makalah, masing-masing dibahas hanya dalam dua menit.
Ikuti pionir: Orang-orang seperti Andrew Ng, Ian Goodfellow, dan Yann LeCunn diwawancarai secara rutin, memberikan perspektif 'pendiri' dari apa yang kita kenal sebagai AI & ML saat ini. Saluran Youtube ini mengumpulkan yang terbaik dari pembicaraan ini, dan menyusunnya menjadi sumber utama - tonton satu kali setiap malam, dan saya jamin Anda akan merasa seperti seorang ahli dalam beberapa minggu.
Tetap up-to-date dengan bidang ini: Wired adalah salah satu platform terbaik bagi siapa pun yang tertarik dengan teknologi. Ini menerbitkan banyak cerita terkait AI setiap hari (meskipun bukankah semua orang saat ini?), yang dapat ditemukan di sini. Ini adalah cara cepat dan menarik untuk memahami tren saat ini. Alternatifnya, berlangganan bot Facebook Messenger TechCrunch - bot ini sering kali memuat artikel terkait AI yang menarik, dan memberi Anda informasi setiap hari.
Pahami implikasinya: Tidak ada cara yang lebih baik untuk melakukan hal ini selain mendengarkan pembicaraan TED. Pembicara mereka sangat berpengetahuan di bidangnya, dan penekanan pada AI dalam pidato mereka semakin meningkat. Koleksi videonya bisa dilihat di sini.
Filosofi: AI mempunyai pendukung dan penentangnya. Namun, filosofi di baliknya sangat menarik. Buku favorit saya yang mengeksplorasi bidang ini, dan cocok untuk siswa sekolah menengah, termasuk 'How to Create a Mind' oleh Ray Kurzweil dan 'Life 3.0' oleh Max Tegmark - cobalah. Mereka melihat perkembangan AI dalam jangka panjang, yang mungkin tidak terasa relevan dalam kehidupan sehari-hari, namun membantu memahami konteks teknologi yang lebih luas secara keseluruhan.
Berkontribusi: Jika Anda adalah tipe orang yang suka belajar dari pengalaman orang lain, lihatlah jalur wacana seperti grup Facebook ini, di mana orang-orang secara teratur memposting artikel dan makalah berwawasan luas yang berkaitan dengan kemajuan di bidang tersebut. Atau, untuk percakapan yang lebih santai, lihat subreddit tentang AI seperti ini.
Pelajari matematika: Ya, Anda memerlukan dasar-dasar matematika tingkat universitas untuk melakukan hal ini, tetapi jika Anda seorang siswa matematika yang kuat, tidak ada yang menghentikan Anda untuk mengambil beberapa kursus online. Microsoft memiliki kursus gratis yang saya pernah dengar manfaatnya, dan hanya memerlukan matematika tingkat sekolah menengah. Thread Quora ini juga memiliki beberapa sumber bagus yang harus Anda periksa. 3Blue1Brown juga merupakan nama terkenal di komunitasnya, karena video Youtube-nya sangat bagus untuk mempelajari matematika (terutama aljabar linier dan kalkulus) di balik beberapa konsep yang lebih rumit.
Saya sudah mendengar terlalu banyak orang yang mengatakan kepada saya bahwa mempelajari Pembelajaran Mesin dan Kecerdasan Buatan terlalu sulit bagi siswa sekolah menengah untuk tidak menulis ini - dengan jalur pembelajaran yang sudah mapan, hal ini dapat dipelajari oleh siapa saja. Dan dengan itu, saya mendoakan yang terbaik bagi semua orang dalam menempuh jalur pembelajaran ini.
Jika Anda memiliki tambahan atau kemungkinan perbaikan pada panduan ini, silakan membuat PR pada repositori ini. Dan untuk masukan, kolaborasi, atau sekadar pertanyaan umum, silakan menulis kepada saya @ [email protected].