안녕하세요. 저는 싱가포르에 거주하는 고등학생 Karan입니다. 지난 1년 동안 인공지능(AI)과 머신러닝(ML) 분야를 탐구하면서 저는 이 분야에는 고등학생을 위해 특별히 만들어진 학습 경로가 없다고 생각합니다. 이것은 하나를 만들려는 나의 시도입니다.
이 분야로 여행을 시작한 이후로 저는 유튜브 비디오를 보든, 개인 프로젝트를 수행하든, 아니면 단순히 책을 읽든, 매일 두 시간씩 가능한 한 많이 이해하려고 노력했습니다. 나는 나보다 훨씬 더 많은 경험을 가진 선배들의 지도를 받았지만 그러한 지도가 모든 사람에게 제공될 수는 없다는 것을 알고 있습니다. 따라서 이것은 모든 학습 내용을 하나의 구체적인 문서로 전달하려는 나의 시도입니다.
이 안내서에 제가 정리한 모든 정보는 앞으로 이 분야에서 뛰어난 성과를 거두기를 원하는 고등학생을 위한 것입니다. 이는 연대순으로 따르도록 의도되었으며, 제가 접한 대부분의 가이드/학습 경로와는 달리 선형 대수학, 편도함수 및 고등학교 강의 계획서에서 찾을 수 없는 기타 복잡한 수학 개념에 대한 이해가 필요하지 않습니다 . 그러나 여기에는 기계 학습에 필수적인 수학의 기초를 다루는 과정이 포함되어 있습니다. 이 수준은 고등학교 수학과 비교할 수 있는 수준입니다. 이 길을 꾸준히 따라가다 보면 3개월 정도면 어느 정도 능숙한 수준에 도달할 수 있다고 생각합니다. 그러나 이 학습 경로는 고등학교 시절 남은 시간 동안 학습을 계속할 수 있는 콘텐츠를 제공합니다.
그럼 시작해 보겠습니다.
Python은 AI/ML 도메인에서 사용될 때 대부분의 기준을 충족하는 언어이므로 시작점으로 Python을 강력히 추천합니다. 배우기 매우 쉬울 뿐만 아니라 거의 모든 기본 알고리즘에 대한 라이브러리와 프레임워크를 제공합니다. 분야에서 알려졌습니다. R이 유용하기는 하지만 Python은 가독성과 학습성 측면에서 고등학생에게 훨씬 더 적합하다고 생각합니다. 기본 프로그래밍 외에도 특히 기계 학습의 경우 가장 유용한 라이브러리는 Numpy, Pandas 및 Matplotlib입니다.
이전에 코딩을 해본 적이 없는 분들에게는 토론토 대학(현재 AI/ML 분야 최고의 대학 중 하나)에서 제공하는 과정을 수강하는 것이 좋습니다. 몇 주가 걸리지만 시간을 투자할 가치가 충분히 있습니다. 이 과정을 통해 얻은 대부분의 지식은 다른 프로그래밍 언어에도 적용할 수 있으며 유일한 차이점은 구문입니다. 강좌는 무료이며 여기에서 확인하실 수 있습니다.
Python 이외의 언어로 코딩 경험이 있는 분들은 Python 구문에 대한 기본적인 이해를 위해 이 튜토리얼을 훑어보세요. 하루 이상 걸리지 않을 것입니다.
ML과 AI는 미적분학, 선형 대수학, 확률, 통계, 최적화와 같은 수학적 원리를 기반으로 구축되었습니다. 많은 희망적인 AI 실무자(나와 같은)는 이것이 어렵다고 생각합니다. 기계 학습을 위한 edX 필수 수학: Microsoft의 Python 에디션에 대한 이 과정은 여러분을 수학자로 만들기 위해 고안되지 않았습니다. 오히려 몇 가지 필수적인 기본 개념과 이를 표현하는 데 사용되는 표기법을 배우는 데 도움을 주는 것을 목표로 합니다. 이 과정에서는 데이터 작업에 대한 실습 접근 방식을 제공하고 실제 문제 설정에서 배운 기술을 적용합니다. 재정 지원이 필요한 사람들은 재정적 지원을 받을 수 있습니다.
이제 Python의 기본 사항을 배운 후에는 주로 데이터 조작, 표현 및 저장에 사용되는 현장에서 사용되는 두 가지 기본 라이브러리인 Numpy 및 Pandas를 이해해야 합니다. 이 분야의 세 번째 '핵심' 라이브러리인 Matplotlib는 그래프와 다이어그램을 통해 이 데이터를 시각화하는 데 사용됩니다. 이에 대해서는 나중에 다루겠습니다. Numpy와 Pandas라는 두 가지 코스를 함께 사용하면 며칠 이상 걸리지 않습니다.
이것을 뒷주머니에 넣고 이제 기계 학습과 인공 지능을 배우는 데 필요한 핵심 프로그래밍을 설정해야 합니다.
머신러닝을 위한 보편적인 강좌가 하나 있다면 그것은 Andrew Ng의 강좌일 것입니다. 편도함수와 같은 개념을 언급하기 때문에 고등학생에게는 다소 어려워 보일 수 있습니다.
그러나 나는 이 과정을 통해 실질적인 지식을 얻기 위해 이러한 것들을 이해하는 것이 필요하지 않다고 굳게 믿습니다. 저는 3~5주차에 일부 강의를 다시 보는 것이 특히 유익하다는 것을 알았습니다. 이러한 주제는 고급 주제이므로 처음 시청할 때 약간 빠르게 느껴질 수 있습니다. 핵심 수학, 특히 미적분학을 완전히 이해할 수 없더라도 너무 걱정하지 마십시오. 이 중 일부는 확실히 대학 수준의 수학 지식이 필요합니다. Ng 교수가 자신의 지식을 전달할 때 사용하는 사고 과정을 따라갈 수 있는 것이 더 중요합니다. 이를 통해 기계 학습 프로세스의 내부에서 무슨 일이 일어나고 있는지 이해할 수 있기 때문입니다.
배운 내용을 적어두면 전달된 정보를 진정으로 이해하는 데 도움이 되므로 과정 중에 메모하는 것이 좋습니다. 프로그래밍 튜토리얼과 연습을 완료하는 것은 Matlab에서 수행되므로 필수는 아닙니다. Matlab은 매트릭스 기반 언어이므로 이해하기 까다로울 수 있습니다. 하지만 걱정하지 마십시오. 우리는 짧은 시간 안에 Python에서 매우 동일한(그리고 훨씬 더 발전된) 알고리즘을 수행하게 될 것입니다.
이 무료 강좌는 여기에서 찾을 수 있습니다.
이러한 알고리즘의 기초가 되는 대학 수준의 수학 지식 없이 ML 알고리즘을 구현하는 것은 역설적인 작업처럼 들립니다. 그러나 호주 팀이 바로 이 작업을 수행하기 시작했습니다.
'SuperDataScience' 팀의 연구원인 Kirill Eremenko와 Hadelin de Ponteves는 실생활에 간단한 알고리즘을 적용하는 적절한 방법을 찾는 데 정말 뛰어납니다. 게다가 고등학생이 이해할 수 없는 복잡한 수학 없이는 알고리즘의 기능을 이해하기 위해 적절한 깊이로 들어갑니다. 이 과정에서는 Python과 R을 모두 다루지만, 지금은 R에 대해 걱정하지 않겠습니다. 간단히 Python 튜토리얼을 살펴보세요. 또한, 진행 속도가 너무 느리다고 생각되면 이 코스를 1.25배속으로 플레이하세요(저는 그렇게 했고 내 학습에 훨씬 더 적합하다고 생각했습니다).
그들의 강좌는 Udemy에 있으며 유료 버전으로만 제공됩니다. 하지만 Udemy는 정기적으로 강좌에 대해 90% 이상의 할인을 제공합니다. 여기에서 찾을 수 있으며 일반적으로 약 $ 10입니다. 기본 회귀 알고리즘부터 심층 신경망까지 모든 것을 다루고 있으며, 후자는 ChatGPT 및 AlphaFold와 같은 많은 현대 애플리케이션에서 사용되는 핵심 아키텍처입니다. 더 고급 영역을 탐구하고 싶다면 머신 러닝 마지막 부분에 딥 러닝 과정이 90% 할인된 가격으로 제공됩니다.
이 과정 비용을 지불하고 싶지 않다면 여기에서 Google의 무료 딥 러닝 과정을 확인하거나 여기에서 University of Michigan의 무료 과정을 확인하세요. 하지만 제 생각에는 이러한 과정은 SuperDataScience 팀의 과정만큼 다재다능하지 않습니다.
이러한 과정의 경우 메모하는 것이 필수는 아닙니다. 온라인에는 작동 방식에 대한 빠른 직관을 제공하는 수많은 '알고리즘 치트 시트'가 있습니다. 이 웹사이트에는 몇 가지 목록이 나와 있습니다.
광범위한 기계 학습 개념을 다루었으므로 이제 이 지식을 독립적으로 사용하여 일부 프로젝트를 완료해야 할 때입니다. Kaggle과 UCI Machine Learning Repository를 살펴보는 것이 좋습니다. 관심 있는 데이터세트를 찾고, 관련된 문제에 대한 솔루션을 모델링해 보세요. 다양한 알고리즘을 사용해 보고 성능을 최적화하기 위해 노력하세요.
사용하는 데이터세트가 본질적으로 단순하고 깨끗한지 확인하세요. 즉, 작업하는 데 너무 많은 사전 처리나 도메인별 지식이 필요하지 않아야 합니다. 내 머릿속에 있는 몇 가지 쉬운 데이터 세트로는 Iris, Wine, Breast Cancer Wisconsin, Autism Screening, Congress Voting, Handwriting Digits MNIST 및 Fashion MNIST가 있습니다.
막다른 골목에 부딪히면 Stack Overflow가 여러분의 가장 친한 친구입니다. Stack Overflow는 여러분이 갖고 있는 거의 모든 질문에 대한 답변을 제공합니다. 그렇지 않은 경우 하나만 게시하세요. 몇 시간 내에 답변을 받으실 수 있습니다! 이 단계에는 더 이상 다른 것이 없습니다. 전체 모델링 프로세스를 뒤에서 앞으로 진행하는 데 익숙해졌다면 자유롭게 진행하세요!
이제 여러분은 모든 기본 사항에 대해 훌륭하고 폭넓게 이해해야 할 뿐만 아니라 이를 실제 데이터 문제에 적용할 수 있는 능력도 갖추어야 합니다. 그러나 이러한 기본 사항이 ML/AI의 전 세계에 적용되는 것은 아니라는 점을 이해하는 것이 중요합니다. 그 중 다수는 수년 동안 이러한 데이터 문제를 해결하는 방법으로 알려져 있었지만 불행히도 최근에는 실제로 활용할 수 있을 만큼 강력한 컴퓨터가 있었습니다. 합리적인 양의 런타임에 실행됩니다. 이 분야의 대부분의 현대 작업은 이를 다양하고 새로운 방식으로 개선하고 기본 알고리즘을 활용하면서도 다양한 방식으로 이를 개선, 확장 및 강화하는 시스템을 구축하는 데 중점을 둡니다. 따라서 저는 여러분이 머신러닝이라는 더 넓은 분야에서 관심 분야를 찾고, 오늘날과 같은 해당 분야의 최신 기술을 더 많이 경험하기 위해 더 깊이 탐구할 것을 제안합니다. 여러분은 고등학교 재학 중에 제가 설명했던 모든 영역에서 전문가가 될 시간이 없을 것입니다. 하지만 한두 가지를 시도해 보십시오.
이러한 영역에 들어가기 전에 해당 내용을 진정으로 이해하는 것이 좋습니다. 간단한 YouTube 검색을 통해 높은 수준의 설명을 검색하면 필요한 모든 정보를 얻을 수 있습니다. 그럼 시작해 보겠습니다.
컴퓨터 비전: 이 영역은 특수한 유형의 신경망을 사용하여 컴퓨터가 사물을 보고 이해하도록 만드는 것과 관련됩니다. Stanford는 강의, 코스 노트 및 과제를 온라인으로 제공하여 온라인으로 코스를 게시합니다. 이 과정을 진행하되 때때로 수학이 너무 복잡하다는 것에 대해 걱정하지 마십시오. 이 과정은 기본적으로 지식을 심화하기 위한 것이며 필연적으로 그렇게 될 것입니다. 복잡한 작업을 많이 수행하는 컴퓨터 비전 라이브러리인 OpenCV를 살펴볼 수도 있습니다. 여기에서 훌륭한 튜토리얼을 찾을 수 있습니다. 이 작업을 마친 후에는 Kaggle 및 UCI의 고급 이미지 데이터 세트를 살펴보거나 Kaggle 대회에 참가할 수도 있습니다.
자연어 처리: 컴퓨터가 말하는 법을 배우는 방법을 이해하는 것도 오늘날 중요한 주제입니다. 다시 한 번 Stanford는 온라인으로 제공되는 훌륭한 강좌를 여기에서 찾을 수 있습니다. 일부 수학 개념을 이해하지 못하더라도 걱정하지 마세요. 이 영역이 어떻게 작동하는지 이해하시면 됩니다. 구현을 위해 이 Udemy 과정을 수강할 수 있습니다. 그러나 잘 알려진 기계 학습 전문가 Siraj Raval의 동영상을 시청할 수도 있습니다. 이 작업을 수행한 후에는 챗봇 구축, 감정 분석 또는 노래 가사 작성과 같은 간단하고 잘 알려진 프로젝트를 수행해 보십시오. 간단한 Youtube 검색이 도움이 될 것입니다. ChatGPT 및 Claude와 같은 보다 현대적인 애플리케이션은 주로 Transformer 아키텍처를 기반으로 하는 대규모 언어 모델이라는 신경망 기반 시스템을 기반으로 구축되었습니다. Andrew Ng의 이 과정은 좋은 출발점입니다.
강화 학습: 이 도메인은 기계가 특정 환경에서 행동하는 방법을 배우는 방법에 중점을 두고 있으며 가장 널리 사용되는 응용 분야는 비디오 게임 분야입니다. Siraj Raval은 이에 대한 꽤 좋은 재생 목록을 가지고 있으며 여기에서 찾을 수 있습니다. 특히 Tensorflow와 같은 고급 패키지를 사용하는 구현 기반 튜토리얼을 찾고 있다면 Denny Britz가 여기에서 찾을 수 있는 탄탄한 튜토리얼 세트를 제공합니다. David Silver의 UCL 과정도 훌륭하지만 초보자에게는 다소 까다로울 수 있습니다. 여기에서 찾을 수 있습니다. 이 작업이 끝나면 온라인에서 기본 프로젝트나 게임을 다운로드하고 에이전트의 작동 방식을 제어하는 AI 요소를 추가하는 것이 꽤 논리적입니다. 간단한 연습은 간단한 Youtube 검색을 통해 다시 찾을 수 있습니다.
데이터 과학 및 분석: 이 분야는 수많은 흥미로운 취업 기회가 있는 신생 영역이며 대부분의 현대 기업에서 비즈니스 결정을 알리기 위해 수집되는 방대한 데이터에서 통찰력을 얻기 위해 광범위하게 사용됩니다. 간단한 Google 검색으로 데이터 과학에 대한 구체적인 학습 경로를 찾을 수 있지만 SuperDataScience의 유료 과정이나 UC San Diego의 Python 기반 무료 과정을 수강하는 것이 좋습니다. 또한 다음 링크를 사용하여 많은 최신 데이터 분석에 사용되는 접선 언어인 SQL 및 Matplotlib를 배울 수 있습니다. 학생 수준에서 이를 학습할 때 얻을 수 있는 이점은 취업 가능성입니다. 제 고등학교에는 데이터 과학 인턴십을 제안받은 친구들이 많이 있습니다. 이 분야에서 얻은 통찰력은 회사에서 즉시 수익을 창출할 수 있기 때문입니다. 데이터 기반 의사 결정은 실제로 오늘날 기업 세계에서 의사 결정의 유일한 형태입니다.
Boltzmann Machines(추천 시스템에 사용됨), Adversial Networks(AI를 개선하는 AI) 및 Genetic Algorithms(자연 진화와 유사한 방식으로 문제에 대한 솔루션을 개선)와 같은 영역도 있지만 제 생각에는 틈새 시장의 조합입니다. 적용 가능성이 높고 고급 수준의 수학이 필요하므로 출발점으로서 바람직하지 않습니다. 그중 하나에 대한 특별한 열정이 있다면 자유롭게 탐색해 보세요. 하지만 다른 영역만큼 잘 문서화되어 있지 않기 때문에 마스터하는 것이 약간 더 까다로울 수 있습니다.
장기적으로 이 분야에서 일하고 싶다면 보다 전체적인 관점에서 이해하는 것이 중요합니다. 이는 획기적인 발견, 적용 방법에 대한 담론 및 사회에 대한 일반적인 영향에 대해 배우는 것을 의미합니다. 기술이 어떻게 작동하는지에 대한 필요한 이해를 얻은 즉시 이 섹션에 나열된 작업을 시작해야 합니다. 좋은 출발점은 이 학습 경로의 섹션 4를 시작하는 것입니다. 이러한 종류의 정보는 데이터 문제에 대한 알고리즘을 구현하는 데 특별히 도움이 되지 않을 수 있지만 오늘날 세계에 필수적인 기술의 경우 해당 기술의 역할, 진정한 잠재력 및 한계에 대한 보다 확실한 이해를 형성하는 데 실제로 도움이 됩니다.
고등학생이 해당 분야에 대한 일반적인 이해를 심화하고 지식을 더욱 풍부하게 만들기 위해 할 수 있는 몇 가지 일이 있습니다.
연구 논문 읽기를 시작하세요. 저는 이것이 실제로 들리는 것만큼 어렵지 않다는 점을 강조하고 싶습니다. 현대 기술을 지배하는 수학은 매우 발전되어 있을 수 있지만, 단순히 업계 최전선에서 일어나고 있는 일을 접하는 것 자체가 나쁜 것은 아닙니다. 이해하지 못하는 내용을 발견하면 그냥 내려놓으세요. 바쁘게 지낼 수 있는 대안이 충분합니다. 이 웹사이트는 시작하기에 좋은 수많은 논문을 제공하지만, 다 마친 후에는 더 긴 목록을 제공합니다. 섹션 5에서 관심이 있거나 '전문 분야'와 관련된 논문을 읽어보세요. 각 논문의 학습 내용을 담은 작은 일기. 이러한 연구 논문 중 많은 부분을 진정으로 이해할 수 없다면 최근 혁신에 대한 보다 이해하기 쉬운 분석을 제공하는 제가 작성한 이 가이드를 살펴보세요. 이 YouTube 채널에는 논문에 대한 더 많은 소개 설명이 있으며 각각 단 2분 만에 다룹니다.
개척자 팔로우: Andrew Ng, Ian Goodfellow 및 Yann LeCunn과 같은 사람들이 정기적으로 인터뷰를 통해 오늘날 우리가 AI 및 ML로 알고 있는 '창시자'의 관점을 제공합니다. 이 YouTube 채널은 이러한 강연 중 최고의 내용을 모아 중앙 리소스로 정리합니다. 하루에 한 편씩 시청하시면 몇 주 내에 전문가가 된 듯한 느낌을 받으실 것이라고 장담합니다.
해당 분야의 최신 정보 유지: Wired는 기술에 관심이 있는 모든 사람을 위한 최고의 플랫폼 중 하나입니다. 매일 여러 개의 AI 관련 기사를 게시합니다(요즘 모든 사람이 그렇지는 않습니까?). 여기에서 찾을 수 있습니다. 시대의 흐름을 빠르고 쉽게 이해할 수 있는 방법입니다. 또는 TechCrunch의 Facebook 메신저 봇을 구독하세요. 이 봇에는 종종 관심 있는 AI 관련 기사가 있고 매일 정보를 제공하는 메시지가 표시됩니다.
의미를 이해하십시오. 이를 수행하는 데 TED 강연을 듣는 것보다 더 좋은 방법은 없습니다. 그들의 연사는 해당 분야에 대한 지식이 매우 풍부하며 연설에서 AI에 대한 강조가 점점 더 커지고 있습니다. 동영상 모음은 여기에서 확인하실 수 있습니다.
철학: AI에는 지지자와 반대자가 있습니다. 하지만 그 뒤에 숨은 철학은 흥미롭습니다. 이 분야를 탐구하고 고등학생에게 적합한 제가 가장 좋아하는 책으로는 Ray Kurzweil의 'How to Create a Mind'와 Max Tegmark의 'Life 3.0'이 있습니다. 한번 시도해 보세요. 그들은 AI의 보다 장기적인 궤적을 살펴봅니다. 이는 일상적인 관련성이 없다고 느낄 수 있지만 전체적으로 기술의 더 넓은 맥락을 이해하는 데 도움이 됩니다.
기여: 다른 사람의 경험으로부터 배우기를 좋아하는 사람이라면 사람들이 해당 분야의 발전과 관련된 통찰력 있는 기사와 논문을 정기적으로 게시하는 이 Facebook 그룹과 같은 담론의 길을 확인하십시오. 또는 좀 더 일상적인 대화를 원하시면 이와 같은 AI에 대한 하위 레딧을 확인하세요.
수학 탐구: 예, 이를 위해서는 대학 수준의 수학 기초가 필요합니다. 하지만 수학에 능숙한 학생이라면 일부 온라인 강좌를 수강하는 데 방해가 되지 않습니다. Microsoft에는 좋은 소식을 들었던 무료 과정이 있으며 고등학교 수준의 수학만 있으면 됩니다. 이 Quora 스레드에는 확인해야 할 몇 가지 훌륭한 리소스도 있습니다. 3Blue1Brown은 커뮤니티에서도 유명한 이름입니다. 그의 YouTube 동영상은 좀 더 복잡한 개념 뒤에 숨겨진 수학(주로 선형 대수 및 미적분)을 학습하는 데 환상적이기 때문입니다.
나는 기계 학습과 인공 지능을 배우는 것이 고등학생이 이 글을 쓰지 않기에는 너무 무리한 일이라고 말하는 사람들이 너무 많다는 것을 들었습니다. 잘 정비된 학습 경로를 통해 누구나 공부할 수 있습니다. 그리고 모든 사람이 이 학습 경로를 수행하는 데 행운이 있기를 바랍니다.
이 가이드에 추가 사항이나 개선 사항이 있는 경우 이 저장소에 자유롭게 PR을 작성해 주세요. 피드백, 협업 또는 일반적인 질문이 있는 경우 언제든지 저에게 @ [email protected]으로 메일을 보내주세요.