? Ranked as one of the top data science repositories on GitHub!
기계 학습을 배우는 데 필요한 기술, 도구, 모범 사례 및 모든 것!
완전한 기계 학습 패키지는 Python 프로그래밍, 데이터 조작, 데이터 분석, 데이터 시각화, 데이터 정리, 고전 기계 학습, 컴퓨터 비전 및 자연어 처리(NLP)에 관한 35개의 노트북을 포함하는 포괄적인 저장소입니다.
모든 노트북은 독자를 염두에 두고 만들어졌습니다. 모든 노트북은 다루는 특정 알고리즘/개념에 대한 높은 수준의 개요로 시작됩니다. 가능하면 시각적인 요소를 사용하여 상황을 명확하게 합니다.
2023년 5월 10일: MLOps에 대한 종합 가이드가 추가되었습니다. 가이드를 즐겨보세요!!
2022년 6월 23일: 많은 사람들이 패키지를 어떻게 지원할 수 있는지 문의했습니다. 커피 한잔 사셔도 됩니다 ☺️
2022년 5월 18일: 이제 완전한 기계 학습 패키지를 웹에서 사용할 수 있습니다. 이제 모든 노트를 쉽게 볼 수 있습니다!
2022년 4월 9일: 추가 사항과 리소스를 추가하여 사전 훈련된 컨볼루션 신경망을 사용한 전이 학습을 업데이트했습니다.
2021년 11월 25일: 머신러닝 기초 업데이트: 소개 노트, ML 시스템 설계 워크플로, 학습 시스템 과제가 추가되었습니다.
다음은 완전한 기계 학습 패키지에서 다루는 도구입니다. 이는 대부분의 기계 학습 엔지니어와 데이터 과학자가 어떤 방식으로든 매일 필요로 하는 인기 있는 도구입니다.
Python은 데이터 커뮤니티에서 많은 인기를 얻은 고급 프로그래밍 언어이며 라이브러리와 프레임워크의 급속한 성장으로 ML을 수행하는 데 적합한 프로그래밍 언어입니다.
NumPy는 배열 또는 행렬 연산에 사용되는 과학 컴퓨팅 도구입니다.
Pandas는 다양한 소스의 데이터를 분석하고 조작하기 위한 훌륭하고 간단한 도구입니다.
Matplotlib는 Python에서 정적, 애니메이션 및 대화형 시각화를 만드는 데 사용되는 포괄적인 데이터 시각화 도구입니다.
Seaborn은 사용하기 매우 간단한 Matplotlib 위에 구축된 또 다른 데이터 시각화 도구입니다.
Scikit-Learn: 처음부터 기계 학습 모델을 구축하는 대신 Scikit-Learn을 사용하면 몇 줄의 코드로 기존 모델을 쉽게 사용할 수 있습니다. 이 도구는 스타트업부터 대기업까지 거의 모든 ML 커뮤니티 및 업계에서 채택되었습니다.
딥 러닝을 위한 TensorFlow 및 Keras: TensorFlow는 컴퓨터 비전 및 자연어 처리와 같은 다양한 분야에 적합한 모델을 구축하는 데 사용되는 인기 있는 딥 러닝 프레임워크입니다. Keras는 딥러닝 모델을 쉽게 설계할 수 있게 해주는 고급 신경망 API입니다. TensorFlow와 Keras는 TensorBoard, TF Datasets, TensorFlow Lite, TensorFlow Extended, TensorFlow Hub, TensorFlow.js, TensorFlow GNN 등과 같은 도구를 포함하는 훌륭한 커뮤니티와 생태계를 보유하고 있습니다.
[ 여기에서 NumPy에 대한 자세한 내용을 확인할 수 있습니다 .]
탐색적 데이터 분석
데이터 준비 소개
범주형 기능 처리
기능 스케일링
누락된 값 처리
기계 학습을 위한 Scikit-Learn 소개
회귀를 위한 선형 모델
분류를 위한 선형 모델
서포트 벡터 머신: 소개와 회귀
분류를 위한 서포트 벡터 머신
의사결정 트리: 소개 및 회귀
분류를 위한 결정 트리
랜덤 포레스트: 소개 및 회귀
분류를 위한 랜덤 포레스트
랜덤 포레스트 너머: 더 많은 앙상블 모델
KMeans 클러스터링을 사용한 비지도 학습 소개
주성분 분석에 대한 실용적인 소개
인공 신경망 소개
왜 딥러닝인가
단일 레이어 신경망
활성화 기능
딥 러닝 아키텍처의 유형
심층 신경망 훈련의 과제
딥 러닝을 위한 TensorFlow 소개
TensorFlow를 사용한 회귀용 신경망
TensorFlow를 사용한 분류를 위한 신경망
CNN(Convolutional Neural Networks)을 사용한 컴퓨터 비전 소개
실제 데이터 및 이미지 확대를 위한 ConvNet
사전 훈련된 컨벌루션 신경망을 사용한 전이 학습
[업데이트된 전이학습 노트북은 여기에서 확인하세요]
TensorFlow를 사용한 NLP 및 텍스트 처리 소개
단어 임베딩을 사용하여 텍스트 표현
순환 신경망(RNN)
텍스트 분류를 위해 컨볼루셔널 신경망 사용
텍스트 분류를 위해 사전 학습된 BERT 사용
이 리포지토리에 사용되는 많은 데이터세트는 다음 소스에서 가져온 것입니다.
머신러닝 커뮤니티는 매우 활발합니다. 완전한 기계 학습 패키지를 사용하면 시작할 수 있지만 그것만으로는 충분하지 않습니다. 다행히도 훌륭한 학습 리소스가 많이 있으며 그 중 일부는 유료이거나 무료로 사용할 수 있습니다. 많은 사람들이 자주 추천하는 강좌 목록입니다. 수강 순서대로 나열되어 있지 않습니다.
Coursera의 기계 학습 : 이 과정은 Andrew Ng가 가르쳤습니다. 가장 인기 있는 기계 학습 과정 중 하나이며 400만 명이 넘는 사람들이 이 과정을 수강했습니다. 이 과정에서는 기계 학습 기술과 알고리즘의 기본 사항에 대해 더 중점을 둡니다. Coursera에서는 무료입니다.
딥 러닝 전문화 : Andrew Ng.가 강의하는 딥 러닝 전문화 역시 기초 기반 과정입니다. 컨볼루션 신경망 및 순환 신경망과 같은 주요 딥 러닝 아키텍처의 적절한 기초를 가르칩니다. 전체 과정은 Coursera에서 청강하거나 Youtube에서 무료로 시청할 수 있습니다.
MIT 딥러닝 입문 : 이 과정은 매우 짧은 시간에 딥러닝의 기초를 제공합니다. 각 강의는 1시간 미만이지만 자료는 여전히 수업 중 최고입니다. 강좌 페이지는 여기에서, 강의 영상은 여기에서 확인하세요.
MIT 데이터 중심 AI 소개 : DCAI에 대한 최초의 강좌입니다. 이 수업에서는 분류와 같은 지도 학습 작업에 사용되는 데이터에 중점을 두고 ML 데이터에서 일반적인 문제를 찾아 수정하고 더 나은 데이터 세트를 구성하는 알고리즘을 다룹니다. 이 과정에서 가르치는 모든 자료는 매우 실용적이며 특정 모델의 작동 방식에 대한 수학적 세부 사항보다는 실제 ML 애플리케이션의 영향을 미치는 측면에 중점을 둡니다. 이 과정을 통해 대부분의 ML 수업에서 다루지 않는 실용적인 기술을 배울 수 있습니다. 이는 많은 실제 ML 애플리케이션을 괴롭히는 "가비지 인, 가비지 아웃" 문제를 완화하는 데 도움이 됩니다. 여기에서 강좌 페이지를 확인하고, 여기에서 강의 비디오를 확인하고, 여기에서 실습 과제를 확인하세요.
NYU 딥 러닝 봄 2021 : Alfredo Canziani의 Yann LeCun이 NYU에서 가르치는 이 과정은 가장 창의적인 과정 중 하나입니다. 자료는 놀라운 방식으로 제공됩니다. 여기에서 강의 비디오를 확인하고 여기에서 강좌 저장소를 확인하세요.
CS231N: 시각적 인식을 위한 컨볼루셔널 신경망(Stanford 제작) : CS231N은 최고의 딥 러닝 및 컴퓨터 비전 강좌 중 하나입니다. 2017년 버전은 Fei-Fei Li, Justin Johnson, Serena Yeung이 가르쳤습니다. 2016년 버전은 Fei-Fei, Johnson, Andrej Karpathy가 가르쳤습니다. 2017년 강의 영상은 여기에서, 기타 자료는 여기에서 확인하세요.
CS224N: 스탠포드 딥러닝을 통한 자연어 처리 : 자연어 처리에 관심이 있다면 이 강좌를 수강하면 좋습니다. 세계적인 NLP 스타 중 한 명인 Christopher Manning이 강의합니다. 강의 영상은 여기에서 확인하세요.
fast.ai가 제공하는 Practical Deep Learning for Coders : 이 과정은 딥 러닝 아키텍처와 기술의 전체 스펙트럼을 다루는 집중 딥 러닝 과정이기도 합니다. 강의 비디오와 노트북과 같은 기타 리소스가 코스 페이지입니다.
MLOps(생산을 위한 기계 학습 엔지니어링) 전문 분야 : Andrew Ng., Laurence Moroney 및 Robert Crowe가 가르치는 최고의 ML 엔지니어링 과정 중 하나입니다. 엔드투엔드 기계 학습 생산 시스템을 설계하고, 효율적인 데이터 및 모델링 파이프라인을 구축하고, 생산에 모델을 배포하는 방법을 가르칩니다. Coursera에서 강좌를 찾아보고 Github에서 기타 강좌 자료를 찾아보세요.
풀 스택 딥 러닝 : 대부분의 기계 학습 과정이 모델링에 중점을 두는 반면, 이 과정은 기계 학습 시스템 출시에 중점을 둡니다. 기계 학습 프로젝트 설계, 데이터 관리(저장, 액세스, 처리, 버전 관리 및 레이블 지정), 기계 학습 모델 교육, 디버깅 및 배포 방법을 가르칩니다. 여기에서 2021년 버전을, 여기에서 2019년 버전을 확인하세요. 또한 프로젝트 쇼케이스를 훑어보고 학습자 프로젝트를 통해 강좌 결과의 종류를 확인할 수도 있습니다.
다음은 몇 가지 멋진 기계 학습 책입니다.
백 페이지짜리 기계 학습 책 : Andriy Burkov가 저술한 이 책은 인터넷에서 찾을 수 있는 가장 짧지만 간결하고 잘 쓰여진 책 중 하나입니다. 여기에서 책을 무료로 읽을 수 있습니다.
기계 학습 공학 : Andriy Burkov가 저술한 이 책은 데이터 수집, 준비부터 모델 제공 및 유지 관리에 이르기까지 기계 학습 워크플로의 각 단계를 설명하는 또 다른 훌륭한 기계 학습 책입니다. 이곳에서는 책도 무료입니다.
Machine Learning Yearning : Andrew Ng.가 집필한 이 책에는 효과적인 학습 시스템을 구축하기 위한 다양한 전략이 담겨 있습니다. 읽기 쉽고 기계 학습 엔지니어에게 적합하지 않은 작은 부분으로 분할되어 있습니다. 데이터 과학 및 기계 학습 팀에서 일하는 사람이라면 누구에게나 이 책이 도움이 될 것입니다. 공식 도서는 여기에서 무료로 제공되지만, 가입하지 않고도 여기에서 읽거나 다운로드할 수 있습니다.
Scikit-Learn, Keras 및 TensorFlow를 사용한 실습형 기계 학습 : Aurelion Geron이 저술한 이 책은 최고의 기계 학습 서적 중 하나입니다. 명확하게 작성되었으며 아이디어와 모범 사례가 가득합니다. 여기에서 책을 구하거나 여기에서 해당 저장소를 볼 수 있습니다.
딥 러닝 : 딥 러닝의 전설 3인인 Ian Goodfellow, Yoshua Bengio, Aaron Courville이 집필한 이 책은 무료로 제공되는 훌륭한 딥 러닝 도서 중 하나입니다. 여기에서 얻을 수 있습니다.
Deep Learning with Python : Keras 디자이너인 Francois Chollet이 저술한 이 책은 매우 포괄적인 딥 러닝 책입니다. 책은 여기에서, 책 저장소는 여기에서 얻을 수 있습니다.
Dive into Deep Learning : 이 책은 무료로 제공되는 훌륭한 딥러닝 책이기도 합니다. 이 책에서는 PyTorch와 TensorFlow를 모두 사용합니다. 여기서 책 전체를 읽을 수 있습니다.
Neural Networks and Deep Learning : 이 책은 Michael Nielsen이 쓴 또 다른 훌륭한 딥 러닝 온라인 책입니다. 여기서 책 전체를 읽을 수 있습니다.
더 많은 머신러닝 및 딥러닝 리소스에 관심이 있다면 여기, 여기, 여기에서 찾아보실 수 있습니다.
@article{Nyandwi2021MLPackage,
title = "Complete Machine Learning Package",
author = "Nyandwi, Jean de Dieu",
journal = "GitHub",
year = "2021",
url = "https://nyandwi.com/machine_learning_complete",
}
이 저장소는 Jean de Dieu Nyandwi가 만들었습니다. Twitter, LinkedIn, Medium 및 Instagram에서 그를 찾을 수 있습니다.