Siraj Raval이 제안한 100일간의 머신러닝 코딩
여기에서 데이터세트를 가져옵니다.
여기에서 코드를 확인하세요.
여기에서 코드를 확인하세요.
여기에서 코드를 확인하세요.
오늘 #100DaysOfMLCode로 나아가면서 실제로 로지스틱 회귀가 무엇인지, 그리고 그 뒤에 관련된 수학이 무엇인지에 대해 더 깊이 살펴보았습니다. 비용 함수를 계산하는 방법과 경사하강법 알고리즘을 비용 함수에 적용하여 예측 오류를 최소화하는 방법을 배웠습니다.
시간이 부족하여 이제 격일로 인포그래픽을 게시하겠습니다. 또한 누군가가 코드 문서 작성에 도움을 주고 싶어하고 이미 해당 분야에 대한 경험이 있고 github용 Markdown을 알고 있다면 LinkedIn에서 저에게 연락해주세요 :).
여기에서 코드를 확인하세요.
#100DaysOfMLCode 로지스틱 회귀에 대한 통찰력을 지우기 위해 인터넷에서 리소스나 기사를 검색하던 중 Saishruthi Swaminathan이 쓴 이 기사(https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc)를 발견했습니다.
로지스틱 회귀에 대한 자세한 설명을 제공합니다. 꼭 확인해 보세요.
SVM이 무엇인지, 분류 문제를 해결하는 데 어떻게 사용되는지에 대한 직관을 얻었습니다.
SVM 작동 방식과 K-NN 알고리즘 구현 방법에 대해 자세히 알아봤습니다.
분류를 위해 K-NN 알고리즘을 구현했습니다. #100DaysOfMLCode 지원 벡터 머신 인포그래픽이 절반 정도 완료되었습니다. 내일 업데이트하겠습니다.
오늘 #100DaysOfMLCode를 계속하면서 Naive Bayes 분류기를 살펴봤습니다. 또한 scikit-learn을 사용하여 Python으로 SVM을 구현하고 있습니다. 곧 코드를 업데이트하겠습니다.
오늘은 선형적으로 관련된 데이터에 SVM을 구현했습니다. Scikit-Learn 라이브러리를 사용했습니다. Scikit-Learn에는 이 작업을 수행하는 데 사용하는 SVC 분류기가 있습니다. 다음 구현에서는 커널 트릭을 사용할 예정입니다. 여기에서 코드를 확인하세요.
다양한 유형의 나이브 베이즈 분류기에 대해 알아봤습니다. Bloomberg의 강의도 시작되었습니다. 재생 목록의 첫 번째는 Black Box Machine Learning이었습니다. 예측 함수, 특징 추출, 학습 알고리즘, 성능 평가, 교차 검증, 샘플 편향, 비정상성, 과적합 및 하이퍼파라미터 튜닝에 대한 전체 개요를 제공합니다.
Scikit-Learn 라이브러리를 사용하여 데이터 포인트를 더 높은 차원으로 매핑하여 최적의 초평면을 찾는 커널 기능과 함께 SVM 알고리즘을 구현했습니다.
하루에 1주차와 2주차 전체를 완료했습니다. 신경망으로 로지스틱 회귀를 배웠습니다.
딥러닝 전문과정 1을 수료했습니다. Python으로 신경망을 구현했습니다.
Yaser Abu-Mostafa 교수의 Caltech 기계 학습 과정 - CS 156 18강 중 1강을 시작했습니다. 기본적으로 앞으로 진행될 강의에 대한 소개였습니다. 그는 또한 퍼셉트론 알고리즘에 대해서도 설명했습니다.
심층 신경망 개선: 초매개변수 조정, 정규화 및 최적화의 1주차를 완료했습니다.
모델 구축을 위한 데이터를 수집하기 위해 Beautiful Soup을 사용하여 웹 스크래핑을 수행하는 방법에 대한 몇 가지 튜토리얼을 시청했습니다.
Caltech의 기계 학습 과정 18개 중 2번째 강의 - Yaser Abu-Mostafa 교수의 CS 156. 회프딩 불평등에 대해 알아봤습니다.
Bloomberg ML 과정의 Lec 3에서는 입력 공간, 행동 공간, 결과 공간, 예측 기능, 손실 기능 및 가설 공간과 같은 핵심 개념 중 일부를 소개했습니다.
여기에서 코드를 확인하세요.
YouTube 3Blue1Brown에서 놀라운 채널을 찾았습니다. Essence of Linear Algebra라는 재생목록이 있습니다. 벡터, 선형 조합, 스팬, 기본 벡터, 선형 변환 및 행렬 곱셈에 대한 전체 개요를 제공하는 4개의 비디오를 완성하는 것으로 시작되었습니다.
재생목록 링크는 여기에 있습니다.
3D 변환, 행렬식, 역행렬, 열 공간, 널 공간 및 비정사각형 행렬 주제를 논의하는 다음 4개의 비디오가 완성된 재생 목록으로 계속됩니다.
재생목록 링크는 여기에 있습니다.
3Blue1Brown의 재생 목록에는 선형 대수학의 본질에 대한 또 다른 3개의 비디오가 완성되었습니다. 다루는 주제는 내적(Dot Product)과 교차곱(Cross Product)이었습니다.
재생목록 링크는 여기에 있습니다.
오늘 전체 재생목록(동영상 12-14)을 완료했습니다. 선형 대수학의 개념을 새롭게 바꿔주는 정말 놀라운 재생목록입니다. 다루는 주제는 기저 변경, 고유벡터와 고유값, 추상 벡터 공간이었습니다.
재생목록 링크는 여기에 있습니다.
3blue1brown의 재생목록 완성 - 선형 대수학의 본질 동일한 채널 3Blue1Brown의 동영상 시리즈에 관해 YouTube에서 다시 제안이 나타났습니다. 선형 대수학에 관한 이전 시리즈에 이미 깊은 인상을 받았기 때문에 나는 곧바로 그 시리즈로 뛰어들었습니다. 파생상품, 연쇄법칙, 곱법칙, 지수미분 등의 주제로 약 5개의 영상을 완성했습니다.
재생목록 링크는 여기에 있습니다.
Essence of Calculus 재생목록에서 암시적 미분 및 극한 주제에 대한 2개의 비디오를 시청했습니다.
재생목록 링크는 여기에 있습니다.
통합 및 고차 파생 상품과 같은 주제를 다루는 나머지 4개의 비디오를 시청했습니다.
재생목록 링크는 여기에 있습니다.
여기에서 코드를 확인하세요.
3Blue1Brown 유튜브 채널의 신경망에 관한 놀라운 비디오. 이 비디오는 신경망에 대한 좋은 이해를 제공하고 필기 숫자 데이터 세트를 사용하여 개념을 설명합니다. 동영상으로 연결됩니다.
3Blue1Brown 유튜브 채널의 신경망 2부. 이 영상은 Gradient Descent의 개념을 흥미로운 방식으로 설명합니다. 169 꼭 시청하고 적극 추천합니다. 동영상으로 연결됩니다.
3Blue1Brown 유튜브 채널의 신경망 3부. 이번 영상에서는 부분도함수와 역전파에 대해 주로 다룹니다. 동영상으로 연결됩니다.
3Blue1Brown 유튜브 채널의 신경망 4부. 여기서 목표는 좀 더 공식적인 용어로 역전파가 어떻게 작동하는지에 대한 직관을 표현하는 것이며 비디오 moslty에서는 편도함수와 역전파에 대해 논의합니다. 동영상으로 연결됩니다.
동영상으로 연결됩니다.
동영상으로 연결됩니다.
동영상으로 연결됩니다.
동영상으로 연결됩니다.
비지도학습(Unsupervised Learning)으로 옮겨 클러스터링(Clustering)에 대해 공부했습니다. 내 웹사이트 작업 중 avikjain.me를 확인하세요. 또한 K - Means Clustering 링크를 쉽게 이해하는 데 도움이 될 수 있는 멋진 애니메이션을 찾았습니다.
K 평균 클러스터링을 구현했습니다. 여기에서 코드를 확인하세요.
JK VanderPlas의 새 책 "Python Data Science HandBook"이 있습니다. 여기에서 Jupyter 노트북을 확인하세요.
2장: Numpy 소개부터 시작했습니다. 데이터 유형, Numpy 배열, Numpy 배열 계산과 같은 주제를 다룹니다.
코드를 확인하세요 -
NumPy 소개
Python의 데이터 유형 이해
NumPy 배열의 기본
NumPy 배열 계산: 범용 함수
2장: 집계, 비교 및 브로드캐스팅
노트북 링크:
집계: 최소, 최대 및 그 사이의 모든 것
배열 계산: 브로드캐스팅
비교, 마스크 및 부울 논리
Chapter 2 : 멋진 인덱싱, 배열 정렬, 구조화된 데이터
노트북 링크:
멋진 인덱싱
배열 정렬
구조화된 데이터: NumPy의 구조화된 배열
3장: Pandas를 사용한 데이터 조작
Pandas 개체, 데이터 인덱싱 및 선택, 데이터 작업, 누락된 데이터 처리, 계층적 인덱싱, ConCat 및 추가와 같은 다양한 주제를 다룹니다.
노트북 링크:
Pandas를 사용한 데이터 조작
Pandas 개체 소개
데이터 인덱싱 및 선택
Pandas의 데이터 작업
누락된 데이터 처리
계층적 인덱싱
데이터세트 결합: 연결 및 추가
3장: 병합 및 조인, 집계 및 그룹화, 피벗 테이블 주제를 완료했습니다.
데이터세트 결합: 병합 및 조인
집계 및 그룹화
피벗 테이블
3장: 벡터화된 문자열 연산, 시계열 작업
노트북 링크:
벡터화된 문자열 작업
시계열 작업
고성능 Pandas: eval() 및 query()
4장: Matplotlib를 사용한 시각화 단순 선 도표, 단순 산점도, 밀도 및 등고선 도표에 대해 배웠습니다.
노트북 링크:
Matplotlib를 사용한 시각화
단순 선 도표
단순 산점도
오류 시각화
밀도 및 등고선 도표
4장: Matplotlib를 사용한 시각화 히스토그램, 플롯 범례, 색상 막대를 사용자 정의하는 방법 및 다중 하위 플롯 구축 방법에 대해 배웠습니다.
노트북 링크:
히스토그램, 비닝 및 밀도
플롯 범례 사용자 정의
컬러바 사용자 정의
다중 서브플롯
텍스트 및 주석
4장: Mathplotlib의 3차원 플로팅을 다룹니다.
노트북 링크:
Matplotlib의 3차원 플로팅
계층적 클러스터링에 대해 공부했습니다. 이 놀라운 시각화를 확인해 보세요.