pip install numpy
)pip install pandas
)pip install scikit-learn
)pip install scipy
)pip install statsmodels
)pip install matplotlib
)pip install seaborn
)pip install sympy
)pip install flask
)pip install wtforms
)pip install tensorflow>=1.15
)pip install keras
)pip install pdpipe
)제가 Heartbeat 매거진(Medium 플랫폼)에 쓴 이 기사로 시작해 보세요.
NumPy, Pandans, Seaborn, Matplotlib 등의 주제에 대한 광범위한 기능과 작업을 다루는 Jupyter 노트북입니다.
Python에서 선형 회귀를 수행하는 여러 가지 방법과 속도 비교(freeCodeCamp에 쓴 기사 확인)
정규화를 사용한 다변량 회귀
scikit-learn 파이프라인 기능을 사용한 다항식 회귀( Towards Data Science 에 쓴 기사 확인)
의사결정 트리 및 Random Forest 회귀(Random Forest가 과적합을 거부하는 강력하고 정규화된 메타 추정기로 어떻게 작동하는지 보여줌)
선형 회귀 문제에 대한 자세한 시각적 분석 및 적합도 진단 테스트
Scikit-learn의 HuberRegressor
사용한 강력한 선형 회귀
k -최근접 이웃 분류(여기 노트북이 있습니다)
의사결정 트리 및 랜덤 포레스트 분류(여기 노트북이 있습니다)
지원 벡터 머신 분류(여기 노트북이 있습니다)( SVM 및 정렬 알고리즘에 대한 데이터 과학을 향하여 제가 쓴 기사를 확인하세요)
K -클러스터링을 의미합니다(여기 노트북이 있습니다).
선호도 전파(시간 복잡도와 감쇠 요인의 효과 표시)(여기 노트북이 있습니다)
평균 이동 기술(시간 복잡성과 클러스터 검색에 대한 노이즈의 영향 표시)(여기 노트북이 있습니다)
DBSCAN(k-평균이 수행하지 못하는 클러스터 모양에 관계없이 일반적으로 고밀도 영역을 감지할 수 있는 방법을 보여줌)(여기 노트북이 있습니다)
최적의 클러스터 수를 선택하는 방법을 보여주는 Dendograms를 사용한 계층적 클러스터링(여기 노트북이 있습니다)
Sympy 패키지를 사용하여 기호 수학 표현식을 사용하여 무작위 데이터 세트를 생성하는 방법.
이 주제에 대한 Medium 기사는 다음과 같습니다. 기호 표현을 사용한 무작위 회귀 및 분류 문제 생성
간단한 HTTP 서버 인터페이스를 통해 선형 회귀 모델을 제공합니다. 사용자는 Python 스크립트를 실행하여 예측을 요청해야 합니다. Flask
와 Gunicorn
사용합니다.
사용자가 매개변수를 입력하고 버튼을 클릭하여 사전 훈련된 RNN 모델을 기반으로 텍스트를 생성할 수 있는 웹 양식이 포함된 HTTP 웹페이지를 통해 순환 신경망(RNN)을 제공합니다. Flask
, Jinja
, Keras
/ TensorFlow
, WTForms
사용합니다.
Scikit-learn과 유사한 추정기를 직접 구축하고 개선하여 기계 학습 컨텍스트에서 핵심 OOP 원칙 중 일부를 구현합니다.
이 주제에 대한 Medium의 내 기사를 참조하십시오.
기계 학습 모델을 위한 단위 테스트 코드/모듈을 작성하는 방법을 이해하려면 Pytest 디렉터리의 파일과 자세한 지침을 확인하세요.
메모리 공간 및 컴퓨팅 시간에 대한 데이터 과학 코드 및 ML 모델을 프로파일링하는 것은 중요하지만 종종 간과되는 영역입니다. 다음은 아이디어를 보여주는 몇 가지 노트북입니다.