만든 사람 Tang Yudi
이 프로젝트를 구성한 원래 의도는 학생들이 인공 지능 자율 학습 계획을 신속하게 시작하고, 학습 과정에서 우회를 피하고, 가능한 한 빨리 AI를 시작하고 거의 200개의 AI 실습 사례를 시작할 수 있도록 돕는 것입니다. 제가 수집 한 것은 지난 5년간 온라인과 오프라인 교육을 통해 개발하고 축적한 사례입니다. 반복적이고 반복적으로 업데이트되었으며 학생들이 단계별로 학습하고 연습하기에 적합하다고 말할 수 있습니다. 여기 오는 학생들은 별표를 클릭해서 저장하는 것을 잊지 마세요!
2019년 말, 머신러닝 강좌 "디에고와 함께 파이썬 데이터 분석 및 머신러닝 실습 배우기" 지원 교재를 출간했습니다. 그 스타일은 여전히 이해하기 쉽고, 마침내 여러분을 만나기까지 10번 이상의 수정이 걸렸습니다. . 더 많은 학생들이 학습 계획을 빨리 시작할 수 있도록 돕기 위해 이 책의 전자 버전을 무료로 제공하기 로 결정했습니다. 모든 사람에게 학습상의 이점을 가져올 수 있기를 바랍니다! 본 프로젝트 홈페이지에서 PDF 버전을 다운로드하실 수 있습니다. 교재가 마음에 드시면 JD.com에서도 구매하실 수 있습니다.
"Diego와 함께 Python 데이터 분석 및 기계 학습 실습 배우기" PDF 원본 다운로드 :
(네트워크 디스크 링크: https://pan.baidu.com/s/19wzJeyPmwTBDp9ASEWBvFQ 추출 코드: tece )
다음 카탈로그는 학습 경로입니다. 초보자는 이미 카탈로그에 표시된 순서대로 공부하는 것이 좋습니다.
사건에 관련된 데이터는 모두 실제 데이터 세트이며 일부는 상당히 클 것입니다. github에 직접 업로드하는 것은 모든 사람이 다운로드하는 데 매우 느릴 것입니다. 데이터, 코드가 포함된 각 모듈의 네트워크 디스크 링크를 점차적으로 업로드하겠습니다. , PPT 및 기타 학습 리소스. 지원 비디오 설명이 필요한 경우 WeChat을 추가하세요: digexiaozhushou(Di Ge의 Little Assistant 병음)
다양한 측면에서 협력, 커뮤니케이션 또는 프로젝트 문제가 있는 경우 WeChat을 직접 추가할 수 있습니다: digexiaozhushou(Dige Assistant의 병음)
인공지능(데이터 과학)을 배우려면 여전히 몇 가지 기본 기술이 필요합니다. 가장 기본적이고 핵심적인 것은 Python 과 수학 입니다! 두 형제가 시작하는 방법은 어렵지 않습니다. 먼저 기본을 익히고 사용하면서 배워도 괜찮습니다!
Python에 익숙하지 않은 경우 Python 입문 동영상 과정을 시청하여 빠르게 시작하는 것이 좋습니다! 문
가장 직접적인 설명은 누구나 사용한다는 것입니다! 예전에는 객체 지향 프로그래밍이었지만 나중에 사람들은 복사하여 붙여넣는 프로그래밍을 선호했고 이제는 GitHub용으로 프로그래밍하기에는 너무 게으른 것이 사실입니다. ! 이후의 모든 실무 콘텐츠는 Python을 기반으로 하므로 선택의 여지가 없습니다!
아나콘다 이면 충분해요! 아나콘다이면 충분해요! 아나콘다이면 충분해요! 알겠습니다. 자세한 설명은 위의 포털 강좌를 참조하세요.
툴킷은 다른 사람들이 모든 기능을 작성했다는 것을 의미하며, 우리는 이를 직접 호출할 수 있습니다. 그게 전부입니다! 데이터 처리, 분석, 모델링 등을 위한 해당 도구 키트가 있습니다. 학습을 위해 이러한 도구 키트를 먼저 외울 필요는 없으며 반드시 나중에 사용하고 확인해야 합니다.
툴킷 이름 | 기능 개요 |
---|---|
넘피 | 행렬 계산의 필수품! 이는 모든 후속 계산의 핵심이자 데이터 과학 분야의 핵심 툴킷입니다. |
팬더 | 데이터 처리를 위한 필수품! 데이터를 읽고, 처리하고, 분석하는 일은 그 사람이 해야 합니다! |
Matplotlib | 시각화는 필수입니다! 이 기능은 매우 강력합니다. 그릴 수 없는 그림은 없습니다. 분석과 디스플레이에 의존하세요! |
시본 | 더욱 간단한 시각화 도구! 한 줄의 코드로 결과를 시각적으로 표시할 수 있습니다. |
학생들은 특히 인공지능(데이터 과학) 분야에서 수학이 얼마나 중요한지 잘 알고 있어야 합니다. 수학을 모르고는 아무것도 하기 어렵습니다. ? 인공지능 산업이 매우 빠르게 발전하고 있다는 점을 설명해 드리겠습니다. 실제 업무를 하면서 배워야 할 것은 무엇입니까? 현재 뛰어난 논문 중 일부일 것입니다. 기본적인 수학 공식도 이해하지 못한다면 고급 기술에 대해 말할 필요가 없습니다. 이 분야의 학생들은 분명히 이런 생각을 할 것입니다. 소위 인공지능은 단지 데이터에 대해 다양한 수학적 계산을 하는 것일 뿐입니다!
처음부터 시작해서 단계별로 배우는 데 많은 시간을 할애할 필요는 없다고 생각합니다. 예를 들어 동료와 친구들은 이 일을 몇 번이나 했는지 모르겠습니다. 나는 수학을 공부하면서 때때로 수많은 문제를 풀었지만 이 문제에 직면하게 될 것입니다. 많은 지식 포인트를 한동안 보지 않으면 빨리 잊혀질 것입니다. 제가 가장 자주 하는 일 중 하나는 제가 사용하는 모든 것을 검색하는 것입니다. 검색 과정은 실제로 학습과 발전의 과정입니다. 상식적인 지식(고급수학, 선형성, 확률론의 기초)을 빠르게 살펴보는 것이 좋습니다. 이 과정에서는 다양한 문제 해결 과정을 살펴보거나 특정 해결 방법을 고민할 필요가 없습니다. 직설적으로 말하면 공식의 역할과 용도를 이해하면 됩니다. 교과서의 연습 문제 및 연습 문제집의 솔루션과 유사하므로 앞으로는 사용할 필요가 없습니다. 이런 번거로운 일을 계산하려면 펜을 사용하세요. 알고리즘을 공부하는 것이 더 경제적입니다!
지식 포인트 | 콘텐츠 | 효과 |
---|---|---|
고급 수학 | 고급 수학, 미적분학, 테일러 공식, 라그랑주의 기초, | 머신러닝 수식 도출에 필수 |
선형대수학 | 선형대수학, 고유값, 행렬분해의 기초, | 알고리즘 솔루션에 필요 |
확률 이론 | 확률이론의 기초, 확률변수 및 확률추정, 일반적으로 사용되는 분포 | 머신러닝에서는 이러한 단어를 자주 언급합니다. |
통계분석 | 회귀분석, 가설검증, 상관분석, 분산분석 | 데이터 분석에 필수 |
인공지능 분야의 핵심은 머신러닝입니다. 앞으로 어떤 방향을 추구하든 머신러닝부터 시작해야 합니다! 크게 두 가지가 있습니다. 첫 번째는 고전적인 알고리즘의 원리를 익히는 것이고, 두 번째는 실용적인 모델링을 위해 Python 툴킷을 능숙하게 사용하는 것입니다!
알고리즘에 대해 무엇을 배워야 할까요? 모델링 및 솔루션 프로세스를 완료하기 위해 기계 학습 알고리즘이 데이터에서 어떻게 작동하는지 이해합니다. 직설적으로 말하면 이는 알고리즘에서 수학이 사용되는 방식에 익숙해지는 것을 의미합니다. 중요한 것은 이해하는 것입니다! 문제에 대해 끝없이 고민하지 마세요. 시간 낭비이며, 후속 학습 과정에서 단시간에 문제를 해결할 수도 있습니다. 특히 취업 면접을 준비하는 학생들의 경우 알고리즘을 두 번, 세 번 공부하는 것이 일반적이라고 생각합니다. (동급생이 인터뷰 전에 총 6번 공부했다고 말했습니다. )
딥러닝에도 머신러닝이 필요한가요?
딥러닝은 일종의 머신러닝 알고리즘이라고 할 수 있습니다. 그렇다고 신경망에 다른 고전적인 알고리즘이 필요하지 않다는 의미는 아닙니다. 학습 경로는 다양한 작업과 데이터를 기반으로 선택되어야 합니다. 실제로 이러한 고전적인 알고리즘을 익히고 나면 신경망을 보는 것은 정말 쉽습니다!
지식 포인트 | 콘텐츠 | 개요 |
---|---|---|
분류 알고리즘 | 로지스틱 회귀, 의사결정 트리, 서포트 벡터 머신, 앙상블 알고리즘, 베이지안 알고리즘 | 면접을 준비하는 학생들은 마스터해야합니다 |
회귀 알고리즘 | 선형 회귀, 의사결정 트리, 앙상블 알고리즘 | 일부 알고리즘은 분류와 회귀를 모두 수행할 수 있습니다. |
클러스터링 알고리즘 | k-평균, dbscan 등 | 감독되지 않음은 실제로 라벨이 없는 경우에만 고려됩니다. |
차원 축소 알고리즘 | 주성분분석, 선형판별분석 등 | 차원 축소 개념을 이해하는 데 중점을 둡니다. |
고급 알고리즘 | GBDT 부스팅 알고리즘, lightgbm, EM 알고리즘, 숨겨진 마르코프 모델 | 시간과 에너지가 있는 학생은 고급 알고리즘에 도전할 수 있습니다. |
비교 실험을 통해 전통적인 알고리즘 모델링 방법과 매개변수가 결과에 미치는 영향을 분석하고, 실험과 시각적 표시를 통해 알고리즘의 매개변수와 응용 사례를 이해합니다.
사건 이름 | 콘텐츠 개요 |
---|---|
선형 회귀 실험 분석 | 일변량 및 다중 선형 회귀, 비선형 회귀 방법 및 정규화 페널티의 역할을 마스터합니다. |
모델 평가 방법 | 일반적으로 사용되는 분류 및 회귀 알고리즘 평가 방법 비교, 데이터 세트 분할의 예 |
로지스틱 회귀 실험 분석 | 고전적 분류모델 구축방법, 의사결정나무 경계도면 방법 |
클러스터링 알고리즘 실험 분석 | 비지도 모델링 예시, 클러스터링 알고리즘 평가 방법, 비지도 역할 및 적용 예시 |
의사결정 트리 실험 분석 | 나무모형 시각화 사례 및 구축방법, 나무모형의 분류 및 회귀적용 |
통합 알고리즘 실험 분석 | 통합 방식의 적용 사례 및 효과 분석, 공통 통합 전략 비교 |
지원 벡터 머신 실험 분석 | SVM에는 매개변수 및 모델링 비교 실험이 포함됩니다. |
연관 규칙의 실제 분석 | 연관규칙의 필수 지식 포인트 및 모델링 분석 예시 |
알고리즘의 메커니즘을 더 잘 이해하기 위해 우리는 기존 알고리즘을 처음부터 재현하고 패킷 손실 없음 원칙을 고수하며 알고리즘에 필요한 모든 모듈을 단계별로 완성합니다.
주요 목적은 알고리즘의 작동 원리를 더 잘 이해하는 것이며 실습에 중점을 둡니다! 시간이 있는 학생들은 스스로 재현할 수 있지만, 시간이 부족한 학생들은 스스로 할 필요가 없습니다.
사건 이름 | 콘텐츠 개요 |
---|---|
선형 회귀 코드 구현 | 모듈 구축 알고리즘에서 일반적으로 사용되는 기능 |
로지스틱 회귀 코드 구현 | 로지스틱 회귀 구현 방법의 예시 해석 |
Kmeans 코드 구현 | 매우 간단하고 이해하기 쉬운 비지도 알고리즘 |
의사결정 트리 코드 구현 | 트리 모델은 실제로 재귀적 구현입니다. |
신경망 코드 구현 | 코드량이 조금 많기 때문에 디버그 모드를 익히는 것을 권장합니다. |
베이지안 코드 구현 | Bayes는 여전히 텍스트 작업에서 설명하기가 더 쉽습니다. |
연관 규칙 코드 구현 | 일반적으로 사용되는 데이터 분석 알고리즘 |
음악 추천 시스템 구축 | 처음부터 추천 시스템 모델 구축 |
실제 전투에서는 대부분의 경우 기성 도구 키트를 사용하여 작업을 완료하기 때문에 수학적 지식 포인트가 약화될 수 있습니다(패키지 전송 담당자). 여기에는 모두가 숙달해야 하는 에너지 절약 기능이 많이 있습니다. 첫 번째는 이러한 공통 툴킷을 능숙하게 사용하는 것입니다. 데이터 전처리, 기능 엔지니어링, 매개변수 조정 및 검증은 모두 매우 핵심 단계입니다. 요약하면, 다양한 작업을 완료하는 데 필요한 프로세스와 루틴은 유사하지만 사용되는 방법과 알고리즘이 다를 수 있으므로 모든 사람이 실무 경험을 풍부하게 하기 위해 지속적으로 축적해야 합니다. 학생들에게 제공되는 케이스를 학생들만의 실용적인 템플릿으로 활용해보세요!
가장 중요한 것은 다양한 데이터(숫자 값, 텍스트, 이미지)를 전처리하고 분석하는 방법을 배우고, 툴킷의 주요 핵심 기능을 능숙하게 적용하여 전처리에 참여하고, 다양한 작업에 대한 여러 솔루션을 제안하고, 실험 분석을 수행하는 방법을 배우는 것입니다. 요약하자면, 더 많은 실험을 하고 더 많은 실제 작업을 수행하면 코드를 더 많이 작성할수록 더 능숙해질 것입니다!
사건 이름 | 콘텐츠 개요 |
---|---|
실제 K 최근접 이웃 알고리즘 | 머신러닝 입문사례, 모델링 방법에 적용되는 툴킷 마스터링 |
거래 데이터 이상 탐지 | 데이터 처리 및 모델링 전략에 대한 매우 중요하고 상세한 분석 및 비교 |
통합 알고리즘 모델링 실습 | 통합에 대해서는 더 말할 필요가 없습니다. 꼭 필요한 핵심 전략입니다. |
랜덤 포레스트 기반 기온 예측 | 랜덤 포레스트(Random Forest)는 기계 학습에서 가장 일반적으로 사용되는 알고리즘입니다. |
뉴스 분류 실습 | 베이지안 알고리즘 기반의 텍스트 데이터 분석 및 처리, 실무 모델링 |
클러스터링 실습 분석 | 비지도 애플리케이션 예시 |
시계열 분석 | 시계열 데이터 생성 방법, 시퀀스 데이터 기반 모델링 |
사용자 이탈 경고 | 나는 종종 Fantasy Westward Journey 사용자가 지고 있다고 말합니다. 이것은 단지 데모일 뿐입니다. |
호텔 교통 예측에 lightgbm 사용 | xgboost보다 더 나쁜 또 다른 큰 킬러 |
인구 조사 데이터 세트 프로젝트 실제 소득 예측 | 핵심 템플릿, 데이터 분석, 시각화 등이 모두 있습니다. |
실제 베이지안 최적화 | 더 어려운 베이지안 최적화 툴킷 사용 예 |
텍스트 기능 방법 비교 | 텍스트 데이터에 일반적으로 사용되는 특징 추출 방법 비교 |
나만의 도구 키트 만들기 | 나만의 가방을 만들어보세요. |
사건 이름 | 콘텐츠 개요 |
---|---|
Python 실제 연관 규칙 | 툴킷을 사용하여 연관 규칙을 만드는 것은 매우 쉽습니다. |
Airbnb 데이터세트 분석 및 모델링 | 주택 가격 데이터 세트 분석 및 모델링 사례 |
유사도 기반 호텔 추천 시스템 | 호텔 추천을 완성하기 위한 추천 시스템 구축 |
제품판매 회귀분석 | 매우 일상적인 업무인 매출 예측을 일상적인 방법으로 수행할 수 있습니다. |
PUBG 데이터 세트 탐색 분석 및 모델링 | PlayerUnknown's Battlegrounds 데이터 세트, 누가 당신을 죽였는지 알아보겠습니다 |
실제 모델 해석 방법 | 모델링 후 모델을 해석하는 방법은 무엇입니까? 이 툴킷이 도움이 될 수 있습니다. |
실제 자연어 처리를 위한 필수 툴킷 | 일반적인 NLP 툴킷 및 실제 사례 해석 |
은행 고객 상환 확률 예측 | 상환 가능성 예측을 위한 은행 고객 데이터 |
영상특징군집분석실습 | 이미지 데이터를 클러스터링하는 방법은 무엇입니까? |
인구 조사 데이터 세트 프로젝트 실제 소득 예측 | 핵심 템플릿, 데이터 분석, 시각화 등이 모두 있습니다. |
데이터 분석이라는 말은 누구나 매일 듣는데, 우리는 어떻게 해야 할까요? 데이터로부터 가치 있는 정보를 얻는 것에 지나지 않으며, 여전히 많은 방법과 루틴이 존재합니다. 이 방향은 이론적 축적이 필요하지 않으며 데이터를 사용하여 수행하십시오! 사례의 축적은 학습 과정입니다!
간단히 말해서, 데이터 마이닝은 원하는 결과를 얻기 위해 대량의 데이터에 기계 학습 알고리즘을 적용하는 것입니다. 데이터 마이닝의 초점은 기계 학습 알고리즘의 선택이 아니라 더 나은 예측 결과를 얻기 위해 데이터를 처리하는 방법입니다. 여기서는 특성 엔지니어링과 전처리가 핵심 솔루션이 됩니다.
사건 이름 | 콘텐츠 개요 |
---|---|
타이타닉 구조 예측 | 입문자용 데이터 마이닝을 위한 최초의 실제 프로젝트인 클래식 Kaggle 대회 사례 |
데이터 특성 구성 | Feature Engineering은 데이터 마이닝의 핵심입니다. Sklearn을 기반으로 다양한 Feature 구축 방법을 설명합니다. |
사용자 초상화 연습 | 사용자 초상화에 대해 다들 들어보셨을 겁니다. 데이터를 적용하여 초상화를 완성하는 방법은 무엇일까요? |
통합 전략 예시 | 데이터 마이닝에서는 일반적으로 효과를 더 잘 향상시키기 위해 통합 전략이 선택됩니다. |
Xgboost 실제 전투 | 통합의 대표적인 대표자이자 경쟁의 킬러무기 |
JD.com 구매의향 예측 | 고전적인 예측 문제, 사용자 기록 행동 데이터를 기반으로 한 완전한 예측 작업 |
캐글 데이터 과학 설문조사 | Kaggle 대회 참가자를 시각적으로 표시 |
집값 예측 | 루틴을 빠르게 익히기 위한 데이터 마이닝 입문 사례 |
전력에 민감한 사용자 분석 | 주로 기능 엔지니어링의 역할을 설명하는 경쟁 사례 |
fbprophet 시계열 예측 | 시계열 예측을 위한 매우 실용적인 알고리즘으로 사용이 매우 간단합니다. |
Tianchi, Kaggle, Rongji 등 모두를 위한 대규모 공모 사례를 선정하였으며, 제공되는 코드와 솔루션은 공모전 우승자들의 솔루션 아이디어입니다. 체스를 배우고 싶다면 최고의 플레이어와 함께 플레이하여 자신을 발전시켜야 하는 것처럼 각 사례마다 승자의 아이디어와 전반적인 솔루션을 설명하고 코드 구현을 제공합니다. 모두가 향상하는 데 매우 도움이 됩니다!
사건 이름 | 콘텐츠 개요 |
---|---|
Kuaishou 짧은 동영상 사용자 활동 분석 | 사용자 행동 데이터를 기반으로 다음 활동 예측 |
산업용 화학 생산 예측 | 화학산업 데이터 및 모델을 분석하여 생산 효율성 예측 |
스마트 도시-도로 이동시간 예측 | 도로 데이터를 기반으로 이동 시간을 예측하는 매우 현실적인 경쟁 |
기능 엔지니어링 모델링 해석 가능 툴킷 | 데이터 마이닝의 가장 어려운 측면 중 하나는 기능 해석입니다. 이러한 툴킷은 매우 유용합니다. |
엔터티 인식이라는 의료 당뇨병 데이터 | 개체명 인식 알고리즘 설명 및 적용 사례 분석 |
대출 플랫폼 리스크 제어 모델-특성 엔지니어링 | 그래픽 모델을 사용하여 기능 엔지니어링을 구축하는 것은 널리 사용되는 아이디어입니다. |
뉴스 키워드 추출 모델 | 키워드 추출은 NLP에 있어서 필수적인 기술이라고 할 수 있습니다 |
머신러닝 프로젝트 실무 템플릿 | 템플릿은 여기에 있습니다. 방법은 비슷합니다. |
전력에 민감한 사용자 분석 | 주로 기능 엔지니어링의 역할을 설명하는 경쟁 사례 |
데이터 마이닝은 주로 모델링을 사용하여 예측을 수행하는 반면, 데이터 분석은 다양한 지표가 결과에 미치는 영향을 시각적으로 표시하고 분석하는 데 중점을 둡니다. 우리는 귀하를 위해 몇 가지 고전적인 분석 사례를 선택했으며 그 중 대부분은 템플릿으로 직접 사용할 수 있습니다.
사건 이름 | 콘텐츠 개요 |
---|---|
산점도 그리기 기술 | 시각화가 핵심이고, 드로잉은 반드시 필수라고 합니다. |
뉴욕 택시 운영 분석 및 모델링 | 많은 툴킷을 사용해 보면 지리 데이터를 분석하고 표시하는 방법에 익숙해질 수 있습니다. |
통계분석 기반 영화 추천 과제 | 통계 분석 및 권장 사항에 일반적으로 사용되는 방법 |
데이터 분석 및 기계 학습 템플릿 | 이 템플릿은 분석, 표시, 모델링 및 평가를 포함하여 매우 포괄적입니다. |
데이터 차원 축소 | 일반적으로 사용되는 여러 차원 축소 알고리즘의 비교 분석 및 표시 |
제품의 시각적 표시 및 텍스트 처리 | 텍스트 데이터 전처리 및 시각적 표시 |
다변량 분석 | 다변량 분석은 데이터 분석에서도 흔히 사용되는 방법입니다. |
상품 주문 데이터 세트 분석 | 주문 데이터 세트 분석 |
KIVA 대출 데이터 분석 | 대출 데이터 세트 분석 |
딥러닝은 현재 가장 유용한 알고리즘이라 할 수 있으며, 다양한 분야에서 활용될 수 있습니다. 실제로 핵심은 여전히 컴퓨터 비전과 자연어 처리에 있습니다. 왜냐하면 신경망 알고리즘은 이미지와 텍스트 데이터에 더 적합하기 때문입니다. 마스터해야 할 주요 사항은 알고리즘과 프레임워크입니다. 알고리즘은 CNN, RNN과 같은 고전적인 네트워크 모델이고, 프레임워크는 테너플로우, 파이토치 등과 같은 실용적인 도구입니다. 이에 대해서는 나중에 자세히 설명합니다.
요즘 많은 친구들이 과제를 받으면 딥러닝을 직접 활용해보고 싶다는 생각이 가장 먼저 드는 것 같아요. 딥러닝이 어렵고 번거롭다면, 아직도 그렇게 인기가 있을까요? 사실, 딥러닝은 머신러닝보다 정말 훨씬 간단하다고 생각합니다. 머신러닝에서는 데이터마다 다른 전처리 방법과 피쳐 엔지니어링 구성 방법을 선택해야 합니다. 딥 러닝의 루틴은 상대적으로 더 고정되어 있으며 이러한 오픈 소스 프레임워크와 주요 클래식 네트워크 아키텍처를 사용하면 일반적으로 우리가 해야 할 일은 이를 적용하는 것뿐입니다. 전반적인 난이도는 머신러닝 작업보다 쉽습니다(상대적으로 말하자면!).
알고리즘 이름 | 콘텐츠 개요 |
---|---|
신경망 | 신경망은 가장 기본적이며, 이는 후속 네트워크 학습을 위한 기반을 마련하는 것과 같습니다. |
컨벌루션 신경망 | 이것은 딥러닝의 큰 형님인 모든 사람에게 친숙하게 들립니다! 컴퓨터 비전 핵심 네트워크 |
순환 신경망 | Bei Qiao Feng과 Nan Murong은 자연어 처리 분야의 큰 형제입니다! |
적대적 생성 네트워크 | 현재 인기가 높은 모델로 가지고 놀기 쉽고 다양한 이미지 융합에 활용이 가능합니다. |
시퀀스 네트워크 모델 | NLP에서 일반적으로 사용되는 아키텍처인 기계 학습 번역 모델에는 많은 적용 지점이 있습니다. |
주요 클래식 네트워크 아키텍처 | 방금 언급한 CNN과 RNN은 상대적으로 기본적인 네트워크 모델이며, 이를 기반으로 모든 사람이 마스터해야 하는 확장 기능이 많이 있습니다. |
프레임워크는 네트워크 모델을 설계한다고 말하는 것과 같지만 모든 구체적인 계산 프로세스를 직접 완료하려면 너무 번거로울 것입니다. 프레임워크는 효율적인 계산 방법을 제공하며 완전 자동 계산 세트인 이를 완료할 필요가 없습니다. 이는 구조만 설계하고 구체적인 구성은 여기에 맡기면 되는 것과 동일합니다. 딥러닝을 하기 위해 필요한 것은 프레임워크입니다.
Tensorflow, Pytorch, keras, caffe 등 프레임워크가 너무 많은데 어떤 것을 선택해야 할까요? 프레임워크마다 큰 차이가 있나요? 현재 가장 주류를 이루고 있는 것은 KFC나 맥도날드에 버금가는 텐서플로우(tensorflow)와 파이토치(PyTorch)이다. 둘 다 매우 강력합니다. 어느 것을 선택할지는 해당 프로젝트 팀과 작업 요구 사항을 참조하세요. 하나를 추천해야 한다면 PyTorch가 더 간결하고 대중적이기 때문에 모든 사람에게 추천하고 싶습니다. 저는 이 프레임워크를 모두 사용해 왔습니다. 주된 이유는 제가 작업할 때 종종 다른 사람의 논문에서 소스 코드에 사용된 프레임워크를 참조해야 하기 때문입니다. 조만간 이 프레임워크를 사용할 것입니다!
프레임워크에 대해 이야기할 이론도 없고, 온갖 긴 설명을 읽을 필요도 없으니 그냥 사용해 보세요! 사실, 툴킷이므로 사용하면서 학습할 수 있고 사례를 요약하기 위한 템플릿으로 사용할 수도 있습니다!
프레임 이름 | 콘텐츠 개요 |
---|---|
Caffe 프레임워크 | 고대의 신급 틀이 지금은 불명예에 빠졌습니다. 그것이 제가 처음으로 배운 틀이었습니다. |
Tensorflow2 버전 | 버전 2는 많은 개선을 이루어 마침내 버전 1보다 사용하기가 훨씬 더 편리해졌습니다. |
케라스 | 한 문장이면 간단해요! 단순한! 단순한! 따로 배우실 필요 없이 코드만 보시면 이해가 매우 쉽습니다. |
파이토치 | 현 단계에서 가장 인기 있는 프레임워크이며 올해(2020)에도 가장 인기 있는 프레임워크가 될 것으로 예상됩니다. 추천합니다! |
각 주요 딥러닝 프레임워크에 대한 풍부한 실제 사례를 제공합니다. 어떤 프레임워크를 사용할지는 여러분의 선호도에 따라 달라집니다!
구글에서 제작한다고 설명할 필요는 없겠지만, 구글의 오픈소스 프로젝트 중 다수는 확실히 TF 프레임워크를 기반으로 하고 있습니다. 다른 사람의 오픈소스 프로젝트나 논문을 참고하거나 공부하고 싶다면 TF를 배워야 합니다. 업계에서도 널리 사용되고 있습니다. 이 파도는 확실히 성과를 거둘 것입니다!
사건 이름 | 콘텐츠 개요 |
---|---|
텐서플로우 설치 및 소개 | 버전 2의 설치 방법이 소개되어 있으니 간단히 살펴보시기 바랍니다. |
신경망 원리 및 전체 아키텍처 해석 | 신경망 아키텍처 검토 |
분류 및 회귀 작업을 위한 신경망 구축 | TF를 사용하여 기본 분류 및 회귀 작업을 완료하고 적용 방법을 숙지하세요. |
컨벌루션 신경망 원리 및 매개변수 해석 | CNN의 아키텍처를 각 매개변수별로 자세히 설명합니다. |
고양이와 개 식별 연습 | 고전적인 이미지 분류 작업은 여기서 이야기할 내용이 많고 매우 중요합니다. |
이미지 데이터 개선 사례 | 이제 데이터 강화는 필수 기술이라고 할 수 있습니다. |
훈련 전략 - 실제 전이 학습 | 전이 학습의 효과는 여전히 꽤 좋습니다. |
재귀 신경망 및 단어 벡터의 원리 해석 | RNN 모델 해석 |
TensorFlow를 기반으로 word2vec 구현 | TF 기반 단어 벡터 모델 해석 및 구현 |
RNN 모델 기반 텍스트 분류 작업 | TF 기반 텍스트 분류 작업 완료 |
tfrecord는 데이터 소스를 생성합니다. | 데이터 소스 제작 예시 |
텍스트 분류 실습에 CNN 네트워크 적용 | CNN은 텍스트 분류도 수행할 수 있습니다. |
시계열 예측 | 시계열 데이터 처리 및 모델링 예시 |
실제 적대적 생성 네트워크 | GAN이 왔어요 너무 재밌어요 |
CycleGan 오픈소스 프로젝트 기반의 실용적인 이미지 융합 | 내가 가장 좋아하는 GAN 플레이는 효과가 꽤 재미있습니다! |
실제로 클래식 네트워크 아키텍처 Resnet | 반드시 이해해야 할 네트워크 아키텍처를 배울 수 있습니다! |
2019년 말 현재 Pytorch 프레임워크의 사용자 수가 텐서플로우를 넘어 가장 인기 있는 프레임워크가 되었습니다. 그 이유는 사실 누구나 간단하고 이해하기 쉬운 프레임워크를 사용하는 것을 좋아하기 때문입니다. 전체적인 느낌은 확실히 텐서플로우보다 사용하기 쉽고 디버깅도 매우 편리합니다. 또한 초보자는 Pytorch 프레임워크를 우선적으로 사용하는 것이 좋습니다.
사건 이름 | 콘텐츠 개요 |
---|---|
PyTorch 프레임워크의 기본 처리 작업 | PyTorch에 익숙해지면 시작하기가 매우 쉽습니다. |
신경망 실제 분류 및 회귀 작업 | PyTorch를 사용하여 신경망 모델을 구축하는 것이 실제로 TF보다 사용하기 쉽습니다. |
컨벌루션 신경망 원리 및 매개변수 해석 | CNN 모델 아키텍처 및 매개변수 책 해석 |
영상인식 핵심모듈의 실무적 해석 | 매우 중요한 것은 PyTorch의 이미지 처리 핵심 모듈입니다. |
전이학습의 역할과 적용 사례 | 전이 학습을 위해 PyTorch에 모델 로드 |
재귀 신경망 및 단어 벡터의 원리 해석 | RNN 모델 아키텍처 해석 |
뉴스 데이터세트의 텍스트 분류에 관한 실무 | PyTorch를 기반으로 텍스트 분류 모델 구축 |
적대적 생성 네트워크 아키텍처의 원리 및 실제 분석 | GAN 모델의 대중적인 해석 |
CycleGan 오픈소스 프로젝트 기반의 실용적인 이미지 융합 | CYCLEGAN의 PyTorch 버전인 이 오픈 소스 프로젝트는 매우 잘 작성되었습니다. |
OCR 텍스트 인식 원리 | OCR의 원리는 실제로 매우 간단하며 이를 완료하려면 여러 모델의 도움이 필요합니다. |
OCR 문자인식 프로젝트 실습 | OCR 네트워크 모델 구축 |
3D 컨볼루션 기반 영상분석 및 동작인식 | 3D 컨볼루션을 사용하여 비디오 데이터를 처리하고 행동 인식을 완료합니다. |
PyTorch 기반의 실용적인 BERT 모델 | BERT의 아키텍처는 매우 인기가 높기 때문에 필수 모델 중 하나입니다. |
PyTorch 프레임워크의 실용적인 템플릿 해석 | 템플릿을 기반으로 향후 업무를 개선할 수 있도록 템플릿을 제공합니다. |
전체적인 느낌은 아무것도 배울 필요가 없고 케이스에서 바로 사용할 수 있다는 것입니다. TF2 버전은 실제로 keras와 매우 유사합니다. 실험과 논문 작성에 적합하며 간단하고 빠릅니다!
사건 이름 | 콘텐츠 개요 |
---|---|
설치 및 소개 | Keras는 tf를 기반으로 설치 및 시작이 쉽습니다. |
신경망 모델 구축 | 물을 테스트하기 위한 신경망 모델 구축 |
컨볼루셔널 신경망과의 또 다른 전투 | CNN 모델은 구축하기도 매우 쉽습니다. |
LSTM 시계열 예측 작업 | LSTM 모델은 시계열 작업에 적용됩니다 |
텍스트 분류 실습 | 텍스트 분류 예 |
다중 라벨 및 다중 출력 | 멀티 라벨 작업은 매우 일반적이며 학습 가치가 뛰어납니다. |
뉴스 데이터 세트의 텍스트 분류에 대한 실제 실습 | Keras를 기반으로 한 텍스트 분류 작업 |
데이터 증대 | 데이터 확대 예제의 해석 |
적대적 생성 네트워크 | Gan Architecture, Keras를 사용하는 것이 더 쉽습니다 |
전송 학습 및 RESNET 잔류 네트워크 | RESNET 모델을 직접 플레이해야합니다 |
주소 우편 번호 다중 시퀀스 작업 | 텍스트 모델 예제 |
SEQ2SEQ 네트워크 실습 | 시퀀스 네트워크 모델은 여전히 널리 사용됩니다. |
실제 템플릿 요약 | Keras 템플릿은 모든 작업이 있으면 직접 작성하십시오. |
이 단계에서는 Tensorflow와 Pytorch가 이미 사용할 수 있다고 생각합니다. Caffe 프레임 워크가 여전히 필요한 논문과 작업이있을 수 있습니다.
사건 이름 | 콘텐츠 개요 |
---|---|
카페 구성 파일 해석 | Caffe 프레임 워크의 일반적으로 사용되는 구성 파일의 해석 |
다양한 데이터 세트 구성 방법 | 데이터 세트 구성 방법, 이것은 매우 중요합니다 |
일반적인 카페 도구의 해석 | 작업을 신속하게 완료하기 위해 많은 작은 도구가 내장되어 있습니다. |
실제로 얼굴 감지 | Caffe 프레임 워크를 기반으로 얼굴 감지 모델 구축 |
얼굴 키 포인트를 찾는 실용적인 실습 | Caffe 프레임 워크를 기반으로 한 완전한 얼굴 키 포인트 인식 모델 |
컴퓨터 비전 산업에 대해 많이 말할 필요는 없습니다. 현재 가장 인기있는 산업입니다. 그래서 무엇을 배워야합니까? 핵심은 실제로 두 부분이며, 하나는 이미지 처리이고 다른 하나는 이미지 모델링입니다. 소위 이미지 처리는 OpenCV가하는 일입니다. 이미지 모델링은 주로 딥 러닝을 사용하여 탐지 및 인식과 같은 작업을 완료합니다. 이 연구 단계에서는 전통적인 이미지 처리 알고리즘에 대해 읽을 필요가 없습니다.
다른 툴킷과 마찬가지로 Python 버전을 선택하는 것이 좋습니다. 익숙하지 않은 것을 만나면 API를 사용하는 동안 더 많이 배우는 것이 가장 빠릅니다. 기본적으로 OpenCV의 모든 기능에는 많은 수학 공식이 포함됩니다.
우리는 모든 사람을 위해 많은 학습 리소스와 사례를 준비했습니다.
사건 이름 | 콘텐츠 개요 |
---|---|
OpenCV 소개 및 환경 구성 | 환경 설치 및 구성 |
기본 이미지 작업 | OpenCV를 사용하여 기본 이미지 처리 작업 및 연습을 완료하십시오! |
임계 값 및 스무딩 | 가장 일반적으로 사용되는 처리 작업은 몇 줄의 코드로 완료 할 수 있습니다. |
이미지 형태 작용 | 이러한 형태 학적 작업에 익숙해 지십시오 |
이미지 그라디언트 계산 | 이미지 그라디언트 계산 예 |
가장자리 감지 | 에지 감지에는 광범위한 응용 프로그램이 있습니다 |
이미지 피라미드 및 윤곽 감지 | 윤곽 감지 예, 효과는 여전히 좋습니다 |
히스토그램 및 푸리에 변환 | 그냥 익숙해 지십시오 |
프로젝트 실무 신용 카드 디지털 식별 | 신용 카드 번호를 감지하고 식별하기 위해 실용적인 프로젝트를 수행하십시오. |
프로젝트 실무 문서 스캔 OCR 인식 | OCR 인식을 위해 문서 데이터를 스캔하십시오 |
이미지 특징 harris | 일반적으로 사용되는 기능 추출 방법, 알고리즘은 간단하고 친숙합니다. |
이미지 기능-시프트 | 가장 오래된 기능 추출 방법은 여전히 많은 수학이 필요합니다. |
사례 연습-파노라마 이미지 스티칭 | 모두가 파노라마 카메라로 연주했을 것입니다. 어떻게 달성 하는가? |
프로젝트 실무-파킹 공간 식별 | 대단한 프로젝트, 처음부터 주차 공간 인식 모델 구축 |
프로젝트 실무 응답 카드 식별 및 심사 | 자동 표시를 즐기십시오 |
배경 모델링 | 기존의 치료 방법 |
광학 흐름 추정 | 그것에 익숙해 지십시오 |
OpenCV DNN 모듈 | 훈련 된 모델을 인식하기 위해로드하십시오 |
프로젝트 실무 - 목표 추적 | 추적 효과는 매우 흥미 롭습니다. |
컨볼 루션 원칙 및 운영 | 컨볼 루션이 어디에 있든, 그것은 핵심입니다. |
프로젝트 실무-관점 탐지 | 카메라를 기반으로 피로 감지 |
나는 면접을 준비하는 학생들이 모든 것을 읽는 것을 권장합니다. 금액 내부의 코드는 비교적 커질 것이므로 디버그 모드로 시작하여 설명 프로세스 중에 코드를 보는 것이 좋습니다.
우리는 Mask-RCNN 실용 프로젝트를 적극 권장합니다. 애플리케이션 시나리오는 매우 광범위하며 이력서에 글을 쓰려면 모든 사람이 알고리즘 원리와 소스 코드에 익숙해야합니다. 프로젝트를 설명하고 데이터 작업이 진행 중입니다.
프로젝트 이름 | 콘텐츠 개요 |
---|---|
이미지 스타일 전송 (스타일 전송) | 주로 그의 아이디어를 배우기 위해 그 효과는 여전히 매우 흥미 롭습니다. |
누락 된 이미지를 자동으로 완료합니다 | GAN 네트워크에는 많은 응용 프로그램 시나리오가 있으며 이미지는 자체적으로 수리 할 수도 있습니다. |
수퍼 해상도 재구성 | 최근 몇 년간 연구의 주요 영역 중 하나 인이 백서의 결과는 이미 매우 좋습니다. |
객체 감지 프레임 워크 -maskrcnn 프로젝트 | 이것은 내가 강조하는 오픈 소스 프로젝트입니다. 꼭 봐야 할 것! 꼭 봐야 할 것! |
MaskRCNN 네트워크 프레임 워크 소스 코드에 대한 자세한 설명 | 소스 코드는 매우 중요합니다. 모든 줄을 이해해야합니다! |
Mask-RCNN 프레임 워크를 기반으로 자신의 데이터를 교육하십시오 | 이미지 데이터를 레이블링하고 훈련하는 방법은 무엇입니까? 여기에 귀하의 대답이 있습니다 |
인간 자세 인식 데모 | MaskRCNN에는 많은 응용 프로그램 시나리오가 있습니다 |
물체 감지 더 빠른 RCNN 시리즈 | 학습 자원으로 사용할 수있는 객체 탐지에 대한 고전적인 작업 |
Cyclegan 오픈 소스 프로젝트를 기반으로 한 실제 이미지 퓨전 | Pytorch 버전의 Cyclegan,이 오픈 소스 프로젝트는 매우 잘 작성되었습니다. |
OCR 텍스트 인식 원리 | OCR의 원리는 실제로 매우 간단하며이를 완료하기 위해 여러 모델의 도움이 필요합니다. |
OCR 텍스트 인식 프로젝트 실습 | OCR 네트워크 모델을 구축하십시오 |
3D 컨볼 루션을 기반으로 한 비디오 분석 및 행동 인식 | 3D 컨볼 루션을 사용하여 비디오 데이터를 처리하고 동작 인식을 완료하십시오. |
이미지의 경우 어려움이 상당히 높고 데이터가 고정되어 있다고 말할 수 있습니다. 그러나 텍스트 데이터는 그렇게 고정되지 않았으며 때로는 컴퓨터는 물론 인간이 이해하기가 쉽지 않습니다. 높은 도전은 또한 높은 이점이 있습니다.
2018 년에 Google 논문이 나왔습니다. Bert! 자연어 처리를위한 일반적인 솔루션 프레임 워크와 동일하며 기본적으로 모든 작업을 수행 할 수 있습니다! 이를 위해서는 모든 사람이 학습에 집중해야하며 이력서에서 프로젝트로 작성할 수 있습니다.
프로젝트 이름 | 콘텐츠 개요 |
---|---|
언어 모델 | 언어 모델은 모든 사람이 후속 단어 벡터의 기초에 익숙해 져야합니다. |
gemsim을 사용하여 단어 벡터를 구축하십시오 | Gensim은 정말 유용한 패키지입니다! |
Word2Vec을 기반으로 한 분류 작업 | 먼저이 예제를 사용하여 단어 벡터 사용 방법을 이해해 봅시다. |
NLP 텍스트 기능 방법의 비교 | 텍스트 기능을 구성하는 방법에는 여러 가지가 있습니다. 어느 것이 더 좋습니까? |
LSTM 감정 분석 | 이 프로젝트를 사용하여 RNN 모델에 필요한 입력이 어떻게 보이는지 이해하십시오. |
NLP- 유사성 모델 | 텍스트 유사성 계산 방법 |
대화 봇 | Tensorlfow 프레임 워크를 기반으로 챗봇을 구축하십시오 |
나만의 입력 방법을 만듭니다 | 자신의 입력 방법을 구축 할 수 있습니까? 당신이 그것을 끝내도록 도와주세요! |
로봇은 탕시를 씁니다 | 모델이 쓴 Tang시를 살펴보십시오! |
NMT 기계 번역 상자 | 2 차 개발이 가능한 오픈 소스 프로젝트 |
주소 우편 번호 다중 시퀀스 작업 | 고전적인 텍스트 분류 작업 |
Bert의 원칙, 자연어 처리를위한 일반적인 프레임 워크 | 이것은 위에서 언급 한 Bert입니다. 요점! 요점! |
Google 오픈 소스 프로젝트 Bert의 소스 코드 해석 | 소스 코드는 매우 중요하며 모든 라인을 이해해야합니다. |
Bert를 기반으로 한 중국 감정 분석 | 오픈 소스 프로젝트를 기반으로 한 모델 개발 |
중국어는 Bert를 기반으로 한 엔티티 인식을 지명했습니다 | 오픈 소스 프로젝트를 기반으로 명명 된 엔티티 인식 |
지난 몇 년 동안 온라인 과정과 오프라인 기업 교육을 통해 많은 친구들과 반 친구들의 신뢰가 계속해서 코스를 업데이트하려는 가장 큰 동기입니다. 모든 사람은 기본적으로 비디오 과정을 통해 저를 알고 있으며, 모든 사람에게 혜택을 가져다 줄 수있어서 매우 기쁩니다. 많은 친구들 덕분에 그들의 지원에 감사드립니다. 당신은 모두 최고입니다!