AI 분야에 종사하면서 수학을 모르는 사람은 설득할 줄 모르는 정치인과 같다. 둘 다 작업할 수 없는 영역이 있습니다!
일주일 전, 저는 2021년 데이터 과학에 들어가는 방법에 대한 기사를 썼고 그 이후로 전 세계 사람들로부터 데이터 과학에 얼마나 많은 수학이 필요한지 묻는 이메일을 여러 통 받았습니다.
거짓말은 안 할게요. 수학이 많이 필요 해요.
그리고 이것이 많은 초보자들을 좌절시키는 이유 중 하나입니다. 해당 분야의 여러 베테랑들과 많은 연구와 대화를 거친 후, 저는 여러분이 알아야 할 수학의 모든 기본 사항을 다루는 실감나는 가이드를 편집했습니다. 아래에 언급된 개념들은 보통 대학에서 여러 학기에 걸쳐 다루지만 집중할 수 있는 핵심 원칙으로 정리해봤습니다.
이 가이드는 초보자를 위한 절대적인 생명의 은인이므로 가장 중요한 주제를 공부할 수 있으며, 이러한 개념을 빠르게 이해해야 하는 저와 같은 실무자에게는 더 나은 리소스입니다.
참고 : 데이터 과학 분야에서 첫 번째 직업을 얻기 위해 아래 개념을 모두 알 필요는 없습니다. 당신에게 필요한 것은 기본을 확실히 이해하는 것 뿐입니다. 이에 집중하고 통합하세요.
대수학에 대한 지식은 아마도 일반적으로 수학의 기본일 것입니다. 덧셈, 뺄셈, 곱셈, 나눗셈과 같은 수학 연산 외에도 다음 사항을 알아야 합니다.
지수
급진파
팩토리얼
요약
과학적 표기법
선형 대수학은 인공 지능과 다양한 과학 및 공학 분야의 주요 수학적 계산 도구입니다. 여기에서는 4가지 주요 수학적 대상과 그 속성을 이해해야 합니다.
스칼라 - 단일 숫자(실수 또는 자연수일 수 있음)
벡터 - 순서대로 정렬된 숫자 목록입니다. 각 요소가 축을 따라 좌표를 나타내는 공간의 점으로 간주하십시오.
행렬 - 각 숫자가 2개의 인덱스로 식별되는 숫자의 2차원 배열입니다.
텐서 - N축의 일반 그리드에 배열된 숫자(N>2)의 ND 배열입니다. 기계 학습, 딥 러닝 및 컴퓨터 비전에서 중요
고유벡터 및 고유값 - 특수 벡터 및 해당 스칼라 수량입니다. 의미와 찾는 방법을 이해합니다.
특이값 분해(Singular Value Decomposition) - 행렬을 3개의 행렬로 인수분해합니다. 속성과 응용 프로그램을 이해합니다.
주성분 분석(PCA) - 중요성, 속성 및 응용을 이해합니다.
Dot product, Vector product 및 Hadamard product와 같은 속성도 알아두면 유용합니다.
미적분학은 매개변수, 함수, 오류 및 근사값의 변경을 다룹니다. 데이터 과학에서는 다차원 미적분학에 대한 실무 지식이 필수적입니다. 다음은 미적분학에서 가장 중요한 개념(완전하지는 않지만)입니다.
도함수 - 규칙(덧셈, 곱, 연쇄 규칙 등), 쌍곡선 도함수(tanh, cosh 등) 및 부분 도함수.
벡터/행렬 미적분학 - 다양한 파생 연산자(그라디언트, 야코비안, 헤시안 및 라플라시안)
그라데이션 알고리즘 - 로컬/글로벌 최대값 및 최소값, 안장점, 볼록 함수, 배치 및 미니 배치, 확률적 경사하강법 및 성능 비교.
기본 통계 - 평균, 중앙값, 모드, 분산, 공분산 등
확률의 기본 규칙 - 사건(종속 및 독립), 표본 공간, 조건부 확률.
무작위 변수 - 연속형 및 이산형, 기대값, 분산, 분포(결합 및 조건부).
베이즈 정리 - 신념의 타당성을 계산합니다. 베이지안 소프트웨어는 기계가 패턴을 인식하고 결정을 내릴 수 있도록 도와줍니다.
최대 가능성 추정(MLE) - 매개변수 추정. 기본적인 확률 개념(공동 확률 및 사건의 독립성)에 대한 지식이 필요합니다.
공통 분포 - 이항, 포아송, 베르누이, 가우스, 지수.
AI와 딥러닝에 크게 기여했지만 아직 많은 사람들에게 알려지지 않은 중요한 분야입니다. 미적분, 통계, 확률의 융합이라고 생각할 수 있습니다.
엔트로피 - 섀넌 엔트로피라고도 합니다. 실험의 불확실성을 측정하는 데 사용됩니다.
교차 엔트로피(Cross-Entropy) - 두 확률 분포를 비교하고 얼마나 유사한지 알려줍니다.
Kullback Leibler Divergence - 두 확률 분포가 얼마나 유사한지에 대한 또 다른 척도입니다.
Viterbi 알고리즘 - 자연어 처리(NLP) 및 음성에 널리 사용됩니다.
인코더-디코더 - 기계 번역 RNN 및 기타 모델에 사용됩니다.
인공지능에서는 수학이 매우 중요합니다. 그것이 없다면 그것은 영혼이 없는 인간의 몸과 비슷합니다. 수학적 개념을 종량제로 처리할 수 있습니다. 외국 개념이 나타날 때마다 그것을 집어 삼키십시오! 위의 가이드는 AI의 모든 종류의 주제나 개념을 이해할 수 있는 최소한의 포괄적인 리소스를 제공합니다.
행운을 빌어요!
이 로드맵이 개선될 수 있다고 생각되면 업데이트가 포함된 PR을 열고 문제를 제출해 주세요. 우리는 이 기능을 지속적으로 개선할 예정이므로 나중에 다시 방문하려면 이 저장소를 시청/별표 표시하는 것이 좋습니다.
로드맵을 업데이트하는 방법은 기여 가이드를 살펴보세요.
개선 사항이 포함된 풀 리퀘스트 열기
이슈에 대한 아이디어 토론
소문을 퍼뜨려라
피드백이 있으면 연락하세요.
이 로드맵은 Jason Dsouza가 작성했으며 MIT 라이선스에 따라 공개적으로 제공되었습니다.