文字课程内容正在一节节补充更新,尽可能抽空继续更新正在AISys ,希望您多多鼓励和参与进来! ! !
텍스트 코스는 AISYS의 오픈 소스, B 및 오일 파이프 시리즈 인 PPT는 GitHub의 오픈 소스입니다. ! !
이 오픈 소스 코스를 영어로 AI 시스템 (AISYS) 이라고하며 중국어로 AI 시스템 이라고합니다.
本开源课程主要是跟大家一起探讨和学习人工智能、深度学习的系统设计,而整个系统是围绕着ZOMI 在工作当中所积累、梳理、构建AI 系统全栈的内容。 AI 오픈 소스 코스에 관심이있는 모든 좋은 친구들과 토론하고 연구하고 함께 학습과 토론을 홍보하고 싶습니다.
이 과정에는 주로 다음 5 가지 모듈이 포함됩니다.
튜토리얼 컨텐츠 | 소개 | 주소 |
---|---|---|
AI 시스템 풀 스택의 개요 | AI 기본 사항 및 AI 시스템 AI 시스템의 전체 스택 개요 및 딥 러닝 시스템의 체계적인 설계 및 방법론에 대한 개요는 주로 AI 교육 및 풀 스택 아키텍처 컨텐츠의 추론에 대한 포괄적 인 이해에 관한 것입니다. | [슬라이드] |
AI 칩과 아키텍처 | AI의 하드웨어 아키텍처로서, 주로 CPU 및 GPU의 칩 기초에서 AI 칩의 원칙, 디자인 및 응용 시나리오에 이르기까지 AI 칩을 주로 말하면 AI 칩의 디자인은 AI Computing의 가속도를 고려할뿐만 아니라 Ai Frpporithms의 전체 고려 사항을 고려할뿐만 아니라 AI 중간에 AI가 필요합니다. 매일. 실제로 사용하기가 어렵습니다. | [슬라이드] |
AI 프로그래밍 및 컴퓨팅 아키텍처 | Advanced Edition은 AI 프로그래밍 및 컴퓨팅 아키텍처를 소개하며 최신 기계 학습 시스템, 특히 중간 표현식 및 백엔드 최적화를 설계 할 때 고려해야 할 컴파일러 문제를 고려할 것입니다. | [슬라이드] |
AI 추론 시스템 및 엔진 | 실제로, 추론 시스템과 엔진은 너무 많은 원칙을 설명하는 데 사용되며 신체는 너무 약하고 소화하기 쉽습니다. | [슬라이드] |
AI 프레임 워크의 핵심 기술 | AI 프레임 워크의 핵심 기술을 도입하면 AI Frameword가 자동 차별화 된 기능을 소개합니다. AI IR 네트워크를 나타내는 그래프 및 연산자는 AI 프레임 워크의 프론트 엔드 최적화가 생성됩니다. | [슬라이드] |
이 과정은 주로 학부 노인, 석사 및 박사 과정 학생 및 AI 시스템 실무자를 위해 설계되어 모든 사람을 돕습니다.
AI의 컴퓨터 시스템 아키텍처를 완전히 이해하고 실제 문제와 사례를 통해 AI의 전체 수명주기에서 시스템 설계를 이해하십시오.
최첨단 시스템 아키텍처와 AI를 결합한 연구 작업을 소개하고 AI 시스템을 이해하기위한 주류 프레임 워크, 플랫폼 및 도구를 이해합니다.
일련 번호 | 이름 | 특정 콘텐츠 |
---|---|---|
1 | AI 시스템 | AI 시스템을 형성하기 위해 알고리즘, 프레임 워크 및 아키텍처 결합 |
일련 번호 | 이름 | 특정 콘텐츠 |
---|---|---|
1 | AI 컴퓨팅 시스템 | 신경망과 같은 AI 기술의 계산 모드 및 컴퓨팅 아키텍처 |
2 | AI 칩 기본 | CPU, GPU, NPU 등과 같은 칩 아키텍처의 기본 원칙. |
3 | 그래픽 프로세서 GPU | GPU의 기본 원칙, Nvidia GPU의 건축 개발 |
4 | NVIDIA GPU 세부 사항 | NVIDIA GPU의 텐서 코어 및 NVLINK의 심층 분석 |
5 | 외국 AI 프로세서 | Google 및 Tesla와 같은 전용 AI 프로세서의 핵심 원칙 |
6 | 국내 AI 프로세서 | Cambrian 및 Suiyuan 기술과 같은 특수 AI 프로세서의 핵심 원칙 |
7 | AI 칩을위한 10 년 금 | AI 칩의 프로그래밍 모델 및 개발 요약 |
일련 번호 | 이름 | 특정 콘텐츠 |
---|---|---|
1 | 전통적인 컴파일러 | 전통적인 컴파일러 GCC 및 LLVM, LLVM 세부 아키텍처 |
2 | AI 컴파일러 | AI 컴파일러 개발 및 아키텍처 정의, 미래의 과제 및 사고 |
3 | 프론트 엔드 최적화 | AI 컴파일러의 프론트 엔드 최적화 (연산자 퓨전, 메모리 최적화 등) |
4 | 백엔드 최적화 | AI 컴파일러의 백엔드 최적화 (커널 최적화, 자동 조정) |
5 | 다면체 | 업데이트를 기다리고 ... |
6 | pytorch2.0 | Pytorch2.0의 가장 중요한 새로운 기능 : 컴파일 기술 스택 |
일련 번호 | 이름 | 특정 콘텐츠 |
---|---|---|
1 | 추론 시스템 | 추론 시스템 및 추론 엔진 아키텍처 분류에 대한 전반적인 소개 |
2 | 경량 네트워크 | 경량 백본 네트워크, 모빌 넷 등과 같은 SOTA 모델 소개 |
3 | 모델 압축 | 모델 압축 세트, 양자화, 증류, 가지 치기 및 이항 |
4 | 변환 및 최적화 | AI 프레임 워크를 교육 한 후 모델이 변환되고 계산 그래프가 최적화됩니다. |
5 | 커널 최적화 | 커널 레이어 및 연산자 레이어 최적화, 연산자, 메모리 및 스케줄링 최적화 |
일련 번호 | 이름 | 특정 콘텐츠 |
---|---|---|
1 | AI 프레임 워크 기본 사항 | AI 프레임 워크의 역할, 개발 및 프로그래밍 패러다임 |
2 | 자동 차별화 | 자동 차별화의 구현 방법 및 원리 |
3 | 계산 다이어그램 | 컴퓨팅 그래프, 그래프 최적화, 그래프 실행, 제어 흐름 표현식의 개념 |
这个仓已经到达疯狂的10G 啦(ZOMI 把所有制作过程、高清图片都原封不动提供),如果你要git clone 会非常的慢,因此建议优先到Releases · chenzomi12/AISystem 来下载你需要的内容
非常希望您也参与到这个开源课程中,B 站给ZOMI 留言哦!
欢迎大家使用的过程中发现bug 或者勘误直接提交代码PR 到开源社区哦!
欢迎大家使用的过程中发现bug 或者勘误直接提交PR 到开源社区哦!
请大家尊重开源和ZOMI 的努力,引用PPT 的内容请规范转载标明出处哦!