Escola de sistema de IA
??? Sistema para aprendizado de máquina, LLM (modelo de linguagem grande), GenAI (IA generativa)
Atualizações:
- Tutoriais em vídeo [YouTube] [bilibili] [小红书]
- Estamos preparando um novo site [Lets Go AI] para este repo!!!
Caminho para o sistema para IA [artigo que você deve ler]
Uma lista selecionada de pesquisas em sistemas de aprendizado de máquina. O link para o código, se disponível, também está presente. Agora temos uma equipe para manter esse projeto. Você é muito bem-vindo para obter solicitação usando nosso modelo .
Sistema para IA (ordenado por categoria)
Infraestrutura ML/DL
- Processamento de Dados
- Sistema de treinamento
- Sistema de Inferência
- Infraestrutura de aprendizado de máquina
LLM Infraestrutura
- Treinamento LLM
- Servindo LLM
Infraestrutura específica de domínio
- Sistema de vídeo
- Sistema AutoML
- IA de borda
- Sistema GNN
- Sistema de aprendizagem federado
- Sistema de aprendizagem por reforço profundo
Sistema para Conferência ML/LLM
Conferência
- OSDI
- SOSP
- SIGCOM
- INDE
- MLSys
- ATC
- Eurosys
- Middleware
- SoCC
- TinyML
Recursos Gerais
- Enquete
- Livro
- Vídeo
- Curso
- Blogue
Enquete
- Rumo a sistemas de nuvem e ML inteligentes e altamente disponíveis [Slide]
- Uma lista com curadoria de artigos, vídeos e recursos incríveis de design de sistema para computação distribuída, também conhecido como Big Data. [GitHub]
- incrível-produção-machine-learning: uma lista com curadoria de incríveis bibliotecas de código aberto para implantar, monitorar, versionar e dimensionar seu aprendizado de máquina [GitHub]
- Oportunidades e desafios dos aceleradores de aprendizado de máquina em produção [artigo]
- Ananthanarayanan, Rajagopal, et al. "
- Conferência {USENIX} 2019 sobre Aprendizado de Máquina Operacional (OpML 19). 2019.
- Como (e como não) escrever um bom artigo sobre sistemas [conselhos]
- Aprendizado de máquina aplicado no Facebook: uma perspectiva de infraestrutura de datacenter [Artigo]
- Hazelwood, Kim, et al. ( HPCA 2018 )
- Infraestrutura para aprendizado de máquina utilizável: Projeto Stanford DAWN
- Bailis, Peter, Kunle Olukotun, Christopher Ré e Matei Zaharia. ( pré-impressão 2017 )
- Dívida técnica oculta em sistemas de aprendizado de máquina [artigo]
- Sculley, David, et al. ( PNI 2015 )
- Argumentos ponta a ponta no design de sistema [Artigo]
- Saltzer, Jerome H., David P. Reed e David D. Clark.
- Projeto de Sistema para Aprendizado de Máquina em Grande Escala [Tese]
- Inferência de aprendizagem profunda em data centers do Facebook: caracterização, otimizações de desempenho e implicações de hardware [artigo]
- Park, Jongsoo, Maxim Naumov, Protonu Basu et al. arXiv 2018
- Resumo: Este artigo apresenta uma caracterização dos modelos DL e, em seguida, mostra o novo princípio de design do hardware DL.
- Uma visão de Berkeley dos desafios de sistemas para IA [artigo]
Livro
- Arquitetura de Computadores: Uma Abordagem Quantitativa [Leitura obrigatória]
- Padrões de aprendizado de máquina distribuído [site]
- Sistemas de Streaming [Livro]
- Kubernetes em Ação (comece a ler) [Livro]
- Sistemas de aprendizado de máquina: projetos em escala [site]
- Confie no aprendizado de máquina [site]
- Aprendizado de máquina automatizado em ação [site]
Vídeo
- ScalaDML2020: Aprenda com as melhores mentes da comunidade de aprendizado de máquina. [Vídeo]
- Jeff Dean: Palestra "Alcançando tempos de resposta rápidos em grandes serviços on-line" - Velocity 2014 [YouTube]
- Da pesquisa à produção com PyTorch [Vídeo]
- Introdução aos microsserviços, Docker e Kubernetes [YouTube]
- Palestra do ICML: Lições aprendidas ao ajudar 200.000 especialistas não-ML a usar ML [Vídeo]
- Sistemas de aprendizagem adaptativos e multitarefa [site]
- Pensamento sistêmico. Uma palestra TED. [YouTube]
- Sistemas flexíveis são a próxima fronteira do aprendizado de máquina. Jeff Dean [YouTube]
- É hora de reescrever o sistema operacional em Rust? [YouTube]
- InfoQ: IA, ML e engenharia de dados [YouTube]
- Netflix: infraestrutura de aprendizado de máquina centrada no ser humano [InfoQ]
- SysML 2019: [YouTube]
- ScaledML 2019: David Patterson, Ion Stoica, Dawn Song e assim por diante [YouTube]
- ScaledML 2018: Jeff Dean, Ion Stoica, Yangqing Jia e assim por diante [YouTube] [Slides]
- Uma nova era de ouro para a história, desafios e oportunidades da arquitetura de computadores. David Paterson [YouTube]
- Como ter uma carreira ruim. David Patterson (sou um grande fã) [YouTube]
- SysML 18: Perspectivas e Desafios. Michael Jordan [YouTube]
- SysML 18: Simbiose de sistemas e aprendizado de máquina. Jeff Dean [YouTube]
- Noções básicas de AutoML: aprendizado de máquina automatizado em ação. Canção Qingquan, Haifeng Jin, Xia Hu [YouTube]
Curso
- Seminário CS692: Sistemas para Aprendizado de Máquina, Aprendizado de Máquina para Sistemas [GitHub]
- Tópicos em redes: aprendizado de máquina para redes e sistemas, outono de 2019 [site do curso]
- CS6465: Desafios emergentes de tecnologias e sistemas em nuvem [Cornell]
- CS294: IA para sistemas e sistemas para IA. [UC Berkeley Spring] ( forte recomendação ) [Sistemas de aprendizado de máquina (outono de 2019)]
- CSE 599W: Sistema para ML. [Chen Tianqi] [Universidade de Washington]
- EECS 598: Sistemas para IA (W'21). [Mosharaf Chowdhury] [Sistemas para IA (W'21)]
- Código do tutorial sobre como construir seu próprio sistema de aprendizado profundo em 2k linhas [GitHub]
- CSE 291F: Análise avançada de dados e sistemas de ML. [UCSD]
- CSci 8980: Aprendizado de Máquina em Sistemas de Computador [Universidade de Minnesota, Twin Cities]
- Mu Li (MxNet, Parameter Server): Introdução ao Deep Learning [Melhor curso DL, eu acho] [Livro]
- 10-605: Aprendizado de Máquina com Grandes Conjuntos de Dados. [UMC]
- CS 329S: Projeto de sistemas de aprendizado de máquina. [Stanford]
Blogue
- Paralelização entre múltiplas CPU/GPUs para acelerar a inferência de aprendizagem profunda na borda [Amazon Blog]
- Construindo modelos robustos de visão de aprendizado profundo prontos para produção em minutos [Blog]
- Implante modelos de aprendizado de máquina com Keras, FastAPI, Redis e Docker [Blog]
- Como implantar um modelo de aprendizado de máquina – Criando uma API pronta para produção usando FastAPI + Uvicorn [Blog] [GitHub]
- Implantando um modelo de aprendizado de máquina como uma API REST [Blog]
- Entrega Contínua para Aprendizado de Máquina [Blog]
- Folhas de dicas do Kubernetes em A4 [GitHub]
- Uma introdução suave ao Kubernetes [Blog]
- Treine e implante modelo de aprendizado de máquina com interface da Web - Docker, PyTorch e Flask [GitHub]
- Aprendendo Kubernetes, o jeito taoísta chinês [GitHub]
- Pipelines de dados, Luigi, Airflow: tudo o que você precisa saber [Blog]
- O conjunto de ferramentas de aprendizado profundo – uma visão geral [Blog]
- Resumo de CSE 599W: Sistemas para ML [Blog Chinês]
- Polyaxon, Argo e Seldon para treinamento, pacote e implantação de modelo em Kubernetes [Blog]
- Visão geral das diferentes abordagens para colocar modelos de aprendizado de máquina (ML) em produção [Blog]
- Ser um cientista de dados não faz de você um engenheiro de software [Parte 1] Arquitetando um pipeline de aprendizado de máquina [Parte 2]
- Exibição de modelo em PyTorch [Blog]
- Aprendizado de máquina no Netflix [médio]
- Materiais da conferência SciPy (slides, repositório) [GitHub]
- 继Spark, UC Berkeley 推出新一代AI计算引擎——Ray [Blog]
- 了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构? [Zhihu]
- Aprenda Kubernetes em menos de 3 horas: um guia detalhado para orquestrar contêineres [Blog] [GitHub]
- roteiro do engenheiro de dados: Aprendendo com várias empresas no Vale do Silício. Netflix, Facebook, Google, Startups [GitHub]
- TensorFlow Serving + Docker + Tornado机器学习模型生产级快速部署 [Blog]
- Implantando um modelo de aprendizado de máquina como uma API REST [Blog]
- Colossal-AI: um sistema unificado de aprendizado profundo para a era dos grandes modelos [Blog] [GitHub]
- Roteiro do engenheiro de dados [Blogs do Scaler]