Para mais grandiosidade, confira.
Esta é uma lista selecionada de recursos incríveis para tudo que você precisa para desenvolver soluções de aprendizado de máquina.
Cada item desta lista lhe ensinará pelo menos uma habilidade ou informação distinta e significativa.
Existem três níveis de conteúdo:
? Leitura essencial para todos os engenheiros de ML
? Leitura avançada para engenheiros profissionais de ML
? Material especializado para engenheiros especialistas em ML
As descrições são escritas para completar a frase "Depois de ler este artigo você terá aprendido..." .
Comunicação
Engenharia de Software
Aprendizado de máquina
DevOps
BLUF: O padrão militar que pode tornar sua escrita mais poderosa - Como tornar sua comunicação mais poderosa (5 min)
O problema XY - Como se concentrar em explicar seu objetivo final ao pedir ajuda (5 min)
Descarte de bicicletas: quão maduro você é como engenheiro? - Como evitar e denunciar o abandono de bicicletas (5 min)
Envie e-mails como um chefe - Como escrever e-mails melhores (5 min)
Pare de usar queijo suíço em sua agenda - Como gerenciar sua agenda para que você possa se concentrar (15 min)
Como escrever em inglês simples - Como escrever em inglês simples (30 min)
Regras de apresentação - Como criar uma ótima apresentação de slides (30 min)
Critérios SMART – Como definir metas (15 min)
Princípio MECE - Como decompor totalmente um problema em uma lista estruturada (15 min)
SCQA: O que é, como funciona e como pode me ajudar? - Como estruturar suas apresentações, propostas e planos de vendas (15 min)
Chega de mal-entendidos - Como evitar falhas de comunicação parafraseando (15 min)
Comunicação não violenta – Como fornecer feedback construtivo em situações difíceis (15 min)
O efeito Halo - Como reconhecer e usar o efeito Halo a seu favor (15 min)
Mês do Homem Mítico - A relação entre dias-pessoa e tempo de produção em um projeto (15 min)
Modelo de quatro lados - Como comunicar de forma eficaz, considerando como o receptor interpreta a sua mensagem (30 min)
Versionamento semântico - Como alterar a versão de seus aplicativos e pacotes (15 min)
__all__
e importações selvagens em Python - Como __all__
define a API pública de seus pacotes Python (15 min)
APIs para aprendizado de máquina - Como projetar APIs RESTful para aplicativos de aprendizado de máquina (30 min)
Documentos FastAPI - Como construir APIs RESTful que correspondam individualmente a uma especificação OpenAPI (1 dia)
A Regra de Três – Quando construir componentes reutilizáveis e quando não (15 min)
Os programadores acreditam em falsidades sobre o tempo - Como evitar armadilhas comuns sobre o tempo (15 min)
Falsidades que os programadores acreditam sobre nomes - Como evitar armadilhas comuns sobre nomes (15 min)
Diretrizes da interface de linha de comando – Como escrever ótimas CLIs (1 hora)
Diretrizes da API RESTful da Zalando - Como projetar APIs RESTful (1 dia)
Poetry Cookiecutter - Como criar um ambiente de desenvolvimento moderno baseado em Poesia para pacotes e aplicativos Python (30 min)
As sete regras de uma ótima mensagem de commit do Git - Como escrever ótimas mensagens de commit do Git (15 min)
Aprenda Git Branching - Pratique Git do iniciante ao avançado (1 hora)
Keep a Changelog - Como manter um changelog para seus aplicativos e pacotes (30 min)
Commits Convencionais - Como prefixar suas mensagens de commit para automatizar o versionamento semântico e manter um changelog (15 min)
Testando aplicativos Python com Pytest - Como testar corretamente um pacote com pytest (30 min)
Um modelo de ramificação Git de sucesso - Como lançar software com Git (15 min)
Práticas recomendadas de revisão de código – O que procurar ao revisar uma solicitação pull (30 min)
Integridade do código: análises respeitosas == análises úteis - como comunicar comentários de revisão de código com respeito (15 min)
A pirâmide de revisão de código – O que procurar e o que automatizar ao revisar uma solicitação pull (15 min)
Plug-in de espaço de trabalho de poesia - Como criar e gerenciar um monorepo baseado em poesia (15 min)
PEP20 "The Zen of Python" - Como escrever Python idiomático (15 min)
O guia definitivo para instruções de importação do Python - como escrever instruções de importação (30 min)
Compreendendo o módulo de registro do Python - Como usar o módulo logging
de maneira eficaz (30 min)
Não execute código no momento da importação – Por que você não deve executar código no momento da importação
Por favor, conserte seus decoradores - Por que você provavelmente deveria usar wrapt
para escrever seus decoradores (30 min)
Não registrar - O que você deveria fazer em vez de registrar (30 min)
O Pequeno Livro dos Antipadrões Python - Uma coleção de antipadrões Python (X horas)
Python eficaz - uma coleção de expressões idiomáticas do Python (X horas)
Python Design Patterns - Uma coleção de padrões de arquitetura de software (1 hora)
SOLID - Um conjunto padrão de padrões de arquitetura de software (1 hora)
Que porra é Python! - Como dominar Python entendendo seus casos extremos (1 dia)
O guia abrangente para mypy - como escrever anotações de tipo em Python (1 hora)
Visão geral do Pydantic - Como escrever anotações de tipo para tipos complexos em vez de um Dict[str, Any]
sem sentido (1 hora)
Número mágico - Por que os valores mágicos são um antipadrão (15 min)
Enums - Como escrever Enum
s em Python em vez de valores mágicos sem segurança de tipo (15 min)
Genéricos Mypy - Como usar TypeVar
s para escrever tipos genéricos como List[T]
(30 min)
Protocolos Mypy - Como usar Protocol
s para definir interfaces como Iterable
(30 min)
cookiecutter - Crie novos pacotes ou aplicativos Python rapidamente com um modelo Cookiecutter
cruft - Atualizar o andaime Cookiecutter subjacente de um pacote Python
commitizen - Verifique se as mensagens de commit satisfazem os commits convencionais e automatiza o versionamento semântico e mantém um changelog
poesia - Gerencie o empacotamento e as dependências do seu projeto Python
poe - Defina e execute tarefas em um projeto de Poesia com Poe the Poet
poesia-workspace-plugin - Gerencie um monorepo Python com este plugin Poetry
preto - Formate seu código automaticamente
isort - Classifique automaticamente suas instruções de importação
pre-commit - Executa verificações de qualidade de código automaticamente no commit
bandido - Encontre problemas comuns de segurança
darglint - Verifique se seus documentos correspondem à assinatura de sua função
flake8 - Verifique se há bugs em seu código e se seu estilo de código é compatível com PEP8
Extensões flake8 – Uma lista incrível de extensões Flake8
mypy - Verifique a exatidão do tipo do seu código
ganchos de pré-commit - Uma coleção de ganchos de pré-commit que verificam a qualidade do arquivo
pydocstyle – Verifique se seu código está documentado
ganchos pygrep - Uma coleção de ganchos pré-commit que verificam cheiros comuns de código Python
gravação pytest - Grave e reproduza solicitações HTTP em seus testes pytest
? pyupgrade – Verifique se seu código foi escrito usando os recursos mais recentes da linguagem Python
? segurança - Verifique se suas dependências não possuem vulnerabilidades de segurança conhecidas
? shellcheck - Verifique a qualidade dos seus scripts de shell
? cobertura.py – Verifique a cobertura de teste do seu código
? hipótese - Escreva testes que procurem automaticamente casos extremos que quebram seu código
? hipótese-auto - Automatiza a geração de testes de hipóteses com base nas anotações de tipo do seu código
? fastapi - Crie APIs RESTful com base em anotações de tipo
? typer - Crie CLIs com base em anotações de tipo
? streamlit - Crie aplicativos da web com um único arquivo Python
? bump2version – Lance uma nova versão do seu pacote
? colourlogs - Aumente a legibilidade dos seus logs com cores
? hvplot - Crie gráficos interativos a partir de dataframes do pandas
? mkdocs – Crie documentação de desenvolvedor para seu projeto
? pdoc – Gere documentação de API para seu código
? birdseye - Depure graficamente seu código Python
? escaleno - Crie um perfil do uso de CPU e memória do seu código por linha
? viztracer - Visualize o desempenho do seu código com um flamegraph
? tqdm – Adicione facilmente barras de progresso a trabalhos de longa duração
? Compensação entre viés e variância - Como o erro total de um modelo é a soma do viés e da variância (30 min)
? Os dois usos diferentes da validação cruzada - Como usar a validação cruzada aninhada para combinar os dois usos diferentes da validação cruzada (30 min)
? Modos, medianas e médias: uma perspectiva unificadora - Por que minimizar o erro médio absoluto (MAE) é mais robusto do que minimizar o erro quadrático médio (MSE) (30 min)
? A retropropagação é a regra da cadeia para calcular o gradiente - Como a retropropagação é um algoritmo para calcular o gradiente da função objetivo (30 min)
? Generalização empilhada - Como empilhar modelos (30 min)
? Temos usado a inicialização errada para t-SNE e UMAP - Como inicializar t-SNE e UMAP corretamente (15min)
? Das redes totalmente conectadas clássicas aos transformadores - Como as redes neurais evoluíram das redes totalmente conectadas aos transformadores (30 min)
? Qual é a regra .632+? - Como medir o desempenho da generalização com bootstrapping (30 min)
? Estratégias de empilhamento com e sem vazamentos - Diferentes estratégias para empilhar modelos (30 min)
? Mudanças e monitoramento de distribuição de dados - Como detectar e lidar com os diferentes tipos de mudança de dados (1 hora)
? Backprop não é apenas a regra da cadeia - Como a retropropagação se relaciona com os multiplicadores de Lagrange (30 min)
? Por que os algoritmos de ML são difíceis de ajustar – Otimize vários objetivos quando a frente de Pareto é côncava (30min)
? Compressão de modelo de aprendizado profundo – como quantização, remoção e destilação podem ser usadas para compactar modelos (30 min)
? SHAP: Explicações do aditivo SHapley - Como explicar a saída de um modelo com valores Shapley (30 min)
? Introdução ao Shapley e SHAP - Como os valores de Shapley são aproximados pelo SHAP (30 min)
? UMAP: Aproximação e projeção uniforme de coletores - Como reduzir a dimensionalidade para visualização e modelagem (30 min)
? PyNNDescent - Como encontrar vizinhos mais próximos em grandes conjuntos de dados (15 min)
? Precisão e recall - Como a precisão e o recall medem o desempenho de um classificador (30 min)
? Calibração de probabilidade - Como e para quais tipos de modelo você deve calibrar as pontuações de saída do modelo em probabilidades (30 min)
? Todos vocês estão calculando as taxas de rotatividade incorretamente - Defina corretamente o que é rotatividade (30 min)
? Processos Gaussianos - Do zero - Como construir modelos de regressão probabilística com Processos Gaussianos (1 hora)
? Document Image Transformer da Microsoft - um modelo pré-treinado auto-supervisionado que atinge desempenho SotA no PubLayNet e pode ser usado para várias tarefas downstream (30 min)
? Incorporação incrível de frases - Uma lista selecionada de modelos pré-treinados de incorporação de frases e palavras (15 min)
? O modelo Profeta - Como o modelo Profeta de Meta decompõe uma série temporal em componentes de tendência, sazonalidade e feriado (30 min)
? Dardos - Séries Temporais Facilitadas em Python - Como construir modelos de previsão com darts
(1 hora)
? Microsoft Recommenders – Uma comparação de modelos de sistema de recomendação (30 min)
? O que eu gostaria que alguém tivesse me contado sobre bibliotecas de computação tensor - como JAX, PyTorch, TensorFlow e Theano são diferentes (30 min)
? Série Modern Pandas (Parte 1 - 7) - Escreva pandas idiomáticos (1 hora)
? Awesome Pandas - Uma lista incrível de recursos do Pandas (1 hora)
? Usando Pipelines e FeatureUnions do scikit-learn - Como usar Pipeline
s para construir modelos ponta a ponta (30 min)
? Transformando alvo em regressão - Como transformar o alvo para construir modelos mais robustos (15 min)
? ColumnTransformer para dados heterogêneos - Como usar ColumnTransformer
para processar DataFrames pandas em sklearn Pipeline
s (30 min)
? Estimadores personalizados - Crie seu próprio Estimator
personalizado (30 min)
? Otimização de hiperparâmetros com redução sucessiva pela metade - Como otimizar hiperparâmetros com o método computacionalmente mais eficiente (30 min)
? Doccano - Uma ferramenta para rotular texto (30 min)
? CVAT: Computer Vision Annotation Tool - Uma ferramenta para rotular imagens (30 min)
? Rotulagem de dados incrível - Uma lista incrível de ferramentas de rotulagem de dados (30 min)
? invocar - Como implementar tarefas comuns executadas em seu projeto como uma CLI (30 min)
? poe - Como implementar tarefas comuns executadas em seu projeto como CLI (30 min)
? Introdução ao gerenciamento de empacotamento e dependências para Python com Poetry - Como gerenciar as dependências e o ambiente do seu pacote Python (30 min)
? Introdução ao Pyenv para aprendizado de máquina - Como usar o pyenv para gerenciar seu interpretador Python (30 min)
? Ambientes Python modernos - gerenciamento de dependências e espaço de trabalho - Uma comparação entre pyenv, venv + pip, venv + pip-tools, poesia, pipenv e conda (30 min)
? Conda: Mitos e Equívocos - Equívocos comuns sobre Conda (15 min)
? Currículo Docker - Como usar o Docker (4 horas)
? Cache de camada Docker - Como escrever Dockerfiles para se beneficiar do cache de camada (30 min)
? Práticas recomendadas do Dockerfile - Como escrever bons Dockerfiles (1 hora)
? Configurando o Gunicorn para Docker - Como configurar melhor o Gunicorn para uma imagem Docker (30 min)
? Acelere o Docker com o novo cache do BuildKit - Como acelerar compilações do Docker com um cache de compilação (30 min)
? Crie segredos no Docker e no Compose, a maneira segura - Como usar segredos em uma compilação do Docker (15 min)
? Scanners de segurança para Python e Docker - Como verificar sua imagem Docker em busca de problemas de segurança com seu código e imagem Docker (30 min)
? O scanner de segurança que gritou o lobo - Como verificar sua imagem Docker em busca de problemas de segurança sem falsos positivos (15 min)
? Awesome Docker – Uma lista incrível de recursos do Docker (30 min)
? Grandes Expectativas - Como testar e documentar seus dados e pipelines de dados (30 min)
? Práticas recomendadas do Cron - Como usar melhor o cron para agendar tarefas (30 min)
? Um guia visual para túneis SSH – Como encaminhar portas e criar túneis com SSH (30 min)
? Maneiras seguras de fazer coisas no bash - Como escrever scripts shell seguros e robustos (1 hora)
? Seu terminal não é um terminal: Uma Introdução aos Streams - Como seu terminal é uma ferramenta para manipular streams (30 min)
? Bash Heredoc - Como passar argumentos multilinhas para comandos com um heredoc (30 min)
? Pare de escrever scripts de shell - Por que você não deve escrever scripts de shell para imagens CI/CD ou Docker (30 min)
? Uma introdução ao Terraform - Como usar o Terraform (1 hora)
? Melhores práticas do Terraform - Melhores práticas do Terraform (1 hora)
? Coleção de ganchos de pré-commit do Terraform - Como automatizar verificações de qualidade de código do Terraform com pré-commit (1 hora)
? Awesome Terraform - Uma lista incrível de recursos do Terraform (30 min)
? Tutorial Terraform - Como começar a usar o Terraform (1 hora)
? Usando o armazenamento na memória do Redis para seus aplicativos Python - Como usar o Redis como um cache na memória para seu aplicativo Python (30 min)
? Consumidores Kafka em Python: pelo menos uma vez, no máximo uma vez, exatamente uma vez - Como escrever diferentes tipos de consumidores Kafka em Python (30 min)
? Kafka Exactly-Once-Semantics - Como produzir e consumir mensagens exatamente uma vez (1 hora)
? RabbitMQ: uma biblioteca de fila de mensagens com persistência - RabbitMQ é um sistema de mensagens com um corretor de mensagens (4 horas)
? ZeroMQ: uma biblioteca de soquetes com primitivas de fila de mensagens - ZeroMQ é um sistema de mensagens leve sem intermediário de mensagens (8 horas)
Superlinear é uma empresa de aprendizado de máquina com sede na Bélgica.
Inventamos, projetamos e desenvolvemos software baseado em IA. Juntamente com os nossos clientes, identificamos quais os problemas dentro das organizações que podem ser resolvidos com IA, demonstrando o valor da Inteligência Artificial para cada problema.
Nossa equipe está constantemente em busca de soluções inovadoras e de melhor desempenho e nos desafiamos para apresentar as melhores ideias para nossos clientes e nossa empresa.
Aqui estão alguns exemplos do que fazemos com Machine Learning, a tecnologia por trás da IA:
Ajude quem procura emprego a encontrar ótimos empregos que correspondam às suas expectativas. No site do Serviço Público de Emprego belga, você pode encontrar nossas recomendações de empregos com base apenas no seu currículo.
Ajude os hospitais a economizar tempo. Extraímos o diagnóstico das cartas de alta dos pacientes.
Ajude os editores a estimar seu impacto detectando artigos imitadores.
Trabalhamos duro e nos divertimos juntos. Promovemos uma cultura de colaboração, onde cada membro da equipe se sente apoiado ao assumir um desafio e confiável ao assumir responsabilidades.