Para más maravillas, echa un vistazo.
Esta es una lista seleccionada de excelentes recursos para todo lo que necesita para desarrollar soluciones de aprendizaje automático.
Cada elemento de esta lista le enseñará al menos una habilidad o información distinta y significativa.
Hay tres niveles de contenido:
? Lectura esencial para todos los ingenieros de ML
? Lectura avanzada para ingenieros profesionales de ML
? Material experto para ingenieros expertos en ML
Las descripciones están escritas para completar la frase "Después de leer este artículo habrás aprendido..." .
Comunicación
Ingeniería de software
Aprendizaje automático
DevOps
BLUF: El estándar militar que puede hacer que su escritura sea más poderosa: cómo hacer que su comunicación sea más poderosa (5 min)
El problema XY: cómo concentrarse en explicar su objetivo final cuando pide ayuda (5 min)
Descartar bicicletas: ¿qué madurez tienes como ingeniero? - Cómo evitar y denunciar el abandono de bicicletas (5 min)
Envíe correos electrónicos como un jefe: cómo escribir mejores correos electrónicos (5 min)
Deja de hacer trampa en tu calendario: cómo administrar tu calendario para que puedas concentrarte (15 min)
Cómo escribir en inglés sencillo - Cómo escribir en inglés sencillo (30 min)
Reglas de presentación: cómo crear una excelente plataforma de diapositivas (30 min)
Criterios SMART - Cómo definir objetivos (15 min)
Principio MECE: cómo descomponer completamente un problema en una lista estructurada (15 min)
SCQA: ¿Qué es, cómo funciona y cómo puede ayudarme? - Cómo estructurar tus presentaciones, propuestas y esquemas de ventas (15 min)
No más malentendidos: cómo evitar la falta de comunicación mediante la paráfrasis (15 min)
Comunicación no violenta: cómo brindar comentarios constructivos en situaciones difíciles (15 min)
El efecto Halo: cómo reconocer y utilizar el efecto Halo a tu favor (15 min)
Mes del hombre mítico: la relación entre los días-persona y el tiempo de rendimiento en un proyecto (15 min)
Modelo de los cuatro lados: cómo comunicarse eficazmente teniendo en cuenta cómo el receptor interpreta su mensaje (30 min)
Versionado semántico: cómo aumentar la versión de sus aplicaciones y paquetes (15 min)
__all__
e importaciones salvajes en Python: cómo __all__
define la API pública de sus paquetes de Python (15 min)
API para aprendizaje automático: cómo diseñar API RESTful para aplicaciones de aprendizaje automático (30 min)
Documentos de FastAPI: cómo crear API RESTful que se correspondan uno a uno con una especificación OpenAPI (1 día)
La regla de tres: cuándo construir componentes reutilizables y cuándo no (15 min)
Falsedades que los programadores creen sobre el tiempo: cómo evitar errores comunes sobre el tiempo (15 min)
Falsedades que los programadores creen sobre los nombres: cómo evitar errores comunes relacionados con los nombres (15 min)
Directrices para la interfaz de línea de comandos: cómo escribir excelentes CLI (1 hora)
Directrices de API RESTful de Zalando: cómo diseñar API RESTful (1 día)
Poetry Cookiecutter: cómo crear un entorno de desarrollo moderno basado en poesía para paquetes y aplicaciones de Python (30 min)
Las siete reglas de un excelente mensaje de confirmación de Git: cómo escribir excelentes mensajes de confirmación de Git (15 min)
Aprenda la ramificación de Git: practique Git desde principiante hasta avanzado (1 hora)
Mantenga un registro de cambios: cómo mantener un registro de cambios para sus aplicaciones y paquetes (30 min)
Confirmaciones convencionales: cómo anteponer sus mensajes de confirmación para automatizar el control de versiones semántico y mantener un registro de cambios (15 min)
Prueba de aplicaciones Python con Pytest: cómo probar correctamente un paquete con pytest (30 min)
Un modelo de ramificación de Git exitoso: cómo lanzar software con Git (15 min)
Mejores prácticas de revisión de código: qué buscar al revisar una solicitud de extracción (30 min)
Estado del código: Revisiones respetuosas == Revisiones útiles: cómo comunicar respetuosamente los comentarios de revisión del código (15 min)
La pirámide de revisión de código: qué buscar y qué automatizar al revisar una solicitud de extracción (15 min)
Complemento del espacio de trabajo de poesía: cómo crear y administrar un monorepo basado en poesía (15 min)
PEP20 "El Zen de Python" - Cómo escribir Python idiomático (15 min)
La guía definitiva para las declaraciones de importación de Python: cómo escribir declaraciones de importación (30 min)
Comprensión del módulo de registro de Python: cómo utilizar el módulo logging
de forma eficaz (30 min)
No ejecute el código en el momento de la importación: por qué no debería ejecutar el código en el momento de la importación
Por favor arregle a sus decoradores: por qué probablemente debería usar wrapt
para escribir a sus decoradores (30 min)
No iniciar sesión: qué debería hacer en lugar de iniciar sesión (30 min)
El pequeño libro de los antipatrones de Python: una colección de antipatrones de Python (X horas)
Python efectivo: una colección de modismos de Python (X horas)
Patrones de diseño de Python: una colección de patrones de arquitectura de software (1 hora)
SÓLIDO: un conjunto estándar de patrones de arquitectura de software (1 hora)
¡Qué carajo Python! - Cómo dominar Python entendiendo sus casos extremos (1 día)
La guía completa de mypy: cómo escribir anotaciones de tipo en Python (1 hora)
Descripción general de Pydantic: cómo escribir anotaciones de tipo para tipos complejos en lugar de un Dict[str, Any]
sin sentido (1 hora)
Número mágico: por qué los valores mágicos son un antipatrón (15 min)
Enums: cómo escribir Enum
s en Python en lugar de valores mágicos de tipo no seguro (15 min)
Mypy generics: cómo usar TypeVar
para escribir tipos genéricos como List[T]
(30 min)
Protocolos Mypy: cómo utilizar Protocol
para definir interfaces como Iterable
(30 min)
cookiecutter: desarrolle rápidamente nuevos paquetes o aplicaciones de Python con una plantilla de Cookiecutter
cruft - Actualiza el andamiaje Cookiecutter subyacente de un paquete Python
commitizen: compruebe que los mensajes de confirmación cumplan con las confirmaciones convencionales, automatice el control de versiones semántico y mantenga un registro de cambios.
poesía: gestiona el empaquetado y las dependencias de tu proyecto Python
poe: define y ejecuta tareas en un proyecto de poesía con Poe the Poet
poesía-workspace-plugin: gestiona un monorepo de Python con este complemento de poesía
negro: formatea automáticamente tu código
isort: ordena automáticamente tus declaraciones de importación
pre-commit: ejecuta automáticamente comprobaciones de calidad del código al confirmar
bandido: encuentre problemas de seguridad comunes
darglint: comprueba que tus cadenas de documentación coincidan con la firma de tu función
flake8 - Verifique su código en busca de errores y que su estilo de código sea compatible con PEP8
Extensiones Flake8: una lista impresionante de extensiones Flake8
mypy: comprueba la corrección del tipo de tu código
Ganchos de confirmación previa: una colección de ganchos de confirmación previa que verifican la calidad del archivo.
pydocstyle: comprueba que tu código esté documentado
Ganchos de pygrep: una colección de ganchos de confirmación previa que verifican los olores comunes del código Python.
pytest-recording: graba y reproduce solicitudes HTTP en tus pruebas de pytest
? pyupgrade: compruebe que su código esté escrito utilizando las últimas funciones del lenguaje Python
? seguridad: compruebe que sus dependencias no tengan vulnerabilidades de seguridad conocidas
? shellcheck: comprueba la calidad de tus scripts de shell
? cobertura.py - Verifique la cobertura de prueba de su código
? hipótesis: escriba pruebas que busquen automáticamente casos extremos que rompan su código
? hipótesis-auto - Automatiza la generación de pruebas de hipótesis basadas en las anotaciones de tipo de tu código
? fastapi: cree API RESTful basadas en anotaciones de tipo
? typer: crea CLI basadas en anotaciones de tipo
? streamlit: cree aplicaciones web con un solo archivo Python
? knock2version: lanza una nueva versión de tu paquete
? colouredlogs: aumente la legibilidad de sus registros con color
? hvplot: crea gráficos interactivos a partir de marcos de datos de pandas
? mkdocs: crea documentación para desarrolladores para tu proyecto
? pdoc: genera documentación API para tu código
? Birdeye: depura gráficamente tu código Python
? escaleno: perfile el uso de memoria y CPU de su código por línea
? viztracer: visualiza el rendimiento de tu código con un flamegraph
? tqdm: agregue fácilmente barras de progreso a trabajos de larga duración
? Compensación entre sesgo y varianza: cómo el error total de un modelo es la suma del sesgo y la varianza (30 min)
? Los dos usos diferentes de la validación cruzada: cómo utilizar la validación cruzada anidada para combinar los dos usos diferentes de la validación cruzada (30 min)
? Modas, medianas y medias: una perspectiva unificadora: por qué minimizar el error absoluto medio (MAE) es más sólido que minimizar el error cuadrático medio (MSE) (30 min)
? La retropropagación es la regla de la cadena para calcular el gradiente: cómo la retropropagación es un algoritmo para calcular el gradiente de la función objetivo (30 min)
? Generalización apilada: cómo apilar modelos (30 min)
? Hemos estado utilizando una inicialización incorrecta para t-SNE y UMAP: cómo inicializar t-SNE y UMAP correctamente (15 min)
? De las clásicas redes totalmente conectadas a los transformadores: cómo evolucionaron las redes neuronales de las redes totalmente conectadas a los transformadores (30 min)
? ¿Qué es la regla .632+? - Cómo medir el rendimiento de la generalización con bootstrapping (30 min)
? Estrategias de apilamiento con y sin fugas - Diferentes estrategias para apilar modelos (30 min)
? Turnos de Distribución de Datos y Monitoreo - Cómo detectar y abordar los diferentes tipos de turnos de datos (1 hora)
? La retropropagación no es solo la regla de la cadena: cómo se relaciona la retropropagación con los multiplicadores de Lagrange (30 min)
? Por qué los algoritmos de aprendizaje automático son difíciles de ajustar: optimice múltiples objetivos cuando el frente de Pareto es cóncavo (30 min)
? Compresión de modelos de aprendizaje profundo: cómo se pueden utilizar la cuantificación, la poda y la destilación para comprimir modelos (30 min)
? SHAP: Explicaciones aditivas de SHApley: cómo explicar el resultado de un modelo con valores de Shapley (30 min)
? Introducción a Shapley y SHAP: cómo SHAP aproxima los valores de Shapley (30 min)
? UMAP: Aproximación y proyección de colectores uniformes: cómo reducir la dimensionalidad para visualización y modelado (30 min)
? PyNNDescent: cómo encontrar vecinos más cercanos en conjuntos de datos enormes (15 min)
? Precisión y recuperación: cómo la precisión y la recuperación miden el rendimiento de un clasificador (30 min)
? Calibración de probabilidad: cómo y para qué tipos de modelos debe calibrar las puntuaciones de salida del modelo en probabilidades (30 min)
? Todos están calculando mal las tasas de abandono: defina correctamente qué es el abandono (30 min)
? Procesos Gaussianos - Desde cero - Cómo construir modelos de regresión probabilística con Procesos Gaussianos (1 hora)
? Document Image Transformer de Microsoft: un modelo previamente entrenado y autosupervisado que logra el rendimiento SotA en PubLayNet y se puede utilizar para diversas tareas posteriores (30 min)
? Incrustación de oraciones impresionante: una lista seleccionada de modelos de incrustación de palabras y oraciones previamente entrenados (15 min)
? El modelo Prophet: cómo el modelo Prophet de Meta descompone una serie temporal en componentes de tendencia, estacionalidad y días festivos (30 min)
? Dardos: series temporales simplificadas en Python: cómo crear modelos de pronóstico con darts
(1 hora)
? Recomendadores de Microsoft: una comparación de modelos de sistemas de recomendación (30 min)
? Lo que desearía que alguien me hubiera contado sobre las bibliotecas de computación tensorial: en qué se diferencian JAX, PyTorch, TensorFlow y Theano (30 min)
? Serie Modern Pandas (Parte 1 - 7): escribe pandas idiomáticos (1 hora)
? Awesome Pandas: una lista impresionante de recursos de Pandas (1 hora)
? Uso de scikit-learn Pipelines y FeatureUnions: cómo usar Pipeline
s para crear modelos de un extremo a otro (30 min)
? Transformar el objetivo en regresión: cómo transformar el objetivo para construir modelos más sólidos (15 min)
? ColumnTransformer para datos heterogéneos: cómo usar ColumnTransformer
para procesar pandas DataFrames en sklearn Pipeline
s (30 min)
? Estimadores personalizados: cree su propio Estimator
personalizado (30 min)
? Optimización de hiperparámetros con reducción a la mitad sucesiva: cómo optimizar los hiperparámetros con el método computacionalmente más eficiente (30 min)
? Doccano - Una herramienta para etiquetar texto (30 min)
? CVAT: herramienta de anotación de visión por computadora: una herramienta para etiquetar imágenes (30 min)
? Impresionante etiquetado de datos: una impresionante lista de herramientas de etiquetado de datos (30 min)
? invocar: cómo implementar tareas comunes que ejecuta en su proyecto como CLI (30 min)
? poe: cómo implementar tareas comunes que ejecuta en su proyecto como CLI (30 min)
? Introducción al empaquetado y la gestión de dependencias para Python con Poetry: cómo gestionar las dependencias y el entorno de su paquete Python (30 min)
? Introducción a Pyenv para aprendizaje automático: cómo usar pyenv para administrar su intérprete de Python (30 min)
? Entornos Python modernos: gestión de dependencias y espacios de trabajo: una comparación entre pyenv, venv + pip, venv + pip-tools, poesía, pipenv y conda (30 min)
? Conda: Mitos y conceptos erróneos: conceptos erróneos comunes sobre Conda (15 min)
? Plan de estudios de Docker: cómo utilizar Docker (4 horas)
? Almacenamiento en caché de capas de Docker: cómo escribir Dockerfiles para beneficiarse del almacenamiento en caché de capas (30 min)
? Mejores prácticas de Dockerfile: cómo escribir buenos Dockerfiles (1 hora)
? Configuración de Gunicorn para Docker: cómo configurar mejor Gunicorn para una imagen de Docker (30 min)
? Acelere Docker con el nuevo almacenamiento en caché de BuildKit: cómo acelerar las compilaciones de Docker con una caché de compilación (30 min)
? Cree secretos en Docker y Compose, de forma segura: cómo usar secretos en una compilación de Docker (15 min)
? Escáneres de seguridad para Python y Docker: cómo escanear su imagen de Docker en busca de problemas de seguridad con su código y su imagen de Docker (30 min)
? El escáner de seguridad que gritó: Cómo escanear su imagen de Docker en busca de problemas de seguridad sin falsos positivos (15 min)
? Awesome Docker: una lista impresionante de recursos de Docker (30 min)
? Grandes expectativas: cómo probar y documentar sus datos y canalizaciones de datos (30 min)
? Mejores prácticas de cron: cómo utilizar mejor cron para programar tareas (30 min)
? Una guía visual de túneles SSH: cómo reenviar puertos y crear túneles con SSH (30 min)
? Formas seguras de hacer cosas en bash: cómo escribir scripts de shell seguros y sólidos (1 hora)
? Su terminal no es un terminal: Introducción a Streams - Cómo su terminal es una herramienta para manipular streams (30 min)
? Bash Heredoc: cómo pasar argumentos multilínea a comandos con un heredoc (30 min)
? Deje de escribir scripts de Shell: por qué no debería escribir scripts de Shell para CI/CD o imágenes de Docker (30 min)
? Introducción a Terraform: cómo utilizar Terraform (1 hora)
? Mejores prácticas de Terraform - Mejores prácticas de Terraform (1 hora)
? Colección de ganchos de confirmación previa de Terraform: cómo automatizar las comprobaciones de calidad del código de Terraform con confirmación previa (1 hora)
? Awesome Terraform: una lista impresionante de recursos de Terraform (30 min)
? Tutorial de Terraform: cómo empezar a utilizar Terraform (1 hora)
? Uso del almacenamiento en memoria de Redis para sus aplicaciones Python: cómo usar Redis como caché en memoria para su aplicación Python (30 min)
? Consumidores de Python Kafka: al menos una vez, como máximo una vez, exactamente una vez: cómo escribir diferentes tipos de consumidores de Kafka en Python (30 min)
? Kafka Exactly-Once-Semantics: cómo producir y consumir mensajes exactamente una vez (1 hora)
? RabbitMQ: una biblioteca de colas de mensajes con persistencia - RabbitMQ es un sistema de mensajería con un intermediario de mensajes (4 horas)
? ZeroMQ: una biblioteca de sockets con primitivas de cola de mensajes: ZeroMQ es un sistema de mensajería liviano sin un intermediario de mensajes (8 horas)
Superlinear es una empresa de aprendizaje automático con sede en Bélgica.
Inventamos, diseñamos y desarrollamos software impulsado por IA. Junto con nuestros clientes, identificamos qué problemas dentro de las organizaciones se pueden resolver con IA, demostrando el valor de la Inteligencia Artificial para cada problema.
Nuestro equipo busca constantemente soluciones novedosas y de mejor rendimiento y nos desafiamos mutuamente para generar las mejores ideas para nuestros clientes y nuestra empresa.
A continuación se muestran algunos ejemplos de lo que hacemos con Machine Learning, la tecnología detrás de la IA:
Ayude a quienes buscan empleo a encontrar excelentes trabajos que coincidan con sus expectativas. En el sitio web del Servicio Público de Empleo de Bélgica, puede encontrar nuestras recomendaciones laborales basadas únicamente en su CV.
Ayude a los hospitales a ahorrar tiempo. Extraemos el diagnóstico de las cartas de alta de los pacientes.
Ayude a los editores a estimar su impacto detectando artículos imitadores.
Trabajamos duro y nos divertimos juntos. Fomentamos una cultura de colaboración, donde cada miembro del equipo se siente apoyado al asumir un desafío y confiado al asumir una responsabilidad.