Nota: Você pode converter facilmente este arquivo markdown em PDF no VSCode usando esta útil extensão Markdown PDF.
Estruturas de aprendizado de máquina/aprendizado profundo.
Recursos de aprendizagem para ML
Estruturas, bibliotecas e ferramentas de ML
Algoritmos
Desenvolvimento PyTorch
Desenvolvimento TensorFlow
Desenvolvimento central de ML
Desenvolvimento de aprendizagem profunda
Desenvolvimento de aprendizagem por reforço
Desenvolvimento de Visão Computacional
Desenvolvimento de Processamento de Linguagem Natural (PNL)
Bioinformática
Desenvolvimento CUDA
Desenvolvimento MATLAB
Desenvolvimento C/C++
Desenvolvimento Java
Desenvolvimento Python
Desenvolvimento Scala
Desenvolvimento R
Júlia Desenvolvimento
Voltar ao topo
Machine Learning é um ramo da inteligência artificial (IA) focado na construção de aplicativos usando algoritmos que aprendem com modelos de dados e melhoram sua precisão ao longo do tempo, sem a necessidade de programação.
Voltar ao topo
Práticas recomendadas de processamento de linguagem natural (PNL) da Microsoft
O livro de receitas de direção autônoma da Microsoft
Azure Machine Learning – ML como serviço | Microsoft Azure
Como executar Jupyter Notebooks em seu espaço de trabalho do Azure Machine Learning
Aprendizado de Máquina e Inteligência Artificial | Amazon Web Services
Agendamento de notebooks Jupyter em instâncias efêmeras do Amazon SageMaker
IA e aprendizado de máquina | Google Nuvem
Usando notebooks Jupyter com Apache Spark no Google Cloud
Aprendizado de máquina | Desenvolvedor Apple
Inteligência Artificial e Piloto Automático | Tesla
Ferramentas Meta AI | Facebook
Tutoriais PyTorch
Tutoriais do TensorFlow
Laboratório Jupyter
Difusão estável com Core ML em Apple Silicon
Voltar ao topo
Aprendizado de máquina pela Universidade de Stanford por Andrew Ng | Curso
Treinamento e certificação da AWS para cursos de aprendizado de máquina (ML)
Programa de bolsas de aprendizado de máquina para Microsoft Azure | Udacidade
Certificado pela Microsoft: Azure Data Scientist Associate
Certificado pela Microsoft: Engenheiro Associado de IA do Azure
Treinamento e implantação do Azure Machine Learning
Aprendendo aprendizado de máquina e inteligência artificial com o treinamento do Google Cloud
Curso intensivo de aprendizado de máquina para Google Cloud
Cursos de aprendizado de máquina on-line | Udemy
Cursos de aprendizado de máquina on-line | Curso
Aprenda aprendizado de máquina com cursos e aulas online | edX
Voltar ao topo
Introdução ao aprendizado de máquina (PDF)
Inteligência Artificial: Uma Abordagem Moderna por Stuart J. Russel e Peter Norvig
Aprendizado profundo por Ian Goodfellow, Yoshoua Bengio e Aaron Courville
O livro de aprendizado de máquina de cem páginas, de Andriy Burkov
Aprendizado de máquina por Tom M. Mitchell
Programando Inteligência Coletiva: Construindo Aplicativos Smart Web 2.0 por Toby Segaran
Aprendizado de máquina: uma perspectiva algorítmica, segunda edição
Reconhecimento de padrões e aprendizado de máquina por Christopher M. Bishop
Processamento de linguagem natural com Python por Steven Bird, Ewan Klein e Edward Loper
Aprendizado de máquina Python: uma abordagem técnica de aprendizado de máquina para iniciantes, por Leonard Eddison
Raciocínio bayesiano e aprendizado de máquina por David Barber
Aprendizado de máquina para iniciantes: uma introdução em inglês simples, por Oliver Theobald
Aprendizado de máquina em ação por Ben Wilson
Aprendizado de máquina prático com Scikit-Learn, Keras e TensorFlow: conceitos, ferramentas e técnicas para construir sistemas inteligentes por Aurélien Géron
Introdução ao aprendizado de máquina com Python: um guia para cientistas de dados por Andreas C. Müller e Sarah Guido
Aprendizado de máquina para hackers: estudos de caso e algoritmos para você começar, por Drew Conway e John Myles White
Os elementos da aprendizagem estatística: mineração de dados, inferência e previsão por Trevor Hastie, Robert Tibshirani e Jerome Friedman
Padrões distribuídos de aprendizado de máquina - livro (livre para leitura online) + código
Aprendizado de máquina do mundo real [capítulos gratuitos]
Uma introdução à aprendizagem estatística - Livro + Código R
Elementos de Aprendizagem Estatística - Livro
Think Bayes - Livro + Código Python
Mineração de conjuntos de dados massivos
Um primeiro encontro com aprendizado de máquina
Introdução ao aprendizado de máquina - Alex Smola e SVN Vishwanathan
Uma teoria probabilística de reconhecimento de padrões
Introdução à recuperação de informações
Previsão: princípios e prática
Introdução ao aprendizado de máquina - Amnon Shashua
Aprendizagem por Reforço
Aprendizado de máquina
Uma busca pela IA
Programação R para Ciência de Dados
Mineração de dados - ferramentas e técnicas práticas de aprendizado de máquina
Aprendizado de máquina com TensorFlow
Sistemas de aprendizado de máquina
Fundamentos do aprendizado de máquina - Mehryar Mohri, Afshin Rostamizadeh e Ameet Talwalkar
Pesquisa baseada em IA - Trey Grainger, Doug Turnbull, Max Irwin -
Métodos Ensemble para Aprendizado de Máquina - Gautam Kunapuli
Engenharia de aprendizado de máquina em ação - Ben Wilson
Aprendizado de máquina que preserva a privacidade - J. Morris Chang, Di Zhuang, G. Dumindu Samaraweera
Aprendizado de máquina automatizado em ação - Qingquan Song, Haifeng Jin e Xia Hu
Padrões Distribuídos de Aprendizado de Máquina - Yuan Tang
Gerenciando projetos de aprendizado de máquina: do design à implantação - Simon Thompson
Aprendizado de máquina causal - Robert Ness
Otimização Bayesiana em Ação - Quan Nguyen
Algoritmos de aprendizado de máquina em profundidade) - Vadim Smolyakov
Algoritmos de Otimização - Alaa Khamis
Aumento prático de gradiente por Guillaume Saupin
Voltar ao topo
Voltar ao topo
TensorFlow é uma plataforma de código aberto ponta a ponta para aprendizado de máquina. Possui um ecossistema abrangente e flexível de ferramentas, bibliotecas e recursos da comunidade que permite aos pesquisadores impulsionar o que há de mais moderno em ML e aos desenvolvedores criar e implantar facilmente aplicativos baseados em ML.
Keras é uma API de redes neurais de alto nível, escrita em Python e capaz de ser executada em TensorFlow, CNTK ou Theano. Foi desenvolvida com foco em permitir experimentação rápida. Ele é capaz de ser executado em TensorFlow, Microsoft Cognitive Toolkit, R, Theano ou PlaidML.
PyTorch é uma biblioteca para aprendizado profundo em dados de entrada irregulares, como gráficos, nuvens de pontos e variedades. Desenvolvido principalmente pelo laboratório de pesquisa de IA do Facebook.
O Amazon SageMaker é um serviço totalmente gerenciado que oferece a todos os desenvolvedores e cientistas de dados a capacidade de criar, treinar e implantar modelos de machine learning (ML) rapidamente. O SageMaker elimina o trabalho pesado de cada etapa do processo de aprendizado de máquina para facilitar o desenvolvimento de modelos de alta qualidade.
Azure Databricks é um serviço de análise de big data baseado em Apache Spark, rápido e colaborativo, projetado para ciência e engenharia de dados. O Azure Databricks configura seu ambiente Apache Spark em minutos, dimensiona automaticamente e colabora em projetos compartilhados em um espaço de trabalho interativo. O Azure Databricks dá suporte a Python, Scala, R, Java e SQL, bem como estruturas e bibliotecas de ciência de dados, incluindo TensorFlow, PyTorch e scikit-learn.
Microsoft Cognitive Toolkit (CNTK) é um kit de ferramentas de código aberto para aprendizado profundo distribuído de nível comercial. Ele descreve redes neurais como uma série de etapas computacionais por meio de um gráfico direcionado. O CNTK permite ao usuário realizar e combinar facilmente tipos de modelos populares, como DNNs feed-forward, redes neurais convolucionais (CNNs) e redes neurais recorrentes (RNNs/LSTMs). CNTK implementa aprendizado de descida gradiente estocástica (SGD, retropropagação de erro) com diferenciação automática e paralelização em várias GPUs e servidores.
Apple CoreML é uma estrutura que ajuda a integrar modelos de aprendizado de máquina ao seu aplicativo. Core ML fornece uma representação unificada para todos os modelos. Seu aplicativo usa APIs Core ML e dados do usuário para fazer previsões e treinar ou ajustar modelos, tudo no dispositivo do usuário. Um modelo é o resultado da aplicação de um algoritmo de aprendizado de máquina a um conjunto de dados de treinamento. Você usa um modelo para fazer previsões com base em novos dados de entrada.
Apache OpenNLP é uma biblioteca de código aberto para um kit de ferramentas baseado em aprendizado de máquina usado no processamento de texto em linguagem natural. Ele apresenta uma API para casos de uso como reconhecimento de entidade nomeada, detecção de frases, marcação POS (parte da fala), extração de recurso de tokenização, fragmentação, análise e resolução de coreferência.
Apache Airflow é uma plataforma de gerenciamento de fluxo de trabalho de código aberto criada pela comunidade para criar, agendar e monitorar fluxos de trabalho de forma programática. Instalar. Princípios. Escalável. O Airflow possui uma arquitetura modular e usa uma fila de mensagens para orquestrar um número arbitrário de trabalhadores. O Airflow está pronto para ser dimensionado até o infinito.
Open Neural Network Exchange (ONNX) é um ecossistema aberto que capacita os desenvolvedores de IA a escolher as ferramentas certas à medida que seu projeto evolui. ONNX fornece um formato de código aberto para modelos de IA, tanto de aprendizagem profunda quanto de ML tradicional. Ele define um modelo gráfico de computação extensível, bem como definições de operadores integrados e tipos de dados padrão.
Apache MXNet é uma estrutura de aprendizado profundo projetada para eficiência e flexibilidade. Ele permite combinar programação simbólica e imperativa para maximizar a eficiência e a produtividade. Em sua essência, o MXNet contém um agendador de dependência dinâmica que paraleliza automaticamente operações simbólicas e imperativas em tempo real. Além disso, uma camada de otimização de gráfico torna a execução simbólica rápida e eficiente em termos de memória. MXNet é portátil e leve, podendo ser dimensionado de forma eficaz para várias GPUs e várias máquinas. Suporte para Python, R, Julia, Scala, Go, Javascript e muito mais.
AutoGluon é um kit de ferramentas para aprendizado profundo que automatiza tarefas de aprendizado de máquina, permitindo que você obtenha facilmente um forte desempenho preditivo em seus aplicativos. Com apenas algumas linhas de código, você pode treinar e implantar modelos de aprendizagem profunda de alta precisão em dados tabulares, de imagem e de texto.
Anaconda é uma plataforma de ciência de dados muito popular para aprendizado de máquina e aprendizado profundo que permite aos usuários desenvolver modelos, treiná-los e implantá-los.
PlaidML é um compilador tensor avançado e portátil para permitir aprendizado profundo em laptops, dispositivos incorporados ou outros dispositivos onde o hardware de computação disponível não é bem suportado ou a pilha de software disponível contém restrições de licença desagradáveis.
OpenCV é uma biblioteca altamente otimizada com foco em aplicações de visão computacional em tempo real. As interfaces C++, Python e Java suportam Linux, MacOS, Windows, iOS e Android.
Scikit-Learn é um módulo Python para aprendizado de máquina desenvolvido com base em SciPy, NumPy e matplotlib, tornando mais fácil a aplicação de implementações robustas e simples de muitos algoritmos populares de aprendizado de máquina.
Weka é um software de aprendizado de máquina de código aberto que pode ser acessado por meio de uma interface gráfica de usuário, aplicativos de terminal padrão ou API Java. É amplamente utilizado para ensino, pesquisa e aplicações industriais, contém uma infinidade de ferramentas integradas para tarefas padrão de aprendizado de máquina e, além disso, oferece acesso transparente a caixas de ferramentas conhecidas, como scikit-learn, R e Deeplearning4j.
Caffe é uma estrutura de aprendizagem profunda feita com expressão, velocidade e modularidade em mente. Ele é desenvolvido pela Berkeley AI Research (BAIR)/The Berkeley Vision and Learning Center (BVLC) e colaboradores da comunidade.
Theano é uma biblioteca Python que permite definir, otimizar e avaliar expressões matemáticas envolvendo matrizes multidimensionais de forma eficiente, incluindo forte integração com NumPy.
nGraph é uma biblioteca C++ de código aberto, compilador e tempo de execução para Deep Learning. O nGraph Compiler visa acelerar o desenvolvimento de cargas de trabalho de IA usando qualquer estrutura de aprendizado profundo e implantando em uma variedade de alvos de hardware. Ele fornece liberdade, desempenho e facilidade de uso para desenvolvedores de IA.
NVIDIA cuDNN é uma biblioteca de primitivas acelerada por GPU para redes neurais profundas. cuDNN fornece implementações altamente ajustadas para rotinas padrão, como convolução direta e reversa, pooling, normalização e camadas de ativação. cuDNN acelera estruturas de aprendizagem profunda amplamente utilizadas, incluindo Caffe2, Chainer, Keras, MATLAB, MxNet, PyTorch e TensorFlow.
Huginn é um sistema auto-hospedado para construção de agentes que executam tarefas automatizadas para você online. Ele pode ler a web, observar eventos e realizar ações em seu nome. Os Agentes de Huginn criam e consomem eventos, propagando-os ao longo de um gráfico direcionado. Pense nisso como uma versão hackeável do IFTTT ou Zapier em seu próprio servidor.
Netron é um visualizador de modelos de redes neurais, aprendizado profundo e aprendizado de máquina. Suporta ONNX, TensorFlow Lite, Caffe, Keras, Darknet, PaddlePaddle, ncnn, MNN, Core ML, RKNN, MXNet, MindSpore Lite, TNN, Barracuda, Tengine, CNTK, TensorFlow.js, Caffe2 e UFF.
Dopamina é uma estrutura de pesquisa para prototipagem rápida de algoritmos de aprendizagem por reforço.
DALI é uma biblioteca acelerada por GPU que contém blocos de construção altamente otimizados e um mecanismo de execução para processamento de dados para acelerar aplicativos de treinamento e inferência de aprendizado profundo.
MindSpore Lite é uma nova estrutura de treinamento/inferência de aprendizagem profunda de código aberto que pode ser usada para cenários móveis, de borda e de nuvem.
Darknet é uma estrutura de rede neural de código aberto escrita em C e CUDA. É rápido, fácil de instalar e suporta computação de CPU e GPU.
PaddlePaddle é uma plataforma de aprendizado profundo fácil de usar, eficiente, flexível e escalonável, originalmente desenvolvida por cientistas e engenheiros do Baidu com o propósito de aplicar aprendizado profundo a muitos produtos do Baidu.
GoogleNotebookLM é uma ferramenta experimental de IA que usa o poder dos modelos de linguagem combinados com seu conteúdo existente para obter insights críticos com mais rapidez. Semelhante a um assistente de pesquisa virtual que pode resumir fatos, explicar ideias complexas e debater novas conexões com base nas fontes selecionadas.
Unilm é um pré-treinamento autosupervisionado em grande escala em tarefas, idiomas e modalidades.
O Semantic Kernel (SK) é um SDK leve que permite a integração de AI Large Language Models (LLMs) com linguagens de programação convencionais. O modelo de programação extensível SK combina funções semânticas de linguagem natural, funções nativas de código tradicional e memória baseada em incorporações, desbloqueando novo potencial e agregando valor às aplicações com IA.
Pandas AI é uma biblioteca Python que integra recursos generativos de inteligência artificial ao Pandas, tornando os dataframes conversacionais.
NCNN é uma estrutura de inferência de rede neural de alto desempenho otimizada para plataforma móvel.
MNN é uma estrutura de aprendizado profundo extremamente rápida e leve, testada em batalha por casos de uso críticos para os negócios no Alibaba.
MediaPipe é otimizado para desempenho ponta a ponta em uma ampla variedade de plataformas. Veja demonstrações Saiba mais ML complexo no dispositivo, simplificado Abstraímos as complexidades de tornar o ML no dispositivo personalizável, pronto para produção e acessível em todas as plataformas.
MegEngine é uma estrutura de aprendizado profundo rápida, escalonável e fácil de usar com três recursos principais: Estrutura unificada para treinamento e inferência.
ML.NET é uma biblioteca de aprendizado de máquina projetada como uma plataforma extensível para que você possa consumir outras estruturas populares de ML (TensorFlow, ONNX, Infer.NET e mais) e ter acesso a ainda mais cenários de aprendizado de máquina, como classificação de imagens, detecção de objetos e muito mais.
Ludwig é uma estrutura declarativa de aprendizado de máquina que facilita a definição de pipelines de aprendizado de máquina usando um sistema de configuração simples e flexível baseado em dados.
MMdnn é uma ferramenta abrangente e de estrutura cruzada para converter, visualizar e diagnosticar modelos de aprendizagem profunda (DL). O “MM” significa gerenciamento de modelo e “dnn” é o acrônimo de rede neural profunda. Converta modelos entre Caffe, Keras, MXNet, Tensorflow, CNTK, PyTorch Onnx e CoreML.
Horovod é uma estrutura de treinamento de aprendizagem profunda distribuída para TensorFlow, Keras, PyTorch e Apache MXNet.
Vaex é uma biblioteca Python de alto desempenho para DataFrames out-of-core preguiçosos (semelhantes ao Pandas), para visualizar e explorar grandes conjuntos de dados tabulares.
GluonTS é um pacote Python para modelagem probabilística de séries temporais, com foco em modelos baseados em aprendizagem profunda, baseados em PyTorch e MXNet.
MindsDB é um servidor ML-SQL que permite fluxos de trabalho de aprendizado de máquina para os bancos de dados e data warehouses mais poderosos usando SQL.
Jupyter Notebook é um aplicativo da web de código aberto que permite criar e compartilhar documentos que contêm código ativo, equações, visualizações e texto narrativo. O Jupyter é amplamente utilizado em setores que realizam limpeza e transformação de dados, simulação numérica, modelagem estatística, visualização de dados, ciência de dados e aprendizado de máquina.
Apache Spark é um mecanismo analítico unificado para processamento de dados em grande escala. Ele fornece APIs de alto nível em Scala, Java, Python e R e um mecanismo otimizado que oferece suporte a gráficos de computação geral para análise de dados. Ele também oferece suporte a um rico conjunto de ferramentas de nível superior, incluindo Spark SQL para SQL e DataFrames, MLlib para aprendizado de máquina, GraphX para processamento de gráficos e Streaming Estruturado para processamento de stream.
O Apache Spark Connector para SQL Server e Azure SQL é um conector de alto desempenho que permite usar dados transacionais em análises de big data e persistir resultados para consultas ad hoc ou relatórios. O conector permite que você use qualquer banco de dados SQL, local ou na nuvem, como fonte de dados de entrada ou coletor de dados de saída para trabalhos do Spark.
Apache PredictionIO é uma estrutura de aprendizado de máquina de código aberto para desenvolvedores, cientistas de dados e usuários finais. Ele oferece suporte à coleta de eventos, implantação de algoritmos, avaliação e consulta de resultados preditivos por meio de APIs REST. É baseado em serviços escalonáveis de código aberto como Hadoop, HBase (e outros bancos de dados), Elasticsearch, Spark e implementa o que é chamado de arquitetura Lambda.
Cluster Manager for Apache Kafka (CMAK) é uma ferramenta para gerenciar clusters Apache Kafka.
BigDL é uma biblioteca distribuída de aprendizado profundo para Apache Spark. Com o BigDL, os usuários podem escrever seus aplicativos de aprendizagem profunda como programas Spark padrão, que podem ser executados diretamente em clusters Spark ou Hadoop existentes.
Eclipse Deeplearning4J (DL4J) é um conjunto de projetos destinados a suportar todas as necessidades de um aplicativo de aprendizado profundo baseado em JVM (Scala, Kotlin, Clojure e Groovy). Isso significa começar com os dados brutos, carregá-los e pré-processá-los de qualquer lugar e formato para construir e ajustar uma ampla variedade de redes de aprendizagem profunda simples e complexas.
Tensorman é um utilitário para fácil gerenciamento de contêineres Tensorflow desenvolvido pela System76. Tensorman permite que o Tensorflow opere em um ambiente isolado que está contido no resto do sistema. Este ambiente virtual pode operar independentemente do sistema base, permitindo usar qualquer versão do Tensorflow em qualquer versão de uma distribuição Linux que suporte o tempo de execução do Docker.
Numba é um compilador de otimização de código aberto compatível com NumPy para Python, patrocinado pela Anaconda, Inc. Ele usa o projeto do compilador LLVM para gerar código de máquina a partir da sintaxe Python. Numba pode compilar um grande subconjunto de Python com foco numérico, incluindo muitas funções NumPy. Além disso, Numba tem suporte para paralelização automática de loops, geração de código acelerado por GPU e criação de ufuncs e retornos de chamada C.
Chainer é uma estrutura de aprendizado profundo baseada em Python que visa flexibilidade. Ele fornece APIs de diferenciação automática baseadas na abordagem definida por execução (gráficos computacionais dinâmicos), bem como APIs de alto nível orientadas a objetos para construir e treinar redes neurais. Ele também oferece suporte a CUDA/cuDNN usando CuPy para treinamento e inferência de alto desempenho.
XGBoost é uma biblioteca otimizada de aumento de gradiente distribuída, projetada para ser altamente eficiente, flexível e portátil. Ele implementa algoritmos de aprendizado de máquina na estrutura Gradient Boosting. XGBoost fornece um aumento de árvore paralelo (também conhecido como GBDT, GBM) que resolve muitos problemas de ciência de dados de forma rápida e precisa. Ele oferece suporte ao treinamento distribuído em várias máquinas, incluindo clusters AWS, GCE, Azure e Yarn. Além disso, pode ser integrado com Flink, Spark e outros sistemas de fluxo de dados em nuvem.
cuML é um conjunto de bibliotecas que implementam algoritmos de aprendizado de máquina e funções matemáticas primitivas que compartilham APIs compatíveis com outros projetos RAPIDS. cuML permite que cientistas de dados, pesquisadores e engenheiros de software executem tarefas tabulares tradicionais de ML em GPUs sem entrar nos detalhes da programação CUDA. Na maioria dos casos, a API Python do cuML corresponde à API do scikit-learn.
Emu é uma biblioteca GPGPU para Rust com foco em portabilidade, modularidade e desempenho. É uma abstração específica de computação no estilo CUDA sobre WebGPU, fornecendo funcionalidade específica para fazer com que o WebGPU pareça mais com CUDA.
Scalene é um criador de perfil de CPU, GPU e memória de alto desempenho para Python que faz uma série de coisas que outros criadores de perfil Python não fazem e não podem fazer. Ele executa ordens de magnitude mais rápido do que muitos outros criadores de perfil, ao mesmo tempo que fornece informações muito mais detalhadas.
MLpack é uma biblioteca de aprendizado de máquina C++ rápida e flexível, escrita em C++ e construída na biblioteca de álgebra linear Armadillo, na pequena biblioteca de otimização numérica e em partes do Boost.
Netron é um visualizador de modelos de redes neurais, aprendizado profundo e aprendizado de máquina. Suporta ONNX, TensorFlow Lite, Caffe, Keras, Darknet, PaddlePaddle, ncnn, MNN, Core ML, RKNN, MXNet, MindSpore Lite, TNN, Barracuda, Tengine, CNTK, TensorFlow.js, Caffe2 e UFF.
Lightning é uma ferramenta que cria e treina modelos PyTorch e os conecta ao ciclo de vida de ML usando modelos de aplicativos Lightning, sem lidar com infraestrutura DIY, gerenciamento de custos, escalonamento, etc.
OpenNN é uma biblioteca de redes neurais de código aberto para aprendizado de máquina. Ele contém algoritmos e utilitários sofisticados para lidar com muitas soluções de inteligência artificial.
H20 é uma plataforma AI Cloud que resolve problemas de negócios complexos e acelera a descoberta de novas ideias com resultados que você pode compreender e confiar.
Gensim é uma biblioteca Python para modelagem de tópicos, indexação de documentos e recuperação de similaridade com grandes corpora. O público-alvo é a comunidade de processamento de linguagem natural (PNL) e recuperação de informação (RI).
llama.cpp é um modelo LLaMA do Port of Facebook em C/C++.
hmmlearn é um conjunto de algoritmos para aprendizagem não supervisionada e inferência de modelos ocultos de Markov.
Nextjournal é um caderno para pesquisas reproduzíveis. Ele executa qualquer coisa que você possa colocar em um contêiner Docker. Melhore seu fluxo de trabalho com notebooks poliglotas, controle de versão automático e colaboração em tempo real. Economize tempo e dinheiro com provisionamento sob demanda, incluindo suporte a GPU.
IPython fornece uma arquitetura rica para computação interativa com:
Veles é uma plataforma distribuída para desenvolvimento rápido de aplicativos de aprendizado profundo atualmente desenvolvida pela Samsung.
DyNet é uma biblioteca de redes neurais desenvolvida pela Carnegie Mellon University e muitas outras. Ele é escrito em C++ (com ligações em Python) e foi projetado para ser eficiente quando executado em CPU ou GPU e para funcionar bem com redes que possuem estruturas dinâmicas que mudam para cada instância de treinamento. Esses tipos de redes são particularmente importantes em tarefas de processamento de linguagem natural, e DyNet tem sido usado para construir sistemas de última geração para análise sintática, tradução automática, inflexão morfológica e muitas outras áreas de aplicação.
Ray é uma estrutura unificada para dimensionar aplicativos de IA e Python. Ele consiste em um tempo de execução distribuído principal e um kit de ferramentas de bibliotecas (Ray AIR) para acelerar cargas de trabalho de ML.
sussurro.cpp é uma inferência de alto desempenho do modelo de reconhecimento automático de fala (ASR) Whisper da OpenAI.
ChatGPT Plus é um plano de assinatura piloto ( US$ 20/mês ) para ChatGPT, uma IA de conversação que pode conversar com você, responder perguntas de acompanhamento e desafiar suposições incorretas.
Auto-GPT é um “agente de IA” que, dado um objetivo em linguagem natural, pode tentar alcançá-lo dividindo-o em subtarefas e usando a internet e outras ferramentas em um loop automático. Ele usa APIs GPT-4 ou GPT-3.5 da OpenAI e está entre os primeiros exemplos de aplicação que usa GPT-4 para realizar tarefas autônomas.
Chatbot UI de mckaywrigley é um kit de chatbot avançado para modelos de chat da OpenAI construído sobre Chatbot UI Lite usando Next.js, TypeScript e Tailwind CSS. Esta versão da UI do ChatBot oferece suporte aos modelos GPT-3.5 e GPT-4. As conversas são armazenadas localmente no seu navegador. Você pode exportar e importar conversas para se proteger contra perda de dados. Veja uma demonstração.
Chatbot UI Lite de mckaywrigley é um kit inicial de chatbot simples para o modelo de bate-papo da OpenAI usando Next.js, TypeScript e Tailwind CSS. Veja uma demonstração.
MiniGPT-4 é um aprimoramento da compreensão da linguagem visual com modelos avançados de linguagem grande.
GPT4All é um ecossistema de chatbots de código aberto treinados em uma enorme coleção de dados de assistentes limpos, incluindo código, histórias e diálogos baseados em LLaMa.
GPT4All UI é um aplicativo da web Flask que fornece uma UI de bate-papo para interagir com o chatbot GPT4All.
Alpaca.cpp é um modelo rápido do tipo ChatGPT localizado localmente no seu dispositivo. Ele combina o modelo básico LLaMA com uma reprodução aberta do Stanford Alpaca, um ajuste fino do modelo básico para obedecer às instruções (semelhante ao RLHF usado para treinar ChatGPT) e um conjunto de modificações no llama.cpp para adicionar uma interface de chat.
llama.cpp é um modelo LLaMA do Port of Facebook em C/C++.
OpenPlayground é um playground para executar modelos do tipo ChatGPT localmente em seu dispositivo.
Vicuna é um chatbot de código aberto treinado pelo ajuste fino do LLaMA. Aparentemente, atinge mais de 90% de qualidade de chatgpt e custa US$ 300 para treinar.
Yeagar ai é um criador de agente Langchain projetado para ajudá-lo a construir, prototipar e implantar agentes com tecnologia de IA com facilidade.
Vicuna é criada ajustando um modelo base LLaMA usando aproximadamente 70 mil conversas compartilhadas por usuários coletadas de ShareGPT.com com APIs públicas. Para garantir a qualidade dos dados, ele converte o HTML novamente em markdown e filtra algumas amostras inadequadas ou de baixa qualidade.
ShareGPT é um lugar para compartilhar suas conversas mais loucas do ChatGPT com um clique. Com 198.404 conversas compartilhadas até o momento.
FastChat é uma plataforma aberta para treinar, servir e avaliar chatbots baseados em grandes modelos de linguagem.
Haystack é uma estrutura de PNL de código aberto para interagir com seus dados usando modelos Transformer e LLMs (GPT-4, ChatGPT e similares). Ele oferece ferramentas prontas para produção para criar rapidamente tomadas de decisões complexas, respostas a perguntas, pesquisa semântica, aplicativos de geração de texto e muito mais.
StableLM (Stability AI Language Models) é uma série de modelos de linguagem StableLM e será continuamente atualizado com novos pontos de verificação.
Dolly do Databricks é um modelo de linguagem grande que segue instruções, treinado na plataforma de aprendizado de máquina Databricks e licenciado para uso comercial.
GPTCach é uma biblioteca para criação de cache semântico para consultas LLM.
AlaC é um gerador de infraestrutura como código de inteligência artificial.
Adrenaline é uma ferramenta que permite conversar com sua base de código. É alimentado por análise estática, pesquisa vetorial e grandes modelos de linguagem.
OpenAssistant é um assistente baseado em chat que entende tarefas, pode interagir com sistemas de terceiros e recuperar informações dinamicamente para fazer isso.
DoctorGPT é um binário leve e independente que monitora os logs do seu aplicativo em busca de problemas e os diagnostica.
HttpGPT é um plugin Unreal Engine 5 que facilita a integração com serviços baseados em GPT da OpenAI (ChatGPT e DALL-E) por meio de solicitações REST assíncronas, facilitando a comunicação dos desenvolvedores com esses serviços. Também inclui Ferramentas de Editor para integrar a geração de imagens Chat GPT e DALL-E diretamente no Engine.
PaLM 2 é um grande modelo de linguagem de próxima geração que se baseia no legado de pesquisas inovadoras do Google em aprendizado de máquina e IA responsável. Inclui tarefas avançadas de raciocínio, incluindo código e matemática, classificação e resposta a perguntas, tradução e proficiência multilíngue e geração de linguagem natural melhor do que nossos LLMs de última geração anteriores.
Med-PaLM é um modelo de linguagem grande (LLM) projetado para fornecer respostas de alta qualidade a questões médicas. Ele aproveita o poder dos grandes modelos de linguagem do Google, que alinhamos ao domínio médico com um conjunto de demonstrações de especialistas médicos cuidadosamente selecionadas.
Sec-PaLM é um grande modelo de linguagem (LLMs), que acelera a capacidade de ajudar as pessoas responsáveis por manter suas organizações seguras. Estes novos modelos não só proporcionam às pessoas uma forma mais natural e criativa de compreender e gerir a segurança.
Voltar ao topo
Voltar ao topo
De volta ao topo
Localai é uma API local-hospedada, orientada à comunidade, com a comunidade. Substituição de drop-in para o OpenAi Running LLMS em hardware de nível de consumo, sem necessidade de GPU. É uma API executar modelos compatíveis com GGML: llama, GPT4all, RWKV, Whisper, Vicuna, Koala, Gpt4all-J, Cerebras, Falcon, Dolly, Starcoder e muitos outros.
LLAMA.CPP é um porto do modelo de llama do Facebook em C/C ++.
Ollama é uma ferramenta para subir e correr com o LLAMA 2 e outros grandes modelos de idiomas localmente.
Localai é uma API local-hospedada, orientada à comunidade, com a comunidade. Substituição de drop-in para o OpenAi Running LLMS em hardware de nível de consumo, sem necessidade de GPU. É uma API executar modelos compatíveis com GGML: llama, GPT4all, RWKV, Whisper, Vicuna, Koala, Gpt4all-J, Cerebras, Falcon, Dolly, Starcoder e muitos outros.
Serge é uma interface da web para conversar com o Alpaca através do llama.cpp. Totalmente auto-hospedado e dockerizado, com uma API fácil de usar.
O Openllm é uma plataforma aberta para operar grandes modelos de idiomas (LLMS) na produção. Tune, sirva, implante e monitore qualquer LLMS com facilidade.
O LLAMA-GPT é um chatbot auto-hospedado, offline e parecido com chatgpt. Alimentado pela LLAMA 2. 100% privado, sem dados deixando seu dispositivo.
O LLAMA2 Webui é uma ferramenta para executar qualquer LLAMA 2 localmente com a interface do graduação na GPU ou CPU de qualquer lugar (Linux/Windows/Mac). Use llama2-wrapper
como back-end local do LLAMA2 para agentes/aplicativos generativos.
LLAMA2.C é uma ferramenta para treinar a arquitetura LLAMA 2 LLM em Pytorch, então a infere com um arquivo C simples de 700 linhas (run.c).
Alpaca.cpp é um modelo rápido do tipo ChatGPT localmente no seu dispositivo. Ele combina o modelo da Fundação LLAMA com uma reprodução aberta de Stanford Alpaca, um ajuste fino do modelo básico para obedecer às instruções (semelhante ao RLHF usado para treinar ChatGPT) e um conjunto de modificações no llama.cpp para adicionar uma interface de bate-papo.
O GPT4all é um ecossistema de chatbots de código aberto treinados em uma enorme coleção de dados de assistente limpo, incluindo código, histórias e diálogos baseados em lhama.
Minigpt-4 é um entendimento aprimorado da linguagem da visão com modelos avançados de linguagem grande
O Lollms Webui é o hub para os modelos LLM (Modelo de Linguagem Grande). O objetivo é fornecer uma interface amigável para acessar e utilizar vários modelos LLM para uma ampla gama de tarefas. Se você precisa de ajuda para escrever, codificar, organizar dados, gerar imagens ou buscar respostas para suas perguntas.
O LM Studio é uma ferramenta para descobrir, baixar e executar o LLMS local.
A UI da Web Gradio é uma ferramenta para grandes modelos de idiomas. Suporta Transformers, GPTQ, LLAMA.CPP (GGML/GGUF), LLAMA.
O OpenPlayground é um jogo de reprodução para executar modelos semelhantes a ChatGPT localmente no seu dispositivo.
Vicuna é um chatbot de código aberto treinado pela Fine Tuning Llama. Aparentemente, atinge mais de 90% de qualidade do ChatGPT e custa US $ 300 para treinar.
O Yeagar AI é um criador de agentes da Langchain, projetado para ajudá-lo a construir, prototipo e implantar agentes movidos a IA com facilidade.
O KoboldCPP é um software de geração de texto AI fácil de usar para os modelos GGML. É um único autônomo distribuível de concordo, que construi llama.cpp, e adiciona um endpoint versátil da API da Kobold, suporte adicional de formato, compatibilidade com versões anteriores, bem como uma interface de usuário sofisticada com histórias persistentes, ferramentas de edição, salvar formatos, memória, mundo Informações, nota do autor, personagens e cenários.
De volta ao topo
A lógica difusa é uma abordagem heurística que permite um processamento mais avançado de árvores de decisão e melhor integração com a programação baseada em regras.
Arquitetura de um sistema lógico difuso. Fonte: ResearchGate
A Máquina Vector de Suporte (SVM) é um modelo de aprendizado de máquina supervisionado que usa algoritmos de classificação para problemas de classificação de dois grupos.
Máquina vetorial de suporte (SVM). Fonte: OpenClipart
As redes neurais são um subconjunto de aprendizado de máquina e estão no coração dos algoritmos de aprendizado profundo. O nome/estrutura é inspirado no cérebro humano que copia o processo que os neurônios/nós biológicos sinalizam um ao outro.
Rede neural profunda. Fonte: IBM
As redes neurais convolucionais (R-CNN) são um algoritmo de detecção de objetos que primeiro segmenta a imagem para encontrar possíveis caixas delimitadoras relevantes e depois executar o algoritmo de detecção para encontrar os objetos mais prováveis nessas caixas delimitadoras.
Redes neurais convolucionais. Fonte: CS231N
Redes neurais recorrentes (RNNs) é um tipo de rede neural artificial que usa dados seqüenciais ou dados de séries temporais.
Redes neurais recorrentes. Fonte: slideteam
As perceptrons multicamadas (MLPs) são redes neurais de várias camadas compostas por múltiplas camadas de perceptrons com uma ativação limiar.
Perceptrons multicamadas. Fonte: Deepai
A floresta aleatória é um algoritmo de aprendizado de máquina comumente usado, que combina a produção de várias árvores de decisão para atingir um único resultado. Uma árvore de decisão em uma floresta não pode ser podada para amostragem e, portanto, a seleção de previsão. Sua facilidade de uso e flexibilidade alimentaram sua adoção, pois lida com problemas de classificação e regressão.
Floresta aleatória. Fonte: Wikimedia
As árvores de decisão são modelos estruturados de árvores para classificação e regressão.
** Árvores de decisão. Fonte: CMU
A ingênua Bayes é um algoritmo de aprendizado de máquina que é usado problemas de calssificação resolvidos. É baseado na aplicação do teorema de Bayes com fortes suposições de independência entre os recursos.
Teorema de Bayes. Fonte: Mathisfun
De volta ao topo
O Pytorch é uma estrutura de aprendizado profundo de código aberto que acelera o caminho da pesquisa para a produção, usada para aplicações como visão computacional e processamento de linguagem natural. O Pytorch é desenvolvido pelo AI Research Lab do Facebook.
Introdução com Pytorch
Documentação de Pytorch
Fórum de discussão de Pytorch
Principais cursos de Pytorch online | Curso
Principais cursos de Pytorch online | Udemy
Aprenda Pytorch com cursos e aulas on -line | edX
Fundamentos de Pytorch - Aprenda | Microsoft Docs
Introdução ao aprendizado profundo com Pytorch | Udacity
Desenvolvimento Pytorch no Código do Visual Studio
Pytorch no Azure - Aprendizagem profunda com Pytorch | Microsoft Azure
Pytorch - Azure Databricks | Microsoft Docs
Aprendizagem profunda com Pytorch | Amazon Web Services (AWS)
Introdução com Pytorch no Google Cloud
O Pytorch Mobile é um fluxo de trabalho de ML de ponta a ponta, do treinamento à implantação para dispositivos móveis iOS e Android.
O TorchScript é uma maneira de criar modelos serializáveis e otimizáveis a partir do código Pytorch. Isso permite que qualquer programa de Torchscript seja salvo de um processo python e carregado em um processo em que não há dependência do Python.
A TorchServe é uma ferramenta flexível e fácil de usar para servir modelos Pytorch.
Keras é uma API de redes neurais de alto nível, escrita em Python e capaz de correr em cima do Tensorflow, CNTK ou Theano. Foi desenvolvido com foco em permitir a experimentação rápida. É capaz de executar em cima do TensorFlow, Microsoft Cognitive Toolkit, R, Theano ou PlaidML.
O OnNX Runtime é um acelerador de inferência e treinamento de alto desempenho e alto desempenho. Ele suporta modelos de estruturas de aprendizado profundo, como Pytorch e Tensorflow/Keras, bem como bibliotecas clássicas de aprendizado de máquina, como Scikit-Learn, LightGBM, XGBoost, etc.
A Kornia é uma biblioteca de visão computacional diferenciável que consiste em um conjunto de rotinas e módulos diferenciáveis para resolver problemas genéricos de CV (Visão Computador).
O Pytorch-NLP é uma biblioteca para processamento de linguagem natural (PNL) em Python. Ele foi construído com as pesquisas mais recentes em mente e foi projetado desde o primeiro dia para apoiar prototipagem rápida. O Pytorch-NLP vem com incorporações pré-treinadas, amostradores, carregadores de dados, métricas, módulos de rede neural e codificadores de texto.
A Ignite é uma biblioteca de alto nível para ajudar no treinamento e na avaliação de redes neurais em Pytorch de maneira flexível e transparente.
O Hummingbird é uma biblioteca para compilar modelos tradicionais de ML treinados em cálculos tensores. Ele permite que os usuários aproveitem perfeitamente as estruturas de redes neurais (como o Pytorch) para acelerar os modelos tradicionais de ML.
A Deep Graph Library (DGL) é um pacote Python criado para facilitar a implementação da família de modelos de rede neural gráfica, em cima de Pytorch e outras estruturas.
Tensorly é uma API de alto nível para métodos tensores e redes neurais tensorizadas profundas no Python, que visa simplificar o aprendizado tensorado.
O GPytorch é uma biblioteca de processos gaussianos implementada usando o Pytorch, projetado para criar modelos de processos gaussianos escaláveis e flexíveis.
Poutyne é uma estrutura do tipo Keras para Pytorch e lida com grande parte do código de explicação de caldeira necessário para treinar redes neurais.
Forte é um kit de ferramentas para a criação de pipelines NLP com componentes composíveis, interfaces de dados convenientes e interação cruzada.
A Torchmetrics é uma métrica de aprendizado de máquina para aplicativos de pytorch distribuídos e distribuídos.
Captum é uma biblioteca extensível de código aberto para interpretabilidade do modelo construída em Pytorch.
O Transformer é um processamento de linguagem natural de última geração para Pytorch, Tensorflow e Jax.
A Hydra é uma estrutura para configurar elegantemente aplicativos complexos.
O Acelerate é uma maneira simples de treinar e usar modelos Pytorch com precisão multi-GPU, TPU, mista.
Ray é uma estrutura rápida e simples para criar e executar aplicativos distribuídos.
Parlai é uma plataforma unificada para compartilhar, treinar e avaliar modelos de diálogo em muitas tarefas.
Pytorchvideo é uma biblioteca de aprendizado profundo para pesquisa em vídeo. Hospeda vários modelos, conjuntos de dados focados em vídeo, pipelines de treinamento e muito mais.
A Opacus é uma biblioteca que permite o treinamento de modelos de Pytorch com privacidade diferencial.
O Pytorch Lightning é uma biblioteca ML do tipo Keras para Pytorch. Ele deixa a lógica de treinamento e validação do núcleo para você e automatiza o restante.
O Pytorch Geométrico Temporal é uma biblioteca de extensão temporal (dinâmica) para a geométrica de Pytorch.
A Pytorch Geométrica é uma biblioteca para aprendizado profundo sobre dados de entrada irregulares, como gráficos, nuvens de pontos e coletores.
A Raster Vision é uma estrutura de código aberto para aprendizado profundo em imagens de satélite e aérea.
Crypten é uma estrutura para a privacidade que preserva o ML. Seu objetivo é tornar as técnicas de computação seguras acessíveis aos profissionais de ML.
O Optuna é uma estrutura de otimização de hiperparâmetro de código aberto para automatizar a pesquisa de hiperparâmetro.
O Pyro é uma linguagem de programação probabilística universal (PPL) escrita em Python e suportada por Pytorch no back -end.
A Albumentations é uma biblioteca de aumento de imagem rápida e extensível para diferentes tarefas de CV, como classificação, segmentação, detecção de objetos e estimativa de pose.
A Skorch é uma biblioteca de alto nível para Pytorch que fornece compatibilidade completa do Scikit-Learn.
O MMF é uma estrutura modular para pesquisa multimodal de visão e idioma da pesquisa da IA do Facebook (FAIR).
O AdapDDL é uma estrutura de treinamento e programação de aprendizado profundo adaptativo de recursos.
A Polyaxon é uma plataforma para construir, treinar e monitorar aplicativos de aprendizado profundo em larga escala.
TextBrewer é um kit de ferramentas de destilação de conhecimento baseado em Pytorch para processamento de linguagem natural
Advertorch é uma caixa de ferramentas para pesquisa de robustez adversária. Ele contém módulos para gerar exemplos adversários e defender contra ataques.
Nemo é um kit de ferramentas AA para a IA conversacional.
Clinicadl é uma estrutura para a classificação reproduzível da doença de Alzheimer
O estável Baselines3 (SB3) é um conjunto de implementações confiáveis de algoritmos de aprendizado de reforço em Pytorch.
Torchio é um conjunto de ferramentas para ler com eficiência, pré -processamento, amostra, aumentar e escrever imagens médicas em 3D em aplicativos de aprendizado profundo escritos em Pytorch.
Pysyft é uma biblioteca Python para a privacidade criptografada, preservando o aprendizado profundo.
Flair é uma estrutura muito simples para o processamento de linguagem natural de última geração (PNL).
O Glow é um compilador de ML que acelera o desempenho de estruturas de aprendizado profundo em diferentes plataformas de hardware.
O FairScale é uma biblioteca de extensão Pytorch para treinamento de alto desempenho e larga escala em uma ou várias máquinas/nós.
A Monai é uma profunda estrutura de aprendizado que fornece recursos fundamentais otimizados para o domínio para o desenvolvimento de fluxos de trabalho de treinamento em imagem em saúde.
O PFRL é uma biblioteca de aprendizado de reforço profundo que implementa vários algoritmos de reforço profundo de ponta em Python usando Pytorch.
O Einops é uma operações tensoras flexíveis e poderosas para um código legível e confiável.
O Pytorch3D é uma biblioteca de aprendizado profundo que fornece componentes eficientes e reutilizáveis para a pesquisa em visão computacional 3D com a Pytorch.
O Ensemble Pytorch é uma estrutura unificada para Pytorch para melhorar o desempenho e a robustez do seu modelo de aprendizado profundo.
Luzmente é uma estrutura de visão computacional para o aprendizado auto-supervisionado.
HIVER é uma biblioteca que facilita a implementação de algoritmos de meta-aprendizagem baseados em gradiente arbitrariamente e loops de otimização aninhados com pytorch quase vanilla.
Horovod é uma biblioteca de treinamento distribuída para estruturas de aprendizado profundo. A Horovod pretende tornar o DL distribuído rápido e fácil de usar.
Pennylane é uma biblioteca para ML quântico, diferenciação automática e otimização de cálculos híbridos clássicos quânticos.
Detectron2 é a plataforma de próxima geração da Fair para detecção e segmentação de objetos.
O Fastai é uma biblioteca que simplifica as redes neurais rápidas e precisas usando as melhores práticas modernas.
De volta ao topo
O TensorFlow é uma plataforma de código aberto de ponta a ponta para aprendizado de máquina. Possui um ecossistema abrangente e flexível de ferramentas, bibliotecas e recursos da comunidade que permite que os pesquisadores pressionem o estado da arte em ML e os desenvolvedores construam facilmente e implantam aplicativos alimentados por ML.
Introdução ao Tensorflow
Tutoriais do TensorFlow
Certificado de desenvolvedor TensorFlow | TensorFlow
Comunidade Tensorflow
Modelos e conjuntos de dados Tensorflow
Cloud Tensorflow
Educação de aprendizado de máquina | TensorFlow
Top Tensorflow Cursos Online | Curso
Top Tensorflow Cursos Online | Udemy
Aprendizagem profunda com tensorflow | Udemy
Aprendizagem profunda com tensorflow | edX
Introdução ao Tensorflow para aprendizado profundo | Udacity
Introdução ao TensorFlow: Curso de Aprendizado de Máquina | Desenvolvedores do Google
Treinar e implantar um modelo de tensorflow - Azure Machine Learning
Aplique modelos de aprendizado de máquina nas funções do Azure com Python e Tensorflow | Microsoft Azure
Aprendizagem profunda com tensorflow | Amazon Web Services (AWS)
Tensorflow - Amazon EMR | Documentação da AWS
Tensorflow Enterprise | Google Cloud
O Tensorflow Lite é uma estrutura de aprendizado profundo de código aberto para implantar modelos de aprendizado de máquina em dispositivos móveis e IoT.
Tensorflow.js é uma biblioteca JavaScript que permite desenvolver ou executar modelos ML em JavaScript e usar ML diretamente no lado do cliente do navegador, lado do servidor via node.js, móvel nativo via React Native, desktop nativo via elétron e até no IOT dispositivos via node.js no Raspberry Pi.
O Tensorflow_macos é uma versão otimizada para Mac dos addons TensorFlow e TensorFlow para MacOS 11.0+ acelerado usando a estrutura de computação ML da Apple.
O Google Colaboratory é um ambiente de notebook Jupyter gratuito que não requer configuração e é executado inteiramente na nuvem, permitindo que você execute o código TensorFlow no seu navegador com um único clique.
What-If Tool é uma ferramenta para sondagem sem código de modelos de aprendizado de máquina, útil para compreensão, depuração e justiça de modelos. Disponível em notebooks Tensorboard e Jupyter ou Colab.
O Tensorboard é um conjunto de ferramentas de visualização para entender, depurar e otimizar os programas TensorFlow.
Keras é uma API de redes neurais de alto nível, escrita em Python e capaz de correr em cima do Tensorflow, CNTK ou Theano. Foi desenvolvido com foco em permitir a experimentação rápida. É capaz de executar em cima do TensorFlow, Microsoft Cognitive Toolkit, R, Theano ou PlaidML.
O XLA (álgebra linear acelerada) é um compilador específico do domínio para álgebra linear que otimiza os cálculos do tensorflow. Os resultados são melhorias em velocidade, uso de memória e portabilidade nas plataformas de servidor e móveis.
O ML Perf é um amplo conjunto de benchmark ML para medir o desempenho de estruturas de software ML, aceleradores de hardware ML e plataformas de nuvem ML.
O Tensorflow Playground é um ambiente de desenvolvimento para mexer com uma rede neural no seu navegador.
A TPU Research Cloud (TRC) é um programa permite que os pesquisadores solicitem acesso a um aglomerado de mais de 1.000 TPUs em nuvem, sem nenhum custo, para ajudá -los a acelerar a próxima onda de avanços de pesquisa.
O MLIR é uma nova representação intermediária e estrutura do compilador.
A Lattice é uma biblioteca para soluções de ML flexíveis, controladas e interpretáveis com restrições de forma de senso comum.
O Tensorflow Hub é uma biblioteca para aprendizado de máquina reutilizável. Faça o download e reutilize os modelos treinados mais recentes com uma quantidade mínima de código.
O Tensorflow Cloud é uma biblioteca para conectar seu ambiente local ao Google Cloud.
O TensorFlow Model Optimization Toolkit é um conjunto de ferramentas para otimizar os modelos ML para implantação e execução.
O TensorFlow Recomendres é uma biblioteca para criar modelos de sistema de recomendação.
O TensorFlow Text é uma coleção de classes e operações relacionadas a texto e NLP prontas para uso com o TensorFlow 2.
A Tensorflow Graphics é uma biblioteca de funcionalidades gráficas de computadores que variam de câmeras, luzes e materiais a renderizadores.
O TensorFlow Federated é uma estrutura de código aberto para aprendizado de máquina e outros cálculos em dados descentralizados.
A probabilidade do TensorFlow é uma biblioteca para raciocínio probabilístico e análise estatística.
O Tensor2tensor é uma biblioteca de modelos e conjuntos de dados de aprendizado profundo projetados para tornar o aprendizado profundo mais acessível e acelerar a pesquisa de ML.
A TensorFlow Privacy é uma biblioteca Python que inclui implementações de otimizadores do TensorFlow para treinamento de modelos de aprendizado de máquina com privacidade diferencial.
O Tensorflow Ranking é uma biblioteca para técnicas de aprendizado de rank (LTR) na plataforma Tensorflow.
Os agentes do TensorFlow é uma biblioteca para o aprendizado de reforço no TensorFlow.
O Tensorflow Addons é um repositório de contribuições que se conformam a padrões de API bem estabelecidos, mas implementam novas funcionalidades não disponíveis no Core Tensorflow, mantidas pelos addons SIG. O TensorFlow suporta nativamente um grande número de operadores, camadas, métricas, perdas e otimizadores.
O Tensorflow E/S é um conjunto de dados, streaming e extensões do sistema de arquivos, mantido pelo SIG IO.
O Tensorflow Quantum é uma biblioteca de aprendizado de máquina quântica para prototipagem rápida de modelos ML clássicos quânticos híbridos.
A dopamina é uma estrutura de pesquisa para prototipagem rápida de algoritmos de aprendizado de reforço.
O TRFL é uma biblioteca para os blocos de construção de aprendizado de reforço criados pela DeepMind.
O Mesh Tensorflow é um idioma para o aprendizado profundo distribuído, capaz de especificar uma ampla classe de cálculos de tensores distribuídos.
RaggedEnsors é uma API que facilita o armazenamento e manipula dados com forma não uniforme, incluindo texto (palavras, frases, caracteres) e lotes de comprimento variável.
O UNICODE OPS é uma API que suporta o trabalho com texto Unicode diretamente no TensorFlow.
Magenta é um projeto de pesquisa que explora o papel do aprendizado de máquina no processo de criação de arte e música.
O Nucleus é uma biblioteca de código Python e C ++ projetado para facilitar a leitura, gravação e analisa os dados em formatos de arquivos genômicos comuns como SAM e VCF.
O Sonnet é uma biblioteca da DeepMind para a construção de redes neurais.
O aprendizado estruturado neural é uma estrutura de aprendizado para treinar redes neurais, alavancando sinais estruturados, além de insumos de recursos.
A remediação do modelo é uma biblioteca para ajudar a criar e treinar modelos de maneira a reduzir ou eliminar os danos ao usuário resultantes de vieses de desempenho subjacentes.
Os indicadores de justiça são uma biblioteca que permite o cálculo fácil de métricas de justiça comumente identificadas para classificadores binários e multiclasse.
A Decision Forests é um algoritmos de última geração para treinamento, atendimento e interpretação de modelos que usam florestas de decisão para classificação, regressão e classificação.
De volta ao topo
O Core ML é uma estrutura da Apple para integrar modelos de aprendizado de máquina em aplicativos em execução em dispositivos Apple (incluindo iOS, WatchOS, MacOS e TVOS). O Core ML apresenta um formato de arquivo público (.mlmodel) para um amplo conjunto de métodos ML, incluindo redes neurais profundas (tanto convolucionais quanto recorrentes), conjuntos de árvores com modelos lineares de reforço e generalização. Os modelos neste formato podem ser diretamente integrados aos aplicativos através do Xcode.
Introdução ao Core ML
Integração de um modelo ML Core em seu aplicativo
Modelos principais de ML
Referência da API ML central
Especificação Core ML
Fóruns de desenvolvedores da Apple para ML Core
Top Core ML Cursos Online | Udemy
Top Core ML Cursos Online | Curso
IBM Watson Services para Core ML | IBM
Gere ativos principais ML usando a inspeção visual da IBM Maximo | IBM
O Core ML Tools é um projeto que contém ferramentas de suporte para a conversão, edição e validação do ML do ML.
Criar ML é uma ferramenta que fornece novas maneiras de treinamento de modelos de aprendizado de máquina no seu Mac. Ele tira a complexidade do treinamento modelo enquanto produz modelos poderosos de ML.
O Tensorflow_macos é uma versão otimizada para Mac dos addons TensorFlow e TensorFlow para MacOS 11.0+ acelerado usando a estrutura de computação ML da Apple.
A Apple Vision é uma estrutura que executa a detecção de referência de face e face, detecção de texto, reconhecimento de código de barras, registro de imagem e rastreamento geral de recursos. A visão também permite o uso de modelos ML personalizados para tarefas como classificação ou detecção de objetos.
Keras é uma API de redes neurais de alto nível, escrita em Python e capaz de correr em cima do Tensorflow, CNTK ou Theano. Foi desenvolvido com foco em permitir a experimentação rápida. É capaz de executar em cima do TensorFlow, Microsoft Cognitive Toolkit, R, Theano ou PlaidML.
O XGBOOST é uma biblioteca de reforço de gradiente distribuído otimizado, projetado para ser altamente eficiente, flexível e portátil. Ele implementa algoritmos de aprendizado de máquina na estrutura de aumento de gradiente. O XGBoost fornece um aumento de árvore paralelo (também conhecido como GBDT, GBM) que resolve muitos problemas de ciência de dados de uma maneira rápida e precisa. Ele suporta treinamento distribuído em várias máquinas, incluindo AWS, GCE, Azure e Clusters de fios. Além disso, ele pode ser integrado aos sistemas Flink, Spark e outros sistemas de fluxo de dados em nuvem.
O LIBSVM é um software integrado para classificação de vetores de suporte (C-SVC, NU-SVC), regressão (EPSilon-SVR, NU-SVR) e estimativa de distribuição (SVM de uma classe). Ele suporta classificação de várias classes.
O Scikit-Learn é uma ferramenta simples e eficiente para mineração de dados e análise de dados. É construído sobre Numpy, Scipy e MathPlotlib.
O Xcode inclui tudo o que os desenvolvedores precisam para criar ótimos aplicativos para Mac, iPhone, iPad, Apple TV e Apple Watch. O XCode fornece aos desenvolvedores um fluxo de trabalho unificado para design, codificação, teste e depuração da interface do usuário. O Xcode é construído como um aplicativo universal que é executado 100% nativamente nas CPUs baseadas em Intel e no Apple Silicon. Ele inclui um SDK do MacOS Unified que apresenta todas as estruturas, compiladores, depuradores e outras ferramentas necessárias para criar aplicativos que executam nativamente no Apple Silicon e na Intel X86_64 CPU.
Swiftui é um kit de ferramentas de interface do usuário que fornece visualizações, controles e estruturas de layout para declarar a interface do usuário do seu aplicativo. A estrutura Swiftui fornece manipuladores de eventos para fornecer torneiras, gestos e outros tipos de entrada para o seu aplicativo.
O UIKIT é uma estrutura fornece a infraestrutura necessária para seus aplicativos iOS ou TvOS. Ele fornece a janela e a arquitetura de exibição para implementar sua interface, a infraestrutura de manuseio de eventos para fornecer multi-toque e outros tipos de entrada para o seu aplicativo e o loop de execução principal necessário para gerenciar interações entre o usuário, o sistema e seu aplicativo.
O AppKit é um kit de ferramentas gráfico de interface de usuário que contém todos os objetos necessários para implementar a interface do usuário para um aplicativo macOS, como janelas, painéis, botões, menus, rolantes e campos de texto, e lida com todos os detalhes para você, pois ele é com eficientemente Desenhe na tela, se comunica com dispositivos de hardware e buffers de tela, limpa as áreas da tela antes de desenhar e clipes.
O Arkit é um conjunto de ferramentas de desenvolvimento de software para permitir que os desenvolvedores criem aplicativos de realidade aumentada para iOS desenvolvidos pela Apple. A versão mais recente do Arkit 3.5 aproveita o novo scanner Lidar e o sistema de detecção de profundidade no iPad Pro (2020) para suportar uma nova geração de aplicativos de AR que usam a geometria da cena para obter um entendimento aprimorado de cena e oclusão de objetos.
O RealityKit é uma estrutura para implementar simulação 3D de alto desempenho e renderização com informações fornecidas pela estrutura do ARKIT para integrar perfeitamente objetos virtuais ao mundo real.
O SceneKit é uma estrutura gráfica 3D de alto nível que ajuda a criar cenas e efeitos animados em 3D em seus aplicativos iOS.
A Instruments é uma ferramenta de análise e análise de desempenho poderosa e flexível que faz parte do conjunto de ferramentas Xcode. Ele foi projetado para ajudá -lo a criar um perfil de seus aplicativos, processos e dispositivos iOS, watchOS, TvOS e MacOS, a fim de entender e otimizar melhor seu comportamento e desempenho.
O Cocoapods é um gerenciador de dependência do Swift e o Objective-C usado em projetos Xcode, especificando as dependências do seu projeto em um arquivo de texto simples. O Cocoapods resolve recursivamente as dependências entre as bibliotecas, busca código -fonte para todas as dependências e cria e mantém um espaço de trabalho do Xcode para criar seu projeto.
O AppCode está monitorando constantemente a qualidade do seu código. Ele adverte sobre erros e cheiros e sugere fixos rápidos para resolvê-los automaticamente. O AppCode fornece muitas inspeções de código para Objective-C, Swift, C/C ++ e várias inspeções de código para outros idiomas suportados.
De volta ao topo
O aprendizado profundo é um subconjunto de aprendizado de máquina, que é essencialmente uma rede neural com três ou mais camadas. Essas redes neurais tentam simular o comportamento do cérebro humano, porém, longe de combinar sua capacidade. Isso permite que as redes neurais "aprendam" com grandes quantidades de dados. O aprendizado pode ser supervisionado, semi-supervisionado ou sem supervisão.
Cursos on -line de aprendizado profundo | NVIDIA
Principais cursos de aprendizado profundo online | Curso
Principais cursos de aprendizado profundo online | Udemy
Aprenda aprendizado profundo com cursos e lições online | edX
Curso on -line de aprendizado profundo Nanodegree | Udacity
Curso de aprendizado de máquina por Andrew Ng | Curso
Curso de Engenharia de Aprendizado de Máquinas para Produção (MLOPS) Por Andrew Ng | Curso
Ciência dos dados: aprendizado profundo e redes neurais em Python | Udemy
Entendendo o aprendizado de máquina com Python | Visão Plural
Como pensar sobre algoritmos de aprendizado de máquina | Visão Plural
Cursos de aprendizagem profunda | Stanford online
Aprendizagem profunda - UW Professional & Continuing Education
Cursos on -line de aprendizado profundo | Universidade de Harvard
Aprendizado de máquina para todos os cursos | DataCamp
Curso de especialista em inteligência artificial: Platinum Edition | Udemy
Principais cursos de inteligência artificial online | Curso
Aprenda inteligência artificial com cursos e lições on -line | edX
Certificado profissional em ciência da computação para inteligência artificial | edX
Programa de Nanodegree de Inteligência Artificial
Cursos on -line de Inteligência Artificial (AI) | Udacity
Introdução ao Curso de Inteligência Artificial | Udacity
EDGE AI para desenvolvedores de IoT Curso | Udacity
Raciocínio: árvores de metas e sistemas especializados baseados em regras | MIT OpenCourseware
Sistemas especializados e inteligência artificial aplicada
Sistemas autônomos - Microsoft AI
Introdução ao Microsoft Project Bonsai
Ensino de máquinas com a plataforma de sistemas autônomos da Microsoft
Treinamento de sistemas marítimos autônomos | Pesquisa AMC
Cursos de carros autônomos principais online | Udemy
Sistemas de controle aplicados 1: Carros autônomos: Math + PID + MPC | Udemy
Aprenda robótica autônoma com cursos e lições online | edX
Programa de Nanodegree de Inteligência Artificial
Cursos e programas online de sistemas autônomos | Udacity
EDGE AI para desenvolvedores de IoT Curso | Udacity
MOOC de sistemas autônomos e cursos on -line gratuitos | MOOC LIST
Programa de pós -graduação de robótica e sistemas autônomos | Standford online
Laboratório de sistemas autônomos móveis | MIT OpenCourseware
A NVIDIA CUDNN é uma biblioteca de primitivas aceleradas por GPU para redes neurais profundas. O CUDNN fornece implementações altamente ajustadas para rotinas padrão, como camadas de convolução para frente e para trás, agrupamento, normalização e ativação. O CUDNN acelera estruturas de aprendizado profundo amplamente utilizadas, incluindo Caffe2, Chainner, Keras, Matlab, MxNet, Pytorch e Tensorflow.
O NVIDIA DLSS (Deep Learning Super Sampling) é uma imagem temporal que usa a tecnologia de renderização de IA que aumenta o desempenho gráfico usando processadores de IA do núcleo tensor dedicado nas GPUs GeForce RTX ™. O DLSS usa o poder de uma rede neural de aprendizado profundo para aumentar as taxas de quadros e gerar imagens bonitas e nítidas para seus jogos.
Super Resolução (FSR) da AMD FidelityFX é uma solução de código aberto e de alta qualidade para produzir quadros de alta resolução a partir de entradas de menor resolução. Ele usa uma coleção de algoritmos de aprendizado profundo de ponta, com uma ênfase particular na criação de arestas de alta qualidade, dando grandes melhorias de desempenho em comparação com a renderização diretamente na resolução nativa. O FSR permite “desempenho prático” para operações de renderização dispendiosas, como rastreamento de raios de hardware para as arquiteturas AMD RDNA ™ e AMD RDNA ™ 2.
A Intel XE Super Sampling (XESS) é uma imagem temporal que aprimora a tecnologia de renderização de IA que aumenta o desempenho gráfico semelhante ao DLSS da NVIDIA (Super Sampling Deep Learning). A arquitetura ARC GPU da Intel (início de 2022) terá GPUs que apresentarão XE dedicados a executar o XESS. As GPUs terão os mecanismos Matrix (XMX) Matrix Matrix para o processamento de IA acelerado por hardware. O XESS poderá executar em dispositivos sem XMX, incluindo gráficos integrados, no entanto, o desempenho do XESS será menor nas placas gráficas não-Intel, pois será alimentado pela instrução DP4A.
O Jupyter Notebook é um aplicativo da Web de código aberto que permite criar e compartilhar documentos que contêm código ao vivo, equações, visualizações e texto narrativo. O Jupyter é amplamente utilizado em indústrias que fazem limpeza e transformação de dados, simulação numérica, modelagem estatística, visualização de dados, ciência de dados e aprendizado de máquina.
O Apache Spark é um mecanismo de análise unificado para processamento de dados em larga escala. Ele fornece APIs de alto nível em Scala, Java, Python e R, e um mecanismo otimizado que suporta gráficos gerais de computação para análise de dados. It also supports a rich set of higher-level tools including Spark SQL for SQL and DataFrames, MLlib for machine learning, GraphX for graph processing, and Structured Streaming for stream processing.
Apache Spark Connector for SQL Server and Azure SQL is a high-performance connector that enables you to use transactional data in big data analytics and persists results for ad-hoc queries or reporting. The connector allows you to use any SQL database, on-premises or in the cloud, as an input data source or output data sink for Spark jobs.
Apache PredictionIO is an open source machine learning framework for developers, data scientists, and end users. It supports event collection, deployment of algorithms, evaluation, querying predictive results via REST APIs. It is based on scalable open source services like Hadoop, HBase (and other DBs), Elasticsearch, Spark and implements what is called a Lambda Architecture.
Cluster Manager for Apache Kafka(CMAK) is a tool for managing Apache Kafka clusters.
BigDL is a distributed deep learning library for Apache Spark. With BigDL, users can write their deep learning applications as standard Spark programs, which can directly run on top of existing Spark or Hadoop clusters.
Eclipse Deeplearning4J (DL4J) is a set of projects intended to support all the needs of a JVM-based(Scala, Kotlin, Clojure, and Groovy) deep learning application. This means starting with the raw data, loading and preprocessing it from wherever and whatever format it is in to building and tuning a wide variety of simple and complex deep learning networks.
Deep Learning Toolbox™ is a tool that provides a framework for designing and implementing deep neural networks with algorithms, pretrained models, and apps. You can use convolutional neural networks (ConvNets, CNNs) and long short-term memory (LSTM) networks to perform classification and regression on image, time-series, and text data. You can build network architectures such as generative adversarial networks (GANs) and Siamese networks using automatic differentiation, custom training loops, and shared weights. With the Deep Network Designer app, you can design, analyze, and train networks graphically. It can exchange models with TensorFlow™ and PyTorch through the ONNX format and import models from TensorFlow-Keras and Caffe. The toolbox supports transfer learning with DarkNet-53, ResNet-50, NASNet, SqueezeNet and many other pretrained models.
Reinforcement Learning Toolbox™ is a tool that provides an app, functions, and a Simulink® block for training policies using reinforcement learning algorithms, including DQN, PPO, SAC, and DDPG. You can use these policies to implement controllers and decision-making algorithms for complex applications such as resource allocation, robotics, and autonomous systems.
Deep Learning HDL Toolbox™ is a tool that provides functions and tools to prototype and implement deep learning networks on FPGAs and SoCs. It provides pre-built bitstreams for running a variety of deep learning networks on supported Xilinx® and Intel® FPGA and SoC devices. Profiling and estimation tools let you customize a deep learning network by exploring design, performance, and resource utilization tradeoffs.
Parallel Computing Toolbox™ is a tool that lets you solve computationally and data-intensive problems using multicore processors, GPUs, and computer clusters. High-level constructs such as parallel for-loops, special array types, and parallelized numerical algorithms enable you to parallelize MATLAB® applications without CUDA or MPI programming. The toolbox lets you use parallel-enabled functions in MATLAB and other toolboxes. You can use the toolbox with Simulink® to run multiple simulations of a model in parallel. Programs and models can run in both interactive and batch modes.
XGBoost is an optimized distributed gradient boosting library designed to be highly efficient, flexible and portable. It implements machine learning algorithms under the Gradient Boosting framework. XGBoost provides a parallel tree boosting (also known as GBDT, GBM) that solve many data science problems in a fast and accurate way. It supports distributed training on multiple machines, including AWS, GCE, Azure, and Yarn clusters. Also, it can be integrated with Flink, Spark and other cloud dataflow systems.
LIBSVM is an integrated software for support vector classification, (C-SVC, nu-SVC), regression (epsilon-SVR, nu-SVR) and distribution estimation (one-class SVM). It supports multi-class classification.
Scikit-Learn is a simple and efficient tool for data mining and data analysis. It is built on NumPy,SciPy, and mathplotlib.
TensorFlow is an end-to-end open source platform for machine learning. It has a comprehensive, flexible ecosystem of tools, libraries and community resources that lets researchers push the state-of-the-art in ML and developers easily build and deploy ML powered applications.
Keras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, or Theano.It was developed with a focus on enabling fast experimentation. It is capable of running on top of TensorFlow, Microsoft Cognitive Toolkit, R, Theano, or PlaidML.
PyTorch is a library for deep learning on irregular input data such as graphs, point clouds, and manifolds. Primarily developed by Facebook's AI Research lab.
Azure Databricks is a fast and collaborative Apache Spark-based big data analytics service designed for data science and data engineering. Azure Databricks, sets up your Apache Spark environment in minutes, autoscale, and collaborate on shared projects in an interactive workspace. Azure Databricks supports Python, Scala, R, Java, and SQL, as well as data science frameworks and libraries including TensorFlow, PyTorch, and scikit-learn.
Microsoft Cognitive Toolkit (CNTK) is an open-source toolkit for commercial-grade distributed deep learning. It describes neural networks as a series of computational steps via a directed graph. CNTK allows the user to easily realize and combine popular model types such as feed-forward DNNs, convolutional neural networks (CNNs) and recurrent neural networks (RNNs/LSTMs). CNTK implements stochastic gradient descent (SGD, error backpropagation) learning with automatic differentiation and parallelization across multiple GPUs and servers.
Tensorflow_macOS is a Mac-optimized version of TensorFlow and TensorFlow Addons for macOS 11.0+ accelerated using Apple's ML Compute framework.
Apache Airflow is an open-source workflow management platform created by the community to programmatically author, schedule and monitor workflows. Instalar. Princípios. Scalable. Airflow has a modular architecture and uses a message queue to orchestrate an arbitrary number of workers. Airflow is ready to scale to infinity.
Open Neural Network Exchange(ONNX) is an open ecosystem that empowers AI developers to choose the right tools as their project evolves. ONNX provides an open source format for AI models, both deep learning and traditional ML. It defines an extensible computation graph model, as well as definitions of built-in operators and standard data types.
Apache MXNet is a deep learning framework designed for both efficiency and flexibility. It allows you to mix symbolic and imperative programming to maximize efficiency and productivity. At its core, MXNet contains a dynamic dependency scheduler that automatically parallelizes both symbolic and imperative operations on the fly. A graph optimization layer on top of that makes symbolic execution fast and memory efficient. MXNet is portable and lightweight, scaling effectively to multiple GPUs and multiple machines. Support for Python, R, Julia, Scala, Go, Javascript and more.
AutoGluon is toolkit for Deep learning that automates machine learning tasks enabling you to easily achieve strong predictive performance in your applications. With just a few lines of code, you can train and deploy high-accuracy deep learning models on tabular, image, and text data.
Anaconda is a very popular Data Science platform for machine learning and deep learning that enables users to develop models, train them, and deploy them.
PlaidML is an advanced and portable tensor compiler for enabling deep learning on laptops, embedded devices, or other devices where the available computing hardware is not well supported or the available software stack contains unpalatable license restrictions.
OpenCV is a highly optimized library with focus on real-time computer vision applications. The C++, Python, and Java interfaces support Linux, MacOS, Windows, iOS, and Android.
Scikit-Learn is a Python module for machine learning built on top of SciPy, NumPy, and matplotlib, making it easier to apply robust and simple implementations of many popular machine learning algorithms.
Weka is an open source machine learning software that can be accessed through a graphical user interface, standard terminal applications, or a Java API. It is widely used for teaching, research, and industrial applications, contains a plethora of built-in tools for standard machine learning tasks, and additionally gives transparent access to well-known toolboxes such as scikit-learn, R, and Deeplearning4j.
Caffe is a deep learning framework made with expression, speed, and modularity in mind. It is developed by Berkeley AI Research (BAIR)/The Berkeley Vision and Learning Center (BVLC) and community contributors.
Theano is a Python library that allows you to define, optimize, and evaluate mathematical expressions involving multi-dimensional arrays efficiently including tight integration with NumPy.
Microsoft Project Bonsai is a low-code AI platform that speeds AI-powered automation development and part of the Autonomous Systems suite from Microsoft. Bonsai is used to build AI components that can provide operator guidance or make independent decisions to optimize process variables, improve production efficiency, and reduce downtime.
Microsoft AirSim is a simulator for drones, cars and more, built on Unreal Engine (with an experimental Unity release). AirSim is open-source, cross platform, and supports software-in-the-loop simulation with popular flight controllers such as PX4 & ArduPilot and hardware-in-loop with PX4 for physically and visually realistic simulations. It is developed as an Unreal plugin that can simply be dropped into any Unreal environment. AirSim is being developed as a platform for AI research to experiment with deep learning, computer vision and reinforcement learning algorithms for autonomous vehicles.
CARLA is an open-source simulator for autonomous driving research. CARLA has been developed from the ground up to support development, training, and validation of autonomous driving systems. In addition to open-source code and protocols, CARLA provides open digital assets (urban layouts, buildings, vehicles) that were created for this purpose and can be used freely.
ROS/ROS2 bridge for CARLA(package) is a bridge that enables two-way communication between ROS and CARLA. The information from the CARLA server is translated to ROS topics. In the same way, the messages sent between nodes in ROS get translated to commands to be applied in CARLA.
ROS Toolbox is a tool that provides an interface connecting MATLAB® and Simulink® with the Robot Operating System (ROS and ROS 2), enabling you to create a network of ROS nodes. The toolbox includes MATLAB functions and Simulink blocks to import, analyze, and play back ROS data recorded in rosbag files. You can also connect to a live ROS network to access ROS messages.
Robotics Toolbox™ provides a toolbox that brings robotics specific functionality(designing, simulating, and testing manipulators, mobile robots, and humanoid robots) to MATLAB, exploiting the native capabilities of MATLAB (linear algebra, portability, graphics). The toolbox also supports mobile robots with functions for robot motion models (bicycle), path planning algorithms (bug, distance transform, D*, PRM), kinodynamic planning (lattice, RRT), localization (EKF, particle filter), map building (EKF) and simultaneous localization and mapping (EKF), and a Simulink model a of non-holonomic vehicle. The Toolbox also including a detailed Simulink model for a quadrotor flying robot.
Image Processing Toolbox™ is a tool that provides a comprehensive set of reference-standard algorithms and workflow apps for image processing, analysis, visualization, and algorithm development. You can perform image segmentation, image enhancement, noise reduction, geometric transformations, image registration, and 3D image processing.
Computer Vision Toolbox™ is a tool that provides algorithms, functions, and apps for designing and testing computer vision, 3D vision, and video processing systems. You can perform object detection and tracking, as well as feature detection, extraction, and matching. You can automate calibration workflows for single, stereo, and fisheye cameras. For 3D vision, the toolbox supports visual and point cloud SLAM, stereo vision, structure from motion, and point cloud processing.
Robotics Toolbox™ is a tool that provides a toolbox that brings robotics specific functionality(designing, simulating, and testing manipulators, mobile robots, and humanoid robots) to MATLAB, exploiting the native capabilities of MATLAB (linear algebra, portability, graphics). The toolbox also supports mobile robots with functions for robot motion models (bicycle), path planning algorithms (bug, distance transform, D*, PRM), kinodynamic planning (lattice, RRT), localization (EKF, particle filter), map building (EKF) and simultaneous localization and mapping (EKF), and a Simulink model a of non-holonomic vehicle. The Toolbox also including a detailed Simulink model for a quadrotor flying robot.
Model Predictive Control Toolbox™ is a tool that provides functions, an app, and Simulink® blocks for designing and simulating controllers using linear and nonlinear model predictive control (MPC). The toolbox lets you specify plant and disturbance models, horizons, constraints, and weights. By running closed-loop simulations, you can evaluate controller performance.
Predictive Maintenance Toolbox™ is a tool that lets you manage sensor data, design condition indicators, and estimate the remaining useful life (RUL) of a machine. The toolbox provides functions and an interactive app for exploring, extracting, and ranking features using data-based and model-based techniques, including statistical, spectral, and time-series analysis.
Vision HDL Toolbox™ is a tool that provides pixel-streaming algorithms for the design and implementation of vision systems on FPGAs and ASICs. It provides a design framework that supports a diverse set of interface types, frame sizes, and frame rates. The image processing, video, and computer vision algorithms in the toolbox use an architecture appropriate for HDL implementations.
Automated Driving Toolbox™ is a MATLAB tool that provides algorithms and tools for designing, simulating, and testing ADAS and autonomous driving systems. You can design and test vision and lidar perception systems, as well as sensor fusion, path planning, and vehicle controllers. Visualization tools include a bird's-eye-view plot and scope for sensor coverage, detections and tracks, and displays for video, lidar, and maps. The toolbox lets you import and work with HERE HD Live Map data and OpenDRIVE® road networks. It also provides reference application examples for common ADAS and automated driving features, including FCW, AEB, ACC, LKA, and parking valet. The toolbox supports C/C++ code generation for rapid prototyping and HIL testing, with support for sensor fusion, tracking, path planning, and vehicle controller algorithms.
UAV Toolbox is an application that provides tools and reference applications for designing, simulating, testing, and deploying unmanned aerial vehicle (UAV) and drone applications. You can design autonomous flight algorithms, UAV missions, and flight controllers. The Flight Log Analyzer app lets you interactively analyze 3D flight paths, telemetry information, and sensor readings from common flight log formats.
Navigation Toolbox™ is a tool that provides algorithms and analysis tools for motion planning, simultaneous localization and mapping (SLAM), and inertial navigation. The toolbox includes customizable search and sampling-based path planners, as well as metrics for validating and comparing paths. You can create 2D and 3D map representations, generate maps using SLAM algorithms, and interactively visualize and debug map generation with the SLAM map builder app.
Lidar Toolbox™ is a tool that provides algorithms, functions, and apps for designing, analyzing, and testing lidar processing systems. You can perform object detection and tracking, semantic segmentation, shape fitting, lidar registration, and obstacle detection. Lidar Toolbox supports lidar-camera cross calibration for workflows that combine computer vision and lidar processing.
Mapping Toolbox™ is a tool that provides algorithms and functions for transforming geographic data and creating map displays. You can visualize your data in a geographic context, build map displays from more than 60 map projections, and transform data from a variety of sources into a consistent geographic coordinate system.
Back to the Top
Reinforcement Learning is a subset of machine learning, which is a neural network with three or more layers. These neural networks attempt to simulate the behavior of the human brain,though, far from matching its ability. This allows the neural networks to "learn" from a process in which a model learns to become more accurate for performing an action in an environment based on feedback in order to maximize the reward. The Learning can be supervised, semi-supervised or unsupervised.
Top Reinforcement Learning Courses | Curso
Top Reinforcement Learning Courses | Udemy
Top Reinforcement Learning Courses | Udacity
Reinforcement Learning Courses | Stanford Online
Deep Learning Online Courses | NVIDIA
Top Deep Learning Courses Online | Curso
Top Deep Learning Courses Online | Udemy
Learn Deep Learning with Online Courses and Lessons | edX
Deep Learning Online Course Nanodegree | Udacity
Machine Learning Course by Andrew Ng | Curso
Machine Learning Engineering for Production (MLOps) course by Andrew Ng | Curso
Data Science: Deep Learning and Neural Networks in Python | Udemy
Understanding Machine Learning with Python | Visão Plural
How to Think About Machine Learning Algorithms | Visão Plural
Deep Learning Courses | Stanford Online
Deep Learning - UW Professional & Continuing Education
Deep Learning Online Courses | Universidade de Harvard
Machine Learning for Everyone Courses | DataCamp
Artificial Intelligence Expert Course: Platinum Edition | Udemy
Top Artificial Intelligence Courses Online | Curso
Learn Artificial Intelligence with Online Courses and Lessons | edX
Professional Certificate in Computer Science for Artificial Intelligence | edX
Artificial Intelligence Nanodegree program
Artificial Intelligence (AI) Online Courses | Udacity
Intro to Artificial Intelligence Course | Udacity
Edge AI for IoT Developers Course | Udacity
Reasoning: Goal Trees and Rule-Based Expert Systems | MIT OpenCourseWare
Expert Systems and Applied Artificial Intelligence
Autonomous Systems - Microsoft AI
Introduction to Microsoft Project Bonsai
Machine teaching with the Microsoft Autonomous Systems platform
Autonomous Maritime Systems Training | AMC Search
Top Autonomous Cars Courses Online | Udemy
Applied Control Systems 1: autonomous cars: Math + PID + MPC | Udemy
Learn Autonomous Robotics with Online Courses and Lessons | edX
Artificial Intelligence Nanodegree program
Autonomous Systems Online Courses & Programs | Udacity
Edge AI for IoT Developers Course | Udacity
Autonomous Systems MOOC and Free Online Courses | MOOC List
Robotics and Autonomous Systems Graduate Program | Standford Online
Mobile Autonomous Systems Laboratory | MIT OpenCourseWare
OpenAI is an open source Python library for developing and comparing reinforcement learning algorithms by providing a standard API to communicate between learning algorithms and environments, as well as a standard set of environments compliant with that API.
ReinforcementLearning.jl is a collection of tools for doing reinforcement learning research in Julia.
Reinforcement Learning Toolbox™ is a tool that provides an app, functions, and a Simulink® block for training policies using reinforcement learning algorithms, including DQN, PPO, SAC, and DDPG. You can use these policies to implement controllers and decision-making algorithms for complex applications such as resource allocation, robotics, and autonomous systems.
Amazon SageMaker is a fully managed service that provides every developer and data scientist with the ability to build, train, and deploy machine learning (ML) models quickly.
AWS RoboMaker is a service that provides a fully-managed, scalable infrastructure for simulation that customers use for multi-robot simulation and CI/CD integration with regression testing in simulation.
TensorFlow is an end-to-end open source platform for machine learning. It has a comprehensive, flexible ecosystem of tools, libraries and community resources that lets researchers push the state-of-the-art in ML and developers easily build and deploy ML powered applications.
Keras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, or Theano.It was developed with a focus on enabling fast experimentation. It is capable of running on top of TensorFlow, Microsoft Cognitive Toolkit, R, Theano, or PlaidML.
PyTorch is a library for deep learning on irregular input data such as graphs, point clouds, and manifolds. Primarily developed by Facebook's AI Research lab.
Scikit-Learn is a simple and efficient tool for data mining and data analysis. It is built on NumPy,SciPy, and mathplotlib.
NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks. cuDNN provides highly tuned implementations for standard routines such as forward and backward convolution, pooling, normalization, and activation layers. cuDNN accelerates widely used deep learning frameworks, including Caffe2, Chainer, Keras, MATLAB, MxNet, PyTorch, and TensorFlow.
Jupyter Notebook is an open-source web application that allows you to create and share documents that contain live code, equations, visualizations and narrative text. Jupyter is used widely in industries that do data cleaning and transformation, numerical simulation, statistical modeling, data visualization, data science, and machine learning.
Apache Spark is a unified analytics engine for large-scale data processing. It provides high-level APIs in Scala, Java, Python, and R, and an optimized engine that supports general computation graphs for data analysis. It also supports a rich set of higher-level tools including Spark SQL for SQL and DataFrames, MLlib for machine learning, GraphX for graph processing, and Structured Streaming for stream processing.
Apache Spark Connector for SQL Server and Azure SQL is a high-performance connector that enables you to use transactional data in big data analytics and persists results for ad-hoc queries or reporting. The connector allows you to use any SQL database, on-premises or in the cloud, as an input data source or output data sink for Spark jobs.
Apache PredictionIO is an open source machine learning framework for developers, data scientists, and end users. It supports event collection, deployment of algorithms, evaluation, querying predictive results via REST APIs. It is based on scalable open source services like Hadoop, HBase (and other DBs), Elasticsearch, Spark and implements what is called a Lambda Architecture.
Cluster Manager for Apache Kafka(CMAK) is a tool for managing Apache Kafka clusters.
BigDL is a distributed deep learning library for Apache Spark. With BigDL, users can write their deep learning applications as standard Spark programs, which can directly run on top of existing Spark or Hadoop clusters.
Eclipse Deeplearning4J (DL4J) is a set of projects intended to support all the needs of a JVM-based(Scala, Kotlin, Clojure, and Groovy) deep learning application. This means starting with the raw data, loading and preprocessing it from wherever and whatever format it is in to building and tuning a wide variety of simple and complex deep learning networks.
Deep Learning Toolbox™ is a tool that provides a framework for designing and implementing deep neural networks with algorithms, pretrained models, and apps. You can use convolutional neural networks (ConvNets, CNNs) and long short-term memory (LSTM) networks to perform classification and regression on image, time-series, and text data. You can build network architectures such as generative adversarial networks (GANs) and Siamese networks using automatic differentiation, custom training loops, and shared weights. With the Deep Network Designer app, you can design, analyze, and train networks graphically. It can exchange models with TensorFlow™ and PyTorch through the ONNX format and import models from TensorFlow-Keras and Caffe. The toolbox supports transfer learning with DarkNet-53, ResNet-50, NASNet, SqueezeNet and many other pretrained models.
Deep Learning HDL Toolbox™ is a tool that provides functions and tools to prototype and implement deep learning networks on FPGAs and SoCs. It provides pre-built bitstreams for running a variety of deep learning networks on supported Xilinx® and Intel® FPGA and SoC devices. Profiling and estimation tools let you customize a deep learning network by exploring design, performance, and resource utilization tradeoffs.
Parallel Computing Toolbox™ is a tool that lets you solve computationally and data-intensive problems using multicore processors, GPUs, and computer clusters. High-level constructs such as parallel for-loops, special array types, and parallelized numerical algorithms enable you to parallelize MATLAB® applications without CUDA or MPI programming. The toolbox lets you use parallel-enabled functions in MATLAB and other toolboxes. You can use the toolbox with Simulink® to run multiple simulations of a model in parallel. Programs and models can run in both interactive and batch modes.
XGBoost is an optimized distributed gradient boosting library designed to be highly efficient, flexible and portable. It implements machine learning algorithms under the Gradient Boosting framework. XGBoost provides a parallel tree boosting (also known as GBDT, GBM) that solve many data science problems in a fast and accurate way. It supports distributed training on multiple machines, including AWS, GCE, Azure, and Yarn clusters. Also, it can be integrated with Flink, Spark and other cloud dataflow systems.
LIBSVM is an integrated software for support vector classification, (C-SVC, nu-SVC), regression (epsilon-SVR, nu-SVR) and distribution estimation (one-class SVM). It supports multi-class classification.
Azure Databricks is a fast and collaborative Apache Spark-based big data analytics service designed for data science and data engineering. Azure Databricks, sets up your Apache Spark environment in minutes, autoscale, and collaborate on shared projects in an interactive workspace. Azure Databricks supports Python, Scala, R, Java, and SQL, as well as data science frameworks and libraries including TensorFlow, PyTorch, and scikit-learn.
Microsoft Cognitive Toolkit (CNTK) is an open-source toolkit for commercial-grade distributed deep learning. It describes neural networks as a series of computational steps via a directed graph. CNTK allows the user to easily realize and combine popular model types such as feed-forward DNNs, convolutional neural networks (CNNs) and recurrent neural networks (RNNs/LSTMs). CNTK implements stochastic gradient descent (SGD, error backpropagation) learning with automatic differentiation and parallelization across multiple GPUs and servers.
Tensorflow_macOS is a Mac-optimized version of TensorFlow and TensorFlow Addons for macOS 11.0+ accelerated using Apple's ML Compute framework.
Apache Airflow is an open-source workflow management platform created by the community to programmatically author, schedule and monitor workflows. Instalar. Princípios. Scalable. Airflow has a modular architecture and uses a message queue to orchestrate an arbitrary number of workers. Airflow is ready to scale to infinity.
Open Neural Network Exchange(ONNX) is an open ecosystem that empowers AI developers to choose the right tools as their project evolves. ONNX provides an open source format for AI models, both deep learning and traditional ML. It defines an extensible computation graph model, as well as definitions of built-in operators and standard data types.
Apache MXNet is a deep learning framework designed for both efficiency and flexibility. It allows you to mix symbolic and imperative programming to maximize efficiency and productivity. At its core, MXNet contains a dynamic dependency scheduler that automatically parallelizes both symbolic and imperative operations on the fly. A graph optimization layer on top of that makes symbolic execution fast and memory efficient. MXNet is portable and lightweight, scaling effectively to multiple GPUs and multiple machines. Support for Python, R, Julia, Scala, Go, Javascript and more.
AutoGluon is toolkit for Deep learning that automates machine learning tasks enabling you to easily achieve strong predictive performance in your applications. With just a few lines of code, you can train and deploy high-accuracy deep learning models on tabular, image, and text data.
Anaconda is a very popular Data Science platform for machine learning and deep learning that enables users to develop models, train them, and deploy them.
PlaidML is an advanced and portable tensor compiler for enabling deep learning on laptops, embedded devices, or other devices where the available computing hardware is not well supported or the available software stack contains unpalatable license restrictions.
OpenCV is a highly optimized library with focus on real-time computer vision applications. The C++, Python, and Java interfaces support Linux, MacOS, Windows, iOS, and Android.
Scikit-Learn is a Python module for machine learning built on top of SciPy, NumPy, and matplotlib, making it easier to apply robust and simple implementations of many popular machine learning algorithms.
Weka is an open source machine learning software that can be accessed through a graphical user interface, standard terminal applications, or a Java API. It is widely used for teaching, research, and industrial applications, contains a plethora of built-in tools for standard machine learning tasks, and additionally gives transparent access to well-known toolboxes such as scikit-learn, R, and Deeplearning4j.
Caffe is a deep learning framework made with expression, speed, and modularity in mind. It is developed by Berkeley AI Research (BAIR)/The Berkeley Vision and Learning Center (BVLC) and community contributors.
Theano is a Python library that allows you to define, optimize, and evaluate mathematical expressions involving multi-dimensional arrays efficiently including tight integration with NumPy.
Microsoft Project Bonsai is a low-code AI platform that speeds AI-powered automation development and part of the Autonomous Systems suite from Microsoft. Bonsai is used to build AI components that can provide operator guidance or make independent decisions to optimize process variables, improve production efficiency, and reduce downtime.
Microsoft AirSim is a simulator for drones, cars and more, built on Unreal Engine (with an experimental Unity release). AirSim is open-source, cross platform, and supports software-in-the-loop simulation with popular flight controllers such as PX4 & ArduPilot and hardware-in-loop with PX4 for physically and visually realistic simulations. It is developed as an Unreal plugin that can simply be dropped into any Unreal environment. AirSim is being developed as a platform for AI research to experiment with deep learning, computer vision and reinforcement learning algorithms for autonomous vehicles.
CARLA is an open-source simulator for autonomous driving research. CARLA has been developed from the ground up to support development, training, and validation of autonomous driving systems. In addition to open-source code and protocols, CARLA provides open digital assets (urban layouts, buildings, vehicles) that were created for this purpose and can be used freely.
ROS/ROS2 bridge for CARLA(package) is a bridge that enables two-way communication between ROS and CARLA. The information from the CARLA server is translated to ROS topics. In the same way, the messages sent between nodes in ROS get translated to commands to be applied in CARLA.
ROS Toolbox is a tool that provides an interface connecting MATLAB® and Simulink® with the Robot Operating System (ROS and ROS 2), enabling you to create a network of ROS nodes. The toolbox includes MATLAB functions and Simulink blocks to import, analyze, and play back ROS data recorded in rosbag files. You can also connect to a live ROS network to access ROS messages.
Robotics Toolbox™ provides a toolbox that brings robotics specific functionality(designing, simulating, and testing manipulators, mobile robots, and humanoid robots) to MATLAB, exploiting the native capabilities of MATLAB (linear algebra, portability, graphics). The toolbox also supports mobile robots with functions for robot motion models (bicycle), path planning algorithms (bug, distance transform, D*, PRM), kinodynamic planning (lattice, RRT), localization (EKF, particle filter), map building (EKF) and simultaneous localization and mapping (EKF), and a Simulink model a of non-holonomic vehicle. The Toolbox also including a detailed Simulink model for a quadrotor flying robot.
Image Processing Toolbox™ is a tool that provides a comprehensive set of reference-standard algorithms and workflow apps for image processing, analysis, visualization, and algorithm development. You can perform image segmentation, image enhancement, noise reduction, geometric transformations, image registration, and 3D image processing.
Computer Vision Toolbox™ is a tool that provides algorithms, functions, and apps for designing and testing computer vision, 3D vision, and video processing systems. You can perform object detection and tracking, as well as feature detection, extraction, and matching. You can automate calibration workflows for single, stereo, and fisheye cameras. For 3D vision, the toolbox supports visual and point cloud SLAM, stereo vision, structure from motion, and point cloud processing.
Robotics Toolbox™ is a tool that provides a toolbox that brings robotics specific functionality(designing, simulating, and testing manipulators, mobile robots, and humanoid robots) to MATLAB, exploiting the native capabilities of MATLAB (linear algebra, portability, graphics). The toolbox also supports mobile robots with functions for robot motion models (bicycle), path planning algorithms (bug, distance transform, D*, PRM), kinodynamic planning (lattice, RRT), localization (EKF, particle filter), map building (EKF) and simultaneous localization and mapping (EKF), and a Simulink model a of non-holonomic vehicle. The Toolbox also including a detailed Simulink model for a quadrotor flying robot.
Model Predictive Control Toolbox™ is a tool that provides functions, an app, and Simulink® blocks for designing and simulating controllers using linear and nonlinear model predictive control (MPC). The toolbox lets you specify plant and disturbance models, horizons, constraints, and weights. By running closed-loop simulations, you can evaluate controller performance.
Predictive Maintenance Toolbox™ is a tool that lets you manage sensor data, design condition indicators, and estimate the remaining useful life (RUL) of a machine. The toolbox provides functions and an interactive app for exploring, extracting, and ranking features using data-based and model-based techniques, including statistical, spectral, and time-series analysis.
Vision HDL Toolbox™ is a tool that provides pixel-streaming algorithms for the design and implementation of vision systems on FPGAs and ASICs. It provides a design framework that supports a diverse set of interface types, frame sizes, and frame rates. The image processing, video, and computer vision algorithms in the toolbox use an architecture appropriate for HDL implementations.
Automated Driving Toolbox™ is a MATLAB tool that provides algorithms and tools for designing, simulating, and testing ADAS and autonomous driving systems. You can design and test vision and lidar perception systems, as well as sensor fusion, path planning, and vehicle controllers. Visualization tools include a bird's-eye-view plot and scope for sensor coverage, detections and tracks, and displays for video, lidar, and maps. The toolbox lets you import and work with HERE HD Live Map data and OpenDRIVE® road networks. It also provides reference application examples for common ADAS and automated driving features, including FCW, AEB, ACC, LKA, and parking valet. The toolbox supports C/C++ code generation for rapid prototyping and HIL testing, with support for sensor fusion, tracking, path planning, and vehicle controller algorithms.
Navigation Toolbox™ is a tool that provides algorithms and analysis tools for motion planning, simultaneous localization and mapping (SLAM), and inertial navigation. The toolbox includes customizable search and sampling-based path planners, as well as metrics for validating and comparing paths. You can create 2D and 3D map representations, generate maps using SLAM algorithms, and interactively visualize and debug map generation with the SLAM map builder app.
UAV Toolbox is an application that provides tools and reference applications for designing, simulating, testing, and deploying unmanned aerial vehicle (UAV) and drone applications. You can design autonomous flight algorithms, UAV missions, and flight controllers. The Flight Log Analyzer app lets you interactively analyze 3D flight paths, telemetry information, and sensor readings from common flight log formats.
Lidar Toolbox™ is a tool that provides algorithms, functions, and apps for designing, analyzing, and testing lidar processing systems. You can perform object detection and tracking, semantic segmentation, shape fitting, lidar registration, and obstacle detection. Lidar Toolbox supports lidar-camera cross calibration for workflows that combine computer vision and lidar processing.
Mapping Toolbox™ is a tool that provides algorithms and functions for transforming geographic data and creating map displays. You can visualize your data in a geographic context, build map displays from more than 60 map projections, and transform data from a variety of sources into a consistent geographic coordinate system.
Back to the Top
Computer Vision is a field of Artificial Intelligence (AI) that focuses on enabling computers to identify and understand objects and people in images and videos.
OpenCV Courses
Exploring Computer Vision in Microsoft Azure
Top Computer Vision Courses Online | Curso
Top Computer Vision Courses Online | Udemy
Learn Computer Vision with Online Courses and Lessons | edX
Computer Vision and Image Processing Fundamentals | edX
Introduction to Computer Vision Courses | Udacity
Computer Vision Nanodegree program | Udacity
Machine Vision Course |MIT Open Courseware
Computer Vision Training Courses | NobleProg
Visual Computing Graduate Program | Stanford Online
OpenCV is a highly optimized library with focus on real-time computer vision applications. The C++, Python, and Java interfaces support Linux, MacOS, Windows, iOS, and Android.
Microsoft Computer Vision Recipes is a project that provides examples and best practice guidelines for building computer vision systems. This allows people to build a comprehensive set of tools and examples that leverage recent advances in Computer Vision algorithms, neural architectures, and operationalizing such systems. Creatin from existing state-of-the-art libraries and build additional utility around loading image data, optimizing and evaluating models, and scaling up to the cloud.
Microsoft Cognitive Toolkit (CNTK) is an open-source toolkit for commercial-grade distributed deep learning. It describes neural networks as a series of computational steps via a directed graph. CNTK allows the user to easily realize and combine popular model types such as feed-forward DNNs, convolutional neural networks (CNNs) and recurrent neural networks (RNNs/LSTMs). CNTK implements stochastic gradient descent (SGD, error backpropagation) learning with automatic differentiation and parallelization across multiple GPUs and servers.
Scikit-Learn is a Python module for machine learning built on top of SciPy, NumPy, and matplotlib, making it easier to apply robust and simple implementations of many popular machine learning algorithms.
NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks. cuDNN provides highly tuned implementations for standard routines such as forward and backward convolution, pooling, normalization, and activation layers. cuDNN accelerates widely used deep learning frameworks, including Caffe2, Chainer, Keras, MATLAB, MxNet, PyTorch, and TensorFlow.
Automated Driving Toolbox™ is a MATLAB tool that provides algorithms and tools for designing, simulating, and testing ADAS and autonomous driving systems. You can design and test vision and lidar perception systems, as well as sensor fusion, path planning, and vehicle controllers. Visualization tools include a bird's-eye-view plot and scope for sensor coverage, detections and tracks, and displays for video, lidar, and maps. The toolbox lets you import and work with HERE HD Live Map data and OpenDRIVE® road networks. It also provides reference application examples for common ADAS and automated driving features, including FCW, AEB, ACC, LKA, and parking valet. The toolbox supports C/C++ code generation for rapid prototyping and HIL testing, with support for sensor fusion, tracking, path planning, and vehicle controller algorithms.
LRSLibrary is a Low-Rank and Sparse Tools for Background Modeling and Subtraction in Videos. The library was designed for moving object detection in videos, but it can be also used for other computer vision and machine learning problems.
Image Processing Toolbox™ is a tool that provides a comprehensive set of reference-standard algorithms and workflow apps for image processing, analysis, visualization, and algorithm development. You can perform image segmentation, image enhancement, noise reduction, geometric transformations, image registration, and 3D image processing.
Computer Vision Toolbox™ is a tool that provides algorithms, functions, and apps for designing and testing computer vision, 3D vision, and video processing systems. You can perform object detection and tracking, as well as feature detection, extraction, and matching. You can automate calibration workflows for single, stereo, and fisheye cameras. For 3D vision, the toolbox supports visual and point cloud SLAM, stereo vision, structure from motion, and point cloud processing.
Statistics and Machine Learning Toolbox™ is a tool that provides functions and apps to describe, analyze, and model data. You can use descriptive statistics, visualizations, and clustering for exploratory data analysis; fit probability distributions to data; generate random numbers for Monte Carlo simulations, and perform hypothesis tests. Regression and classification algorithms let you draw inferences from data and build predictive models either interactively, using the Classification and Regression Learner apps, or programmatically, using AutoML.
Lidar Toolbox™ is a tool that provides algorithms, functions, and apps for designing, analyzing, and testing lidar processing systems. You can perform object detection and tracking, semantic segmentation, shape fitting, lidar registration, and obstacle detection. Lidar Toolbox supports lidar-camera cross calibration for workflows that combine computer vision and lidar processing.
Mapping Toolbox™ is a tool that provides algorithms and functions for transforming geographic data and creating map displays. You can visualize your data in a geographic context, build map displays from more than 60 map projections, and transform data from a variety of sources into a consistent geographic coordinate system.
UAV Toolbox is an application that provides tools and reference applications for designing, simulating, testing, and deploying unmanned aerial vehicle (UAV) and drone applications. You can design autonomous flight algorithms, UAV missions, and flight controllers. The Flight Log Analyzer app lets you interactively analyze 3D flight paths, telemetry information, and sensor readings from common flight log formats.
Parallel Computing Toolbox™ is a tool that lets you solve computationally and data-intensive problems using multicore processors, GPUs, and computer clusters. High-level constructs such as parallel for-loops, special array types, and parallelized numerical algorithms enable you to parallelize MATLAB® applications without CUDA or MPI programming. The toolbox lets you use parallel-enabled functions in MATLAB and other toolboxes. You can use the toolbox with Simulink® to run multiple simulations of a model in parallel. Programs and models can run in both interactive and batch modes.
Partial Differential Equation Toolbox™ is a tool that provides functions for solving structural mechanics, heat transfer, and general partial differential equations (PDEs) using finite element analysis.
ROS Toolbox is a tool that provides an interface connecting MATLAB® and Simulink® with the Robot Operating System (ROS and ROS 2), enabling you to create a network of ROS nodes. The toolbox includes MATLAB functions and Simulink blocks to import, analyze, and play back ROS data recorded in rosbag files. You can also connect to a live ROS network to access ROS messages.
Robotics Toolbox™ provides a toolbox that brings robotics specific functionality(designing, simulating, and testing manipulators, mobile robots, and humanoid robots) to MATLAB, exploiting the native capabilities of MATLAB (linear algebra, portability, graphics). The toolbox also supports mobile robots with functions for robot motion models (bicycle), path planning algorithms (bug, distance transform, D*, PRM), kinodynamic planning (lattice, RRT), localization (EKF, particle filter), map building (EKF) and simultaneous localization and mapping (EKF), and a Simulink model a of non-holonomic vehicle. The Toolbox also including a detailed Simulink model for a quadrotor flying robot.
Deep Learning Toolbox™ is a tool that provides a framework for designing and implementing deep neural networks with algorithms, pretrained models, and apps. You can use convolutional neural networks (ConvNets, CNNs) and long short-term memory (LSTM) networks to perform classification and regression on image, time-series, and text data. You can build network architectures such as generative adversarial networks (GANs) and Siamese networks using automatic differentiation, custom training loops, and shared weights. With the Deep Network Designer app, you can design, analyze, and train networks graphically. It can exchange models with TensorFlow™ and PyTorch through the ONNX format and import models from TensorFlow-Keras and Caffe. The toolbox supports transfer learning with DarkNet-53, ResNet-50, NASNet, SqueezeNet and many other pretrained models.
Reinforcement Learning Toolbox™ is a tool that provides an app, functions, and a Simulink® block for training policies using reinforcement learning algorithms, including DQN, PPO, SAC, and DDPG. You can use these policies to implement controllers and decision-making algorithms for complex applications such as resource allocation, robotics, and autonomous systems.
Deep Learning HDL Toolbox™ is a tool that provides functions and tools to prototype and implement deep learning networks on FPGAs and SoCs. It provides pre-built bitstreams for running a variety of deep learning networks on supported Xilinx® and Intel® FPGA and SoC devices. Profiling and estimation tools let you customize a deep learning network by exploring design, performance, and resource utilization tradeoffs.
Model Predictive Control Toolbox™ is a tool that provides functions, an app, and Simulink® blocks for designing and simulating controllers using linear and nonlinear model predictive control (MPC). The toolbox lets you specify plant and disturbance models, horizons, constraints, and weights. By running closed-loop simulations, you can evaluate controller performance.
Vision HDL Toolbox™ is a tool that provides pixel-streaming algorithms for the design and implementation of vision systems on FPGAs and ASICs. It provides a design framework that supports a diverse set of interface types, frame sizes, and frame rates. The image processing, video, and computer vision algorithms in the toolbox use an architecture appropriate for HDL implementations.
Data Acquisition Toolbox™ is a tool that provides apps and functions for configuring data acquisition hardware, reading data into MATLAB® and Simulink®, and writing data to DAQ analog and digital output channels. The toolbox supports a variety of DAQ hardware, including USB, PCI, PCI Express®, PXI®, and PXI Express® devices, from National Instruments® and other vendors.
Microsoft AirSim is a simulator for drones, cars and more, built on Unreal Engine (with an experimental Unity release). AirSim is open-source, cross platform, and supports software-in-the-loop simulation with popular flight controllers such as PX4 & ArduPilot and hardware-in-loop with PX4 for physically and visually realistic simulations. It is developed as an Unreal plugin that can simply be dropped into any Unreal environment. AirSim is being developed as a platform for AI research to experiment with deep learning, computer vision and reinforcement learning algorithms for autonomous vehicles.
Back to the Top
Natural Language Processing (NLP) is a branch of artificial intelligence (AI) focused on giving computers the ability to understand text and spoken words in much the same way human beings can. NLP combines computational linguistics rule-based modeling of human language with statistical, machine learning, and deep learning models.
Natural Language Processing With Python's NLTK Package
Cognitive Services—APIs for AI Developers | Microsoft Azure
Artificial Intelligence Services - Amazon Web Services (AWS)
Google Cloud Natural Language API
Top Natural Language Processing Courses Online | Udemy
Introduction to Natural Language Processing (NLP) | Udemy
Top Natural Language Processing Courses | Curso
Natural Language Processing | Curso
Natural Language Processing in TensorFlow | Curso
Learn Natural Language Processing with Online Courses and Lessons | edX
Build a Natural Language Processing Solution with Microsoft Azure | Visão Plural
Natural Language Processing (NLP) Training Courses | NobleProg
Natural Language Processing with Deep Learning Course | Standford Online
Advanced Natural Language Processing - MIT OpenCourseWare
Certified Natural Language Processing Expert Certification | IABAC
Natural Language Processing Course - Intel
Natural Language Toolkit (NLTK) is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, wrappers for industrial-strength NLP libraries.
spaCy is a library for advanced Natural Language Processing in Python and Cython. It's built on the very latest research, and was designed from day one to be used in real products. spaCy comes with pretrained pipelines and currently supports tokenization and training for 60+ languages. It also features neural network models for tagging, parsing, named entity recognition, text classification and more, multi-task learning with pretrained transformers like BERT.
CoreNLP is a set of natural language analysis tools written in Java. CoreNLP enables users to derive linguistic annotations for text, including token and sentence boundaries, parts of speech, named entities, numeric and time values, dependency and constituency parses, coreference, sentiment, quote attributions, and relations.
NLPnet is a Python library for Natural Language Processing tasks based on neural networks. It performs part-of-speech tagging, semantic role labeling and dependency parsing.
Flair is a simple framework for state-of-the-art Natural Language Processing (NLP) models to your text, such as named entity recognition (NER), part-of-speech tagging (PoS), special support for biomedical data, sense disambiguation and classification, with support for a rapidly growing number of languages.
Catalyst is a C# Natural Language Processing library built for speed. Inspired by spaCy's design, it brings pre-trained models, out-of-the box support for training word and document embeddings, and flexible entity recognition models.
Apache OpenNLP is an open-source library for a machine learning based toolkit used in the processing of natural language text. It features an API for use cases like Named Entity Recognition, Sentence Detection, POS(Part-Of-Speech) tagging, Tokenization Feature extraction, Chunking, Parsing, and Coreference resolution.
Microsoft Cognitive Toolkit (CNTK) is an open-source toolkit for commercial-grade distributed deep learning. It describes neural networks as a series of computational steps via a directed graph. CNTK allows the user to easily realize and combine popular model types such as feed-forward DNNs, convolutional neural networks (CNNs) and recurrent neural networks (RNNs/LSTMs). CNTK implements stochastic gradient descent (SGD, error backpropagation) learning with automatic differentiation and parallelization across multiple GPUs and servers.
NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks. cuDNN provides highly tuned implementations for standard routines such as forward and backward convolution, pooling, normalization, and activation layers. cuDNN accelerates widely used deep learning frameworks, including Caffe2, Chainer, Keras, MATLAB, MxNet, PyTorch, and TensorFlow.
TensorFlow is an end-to-end open source platform for machine learning. It has a comprehensive, flexible ecosystem of tools, libraries and community resources that lets researchers push the state-of-the-art in ML and developers easily build and deploy ML powered applications.
Tensorflow_macOS is a Mac-optimized version of TensorFlow and TensorFlow Addons for macOS 11.0+ accelerated using Apple's ML Compute framework.
Keras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, or Theano.It was developed with a focus on enabling fast experimentation. It is capable of running on top of TensorFlow, Microsoft Cognitive Toolkit, R, Theano, or PlaidML.
PyTorch is a library for deep learning on irregular input data such as graphs, point clouds, and manifolds. Primarily developed by Facebook's AI Research lab.
Eclipse Deeplearning4J (DL4J) is a set of projects intended to support all the needs of a JVM-based(Scala, Kotlin, Clojure, and Groovy) deep learning application. This means starting with the raw data, loading and preprocessing it from wherever and whatever format it is in to building and tuning a wide variety of simple and complex deep learning networks.
Chainer is a Python-based deep learning framework aiming at flexibility. It provides automatic differentiation APIs based on the define-by-run approach (dynamic computational graphs) as well as object-oriented high-level APIs to build and train neural networks. It also supports CUDA/cuDNN using CuPy for high performance training and inference.
Anaconda is a very popular Data Science platform for machine learning and deep learning that enables users to develop models, train them, and deploy them.
PlaidML is an advanced and portable tensor compiler for enabling deep learning on laptops, embedded devices, or other devices where the available computing hardware is not well supported or the available software stack contains unpalatable license restrictions.
Scikit-Learn is a Python module for machine learning built on top of SciPy, NumPy, and matplotlib, making it easier to apply robust and simple implementations of many popular machine learning algorithms.
Caffe is a deep learning framework made with expression, speed, and modularity in mind. It is developed by Berkeley AI Research (BAIR)/The Berkeley Vision and Learning Center (BVLC) and community contributors.
Theano is a Python library that allows you to define, optimize, and evaluate mathematical expressions involving multi-dimensional arrays efficiently including tight integration with NumPy.
Apache Spark is a unified analytics engine for large-scale data processing. It provides high-level APIs in Scala, Java, Python, and R, and an optimized engine that supports general computation graphs for data analysis. It also supports a rich set of higher-level tools including Spark SQL for SQL and DataFrames, MLlib for machine learning, GraphX for graph processing, and Structured Streaming for stream processing.
Apache Spark Connector for SQL Server and Azure SQL is a high-performance connector that enables you to use transactional data in big data analytics and persists results for ad-hoc queries or reporting. The connector allows you to use any SQL database, on-premises or in the cloud, as an input data source or output data sink for Spark jobs.
Apache PredictionIO is an open source machine learning framework for developers, data scientists, and end users. It supports event collection, deployment of algorithms, evaluation, querying predictive results via REST APIs. It is based on scalable open source services like Hadoop, HBase (and other DBs), Elasticsearch, Spark and implements what is called a Lambda Architecture.
Apache Airflow is an open-source workflow management platform created by the community to programmatically author, schedule and monitor workflows. Airflow has a modular architecture and uses a message queue to orchestrate an arbitrary number of workers. Airflow is ready to scale to infinity.
Open Neural Network Exchange(ONNX) is an open ecosystem that empowers AI developers to choose the right tools as their project evolves. ONNX provides an open source format for AI models, both deep learning and traditional ML. It defines an extensible computation graph model, as well as definitions of built-in operators and standard data types.
BigDL is a distributed deep learning library for Apache Spark. With BigDL, users can write their deep learning applications as standard Spark programs, which can directly run on top of existing Spark or Hadoop clusters.
Numba is an open source, NumPy-aware optimizing compiler for Python sponsored by Anaconda, Inc. It uses the LLVM compiler project to generate machine code from Python syntax. Numba can compile a large subset of numerically-focused Python, including many NumPy functions. Additionally, Numba has support for automatic parallelization of loops, generation of GPU-accelerated code, and creation of ufuncs and C callbacks.
Back to the Top
Bioinformatics is a field of computational science that has to do with the analysis of sequences of biological molecules. This usually refers to genes, DNA, RNA, or protein, and is particularly useful in comparing genes and other sequences in proteins and other sequences within an organism or between organisms, looking at evolutionary relationships between organisms, and using the patterns that exist across DNA and protein sequences to figure out what their function is.
European Bioinformatics Institute
Centro Nacional de informações sobre biotecnologia
Online Courses in Bioinformatics |ISCB - International Society for Computational Biology
Bioinformatics | Curso
Top Bioinformatics Courses | Udemy
Biometrics Courses | Udemy
Learn Bioinformatics with Online Courses and Lessons | edX
Bioinformatics Graduate Certificate | Harvard Extension School
Bioinformatics and Biostatistics | UC San Diego Extension
Bioinformatics and Proteomics - Free Online Course Materials | MIT
Introduction to Biometrics course - Biometrics Institute
Bioconductor is an open source project that provides tools for the analysis and comprehension of high-throughput genomic data. Bioconductor uses the R statistical programming language, and is open source and open development. It has two releases each year, and an active user community. Bioconductor is also available as an AMI (Amazon Machine Image) and Docker images.
Bioconda is a channel for the conda package manager specializing in bioinformatics software. It has a repository of packages containing over 7000 bioinformatics packages ready to use with conda install.
UniProt is a freely accessible database that provide users with a comprehensive, high-quality and freely accessible set of protein sequences annotated with functional information.
Bowtie 2 is an ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences. It is particularly good at aligning reads of about 50 up to 100s or 1,000s of characters, and particularly good at aligning to relatively long (mammalian) genomes.
Biopython is a set of freely available tools for biological computation written in Python by an international team of developers. It is a distributed collaborative effort to develop Python libraries and applications which address the needs of current and future work in bioinformatics.
BioRuby is a toolkit that has components for sequence analysis, pathway analysis, protein modelling and phylogenetic analysis; it supports many widely used data formats and provides easy access to databases, external programs and public web services, including BLAST, KEGG, GenBank, MEDLINE and GO.
BioJava is a toolkit that provides an API to maintain local installations of the PDB, load and manipulate structures, perform standard analysis such as sequence and structure alignments and visualize them in 3D.
BioPHP is an open source project that provides a collection of open source PHP code, with classes for DNA and protein sequence analysis, alignment, database parsing, and other bioinformatics tools.
Avogadro is an advanced molecule editor and visualizer designed for cross-platform use in computational chemistry, molecular modeling, bioinformatics, materials science, and related areas. It offers flexible high quality rendering and a powerful plugin architecture.
Ascalaph Designer is a program for molecular dynamic simulations. Under a single graphical environment are represented as their own implementation of molecular dynamics as well as the methods of classical and quantum mechanics of popular programs.
Anduril is a workflow platform for analyzing large data sets. Anduril provides facilities for analyzing high-thoughput data in biomedical research, and the platform is fully extensible by third parties. Ready-made tools support data visualization, DNA/RNA/ChIP-sequencing, DNA/RNA microarrays, cytometry and image analysis.
Galaxy is an open source, web-based platform for accessible, reproducible, and transparent computational biomedical research. It allows users without programming experience to easily specify parameters and run individual tools as well as larger workflows. It also captures run information so that any user can repeat and understand a complete computational analysis.
PathVisio is a free open-source pathway analysis and drawing software which allows drawing, editing, and analyzing biological pathways. It is developed in Java and can be extended with plugins.
Orange is a powerful data mining and machine learning toolkit that performs data analysis and visualization.
Basic Local Alignment Search Tool is a tool that finds regions of similarity between biological sequences. The program compares nucleotide or protein sequences to sequence databases and calculates the statistical significance.
OSIRIS is public-domain, free, and open source STR analysis software designed for clinical, forensic, and research use, and has been validated for use as an expert system for single-source samples.
NCBI BioSystems is a Database that provides integrated access to biological systems and their component genes, proteins, and small molecules, as well as literature describing those biosystems and other related data throughout Entrez.
Back to the Top
CUDA Toolkit. Source: NVIDIA Developer CUDA
CUDA is a parallel computing platform and programming model developed by NVIDIA for general computing on graphical processing units (GPUs). With CUDA, developers are able to dramatically speed up computing applications by harnessing the power of GPUs. In GPU-accelerated applications, the sequential part of the workload runs on the CPU, which is optimized for single-threaded. The compute intensive portion of the application runs on thousands of GPU cores in parallel. When using CUDA, developers can program in popular languages such as C, C++, Fortran, Python and MATLAB.
CUDA Toolkit Documentation
CUDA Quick Start Guide
CUDA on WSL
CUDA GPU support for TensorFlow
NVIDIA Deep Learning cuDNN Documentation
NVIDIA GPU Cloud Documentation
NVIDIA NGC is a hub for GPU-optimized software for deep learning, machine learning, and high-performance computing (HPC) workloads.
NVIDIA NGC Containers is a registry that provides researchers, data scientists, and developers with simple access to a comprehensive catalog of GPU-accelerated software for AI, machine learning and HPC. These containers take full advantage of NVIDIA GPUs on-premises and in the cloud.
CUDA Toolkit is a collection of tools & libraries that provide a development environment for creating high performance GPU-accelerated applications. The CUDA Toolkit allows you can develop, optimize, and deploy your applications on GPU-accelerated embedded systems, desktop workstations, enterprise data centers, cloud-based platforms and HPC supercomputers. The toolkit includes GPU-accelerated libraries, debugging and optimization tools, a C/C++ compiler, and a runtime library to build and deploy your application on major architectures including x86, Arm and POWER.
NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks. cuDNN provides highly tuned implementations for standard routines such as forward and backward convolution, pooling, normalization, and activation layers. cuDNN accelerates widely used deep learning frameworks, including Caffe2, Chainer, Keras, MATLAB, MxNet, PyTorch, and TensorFlow.
CUDA-X HPC is a collection of libraries, tools, compilers and APIs that help developers solve the world's most challenging problems. CUDA-X HPC includes highly tuned kernels essential for high-performance computing (HPC).
NVIDIA Container Toolkit is a collection of tools & libraries that allows users to build and run GPU accelerated Docker containers. The toolkit includes a container runtime library and utilities to automatically configure containers to leverage NVIDIA GPUs.
Minkowski Engine is an auto-differentiation library for sparse tensors. It supports all standard neural network layers such as convolution, pooling, unpooling, and broadcasting operations for sparse tensors.
CUTLASS is a collection of CUDA C++ template abstractions for implementing high-performance matrix-multiplication (GEMM) at all levels and scales within CUDA. It incorporates strategies for hierarchical decomposition and data movement similar to those used to implement cuBLAS.
CUB is a cooperative primitives for CUDA C++ kernel authors.
Tensorman is a utility for easy management of Tensorflow containers by developed by System76.Tensorman allows Tensorflow to operate in an isolated environment that is contained from the rest of the system. This virtual environment can operate independent of the base system, allowing you to use any version of Tensorflow on any version of a Linux distribution that supports the Docker runtime.
Numba is an open source, NumPy-aware optimizing compiler for Python sponsored by Anaconda, Inc. It uses the LLVM compiler project to generate machine code from Python syntax. Numba can compile a large subset of numerically-focused Python, including many NumPy functions. Additionally, Numba has support for automatic parallelization of loops, generation of GPU-accelerated code, and creation of ufuncs and C callbacks.
Chainer is a Python-based deep learning framework aiming at flexibility. It provides automatic differentiation APIs based on the define-by-run approach (dynamic computational graphs) as well as object-oriented high-level APIs to build and train neural networks. It also supports CUDA/cuDNN using CuPy for high performance training and inference.
CuPy is an implementation of NumPy-compatible multi-dimensional array on CUDA. CuPy consists of the core multi-dimensional array class, cupy.ndarray, and many functions on it. It supports a subset of numpy.ndarray interface.
CatBoost is a fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports computation on CPU and GPU.
cuDF is a GPU DataFrame library for loading, joining, aggregating, filtering, and otherwise manipulating data. cuDF provides a pandas-like API that will be familiar to data engineers & data scientists, so they can use it to easily accelerate their workflows without going into the details of CUDA programming.
cuML is a suite of libraries that implement machine learning algorithms and mathematical primitives functions that share compatible APIs with other RAPIDS projects. cuML enables data scientists, researchers, and software engineers to run traditional tabular ML tasks on GPUs without going into the details of CUDA programming. In most cases, cuML's Python API matches the API from scikit-learn.
ArrayFire is a general-purpose library that simplifies the process of developing software that targets parallel and massively-parallel architectures including CPUs, GPUs, and other hardware acceleration devices.
Thrust is a C++ parallel programming library which resembles the C++ Standard Library. Thrust's high-level interface greatly enhances programmer productivity while enabling performance portability between GPUs and multicore CPUs.
AresDB is a GPU-powered real-time analytics storage and query engine. It features low query latency, high data freshness and highly efficient in-memory and on disk storage management.
Arraymancer is a tensor (N-dimensional array) project in Nim. The main focus is providing a fast and ergonomic CPU, Cuda and OpenCL ndarray library on which to build a scientific computing ecosystem.
Kintinuous is a real-time dense visual SLAM system capable of producing high quality globally consistent point and mesh reconstructions over hundreds of metres in real-time with only a low-cost commodity RGB-D sensor.
GraphVite is a general graph embedding engine, dedicated to high-speed and large-scale embedding learning in various applications.
Back to the Top
MATLAB is a programming language that does numerical computing such as expressing matrix and array mathematics directly.
MATLAB Documentation
Getting Started with MATLAB
MATLAB and Simulink Training from MATLAB Academy
MathWorks Certification Program
MATLAB Online Courses from Udemy
MATLAB Online Courses from Coursera
MATLAB Online Courses from edX
Building a MATLAB GUI
MATLAB Style Guidelines 2.0
Setting Up Git Source Control with MATLAB & Simulink
Pull, Push and Fetch Files with Git with MATLAB & Simulink
Create New Repository with MATLAB & Simulink
PRMLT is Matlab code for machine learning algorithms in the PRML book.
MATLAB and Simulink Services & Applications List
MATLAB in the Cloud is a service that allows you to run in cloud environments from MathWorks Cloud to Public Clouds including AWS and Azure.
MATLAB Online™ is a service that allows to users to uilitize MATLAB and Simulink through a web browser such as Google Chrome.
Simulink is a block diagram environment for Model-Based Design. It supports simulation, automatic code generation, and continuous testing of embedded systems.
Simulink Online™ is a service that provides access to Simulink through your web browser.
MATLAB Drive™ is a service that gives you the ability to store, access, and work with your files from anywhere.
MATLAB Parallel Server™ is a tool that lets you scale MATLAB® programs and Simulink® simulations to clusters and clouds. You can prototype your programs and simulations on the desktop and then run them on clusters and clouds without recoding. MATLAB Parallel Server supports batch jobs, interactive parallel computations, and distributed computations with large matrices.
MATLAB Schemer is a MATLAB package makes it easy to change the color scheme (theme) of the MATLAB display and GUI.
LRSLibrary is a Low-Rank and Sparse Tools for Background Modeling and Subtraction in Videos. The library was designed for moving object detection in videos, but it can be also used for other computer vision and machine learning problems.
Image Processing Toolbox™ is a tool that provides a comprehensive set of reference-standard algorithms and workflow apps for image processing, analysis, visualization, and algorithm development. You can perform image segmentation, image enhancement, noise reduction, geometric transformations, image registration, and 3D image processing.
Computer Vision Toolbox™ is a tool that provides algorithms, functions, and apps for designing and testing computer vision, 3D vision, and video processing systems. You can perform object detection and tracking, as well as feature detection, extraction, and matching. You can automate calibration workflows for single, stereo, and fisheye cameras. For 3D vision, the toolbox supports visual and point cloud SLAM, stereo vision, structure from motion, and point cloud processing.
Statistics and Machine Learning Toolbox™ is a tool that provides functions and apps to describe, analyze, and model data. You can use descriptive statistics, visualizations, and clustering for exploratory data analysis; fit probability distributions to data; generate random numbers for Monte Carlo simulations, and perform hypothesis tests. Regression and classification algorithms let you draw inferences from data and build predictive models either interactively, using the Classification and Regression Learner apps, or programmatically, using AutoML.
Lidar Toolbox™ is a tool that provides algorithms, functions, and apps for designing, analyzing, and testing lidar processing systems. You can perform object detection and tracking, semantic segmentation, shape fitting, lidar registration, and obstacle detection. Lidar Toolbox supports lidar-camera cross calibration for workflows that combine computer vision and lidar processing.
Mapping Toolbox™ is a tool that provides algorithms and functions for transforming geographic data and creating map displays. You can visualize your data in a geographic context, build map displays from more than 60 map projections, and transform data from a variety of sources into a consistent geographic coordinate system.
UAV Toolbox is an application that provides tools and reference applications for designing, simulating, testing, and deploying unmanned aerial vehicle (UAV) and drone applications. You can design autonomous flight algorithms, UAV missions, and flight controllers. The Flight Log Analyzer app lets you interactively analyze 3D flight paths, telemetry information, and sensor readings from common flight log formats.
Parallel Computing Toolbox™ is a tool that lets you solve computationally and data-intensive problems using multicore processors, GPUs, and computer clusters. High-level constructs such as parallel for-loops, special array types, and parallelized numerical algorithms enable you to parallelize MATLAB® applications without CUDA or MPI programming. The toolbox lets you use parallel-enabled functions in MATLAB and other toolboxes. You can use the toolbox with Simulink® to run multiple simulations of a model in parallel. Programs and models can run in both interactive and batch modes.
Partial Differential Equation Toolbox™ is a tool that provides functions for solving structural mechanics, heat transfer, and general partial differential equations (PDEs) using finite element analysis.
ROS Toolbox is a tool that provides an interface connecting MATLAB® and Simulink® with the Robot Operating System (ROS and ROS 2), enabling you to create a network of ROS nodes. The toolbox includes MATLAB functions and Simulink blocks to import, analyze, and play back ROS data recorded in rosbag files. You can also connect to a live ROS network to access ROS messages.
Robotics Toolbox™ provides a toolbox that brings robotics specific functionality(designing, simulating, and testing manipulators, mobile robots, and humanoid robots) to MATLAB, exploiting the native capabilities of MATLAB (linear algebra, portability, graphics). The toolbox also supports mobile robots with functions for robot motion models (bicycle), path planning algorithms (bug, distance transform, D*, PRM), kinodynamic planning (lattice, RRT), localization (EKF, particle filter), map building (EKF) and simultaneous localization and mapping (EKF), and a Simulink model a of non-holonomic vehicle. The Toolbox also including a detailed Simulink model for a quadrotor flying robot.
Deep Learning Toolbox™ is a tool that provides a framework for designing and implementing deep neural networks with algorithms, pretrained models, and apps. You can use convolutional neural networks (ConvNets, CNNs) and long short-term memory (LSTM) networks to perform classification and regression on image, time-series, and text data. You can build network architectures such as generative adversarial networks (GANs) and Siamese networks using automatic differentiation, custom training loops, and shared weights. With the Deep Network Designer app, you can design, analyze, and train networks graphically. It can exchange models with TensorFlow™ and PyTorch through the ONNX format and import models from TensorFlow-Keras and Caffe. The toolbox supports transfer learning with DarkNet-53, ResNet-50, NASNet, SqueezeNet and many other pretrained models.
Reinforcement Learning Toolbox™ is a tool that provides an app, functions, and a Simulink® block for training policies using reinforcement learning algorithms, including DQN, PPO, SAC, and DDPG. You can use these policies to implement controllers and decision-making algorithms for complex applications such as resource allocation, robotics, and autonomous systems.
Deep Learning HDL Toolbox™ is a tool that provides functions and tools to prototype and implement deep learning networks on FPGAs and SoCs. It provides pre-built bitstreams for running a variety of deep learning networks on supported Xilinx® and Intel® FPGA and SoC devices. Profiling and estimation tools let you customize a deep learning network by exploring design, performance, and resource utilization tradeoffs.
Model Predictive Control Toolbox™ is a tool that provides functions, an app, and Simulink® blocks for designing and simulating controllers using linear and nonlinear model predictive control (MPC). The toolbox lets you specify plant and disturbance models, horizons, constraints, and weights. By running closed-loop simulations, you can evaluate controller performance.
Vision HDL Toolbox™ is a tool that provides pixel-streaming algorithms for the design and implementation of vision systems on FPGAs and ASICs. It provides a design framework that supports a diverse set of interface types, frame sizes, and frame rates. The image processing, video, and computer vision algorithms in the toolbox use an architecture appropriate for HDL implementations.
SoC Blockset™ is a tool that provides Simulink® blocks and visualization tools for modeling, simulating, and analyzing hardware and software architectures for ASICs, FPGAs, and systems on a chip (SoC). You can build your system architecture using memory models, bus models, and I/O models, and simulate the architecture together with the algorithms.
Wireless HDL Toolbox™ is a tool that provides pre-verified, hardware-ready Simulink® blocks and subsystems for developing 5G, LTE, and custom OFDM-based wireless communication applications. It includes reference applications, IP blocks, and gateways between frame and sample-based processing.
ThingSpeak™ is an IoT analytics service that allows you to aggregate, visualize, and analyze live data streams in the cloud. ThingSpeak provides instant visualizations of data posted by your devices to ThingSpeak. With the ability to execute MATLAB® code in ThingSpeak, you can perform online analysis and process data as it comes in. ThingSpeak is often used for prototyping and proof-of-concept IoT systems that require analytics.
SEA-MAT is a collaborative effort to organize and distribute Matlab tools for the Oceanographic Community.
Gramm is a complete data visualization toolbox for Matlab. It provides an easy to use and high-level interface to produce publication-quality plots of complex data with varied statistical visualizations. Gramm is inspired by R's ggplot2 library.
hctsa is a software package for running highly comparative time-series analysis using Matlab.
Plotly is a Graphing Library for MATLAB.
YALMIP is a MATLAB toolbox for optimization modeling.
GNU Octave is a high-level interpreted language, primarily intended for numerical computations. It provides capabilities for the numerical solution of linear and nonlinear problems, and for performing other numerical experiments. It also provides extensive graphics capabilities for data visualization and manipulation.
Back to the Top
C++ is a cross-platform language that can be used to build high-performance applications developed by Bjarne Stroustrup, as an extension to the C language.
C is a general-purpose, high-level language that was originally developed by Dennis M. Ritchie to develop the UNIX operating system at Bell Labs. It supports structured programming, lexical variable scope, and recursion, with a static type system. C also provides constructs that map efficiently to typical machine instructions, which makes it one was of the most widely used programming languages today.
Embedded C is a set of language extensions for the C programming language by the C Standards Committee to address issues that exist between C extensions for different embedded systems. The extensions hep enhance microprocessor features such as fixed-point arithmetic, multiple distinct memory banks, and basic I/O operations. This makes Embedded C the most popular embedded software language in the world.
C & C++ Developer Tools from JetBrains
Open source C++ libraries on cppreference.com
C++ Graphics libraries
C++ Libraries in MATLAB
C++ Tools and Libraries Articles
Google C++ Style Guide
Introduction C++ Education course on Google Developers
C++ style guide for Fuchsia
C and C++ Coding Style Guide by OpenTitan
Chromium C++ Style Guide
C++ Core Guidelines
C++ Style Guide for ROS
Learn C++
Learn C : An Interactive C Tutorial
C++ Institute
C++ Online Training Courses on LinkedIn Learning
C++ Tutorials on W3Schools
Learn C Programming Online Courses on edX
Learn C++ with Online Courses on edX
Learn C++ on Codecademy
Coding for Everyone: C and C++ course on Coursera
C++ For C Programmers on Coursera
Top C Courses on Coursera
C++ Online Courses on Udemy
Top C Courses on Udemy
Basics of Embedded C Programming for Beginners on Udemy
C++ For Programmers Course on Udacity
C++ Fundamentals Course on Pluralsight
Introduction to C++ on MIT Free Online Course Materials
Introduction to C++ for Programmers | Harvard
Online C Courses | Universidade de Harvard
AWS SDK for C++
Azure SDK for C++
Azure SDK for C
C++ Client Libraries for Google Cloud Services
Visual Studio is an integrated development environment (IDE) from Microsoft; which is a feature-rich application that can be used for many aspects of software development. Visual Studio makes it easy to edit, debug, build, and publish your app. By using Microsoft software development platforms such as Windows API, Windows Forms, Windows Presentation Foundation, and Windows Store.
Visual Studio Code is a code editor redefined and optimized for building and debugging modern web and cloud applications.
Vcpkg is a C++ Library Manager for Windows, Linux, and MacOS.
ReSharper C++ is a Visual Studio Extension for C++ developers developed by JetBrains.
AppCode is constantly monitoring the quality of your code. It warns you of errors and smells and suggests quick-fixes to resolve them automatically. AppCode provides lots of code inspections for Objective-C, Swift, C/C++, and a number of code inspections for other supported languages. All code inspections are run on the fly.
CLion is a cross-platform IDE for C and C++ developers developed by JetBrains.
Code::Blocks is a free C/C++ and Fortran IDE built to meet the most demanding needs of its users. It is designed to be very extensible and fully configurable. Built around a plugin framework, Code::Blocks can be extended with plugins.
CppSharp is a tool and set of libraries which facilitates the usage of native C/C++ code with the .NET ecosystem. It consumes C/C++ header and library files and generates the necessary glue code to surface the native API as a managed API. Such an API can be used to consume an existing native library in your managed code or add managed scripting support to a native codebase.
Conan is an Open Source Package Manager for C++ development and dependency management into the 21st century and on par with the other development ecosystems.
High Performance Computing (HPC) SDK is a comprehensive toolbox for GPU accelerating HPC modeling and simulation applications. It includes the C, C++, and Fortran compilers, libraries, and analysis tools necessary for developing HPC applications on the NVIDIA platform.
Thrust is a C++ parallel programming library which resembles the C++ Standard Library. Thrust's high-level interface greatly enhances programmer productivity while enabling performance portability between GPUs and multicore CPUs. Interoperability with established technologies such as CUDA, TBB, and OpenMP integrates with existing software.
Boost is an educational opportunity focused on cutting-edge C++. Boost has been a participant in the annual Google Summer of Code since 2007, in which students develop their skills by working on Boost Library development.
Automake is a tool for automatically generating Makefile.in files compliant with the GNU Coding Standards. Automake requires the use of GNU Autoconf.
Cmake is an open-source, cross-platform family of tools designed to build, test and package software. CMake is used to control the software compilation process using simple platform and compiler independent configuration files, and generate native makefiles and workspaces that can be used in the compiler environment of your choice.
GDB is a debugger, that allows you to see what is going on `inside' another program while it executes or what another program was doing at the moment it crashed.
GCC is a compiler Collection that includes front ends for C, C++, Objective-C, Fortran, Ada, Go, and D, as well as libraries for these languages.
GSL is a numerical library for C and C++ programmers. It is free software under the GNU General Public License. The library provides a wide range of mathematical routines such as random number generators, special functions and least-squares fitting. There are over 1000 functions in total with an extensive test suite.
OpenGL Extension Wrangler Library (GLEW) is a cross-platform open-source C/C++ extension loading library. GLEW provides efficient run-time mechanisms for determining which OpenGL extensions are supported on the target platform.
Libtool is a generic library support script that hides the complexity of using shared libraries behind a consistent, portable interface. To use Libtool, add the new generic library building commands to your Makefile, Makefile.in, or Makefile.am.
Maven is a software project management and comprehension tool. Based on the concept of a project object model (POM), Maven can manage a project's build, reporting and documentation from a central piece of information.
TAU (Tuning And Analysis Utilities) is capable of gathering performance information through instrumentation of functions, methods, basic blocks, and statements as well as event-based sampling. All C++ language features are supported including templates and namespaces.
Clang is a production quality C, Objective-C, C++ and Objective-C++ compiler when targeting X86-32, X86-64, and ARM (other targets may have caveats, but are usually easy to fix). Clang is used in production to build performance-critical software like Google Chrome or Firefox.
OpenCV is a highly optimized library with focus on real-time applications. Cross-Platform C++, Python and Java interfaces support Linux, MacOS, Windows, iOS, and Android.
Libcu++ is the NVIDIA C++ Standard Library for your entire system. It provides a heterogeneous implementation of the C++ Standard Library that can be used in and between CPU and GPU code.
ANTLR (ANother Tool for Language Recognition) is a powerful parser generator for reading, processing, executing, or translating structured text or binary files. It's widely used to build languages, tools, and frameworks. From a grammar, ANTLR generates a parser that can build parse trees and also generates a listener interface that makes it easy to respond to the recognition of phrases of interest.
Oat++ is a light and powerful C++ web framework for highly scalable and resource-efficient web application. It's zero-dependency and easy-portable.
JavaCPP is a program that provides efficient access to native C++ inside Java, not unlike the way some C/C++ compilers interact with assembly language.
Cython is a language that makes writing C extensions for Python as easy as Python itself. Cython is based on Pyrex, but supports more cutting edge functionality and optimizations such as calling C functions and declaring C types on variables and class attributes.
Spdlog is a very fast, header-only/compiled, C++ logging library.
Infer is a static analysis tool for Java, C++, Objective-C, and C. Infer is written in OCaml.
Back to the Top
Java is a popular programming language and development platform(JDK). It reduces costs, shortens development timeframes, drives innovation, and improves application services. With millions of developers running more than 51 billion Java Virtual Machines worldwide.
The Eclipse Foundation is home to a worldwide community of developers, the Eclipse IDE, Jakarta EE and over 375 open source projects, including runtimes, tools and frameworks for Java and other languages.
Getting Started with Java
Oracle Java certifications from Oracle University
Google Developers Training
Google Developers Certification
Java Tutorial by W3Schools
Building Your First Android App in Java
Getting Started with Java in Visual Studio Code
Google Java Style Guide
AOSP Java Code Style for Contributors
Chromium Java style guide
Get Started with OR-Tools for Java
Getting started with Java Tool Installer task for Azure Pipelines
Gradle User Manual
Java SE contains several tools to assist in program development and debugging, and in the monitoring and troubleshooting of production applications.
JDK Development Tools includes the Java Web Start Tools (javaws) Java Troubleshooting, Profiling, Monitoring and Management Tools (jcmd, jconsole, jmc, jvisualvm); and Java Web Services Tools (schemagen, wsgen, wsimport, xjc).
Android Studio is the official integrated development environment for Google's Android operating system, built on JetBrains' IntelliJ IDEA software and designed specifically for Android development. Availble on Windows, macOS, Linux, Chrome OS.
IntelliJ IDEA is an IDE for Java, but it also understands and provides intelligent coding assistance for a large variety of other languages such as Kotlin, SQL, JPQL, HTML, JavaScript, etc., even if the language expression is injected into a String literal in your Java code.
NetBeans is an IDE provides Java developers with all the tools needed to create professional desktop, mobile and enterprise applications. Creating, Editing, and Refactoring. The IDE provides wizards and templates to let you create Java EE, Java SE, and Java ME applications.
Java Design Patterns is a collection of the best formalized practices a programmer can use to solve common problems when designing an application or system.
Elasticsearch is a distributed RESTful search engine built for the cloud written in Java.
RxJava is a Java VM implementation of Reactive Extensions: a library for composing asynchronous and event-based programs by using observable sequences. It extends the observer pattern to support sequences of data/events and adds operators that allow you to compose sequences together declaratively while abstracting away concerns about things like low-level threading, synchronization, thread-safety and concurrent data structures.
Guava is a set of core Java libraries from Google that includes new collection types (such as multimap and multiset), immutable collections, a graph library, and utilities for concurrency, I/O, hashing, caching, primitives, strings, and more! It is widely used on most Java projects within Google, and widely used by many other companies as well.
okhttp is a HTTP client for Java and Kotlin developed by Square.
Retrofit is a type-safe HTTP client for Android and Java develped by Square.
LeakCanary is a memory leak detection library for Android develped by Square.
Apache Spark is a unified analytics engine for large-scale data processing. It provides high-level APIs in Scala, Java, Python, and R, and an optimized engine that supports general computation graphs for data analysis. It also supports a rich set of higher-level tools including Spark SQL for SQL and DataFrames, MLlib for machine learning, GraphX for graph processing, and Structured Streaming for stream processing.
Apache Flink is an open source stream processing framework with powerful stream- and batch-processing capabilities with elegant and fluent APIs in Java and Scala.
Fastjson is a Java library that can be used to convert Java Objects into their JSON representation. It can also be used to convert a JSON string to an equivalent Java object.
libGDX is a cross-platform Java game development framework based on OpenGL (ES) that works on Windows, Linux, Mac OS X, Android, your WebGL enabled browser and iOS.
Jenkins is the leading open-source automation server. Built with Java, it provides over 1700 plugins to support automating virtually anything, so that humans can actually spend their time doing things machines cannot.
DBeaver is a free multi-platform database tool for developers, SQL programmers, database administrators and analysts. Supports any database which has JDBC driver (which basically means - ANY database). EE version also supports non-JDBC datasources (MongoDB, Cassandra, Redis, DynamoDB, etc).
Redisson is a Redis Java client with features of In-Memory Data Grid. Over 50 Redis based Java objects and services: Set, Multimap, SortedSet, Map, List, Queue, Deque, Semaphore, Lock, AtomicLong, Map Reduce, Publish / Subscribe, Bloom filter, Spring Cache, Tomcat, Scheduler, JCache API, Hibernate, MyBatis, RPC, and local cache.
GraalVM is a universal virtual machine for running applications written in JavaScript, Python, Ruby, R, JVM-based languages like Java, Scala, Clojure, Kotlin, and LLVM-based languages such as C and C++.
Gradle is a build automation tool for multi-language software development. From mobile apps to microservices, from small startups to big enterprises, Gradle helps teams build, automate and deliver better software, faster. Write in Java, C++, Python or your language of choice.
Apache Groovy is a powerful, optionally typed and dynamic language, with static-typing and static compilation capabilities, for the Java platform aimed at improving developer productivity thanks to a concise, familiar and easy to learn syntax. It integrates smoothly with any Java program, and immediately delivers to your application powerful features, including scripting capabilities, Domain-Specific Language authoring, runtime and compile-time meta-programming and functional programming.
JaCoCo is a free code coverage library for Java, which has been created by the EclEmma team based on the lessons learned from using and integration existing libraries for many years.
Apache JMeter is used to test performance both on static and dynamic resources, Web dynamic applications. It also used to simulate a heavy load on a server, group of servers, network or object to test its strength or to analyze overall performance under different load types.
Junit is a simple framework to write repeatable tests. It is an instance of the xUnit architecture for unit testing frameworks.
Mockito is the most popular Mocking framework for unit tests written in Java.
SpotBugs is a program which uses static analysis to look for bugs in Java code.
SpringBoot is a great tool that helps you to create Spring-powered, production-grade applications and services with absolute minimum fuss. It takes an opinionated view of the Spring platform so that new and existing users can quickly get to the bits they need.
YourKit is a technology leader, creator of the most innovative and intelligent tools for profiling Java & .NET applications.
Back to the Top
Python is an interpreted, high-level programming language. Python is used heavily in the fields of Data Science and Machine Learning.
Python Developer's Guide is a comprehensive resource for contributing to Python – for both new and experienced contributors. It is maintained by the same community that maintains Python.
Azure Functions Python developer guide is an introduction to developing Azure Functions using Python. The content below assumes that you've already read the Azure Functions developers guide.
CheckiO is a programming learning platform and a gamified website that teaches Python through solving code challenges and competing for the most elegant and creative solutions.
Python Institute
PCEP – Certified Entry-Level Python Programmer certification
PCAP – Certified Associate in Python Programming certification
PCPP – Certified Professional in Python Programming 1 certification
PCPP – Certified Professional in Python Programming 2
MTA: Introduction to Programming Using Python Certification
Getting Started with Python in Visual Studio Code
Google's Python Style Guide
Google's Python Education Class
Real Python
The Python Open Source Computer Science Degree by Forrest Knight
Intro to Python for Data Science
Intro to Python by W3schools
Codecademy's Python 3 course
Learn Python with Online Courses and Classes from edX
Python Courses Online from Coursera
Python Package Index (PyPI) is a repository of software for the Python programming language. PyPI helps you find and install software developed and shared by the Python community.
PyCharm is the best IDE I've ever used. With PyCharm, you can access the command line, connect to a database, create a virtual environment, and manage your version control system all in one place, saving time by avoiding constantly switching between windows.
Python Tools for Visual Studio(PTVS) is a free, open source plugin that turns Visual Studio into a Python IDE. It supports editing, browsing, IntelliSense, mixed Python/C++ debugging, remote Linux/MacOS debugging, profiling, IPython, and web development with Django and other frameworks.
Pylance is an extension that works alongside Python in Visual Studio Code to provide performant language support. Under the hood, Pylance is powered by Pyright, Microsoft's static type checking tool.
Pyright is a fast type checker meant for large Python source bases. It can run in a “watch” mode and performs fast incremental updates when files are modified.
Django is a high-level Python Web framework that encourages rapid development and clean, pragmatic design.
Flask is a micro web framework written in Python. It is classified as a microframework because it does not require particular tools or libraries.
Web2py is an open-source web application framework written in Python allowing allows web developers to program dynamic web content. One web2py instance can run multiple web sites using different databases.
AWS Chalice is a framework for writing serverless apps in python. It allows you to quickly create and deploy applications that use AWS Lambda.
Tornado is a Python web framework and asynchronous networking library. Tornado uses a non-blocking network I/O, which can scale to tens of thousands of open connections.
HTTPie is a command line HTTP client that makes CLI interaction with web services as easy as possible. HTTPie is designed for testing, debugging, and generally interacting with APIs & HTTP servers.
Scrapy is a fast high-level web crawling and web scraping framework, used to crawl websites and extract structured data from their pages. It can be used for a wide range of purposes, from data mining to monitoring and automated testing.
Sentry is a service that helps you monitor and fix crashes in realtime. The server is in Python, but it contains a full API for sending events from any language, in any application.
Pipenv is a tool that aims to bring the best of all packaging worlds (bundler, composer, npm, cargo, yarn, etc.) to the Python world.
Python Fire is a library for automatically generating command line interfaces (CLIs) from absolutely any Python object.
Bottle is a fast, simple and lightweight WSGI micro web-framework for Python. It is distributed as a single file module and has no dependencies other than the Python Standard Library.
CherryPy is a minimalist Python object-oriented HTTP web framework.
Sanic is a Python 3.6+ web server and web framework that's written to go fast.
Pyramid is a small and fast open source Python web framework. It makes real-world web application development and deployment more fun and more productive.
TurboGears is a hybrid web framework able to act both as a Full Stack framework or as a Microframework.
Falcon is a reliable, high-performance Python web framework for building large-scale app backends and microservices with support for MongoDB, Pluggable Applications and autogenerated Admin.
Neural Network Intelligence(NNI) is an open source AutoML toolkit for automate machine learning lifecycle, including Feature Engineering, Neural Architecture Search, Model Compression and Hyperparameter Tuning.
Dash is a popular Python framework for building ML & data science web apps for Python, R, Julia, and Jupyter.
Luigi is a Python module that helps you build complex pipelines of batch jobs. It handles dependency resolution, workflow management, visualization etc. It also comes with Hadoop support built-in.
Locust is an easy to use, scriptable and scalable performance testing tool.
spaCy is a library for advanced Natural Language Processing in Python and Cython.
NumPy is the fundamental package needed for scientific computing with Python.
Pillow is a friendly PIL(Python Imaging Library) fork.
IPython is a command shell for interactive computing in multiple programming languages, originally developed for the Python programming language, that offers enhanced introspection, rich media, additional shell syntax, tab completion, and rich history.
GraphLab Create is a Python library, backed by a C++ engine, for quickly building large-scale, high-performance machine learning models.
Pandas is a fast, powerful, and easy to use open source data structrures, data analysis and manipulation tool, built on top of the Python programming language.
PuLP is an Linear Programming modeler written in python. PuLP can generate LP files and call on use highly optimized solvers, GLPK, COIN CLP/CBC, CPLEX, and GUROBI, to solve these linear problems.
Matplotlib is a 2D plotting library for creating static, animated, and interactive visualizations in Python. Matplotlib produces publication-quality figures in a variety of hardcopy formats and interactive environments across platforms.
Scikit-Learn is a simple and efficient tool for data mining and data analysis. It is built on NumPy,SciPy, and mathplotlib.
Back to the Top
Scala is a combination of object-oriented and functional programming in one concise, high-level language. Scala's static types help avoid bugs in complex applications, and its JVM and JavaScript runtimes let you build high-performance systems with easy access to huge ecosystems of libraries.
Scala Style Guide
Databricks Scala Style Guide
Data Science using Scala and Spark on Azure
Creating a Scala Maven application for Apache Spark in HDInsight using IntelliJ
Intro to Spark DataFrames using Scala with Azure Databricks
Using Scala to Program AWS Glue ETL Scripts
Using Flink Scala shell with Amazon EMR clusters
AWS EMR and Spark 2 using Scala from Udemy
Using the Google Cloud Storage connector with Apache Spark
Write and run Spark Scala jobs on Cloud Dataproc for Google Cloud
Scala Courses and Certifications from edX
Scala Courses from Coursera
Top Scala Courses from Udemy
Apache Spark is a unified analytics engine for large-scale data processing. It provides high-level APIs in Scala, Java, Python, and R, and an optimized engine that supports general computation graphs for data analysis. It also supports a rich set of higher-level tools including Spark SQL for SQL and DataFrames, MLlib for machine learning, GraphX for graph processing, and Structured Streaming for stream processing.
Apache Spark Connector for SQL Server and Azure SQL is a high-performance connector that enables you to use transactional data in big data analytics and persists results for ad-hoc queries or reporting. The connector allows you to use any SQL database, on-premises or in the cloud, as an input data source or output data sink for Spark jobs.
Azure Databricks is a fast and collaborative Apache Spark-based big data analytics service designed for data science and data engineering. Azure Databricks, sets up your Apache Spark environment in minutes, autoscale, and collaborate on shared projects in an interactive workspace. Azure Databricks supports Python, Scala, R, Java, and SQL, as well as data science frameworks and libraries including TensorFlow, PyTorch, and scikit-learn.
Apache PredictionIO is an open source machine learning framework for developers, data scientists, and end users. It supports event collection, deployment of algorithms, evaluation, querying predictive results via REST APIs. It is based on scalable open source services like Hadoop, HBase (and other DBs), Elasticsearch, Spark and implements what is called a Lambda Architecture.
Cluster Manager for Apache Kafka(CMAK) is a tool for managing Apache Kafka clusters.
BigDL is a distributed deep learning library for Apache Spark. With BigDL, users can write their deep learning applications as standard Spark programs, which can directly run on top of existing Spark or Hadoop clusters.
Eclipse Deeplearning4J (DL4J) is a set of projects intended to support all the needs of a JVM-based(Scala, Kotlin, Clojure, and Groovy) deep learning application. This means starting with the raw data, loading and preprocessing it from wherever and whatever format it is in to building and tuning a wide variety of simple and complex deep learning networks.
Play Framework is a web framework combines productivity and performance making it easy to build scalable web applications with Java and Scala.
Dotty is a research compiler that will become Scala 3.
AWScala is a tool that enables Scala developers to easily work with Amazon Web Services in the Scala way.
Scala.js is a compiler that converts Scala to JavaScript.
Polynote is an experimental polyglot notebook environment. Currently, it supports Scala and Python (with or without Spark), SQL, and Vega.
Scala Native is an optimizing ahead-of-time compiler and lightweight managed runtime designed specifically for Scala.
Gitbucket is a Git platform powered by Scala with easy installation, high extensibility & GitHub API compatibility.
Finagle is a fault tolerant, protocol-agnostic RPC system
Gatling is a load test tool. It officially supports HTTP, WebSocket, Server-Sent-Events and JMS.
Scalatra is a tiny Scala high-performance, async web framework, inspired by Sinatra.
Back to the Top
R is an open source software environment for statistical computing and graphics. It compiles and runs on a wide variety of platforms such as Windows and MacOS.
An Introduction to R
Google's R Style Guide
R developer's guide to Azure
Running R at Scale on Google Compute Engine
Running R on AWS
RStudio Server Pro for AWS
Learn R by Codecademy
Learn R Programming with Online Courses and Lessons by edX
R Language Courses by Coursera
Learn R For Data Science by Udacity
RStudio is an integrated development environment for R and Python, with a console, syntax-highlighting editor that supports direct code execution, and tools for plotting, history, debugging and workspace management.
Shiny is a newer package from RStudio that makes it incredibly easy to build interactive web applications with R.
Rmarkdown is a package helps you create dynamic analysis documents that combine code, rendered output (such as figures), and prose.
Rplugin is R Language supported plugin for the IntelliJ IDE.
Plotly is an R package for creating interactive web graphics via the open source JavaScript graphing library plotly.js.
Metaflow is a Python/R library that helps scientists and engineers build and manage real-life data science projects. Metaflow was originally developed at Netflix to boost productivity of data scientists who work on a wide variety of projects from classical statistics to state-of-the-art deep learning.
Prophet is a procedure for forecasting time series data based on an additive model where non-linear trends are fit with yearly, weekly, and daily seasonality, plus holiday effects. It works best with time series that have strong seasonal effects and several seasons of historical data.
LightGBM is a gradient boosting framework that uses tree based learning algorithms, used for ranking, classification and many other machine learning tasks.
Dash is a Python framework for building analytical web applications in Python, R, Julia, and Jupyter.
MLR is Machine Learning in R.
ML workspace is an all-in-one web-based IDE specialized for machine learning and data science. It is simple to deploy and gets you started within minutes to productively built ML solutions on your own machines. ML workspace is the ultimate tool for developers preloaded with a variety of popular data science libraries (Tensorflow, PyTorch, Keras, and MXnet) and dev tools (Jupyter, VS Code, and Tensorboard) perfectly configured, optimized, and integrated.
CatBoost is a fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports computation on CPU and GPU.
Plumber is a tool that allows you to create a web API by merely decorating your existing R source code with special comments.
Drake is an R-focused pipeline toolkit for reproducibility and high-performance computing.
DiagrammeR is a package you can create, modify, analyze, and visualize network graph diagrams. The output can be incorporated into R Markdown documents, integrated with Shiny web apps, converted to other graph formats, or exported as image files.
Knitr is a general-purpose literate programming engine in R, with lightweight API's designed to give users full control of the output without heavy coding work.
Broom is a tool that converts statistical analysis objects from R into tidy format.
Back to the Top
Julia is a high-level, high-performance dynamic language for technical computing. Julia programs compile to efficient native code for multiple platforms via LLVM.
JuliaHub contains over 4,000 Julia packages for use by the community.
Julia Observer
Julia Manual
JuliaLang Essentials
Julia Style Guide
Julia By Example
JuliaLang Gitter
DataFrames Tutorial using Jupyter Notebooks
Julia Academy
Julia Meetup groups
Julia on Microsoft Azure
JuliaPro is a free and fast way to setup Julia for individual researchers, engineers, scientists, quants, traders, economists, students and others. Julia developers can build better software quicker and easier while benefiting from Julia's unparalleled high performance. It includes 2600+ open source packages or from a curated list of 250+ JuliaPro packages. Curated packages are tested, documented and supported by Julia Computing.
Juno is a powerful, free IDE based on Atom for the Julia language.
Debugger.jl is the Julia debuggin tool.
Profile (Stdlib) is a module provides tools to help developers improve the performance of their code. When used, it takes measurements on running code, and produces output that helps you understand how much time is spent on individual line's.
Revise.jl allows you to modify code and use the changes without restarting Julia. With Revise, you can be in the middle of a session and then update packages, switch git branches, and/or edit the source code in the editor of your choice; any changes will typically be incorporated into the very next command you issue from the REPL. This can save you the overhead of restarting Julia, loading packages, and waiting for code to JIT-compile.
JuliaGPU is a Github organization created to unify the many packages for programming GPUs in Julia. With its high-level syntax and flexible compiler, Julia is well positioned to productively program hardware accelerators like GPUs without sacrificing performance.
IJulia.jl is the Julia kernel for Jupyter.
AWS.jl is a Julia interface for Amazon Web Services.
CUDA.jl is a package for the main programming interface for working with NVIDIA CUDA GPUs using Julia. It features a user-friendly array abstraction, a compiler for writing CUDA kernels in Julia, and wrappers for various CUDA libraries.
XLA.jl is a package for compiling Julia to XLA for Tensor Processing Unit(TPU).
Nanosoldier.jl is a package for running JuliaCI services on MIT's Nanosoldier cluster.
Julia for VSCode is a powerful extension for the Julia language.
JuMP.jl is a domain-specific modeling language for mathematical optimization embedded in Julia.
Optim.jl is a univariate and multivariate optimization in Julia.
RCall.jl is a package that allows you to call R functions from Julia.
JavaCall.jl is a package that allows you to call Java functions from Julia.
PyCall.jl is a package that allows you to call Python functions from Julia.
MXNet.jl is the Apache MXNet Julia package. MXNet.jl brings flexible and efficient GPU computing and state-of-art deep learning to Julia.
Knet is the Koç University deep learning framework implemented in Julia by Deniz Yuret and collaborators. It supports GPU operation and automatic differentiation using dynamic computational graphs for models defined in plain Julia.
Distributions.jl is a Julia package for probability distributions and associated functions.
DataFrames.jl is a tool for working with tabular data in Julia.
Flux.jl is an elegant approach to machine learning. It's a 100% pure-Julia stack, and provides lightweight abstractions on top of Julia's native GPU and AD support.
IRTools.jl is a simple and flexible IR format, expressive enough to work with both lowered and typed Julia code, as well as external IRs.
Cassette.jl is a Julia package that provides a mechanism for dynamically injecting code transformation passes into Julia's just-in-time (JIT) compilation cycle, enabling post hoc analysis and modification of "Cassette-unaware" Julia programs without requiring manual source annotation or refactoring of the target code.
Back to the Top
Distributed under the Creative Commons Attribution 4.0 International (CC BY 4.0) Public License.