Aplicações de aprendizado de máquina e ciência de dados na indústria
? Estamos crescendo!
Procuramos colaborar com doutorados ou estudantes de doutoramento motivados e independentes em aproximadamente sete novos projetos em 2024. Se estiver interessado em contribuir para insights de investimento e análise de dados de ponta, entre em contacto! Isto pode ser em colaboração com uma universidade ou como estudo independente.
Sobre Sov.ai
Sov.ai está na vanguarda da integração de técnicas avançadas de aprendizado de máquina com análise de dados financeiros para revolucionar as estratégias de investimento. Estamos trabalhando com três dos 10 principais fundos de hedge quantitativos e com muitas empresas de médio porte e boutique.
Nossa plataforma aproveita diversas fontes de dados e algoritmos inovadores para fornecer insights acionáveis que conduzem decisões de investimento mais inteligentes.
Ao ingressar na Sov.ai, você fará parte de uma equipe de pesquisa dinâmica dedicada a ampliar os limites do que é possível em finanças por meio da tecnologia. Antes de manifestar seu interesse, esteja ciente de que a pesquisa será predominantemente desafiadora e de natureza experimental.
? Oportunidades de pesquisa e projetos
Oferecemos uma ampla gama de projetos que atendem a diversos interesses e conhecimentos em aprendizado de máquina e finanças. Alguns dos projetos recentes interessantes incluem:
- Modelagem preditiva com registros do GitHub: Desenvolva modelos para prever tendências de mercado e oportunidades de investimento usando atividades do GitHub e dados de desenvolvedores.
- Análise de dados de satélite: explore fontes de dados não tradicionais, como sentimento de mídia social, imagens de satélite ou tráfego da web para aprimorar a previsão financeira.
- Técnicas de imputação de dados: Investigar novos métodos para lidar com dados ausentes ou incompletos para melhorar a robustez e a precisão de nossos modelos.
Visite docs.sov.ai para obter mais informações sobre projetos públicos que foram incluídos no produto de assinatura. Se você já tem um patrocinador corporativo, também ficaremos felizes em trabalhar com ele.
Por que aderir ao Sov.ai?
- Ambiente Inovador: Envolva-se com as mais recentes tecnologias e metodologias em aprendizado de máquina e finanças.
- Equipe Colaborativa: Trabalhe ao lado de uma equipe de especialistas apaixonados por impulsionar a inovação em insights de investimento.
- Projetos flexíveis: personalize sua pesquisa para alinhá-la aos seus interesses e conhecimentos, com liberdade para explorar novas ideias.
- Pesquisadores experientes: especialistas anteriormente da NYU, Columbia, Oxford-Man Institute, Alan Turing Institute e Cambridge.
- Pós-pesquisa: Conecte-se com ex-alunos que migraram para DRW, Citadel Securities, Virtu Financial, Akuna Capital, HRT.
? Como se inscrever
Se você está entusiasmado em aproveitar sua experiência em aprendizado de máquina e finanças para impulsionar pesquisas e projetos impactantes, adoraríamos ouvir sua opinião! Entre em contato conosco pelo e-mail [email protected] com seu currículo e uma breve descrição de seus interesses de pesquisa.
Junte-se a nós para moldar o futuro dos insights de investimento e causar um impacto significativo no mundo das finanças!
Administrador
Dê uma olhada na recém-lançada publicação FirmAI Medium, onde temos especialistas em IA nos negócios, escrevendo sobre seus temas de interesse.
Adicione suas ferramentas e cadernos a esta Planilha Google. Ou simplesmente adicione-o a este subreddit, r/datascienceproject
Destaque em AMARELO para adicionar seu pacote, você também pode adicioná-lo você mesmo com uma solicitação pull .
Uma lista selecionada de notebooks e bibliotecas de aprendizado de máquina aplicado e ciência de dados em diferentes setores. O código neste repositório está em Python (principalmente usando notebooks jupyter), salvo indicação em contrário. O catálogo é inspirado no awesome-machine-learning
. r/datascienceproject é um subreddit onde você pode compartilhar todos os seus projetos de ciência de dados.
Cuidado: Este é um trabalho em andamento. Por favor, contribua, especialmente se você for um especialista no assunto em qualquer um dos setores listados abaixo. Se você é um pesquisador/analista [analítico, computacional, estatístico, quantitativo] na área X ou na área X [engenheiro de aprendizado de máquina, cientista de dados, modelador, programador], então sua contribuição será muito apreciada.
Se você quiser contribuir com esta lista (por favor), envie-me um pull request ou entre em contato comigo @dereknow ou no LinkedIn ou entre em contato no site FirmAI. Além disso, um repositório listado deve ser descontinuado se:
- O proprietário do repositório diz explicitamente que "esta biblioteca não é mantida".
- Não comprometido por muito tempo (2 a 3 anos).
Ajuda necessária: Se houver algum contribuidor disposto a ajudar primeiro a preencher e depois manter uma seção de análise Python em qualquer um dos seguintes sub/setores, entre em contato comigo. Entre em contato comigo também para adicionar indústrias adicionais .
| | |
---|
Alojamento e alimentação | Agricultura | Bancos e Seguros |
Biotecnologia e Ciências da Vida | Construção e Engenharia | Educação e Pesquisa |
Emergência e Socorro | Financiar | Fabricação |
Governo e Obras Públicas | Assistência médica | Mídia e publicação |
Justiça, Lei e Regulamentos | Variado | Contabilidade |
Imobiliário, Aluguel e Leasing | Utilitários | Atacado e Varejo |
Índice
Aplicações Industriais
- Alojamento e alimentação
- Comida
- Restaurante
- Alojamento
- Contabilidade
- Aprendizado de máquina
- Análise
- Análise Textual
- Dados
- Pesquisas e Artigos
- Sites
- Cursos
- Agricultura
- Bancos e Seguros
- Financeiro do Consumidor
- Gestão e Operações
- Avaliação
- Fraude
- Seguros e Riscos
- Físico
- Dados
- Biotecnologia e Ciências da Vida
- Em geral
- Sequenciamento
- Quimioinformática e descoberta de medicamentos
- Genômica
- Ciências da vida
- Construção e Engenharia
- Construção
- Engenharia
- Ciência dos Materiais
- Economia
- Em geral
- Aprendizado de máquina
- Computacional
- Educação e Pesquisa
- Emergência e Socorro
- Preventivo e Reativo
- Crime
- Ambulância
- Gestão de Desastres
- Financiar
- Negociação e Investimento
- Dados
- Assistência médica
- Justiça, Lei e Regulamentos
- Ferramentas
- Política e Regulamentação
- Judicial
- Fabricação
- Em geral
- Manutenção
- Falha
- Qualidade
- Mídia e publicação
- Variado
- Física
- Em geral
- Aprendizado de máquina
- Governo e Obras Públicas
- Políticas Sociais
- Análise Eleitoral
- Gestão de Desastres
- Política
- Instituições de caridade
- Imobiliário, Aluguel e Leasing
- Imobiliária
- Aluguel e Leasing
- Utilitários
- Eletricidade
- Carvão, Petróleo e Gás
- Água e Poluição
- Transporte
- Atacado e Varejo
Seção de carreira de ML/DS para aprendizado de máquina da indústria
Consulte o repositório de carreira em ciência de dados para obter mais informações.
Plataformas:
- Triplebyte - Faça um teste. Receba ofertas de várias empresas de tecnologia importantes de uma só vez (agora tenha um curso de aprendizado de máquina).
- Toptal - Os desenvolvedores que buscam entrar na comunidade Toptal são submetidos a uma bateria de testes técnicos e de personalidade.
- Hired - Hired combina empregadores com candidatos qualificados por meio de uma combinação de algoritmos internos e suporte online.
- Kaggle - Scalable Path é um serviço premium de correspondência de talentos.
Comentários:
- Glassdoor - Melhores narrativas de funcionários.
- Na verdade - Melhor cobertura.
- Kununu - Melhor informação completa.
- Comparativamente - Melhor funcionalidade de comparação.
- InHerSight - Melhor perspectiva voltada para mulheres.
Alojamento e alimentação
Comida
- RobotChef - Refinando receitas com base em avaliações de usuários.
- Amenidades Alimentares - Prevendo a demanda por comodidades alimentares usando redes neurais
- Cozinha e classificação da receita - Preveja a classificação e o tipo de culinária a partir de uma lista de ingredientes.
- Classificação de Alimentos - Classificação utilizando Keras.
- Imagem para Receita - Traduza uma imagem em uma receita usando aprendizado profundo.
- Estimativa de calorias - Estime calorias a partir de fotos de alimentos.
- Fine Food Reviews - Análise de sentimento nas Amazon Fine Food Reviews.
Restaurante
- Violação de Restaurante - Previsão de violação de fiscalização de alimentos.
- Sucesso do restaurante - Preveja se um restaurante irá falir.
- Prever Michelin - Prever a probabilidade de aquele restaurante ser um restaurante Michelin.
- Inspeção de Restaurante - Uma análise de inspeção para ver se a limpeza está relacionada à classificação.
- Vendas - Previsão de vendas de restaurantes com LSTM.
- Previsão de Visitantes - Previsão de reserva e número de visitação.
- Lucro do Restaurante - Análise de regressão do restaurante.
- Concorrência - Análise de competitividade de restaurantes.
- Análise de Negócios - Projeto de análise de negócios de restaurantes.
- Recomendação de localização - ferramenta e análise de recomendação de localização de restaurantes.
- Fechamento, Classificação e Recomendação – Três tarefas de previsão usando dados do Yelp.
- Anti-recomendador - Encontre restaurantes que você não deseja frequentar.
- Análise de Cardápios - Análise mais aprofundada dos restaurantes através de seus cardápios.
- Recomendação de cardápio - PNL para recomendar restaurantes com cardápios semelhantes.
- Preço dos Alimentos - Preveja o custo dos alimentos.
- Relatório de restaurante automatizado - Relatório automatizado de empresa de aprendizado de máquina.
Alojamento
- Habitação peer-to-peer - O efeito dos aluguéis entre pares na habitação.
- Recomendação de companheiros de quarto - Um sistema para estudantes que procuram companheiros de quarto.
- Alocação de Quartos - Processo de alocação de quartos.
- Preços Dinâmicos - Cálculos de preços dinâmicos de hotéis.
- Similaridade de hotéis – Compare marcas que competem diretamente
- Avaliações de hotéis - Avaliações de hotéis em cluster.
- Prever preços - Prever tarifas de quartos de hotel.
- Hotéis vs Airbnb – Comparando as duas abordagens.
- Melhoria do Hotel - Analise avaliações para sugerir melhorias no hotel.
- Pedidos - Previsão de cancelamento de pedidos para hotéis.
- Avaliações Falsas - Identifique se as avaliações são falsas/spam.
- Hospedagem com imagem reversa - Encontre sua hospedagem preferida enviando uma imagem.
Contabilidade
Aprendizado de máquina
- Previsão do plano de contas - usando dados rotulados para sugerir o nome da conta para cada transação.
- Anomalias Contábeis - Usando estruturas de aprendizado profundo para identificar anomalias contábeis.
- Anomalias nas Demonstrações Financeiras - Detectando anomalias antes do arquivamento, usando R.
- Previsão de vida útil (FirmAI) - Preveja a vida útil dos ativos usando observações de sensores e engenharia de recursos.
- IA aplicada a XBRL - Representação padronizada de XBRL em IA e aprendizado de máquina.
Análise
- Contabilidade Forense - Coleção de estudos de caso sobre contabilidade forense utilizando análise de dados. Em busca de mais dados para praticar a contabilidade forense, entre em contato
- General Ledger (FirmAI) - Processamento de dados em um razão geral exportado por meio de um sistema de contabilidade.
- Bullet Graph (FirmAI) - Visualização de gráfico de marcadores útil para rastrear vendas, comissões e outros desempenhos.
- Devedores Idosos (FirmAI) - Exemplo de análise para investigar devedores idosos.
- FS XBRL - Linguagem XML automatizada, no entanto, possivelmente porta a análise para Python.
Análise Textual
- Análise de Sentimento Financeiro - Análise de sentimento, distância e proporção para sinais de negociação.
- PNL extensiva - Técnicas abrangentes de PNL para pesquisa contábil.
Dados, análise e APIs
- EDGAR - Um passo a passo sobre como obter dados EDGAR.
- PyEDGAR – Uma biblioteca para baixar, armazenar em cache e acessar arquivos EDGAR.
- IRS - Acessando e analisando registros do IRS.
- Financial Corporate - conjuntos de dados financeiros corporativos da Rutgers.
- Corporativo Não Financeiro - Conjunto de dados corporativos não financeiros da Rutgers.
- Análise de PDF - Extração de dados úteis de documentos PDF.
- Tabela PDF para Excel - Como gerar um arquivo Excel a partir de um PDF.
Pesquisas e artigos
- Noções básicas sobre análise contábil - Um artigo que aborda a importância da análise contábil.
- VLFeat - VLFeat é uma biblioteca aberta e portátil de algoritmos de visão computacional, que possui uma caixa de ferramentas Matlab.
Sites
- Rutgers Raw – Boa pesquisa de contabilidade digital da Rutgers.
Cursos
- Contabilidade Aumentada por Computador - Uma série de vídeos da Rutgers University que analisa o uso da computação para melhorar a contabilidade.
- Contabilidade na Era Digital - Outra série de Rutgers que investiga os efeitos que a era digital terá na contabilidade.
Agricultura
Economia
- Preços - Previsão de preços agrícolas.
- Preços 2 - Previsão de preços agrícolas.
- Rendimento - Análise agrícola observando o rendimento das colheitas na Ucrânia.
- Recuperação - Uso estratégico da terra para agricultura e recuperação de ecossistemas
- MPR - Dados obrigatórios de relatórios de preços do Serviço de Marketing Agrícola do USDA.
Desenvolvimento
- Segmentação - Segmentação de parcelas agrícolas utilizando imagens de satélite.
- Lençol freático - Previsão da profundidade do lençol freático em áreas agrícolas.
- Assistente - Cadernos de auxiliar agrícola.
- Eco-evolucionária - Dinâmica eco-evolutiva.
- Doenças - Identificação de doenças e pragas de culturas usando a estrutura de Deep Learning a partir das imagens.
- Irrigação e previsão de pragas - Analise a irrigação e preveja a probabilidade de pragas.
Bancos e Seguros
Financiamento ao Consumidor
- Aceitação de Empréstimos - Classificação e análise de séries temporais para aceitação de empréstimos.
- Prever o reembolso do empréstimo - Preveja se um empréstimo será reembolsado usando engenharia automatizada de recursos.
- Ranking de Elegibilidade de Empréstimo - Sistema para ajudar os bancos a verificar se um cliente é elegível para um determinado empréstimo.
- Inadimplência de crédito residencial (FirmAI) - Preveja a inadimplência de crédito residencial.
- Mortgage Analytics - Análise extensiva de empréstimos hipotecários.
- Aprovação de Crédito - Um sistema para aprovação de cartão de crédito.
- Risco de Empréstimo - Modelo preditivo para ajudar a reduzir baixas e perdas de empréstimos.
- Cronograma de Amortização (FirmAI) - Cronograma de amortização simples em python para uso pessoal.
Gestão e Operação
- Cartão de Crédito - Estime o CLV dos clientes de cartão de crédito.
- Análise de Sobrevivência - Realize uma análise de sobrevivência dos clientes.
- Próxima transação – modelo de aprendizado profundo para prever o valor da transação e os dias até a próxima transação.
- Rotatividade de cartão de crédito - Previsão de rotatividade de clientes de cartão de crédito.
- Atas do Banco da Inglaterra - Análise textual das atas bancárias.
- CEO - Análise da remuneração do CEO.
Avaliação
- Previsão Zillow - Previsão de avaliação Zillow realizada no Kaggle.
- Imobiliário - Previsão de preços imobiliários a partir do ambiente urbano.
- Carro Usado - Previsão de preço de veículos usados.
Fraude
- XGBoost - Detecção de fraude ajustando hiperparâmetros XGBoost com Simulated Annealing
- Fraud Detection Loan in R - Detecção de fraudes em empréstimos bancários.
- AML Finance Due Diligence - Pesquise artigos de notícias para financiar AML DD.
- Fraude de cartão de crédito - Detecção de fraude de cartão de crédito.
Seguros e Riscos
- Detetive de danos em carros - avaliando danos em carros com redes neurais de convolução para reclamações pessoais de automóveis.
- Reclamações de seguro médico - Previsão de reclamações de seguro médico.
- Negação de sinistro - Prevendo negação de sinistro de seguro
- Fraude de sinistros - Modelos preditivos para determinar quais sinistros de automóveis são fraudulentos.
- Anomalias de sinistros - Sistema de detecção de anomalias para dados de sinistros de seguros médicos.
- Ciências Atuariais (R) - Uma gama de ferramentas atuariais em R.
- Falência Bancária - Previsão de falência bancária.
- Gestão de Riscos - Recursos do curso de engajamento de risco financeiro.
- VaR GaN - Estimativa de valor em risco para gerenciamento de risco de mercado usando Keras e TensorFlow.
- Compliance - Gestão de Conformidade de Reclamações Bancárias.
- Testes de esforço - testes de esforço do BCE.
- Técnicas de teste de estresse - Um caderno com vários exercícios de teste de estresse.
- Teste de estresse reverso - Dado um portfólio e um tamanho de perda predefinido, determine quais fatores de estresse (cenários) levariam a essa perda
- Teste de estresse do BoE - Resultados e plotagem do teste de estresse.
- Recuperação - Recuperação de dinheiro devido.
- Controle de Qualidade - Controle de qualidade para bancos usando LDA
Físico
- Detecção de fraude em notas bancárias - Autenticação de notas bancárias usando classificador DNN Tensorflow e RandomForest.
- Vigilância de ATMs - Caso de uso de Vigilância de ATMs em bancos.
Biotecnologia e Ciências da Vida
Em geral
- Programação - Programação Python para Biólogos
- Introdução DL - Uma cartilha sobre aprendizado profundo em genômica
- Pose - Estimando poses de animais usando DL.
- Privacidade - NNs que preservam a privacidade para compartilhamento de dados clínicos.
- Genética Populacional - DL para inferência genética populacional.
- Curso de Bioinformática - Materiais do curso de Biologia Computacional e Bioinformática
- Estatísticas Aplicadas - Estatísticas Aplicadas para Biologia de Alto Rendimento
- Scripts - Scripts Python para biólogos.
- Molecular NN - Uma miniestrutura para construir e treinar redes neurais para biologia molecular.
- Simulações de Biologia de Sistemas - Prática de biologia de sistemas na escrita de simuladores com F# e Z3
- Movimento Celular - LSTM para prever o movimento celular biológico.
- Deepchem - Democratizando o aprendizado profundo para descoberta de medicamentos, química quântica, ciência de materiais e biologia
Sequenciamento
- Sequenciamento de DNA, RNA e Proteínas - Nova representação para sequências biológicas usando DL.
- Sequenciamento CNN - Uma caixa de ferramentas para aprender motivos de dados de sequência de DNA/RNA usando redes neurais convolucionais
- Sequenciamento de PNL - modelo de aprendizagem por transferência de linguagem para genômica
Quimioinformática e descoberta de medicamentos
- Novas moléculas - Uma rede convolucional que pode aprender recursos.
- Automatizando o Projeto Químico - Gere novas moléculas para exploração eficiente.
- GAN drug Discovery - Um método que combina modelos generativos com aprendizagem por reforço.
- RL - gerando compostos que se prevê serem activos contra um alvo biológico.
- Aprendizado único - biblioteca Python que visa tornar o uso do aprendizado de máquina na descoberta de medicamentos simples e conveniente.
Genômica
- Jupyter Genomics - Coleção de cadernos de biologia computacional e bioinformática.
- Chamada de variante - Identifique corretamente variações do genoma de referência no DNA de um indivíduo.
- Gráficos de Expressão Gênica - Usando convoluções em uma imagem.
- Expressão de codificação automática - Extração de padrões relevantes de grandes conjuntos de dados de expressão gênica
- Inferência de Expressão Gênica - Preveja a expressão de genes alvo específicos a partir de um painel de cerca de 1.000 “genes de referência” pré-selecionados.
- Genômica Vegetal - Apresentação e material de exemplo para Genômica Vegetal e Patogênica
Ciências da vida
- Doenças de Plantas - Aplicativo que detecta doenças em plantas usando um modelo de aprendizado profundo.
- Identificação de Folhas - Identificação de plantas através de folhas de plantas com base em sua forma, cor e textura.
- Crop Analysis - Uma biblioteca de imagens para detectar e rastrear a posição futura das espigas nas plantas de milho
- Mudas - Classificação de Mudas de Plantas da competição kaggle
- Plant Stress - Uma ontologia contendo estresses de plantas; biótico e abiótico.
- Hierarquia Animal - Pacote para calcular hierarquias de dominância animal .
- Identificação Animal - Aprendizado profundo para identificação animal.
- Espécies - Análise de Big Data de diferentes espécies de animais
- Vocalizações de animais - Uma rede generativa para vocalizações de animais
- Evolucionário - Ferramenta de Estratégias de Evolução
- Geleiras - Material educativo sobre geleiras.
Construção e Engenharia
Construção
- Arquitetura DL - Classificador de aprendizado profundo e gerador de imagens para arquitetura de edifícios.
- Materiais de Construção - Um curso sobre materiais de construção.
- Modelo de risco de mau ator - Modelo de risco para melhorar a segurança de edifícios relacionados à construção
- Inspetores - Determine as inspeções atribuídas.
- Interações sociais corruptas - Descubra possíveis interações sociais corruptas entre um membro da indústria e a equipe do DOB
- Construção de Risco - Identifique construções de alto risco.
- Risco de Fachada - Um modelo de risco para prever fachadas inseguras.
- Níveis de pessoal - Previsão dos níveis de pessoal para os trabalhadores da linha de frente.
- Lesões - Modelagem de tópicos de lesões relacionadas a edifícios.
- Violações Prediais - Análise preditiva de infrações prediais.
- Produtividade - Análise e inspeção de produtividade com Tableau.
Engenharia:
- Análise Estrutural - Análise Estrutural 2D em Python.
- Engenharia Estrutural - Módulos de engenharia estrutural.
- Nusa - Análise estrutural pelo método dos elementos finitos.
- StructPy - Biblioteca de Análise Estrutural para Python baseada no método de rigidez direta
- Aileron - Análise estrutural do aileron de um Boeing 737
- Vibração - Programas educacionais de vibração.
- Civil - Coleção de ferramentas de engenharia civil em FreeCAD
- GEstimator - Software simples de estimativa civil
- Fatpack – Funções e classes para análise de fadiga de séries de dados.
- Pysteel - Projeto automatizado de diferentes estruturas de aço
- Incerteza Estrutural - Quantificando a incerteza estrutural com aprendizado profundo.
- Pymech – Um módulo Python para engenheiros mecânicos
- Engenharia Aeroespacial - Astrodinâmica e Estatística
- Química Quântica Interativa - Combinando Psi4 e Numpy para educação e desenvolvimento.
- Engenharia Química e de Processos - Recursos diversos.
- PyTherm - Termodinâmica Aplicada
- Aerogami - Aerodinâmica utilizando aviões.
- Eletrogeofísica - Aplicações interativas para eletromagnetismo em geofísica
- Graph Signal - Tutorial de processamento de sinal gráfico.
- Vibrações Mecânicas - Vibrações Mecânicas na Universidade de Louisiana.
- Dinâmica de Processos - Dinâmica e Controle de Processos
- Ciclo de vida da bateria - previsão baseada em dados do ciclo de vida da bateria.
- Energia Eólica - Python para energia eólica
- Uso de Energia - Métodos padrão para calcular o consumo de energia medido normalizado
- Radiação Nuclear - Como as pessoas são afetadas pelas radiações emitidas pelas usinas nucleares
Ciência dos Materiais
- Python Materials Genomics – Código robusto de análise de materiais usado em um projeto bem estabelecido.
- Mineração de Materiais - Scripts para simulações e análises de materiais.
- Emmet - Construa bancos de dados de propriedades de materiais.
- Megnet - Redes gráficas como estrutura de ML para moléculas e cristais
- Atomate – Fluxos de trabalho pré-construídos para ciência de materiais computacionais.
- Conformidade com o Estatuto Social - Previsão de multas patrimoniais.
- Ligante Asfáltico - Materiais de construção, energia livre e composição química do ligante asfáltico.
- Aço - Otimização do aço.
- Awesome Materials Informatics - Lista selecionada de esforços conhecidos em informática de materiais.
Economia
Em geral
- API Trading Economics - Informações para 196 países.
- Economia do Desenvolvimento - A microeconomia do desenvolvimento é escrita principalmente como cadernos jupyter interativos
- Applied Econ & Fin - Economia e Finanças Computacionais Aplicadas
- Macroeconomia - Tópicos de macroeconomia com exemplos de cadernos.
Aprendizado de máquina
- EconML - Aprendizagem Automatizada e Inteligência para Causalidade e Economia.
- Leilões - Leilões ideais usando aprendizagem profunda.
Computacional
- Quant Econ - curso de economia quantitativa pela NYU
- Computacional - Métodos computacionais em economia.
- Computacional 2 - Pequeno curso de economia computacional.
- Teoria Econométrica - Cadernos de Uma Cartilha sobre Teoria Econométrica.
Educação e Pesquisa
Estudante
- Desempenho do Aluno - Mineração do desempenho do aluno usando aprendizado de máquina.
- Desempenho do aluno 2 - Desempenho do aluno no exame.
- Desempenho dos Alunos 3 - Desempenho dos alunos no ensino secundário.
- Desempenho do Aluno 4 - Avaliação do Desempenho dos Alunos usando Engenharia de Recursos
- Intervenção Estudantil - Construindo um sistema de intervenção estudantil.
- Matrícula de Alunos - Matrícula de alunos e análise de desempenho.
- Desempenho Acadêmico - Explore as características demográficas e familiares que impactam o desempenho acadêmico de um aluno.
- Análise de notas - Análise do desempenho dos alunos.
Escola
- Escolha da Escola - Análise de dados para a escolha da escola pela educação.
- Orçamentos e prioridades escolares - Ajudar o conselho escolar e o prefeito a tomar decisões estratégicas sobre futuros orçamentos e prioridades escolares
- Desempenho Escolar - Prática de análise de dados usando dados de data.utah.gov sobre desempenho escolar.
- Desempenho Escolar 2 - Usando pandas para analisar o desempenho da escola e dos alunos em um distrito
- Desempenho Escolar 3 - Desempenho Escolar da Filadélfia
- Desempenho Escolar 4 - Desempenho Escolar NJ
- Fechamento de Escolas - Identifique escolas em risco de fechamento por desempenho e outras características.
- Orçamentos Escolares - Ferramentas e técnicas para orçamentação escolar.
- Orçamentos escolares - O mesmo que acima, datacamp.
- PyCity - Análise escolar.
- PyCity 2 - Orçamento escolar vs resultados escolares.
- PNL orçamentária - Classificação da PNL para recursos orçamentários.
- Orçamento PNL 2 - Exercício de classificação adicional.
- Orçamento PNL 3 - Classificação orçamentária.
- Análise de Pesquisa - Análise de pesquisa educacional.
Emergência e Polícia
Preventivo e Reativo
- Mapeamento de Emergência - Detecção de casas destruídas na Califórnia
- Pronto Socorro - Apoiando a tomada de decisões em pronto-socorro
- Readmissão de Emergência - Risco Ajustado de Readmissão de Emergência .
- Incêndio Florestal - Detecção de incêndio florestal através de imagens de UAV usando CNNs
- Resposta a Emergências - Análise de resposta a emergências.
- Transporte de Emergência - Alerta de transporte em serviços de emergência
- Despacho de Emergência – Reduzindo os tempos de resposta com modelagem preditiva, otimização e automação
- Chamadas de Emergência - Projeto de análise de chamadas de emergência.
- Análise de dados de chamadas - análise de dados 911.
- Resposta a Emergências - Fábrica Química RL.
Crime
- Classificação do Crime - Análise de tempos de agressões graves classificadas incorretamente pelo LAPD.
- Marcação de artigos - Artigo de notícias sobre processamento de linguagem natural de Chicago
- Análise Criminal - Mineração de Regras de Associação a partir de Dados Espaciais para Análise Criminal
- Crimes de Chicago - Explorando dados públicos de crimes de Chicago em Python
- Análise gráfica - Crimes de Haia.
- Previsão de Crime - Classificação, análise e previsão de crimes na cidade de Indore.
- Previsão de Crime - Desenvolveu modelos preditivos para taxa de criminalidade .
- Revisão de Crime - Análise de dados de revisão de crime.
- Tendências criminais - A ferramenta de análise de tendências criminais analisa tendências criminais e revela condições criminais problemáticas
- Crime Analytics - Análise de dados criminais em Seattle e São Francisco.
Ambulância:
- Análise de ambulâncias - Uma investigação da variação do tempo de ambulância na área do governo local em Victoria.
- Localização do site - Locais de ambulâncias.
- Despacho - Aplicação da teoria dos jogos e simulação de eventos discretos para encontrar a solução ideal para o despacho de ambulâncias
- Alocação de Ambulâncias - Análise de série temporal de envios de ambulâncias na cidade de San Diego.
- Tempo de Resposta - Uma análise sobre as melhorias no tempo de resposta da ambulância.
- Roteamento Ótimo - Projeto para encontrar o roteamento ideal de ambulâncias em Ithaca.
- Análise de Acidentes - Prever a probabilidade de acidentes em um determinado segmento em um determinado momento.
Gestão de Desastres
- Previsão de Conflitos - Cadernos sobre previsão de conflitos.
- Previsão de roubo - Modelagem espaço-temporal para previsão de roubo.
- Predição de surto de doenças - implementação de aprendizado de máquina baseada em múltiplas implementações de algoritmos classificadores.
- Previsão de acidentes rodoviários - Previsão do tipo de vítimas em acidentes rodoviários federais no Brasil.
- Mineração de Texto - Gerenciamento de Desastres usando Mineração de Texto.
- Twitter e desastres - Tente prever corretamente se os tweets são sobre desastres.
- Risco de Inundações - Impacto de inundações catastróficas.
- Previsão de Incêndios - Usamos 4 algoritmos diferentes para prever a probabilidade de incêndios futuros.
Financiar
Negociação e Investimento
- Para mais informações, consulte aprendizado de máquina financeira
- Para gerenciamento de ativos, consulte aprendizado de máquina financeira
- Deep Portfolio - Aprendizado profundo para finanças Preveja o volume de títulos.
- AI Trading - Técnicas modernas de negociação de IA.
- Títulos Corporativos - Prever o volume de compra e venda de títulos corporativos.
- Simulação - Investigando simulações como parte de finanças computacionais.
- Clustering de Indústrias - Projeto para agrupar indústrias de acordo com atributos financeiros.
- Modelagem Financeira - negociação HFT e modelagem de volatilidade implícita.
- Acompanhamento de tendência - Uma tendência futura que segue a estratégia de investimento de portfólio.
- Sentimento das demonstrações financeiras - Extraindo o sentimento das demonstrações financeiras usando redes neurais.
- Finanças Corporativas Aplicadas - Estuda os comportamentos empíricos do mercado de ações.
- Previsão de quebra de mercado - previsão de quebras de mercado usando um modelo LPPL.
- NLP Finance Papers - Curadoria de artigos financeiros quantitativos usando aprendizado de máquina.
- ARIMA-LTSM Hybrid - Modelo híbrido para prever coeficientes de correlação de preços futuros de dois ativos
- Investimentos Básicos - Ferramentas básicas de investimento em python.
- Derivativos Básicos - Contratos a termo básicos e hedge.
- Finanças Básicas - Aplicativos financeiros básicos de cadernos de código-fonte.
- Advanced Pricing ML - Implementação adicional de Advances in Financial Machine Learning (livro)
- Opções e Regressão - Projeto de engenharia financeira para técnicas de precificação de opções.
- Quant Notebooks - Cadernos educacionais sobre finanças quantitativas, negociação algorítmica e estratégia de investimento.
- Desafio de previsão - Desafio de previsão financeira da G-Research (Hedge Fund)
- XGboost – Um algoritmo de negociação usando XgBoost
- Research Paper Trading - Uma implementação de estratégia baseada em um artigo usando Alpaca Markets.
- Vários - Opções, Alocação, Simulação
- ML & RL NYU - Aprendizado de Máquina e Aprendizado por Reforço em Finanças.
Dados
- Datastream - Datastrem da Thomson Reuters acessível através de Python.
- AlphaVantage – wrapper de API para simplificar o processo de aquisição de dados financeiros gratuitos.
- FSA- Um projeto para transferir dados financeiros da SEC Edgar Filings para modelos personalizados de análise de demonstrações financeiras.
- TradeConnector – Uma camada para conexão com provedores de dados de mercado.
- Arquivos SEC de contagem de funcionários - Extração para obter os valores exatos de contagem de funcionários para empresas a partir de arquivos SEC.
- Análise SEC - PNL para encontrar e extrair informações específicas de documentos longos e não estruturados
- Abra Edgar - OpenEDGAR (openedgar.io)
- Rating Industries - Histórias de várias agências convertidas para o formato CSV
Documentos pessoais
- Regulamento de aprendizado de máquina financeira
- Previsão de fechamento de instalações de restaurantes
- Previsão de falências corporativas
- Prevendo surpresas nos ganhos
- Aprendizado de máquina em gerenciamento de ativos
Assistência médica
Em geral
- zEpid - Pacote de análise epidemiológica.
- Python para epidemiologistas - Tutorial para apresentar a análise epidemiológica em Python.
- Conformidade com prescrição - Uma análise de prescrição e conformidade médica
- Doenças Respiratórias - Rastreamento de doenças respiratórias em atletas olímpicos
- Peste Bubônica - Peste Bubônica e modelo SIR.
Justiça, Lei e Regulamentos
Ferramentas
- LexPredict - Pacote de software e biblioteca.
- AI Para-legal - Lobe é o primeiro paralegal de IA do mundo.
- Detecção de Pessoa Jurídica - NER Para Documentos Jurídicos.
- Sumarização de Casos Jurídicos - Implementação de diferentes algoritmos de sumarização aplicados a julgamentos de processos judiciais.
- Documentos legais Google Scholar - Usando o Google Scholar para extrair casos programaticamente.
- Chat Bot - Chat-bot e notificações por e-mail.
- API do Congresso - Acesso à API do congresso ProPublica.
- Data Generator GDPR - Gerador de dados fictícios para conformidade com GDPR
- Blackstone - pipeline spaCy e modelo para PNL em texto jurídico não estruturado.
Política e Regulamentação
- Pontuações do GDPR - Previsão de pontuações do GDPR para documentos legais.
- Fatores determinantes FINRA - Identifique os fatores determinantes que influenciam as decisões de arbitragem da FINRA.
- Correção de polarização de títulos - estimativa corrigida de polarização do impacto do preço em litígios de valores mobiliários.
- Empresa Pública à Decisão Legal - Incorpore empresas públicas com base em sua reação às decisões legais.
- Regulamentação da Vida Noturna - Vida noturna australiana e sua regulamentação e policiamento
- Comentários - Comentários públicos sobre regulamentações governamentais.
- Clustering - Regulamentações canadenses de clustering.
- Meio Ambiente - Regulação da Energia e do Meio Ambiente
- Risco - Risco sistemático de diversas regulamentações financeiras.
- Conformidade FINRA - Modelagem de tópicos sobre conformidade.
Judicial Aplicado
- Previsão da Suprema Corte - Prever a direção ideológica das decisões da Suprema Corte: modelo conjunto vs. modelo unificado baseado em casos.
- Modelagem de Tópicos da Suprema Corte – Múltiplas etapas necessárias para implementar a modelagem de tópicos em decisões da Suprema Corte.
- Opinião do Juiz - Usando mineração de texto e aprendizado de máquina para analisar as opiniões dos juízes sobre uma preocupação específica.
- ML Law Matching - Um criador de correspondências jurídicas de aprendizado de máquina.
- Classificação Bert Multi-label - Análise de sentimento granular da IA.
- Algum curso de IA Computacional - Série de vídeos Law MIT.
- Regulamento de aprendizado de máquina financeira (papel)
Fabricação
Em geral
- Green Manufacturing - competição Mercedes-Benz Greener Manufacturing no Kaggle.
- Fabricação de Semicondutores - Análise de dados da linha de processo de fabricação de semicondutores.
- Smart Manufacturing - Trabalho compartilhado de uma metodologia de modelagem.
- Fabricação Bosch - Projeto de fabricação Bosch, Kaggle.
Manutenção
- Manutenção Preditiva 1 - Prever a vida útil restante dos motores das aeronaves
- Manutenção Preditiva 2 - Tempo até falha (TTF) ou Vida útil restante (RUL)
- Manutenção de Manufatura - Simulação de manutenção em sistemas de manufatura .
Falha
- Análise Preditiva - Método para Predição de Falhas em Equipamentos utilizando dados de Sensores.
- Detectando Defeitos - Detecção de anomalias para semicondutores defeituosos
- Detecção de defeitos - Detecção inteligente de defeitos na fabricação de comprimidos.
- Falhas de Fabricação - Reduzindo falhas de fabricação.
- Anomalias de Fabricação - Detecção inteligente de anomalias para linha de fabricação .
Qualidade
- Controle de Qualidade - Falha Bosh no controle de qualidade.
- Qualidade de Fabricação - Previsão Inteligente de Qualidade de Fabricação
- Fabricação de automóveis - Projeto de estudo de caso de regressão em dados de vendas em leilão de manufatura .
Mídia e publicação
Marketing
- Popularidade do vídeo - modelo HIP para prever a popularidade dos vídeos.
- Transcritor do YouTube - Transcreva vídeos do YouTube automaticamente.
- Marketing Analytics - estudos de caso de análise de marketing.
- Marketing Algorítmico - Modelos do livro Introdução ao Marketing Algorítmico
- Scripts de marketing - aplicativos de ciência de dados de marketing.
- Mineração Social - Mineração da web social.
Variado
Arte
- Pintura Forense - Analisando pinturas para descobrir o ano de criação.
Turismo
- Flickr – Ferramenta de mineração de metadados para pesquisa em turismo.
- Moda - Um modelo de recuperação de roupas e recomendação visual para imagens de moda
Física
Em geral
- Reconstrução Gamma-Hadron-Ferramentas usadas na astronomia baseada em solo de raios gama.
- Currículo - Notebooks newtonianos.
- Redes de interação - redes de interação para aprender sobre objetos, relações e física.
- Física de partículas - Código de Treinamento, Geração e Análise para Aprender Física de Partículas
- Física computacional - um repositório de física computacional.
- Física médica - Python útil para física médica.
- Física Médica 2 - Um pacote comum Python para física médica
- Fluxo Physics - Flow Physics e Aeroacoustics Caixa de ferramentas com Python
Aprendizado de máquina
- ML e estatísticas de física - aprendizado de máquina e estatística para físicos
- Alta energia - aprendizado de máquina para física de alta energia.
- GaN de alta energia - redes adversárias generativas para física de alta energia.
- Redes neurais - P Hysics atende às redes neurais
Governo e obras públicas
Políticas sociais
- Triagem - Modelagem de Riscos de Risco e Risco de Punto Geral Para Problemas Políticos e Sociais.
- Pobreza do Banco Mundial I - Uma avaliação comparativa dos algoritmos de classificação de aprendizado de máquina aplicados à previsão da pobreza.
- Poverty II do Banco Mundial - Repositório para a solução de concorrência do Banco Mundial do Banco Pover -T no exterior.
- O exterior de propriedade da empresa - identificando a propriedade estrangeira no Reino Unido.
- CFPB - Análise de reclamações do Departamento de Proteção do Consumer Finances.
- Efeito de legalização da cannabis - Efeitos da legalização da cannabis no crime.
- Cartão de crédito público - Identificação de possíveis fraudes para cartões de crédito do Conselho. Dados
- Previsão de reincidência - transparência e audibilidade para avaliação de risco de reincidência
- Pobreza doméstica - Preveja a pobreza em famílias na Costa Rica.
- Política pública da PNL - um exemplo de um caso de uso da PNL em políticas públicas.
- Produção mundial de alimentos - Comparando os melhores produtores de alimentos e alimentos em todo o mundo.
- Desigualdade tributária - Projeto de dados em torno da tributação e desigualdade em Basileia Stadt.
- Conformidade do xerife - conformidade com solicitações de gelo.
- Detecção de aplicativos - Detecção suspeita de aplicativos para crianças.
- Assistência Social - Informações sobre Tendências sobre Assistência Social
- Ciências Sociais Computacionais - Curso Escolar de Verão de Ciência dos Dados Sociais.
- Licor e crime - Efeito das licenças de licor emitidas na taxa de criminalidade.
- Kennels de colocação de animais - otimizando a colocação de animais em abrigos.
- Wall de pessoal - Projeto de exploração independente na parede de fronteira mexicana
- Fatalidades do trabalhador - Fatalidades e catástrofes do trabalhador Mapa da OSHA Data
Instituições de caridade
- API de dados do censo - Puxe variáveis da pesquisa da comunidade americana de 5 anos.
- Doações filantrópicas - trabalho realizado por vários voluntários da Datakind no aproveitamento dos dados do formulário 990
- Recomendador de caridade - sistema de recomendação colaborativo de caridade de Nova York em um conjunto de dados implícito.
- Identificação de doadores - um projeto de aprendizado de máquina no qual precisamos encontrar doadores para caridade.
- Caridade dos EUA - Exploração de caridade e aprendizado de máquina.
- Eficácia da caridade - raspando dados on -line sobre instituições de caridade para entender a eficácia
Análise eleitoral
- Análise eleitoral - Análise eleitoral e modelos de previsão
- Eleição americana causal - usando dados de ANES com modelos de inferência causal.
- Finanças da campanha e resultados das eleições - Investigando a relação entre o financiamento da campanha e os subsequentes resultados das eleições.
- Sistema de votação - Métodos de votação de representação proporcional.
- Presidente Vote - Vote por análise de nível de renda ..
Política
- Política do Congresso - Partidarismo do Congresso da Câmara e do Senado.
- Politico - Uma plataforma para criar figuras públicas na política brasileira.
- Bots - Ferramentas e algoritmos para analisar tweets paraguaios em tempos de eleição
- Testes de Gerrymander - Muitas métricas para quantificar a gerrymandering.
- Sentimento - Analise os jornais em relação à sua condenação política usando sentimentos de entidade dos representantes do partido.
- Política DL - Previsão da afinidade política espanhola com redes neurais profundas: partido socialista vs pessoas
- PAC Money - Efeitos do dinheiro do PAC na política dos EUA.
- Redes de energia - Construindo um cão de guarda para redes corporativas e políticas indianas
- Elite - elite política nos EUA.
- Análise de debate - Programa para analisar debates políticos .
- Afiliação política - Previsão de afiliação política usando metadados do Twitter.
- Anúncios políticos - investigação sobre anúncios políticos do Facebook e segmentação
- Identidade política - modelo político multi -axial.
- Política YT - Mapeando a política no YouTube
- Ideologia política - aprendizado não supervisionado da ideologia política por projeções de vetor de palavras
Imóveis, aluguel e leasing
Imobiliária
- Encontrando donuts - encontrando oportunidades imobiliárias prevendo bairros transformadores.
- Bairro - Prevendo preços imobiliários do ambiente urbano.
- Classificação imobiliária - Classificando o tipo de propriedade que recebe imagens imobiliárias, satélites e vistas de rua
- RECOMENDADO - Esta ferramenta visa recomendar a um usuário as 5 principais propriedades imobiliárias que correspondem à sua pesquisa.
- Preço da casa - previsão dos preços das casas usando regressão linear e GBR
- Preço da casa Portland - preveja os preços da habitação em Portland.
- Previsão de Zillow - Previsão de avaliação de Zillow, como realizado em Kaggle.
- Imóveis - prevendo os preços dos imóveis do ambiente urbano.
Aluguel e leasing
- Analisando aluguel - analisando e visualizando dados de listagens de aluguel.
- Previsão de juros - preveja o interesse das pessoas em alugar apartamentos específicos de Nova York.
- Habitação UNI vs não -UNI - O efeito no alojamento da universidade após o GFC.
- Preveja a pobreza doméstica - preveja a pobreza das famílias na Costa Rica usando a engenharia automatizada de recursos.
- Competição de análise pública do Airbnb: - Agora gerenciamento estratégico.
Utilitários
Eletricidade
- Preço de eletricidade - comparação de preços de eletricidade em Cingapura.
- Correlação de coal de eletricidade - Determinando a correlação entre as taxas de eletricidade do estado e a geração de carvão na última década.
- Capacidade de eletricidade - Uma análise do Los Angeles Times do caro caro da Califórnia.
- Sistemas de eletricidade - Sistemas ideais de vento+hidrogênio+outra bateria+solar (whobs) para países europeus.
- Disaggregação de carga - Disaggregação de carga do medidor inteligente com modelos ocultos de Markov
- Previsão de preços - Previsão de preços de eletricidade do dia seguinte na zona de licitação alemã com redes neurais profundas.
- Índice de Carbono - Cálculo da Intensidade da Co₂ de Eletricidade nas regiões nacionais, estaduais e NERC de 2001 -presente.
- Previsão da demanda - Previsão da demanda de eletricidade para Austin.
- Consumo de eletricidade - estimando o consumo de eletricidade a partir de pesquisas domésticas
- Consumo de energia doméstica - Consumo individual de energia doméstica LSTM.
- Distribuição francesa de eletricidade - Uma análise dos dados de eletricidade fornecidos pela Rede de Distribuição Francesa (RTE)
- Usinas renováveis - Série temporal de capacidade instalada acumulada.
- Fluxo do parque eólico - Um repositório de modelos de fluxo de plantas eólicas conectadas ao vento fundido.
- Usina - O conjunto de dados contém 9568 pontos de dados coletados de uma usina de ciclo combinada ao longo de 6 anos (2006-2011).
Carvão, petróleo e gás
- Fase de carvão - A geração de adequação é questionada com a eliminatória do carvão da Alemanha.
- Previsão de carvão - previsão da produção de carvão.
- Oil e gás - previsão de preços de petróleo e gás natural usando redes ARIMA e neural
- Fórmula de gás - Calcule o efeito econômico potencial da fórmula de indexação de preços.
- Previsão da demanda - Previsão da demanda de gás natural.
- Previsão de consumo - Previsão de consumo de gás natural.
- Comércio de Gás - Modelo Mundial para Comércio de Gás Natural .
Água e poluição
- Água segura - preveja violações de água potável baseadas em saúde nos Estados Unidos.
- Dados de hidrologia - um conjunto de funções de conveniência para explorar dados de água no Python.
- Observatório de Água - Monitorando os níveis de água de lagos e reservatórios usando imagens de satélite.
- Dipelines de água - Usando aprendizado de máquina para encontrar dutos de água em imagens aéreas.
- Modelagem de Água - Sistema de Modelagem Comunitária de Avaliação de Recursos Hídricos da Austrália (AWRA).
- Restrições de seca - A Los Angeles Times Análise do uso da água após o estado aliviar as restrições de seca
- Previsão de inundações - Aplicando LSTM nos dados do nível da água do rio
- Overflow de esgoto - Insights sobre o transbordamento de esgoto sanitário (SSO). - Isso foi removido
- Contabilidade de água - monta os dados do orçamento da água para os EUA da fonte de dados existente
- Previsão da qualidade do ar - preveja a qualidade do ar (AQ) em Pequim e Londres nas próximas 48 horas.
Transporte
- Transdim - Criando soluções precisas e eficientes para as tarefas de imputação e previsão de dados de tráfego espaço -temporais.
- Recomendação de transporte-recomendação de transporte multimodal com reconhecimento de contexto
- Dados de transporte - Dados e notebooks para Transporte de Toronto.
- Demanda de transporte - Prevendo a demanda por transporte público em Nairóbi.
- Estimativa da demanda - Implementação da estimativa de demanda de origem dinâmica.
- Análise de congestionamento - análise de sistemas de transporte
- Análise TS - Análise de séries temporais sobre dados de transporte.
- Gráfico de rede Subway - Análise de vulnerabilidade para redes de transporte. - foram derrubados
- INFENDÊNCIAS DE TRANSPORTE - Quantificando as ineficiências das redes de transporte
- Otimização de trem - otimização do cronograma de trem
- Previsão de tráfego - Redes neurais recorrentes de atenção múltipla para séries temporais (tráfego da cidade)
- Preveja falhas - aplicação de modelagem de previsão de falhas que aproveita várias fontes de dados
- Cadeia de suprimentos de IA - sistema de otimização da cadeia de suprimentos.
- Transferir Atraso no voo de aprendizado - Usando codificadores de variação em Keras para prever o atraso do voo.
- Reabastecimento - Código de reabastecimento de varejo para gerenciamento da cadeia de suprimentos.
Atacado e varejo
Atacado
- Análise do Cliente - Análise de Cliente de atacado.
- Distribuição - Análise de distribuição por atacado JB.
- Clustering - Técnicas de aprendizado não supervisionado são aplicadas nos dados de gastos com produtos coletados para clientes
- Análise da cesta de mercado - o conjunto de dados público do Instacart para relatar quais produtos são frequentemente comprados juntos.
Varejo
- Análise de varejo - Estudando o conjunto de dados de varejo on -line e obtendo informações dele.
- Insights online - analisando as transações on -line no Reino Unido
- Caso de uso no varejo - Notebooks e dados para o caso de uso do varejo CyberShop
- Horário de Habitação - Tempo de permanência do cliente e outras análises.
- Coorte de varejo - Análise de coorte.