Conjuntos de dados públicos incríveis
Esta é uma lista de fontes de dados públicos centradas em tópicos e de alta qualidade. Eles são coletados e organizados em blogs, respostas e respostas de usuários. A maioria dos conjuntos de dados listados abaixo são gratuitos, mas alguns não são. Este projeto foi incubado no OMNILab, Universidade Shanghai Jiao Tong durante o doutorado de Xiaming Chen. estudos. OMNILab agora faz parte da comunidade BaiYuLan Open AI. Outras listas incrivelmente impressionantes podem ser encontradas na lista incrível de sindresorhus.
AVISO : Este repositório é gerado automaticamente pelo apd-core. Por favor, NÃO modifique este arquivo diretamente. Fornecemos uma nova maneira de contribuir com este repositório. Junte-se à comunidade do Slack para receber atualizações instantâneas de dados do HQ.
- Estou bem.
- Por favor, me conserte.
Índice
- Agricultura
- Arquitetura
- Biologia
- Química
- Clima+Tempo
- Redes Complexas
- Redes de Computadores
- Cibersegurança
- Desafios de dados
- Ciências da Terra
- Economia
- Educação
- Energia
- Entretenimento
- Financiar
- SIG
- Governo
- Assistência médica
- Processamento de imagens
- Aprendizado de máquina
- Museus
- Linguagem Natural
- Neurociência
- Física
- Câncer de próstata
- Psicologia+Cognição
- Domínios Públicos
- Motores de pesquisa
- Redes Sociais
- Ciências Sociais
- Programas
- Esportes
- Série temporal
- Transporte
- eSports
- Coleções Complementares
Agricultura
- O conjunto de dados globais de rendimentos históricos para as principais culturas 1981–2016 - O conjunto de dados global de [...] [Meta]
- Conjunto de dados de referência hiperespectral sobre umidade do solo - Este conjunto de dados foi medido em um período de cinco dias [...] [Meta]
- Conjunto de dados de controle de qualidade de limões - O conjunto de dados de limão foi preparado para investigar o [...] [Meta]
- Índice de Vegetação Otimizado Ajustado ao Solo - O BID é uma ferramenta para trabalhar com sensoriamento remoto [...] [Meta]
- Banco de dados de nutrientes do Departamento de Agricultura dos EUA [Meta]
- Banco de dados de PLANTAS do Departamento de Agricultura dos EUA - A lista de verificação completa de PLANTAS tem quase 7 [...] [Meta]
Arquitetura
- Modelos de apartamentos suíços - Este conjunto de dados contém dados detalhados sobre 42.207 apartamentos (242.257 [...] [Meta]
Biologia
- 1000 Genomas - O Projeto 1000 Genomas funcionou entre 2008 e 2015, criando o maior [...] [Meta]
- ANHIR - Registro Automático de Imagem Histológica Não Rígida (ANHIR) consiste em 2D [...] [Meta]
- American Gut (Microbiome Project) - O projeto American Gut é o maior crowdsourced [...] [Meta]
- BCNB - Existem WSIs de 1.058 pacientes, parte das regiões tumorais estão anotadas nos WSIs. Exceto [...] [Meta]
- Coleção Broad Bioimage Benchmark (BBBC) - Coleção Broad Bioimage Benchmark (BBBC) [...] [Meta]
- Enciclopédia Ampla de Linha Celular de Câncer (CCLE) [Meta]
- CIMA - O conjunto de dados CIMA inclui imagens de fatias de tecido de microscopia histológica 2D. [Meta]
- Cell Image Library - Esta biblioteca é um banco de dados de recursos público e de fácil acesso de [...] [Meta]
- Dados públicos completos de genômica - Um conjunto diversificado de dados de genomas humanos inteiros é disponibilizado gratuitamente [...] [Meta]
- CytoImageNet - Um conjunto de dados em grande escala de imagens de microscopia. Contém 890.737 tons de cinza totais [...] [Meta]
- EBI ArrayExpress - Arquivo ArrayExpress de dados de genômica funcional armazena dados de alta- [...] [Meta]
- EBI Protein Data Bank na Europa - O Electron Microscopy Data Bank (EMDB) é um público [...] [Meta]
- Projeto ENCODE - O Consórcio Enciclopédia de Elementos de DNA (ENCODE) é um projeto em andamento [...] [Meta]
- Arquivo de imagens piloto de microscopia eletrônica (EMPIAR) - EMPIAR, o Público de Microscopia Eletrônica [...] [Meta]
- Conjunto de Genomas [Meta]
- Gene Expression Omnibus (GEO) - GEO é um repositório público funcional de dados genômicos [...] [Meta]
- Gene Ontology (GO) - arquivos de anotação GO [Meta]
- Interações Bióticas Globais (GloBI) [Meta]
- Projeto LINCS da Harvard Medical School (HMS) - O Centro LINCS da Harvard Medical School (HMS) é [...] [Meta]
- Projeto de Diversidade do Genoma Humano - Um grupo de cientistas da Universidade de Stanford [...] [Meta]
- Projeto Microbioma Humano (HMP) - O HMP sequenciou mais de 2.000 genomas de referência isolados de [...] [Meta]
- Benchmark ICOS PSP - O repositório de benchmarks ICOS PSP contém um mundo real ajustável [...] [Meta]
- Projeto Internacional HapMap [Meta]
- DataViewer do Journal of Cell Biology [Meta]
- KEGG - KEGG é um recurso de banco de dados para entender funções e utilidades de alto nível de [...] [Meta]
- Proteínas NCBI [Meta]
- Taxonomia NCBI - O banco de dados de Taxonomia NCBI é um conjunto com curadoria de nomes e classificações para [...] [Meta]
- NCI Genomic Data Commons - O GDC Data Portal é uma plataforma robusta baseada em dados que permite [...] [Meta]
- Dados de microarray do NIH [Meta]
- Dados de genótipos OpenSNP - o openSNP permite que clientes de testes genéticos diretos ao cliente [...] [Meta]
- Palmer Penguins - O objetivo dos palmerpenguins é fornecer um ótimo conjunto de dados para dados [...] [Meta]
- Pathguid - Catálogo de Interações Proteína-Proteína [Meta]
- Protein Data Bank - Este recurso é alimentado pelo arquivo de informações do Protein Data Bank [...] [Meta]
- Consórcio de Genômica Psiquiátrica - O objetivo do Consórcio de Genômica Psiquiátrica (PGC) é [...] [Meta]
- Projeto PubChem - PubChem é a maior coleção do mundo de produtos químicos de acesso gratuito [...] [Meta]
- PubGene (agora Coremine Medical) - COREMINE™ é uma família de ferramentas desenvolvidas pela norueguesa [...] [Meta]
- Catálogo Sanger de Mutações Somáticas no Câncer (COSMIC) - COSMIC, o Catálogo de Mutações Somáticas [...] [Meta]
- Projeto Sanger de Genômica de Sensibilidade a Medicamentos no Câncer (GDSC) [Meta]
- Sequence Read Archive (SRA) - O Sequence Read Archive (SRA) armazena dados brutos de sequência de [...] [Meta]
- Serratus - Análise de 7,1 milhões de conjuntos de dados de sequenciamento de RNA/DNA para descobrir o total [...] [Meta]
- Dados de microarray de Stanford (aposentados AGORA) [Meta]
- Repositório de dados originais do Stowers Institute [Meta]
- Banco de dados de Ciência de Sistemas de Dinâmica Biológica (SSBD) - Ciência de Sistemas de Biologia [...] [Meta]
- O Atlas do Genoma do Câncer (TCGA), disponível via Broad GDAC [Meta]
- O Catálogo da Vida - O Catálogo da Vida é uma lista de verificação de qualidade garantida de mais de 1,8 [...] [Meta]
- O Projeto Genoma Pessoal - O Projeto Genoma Pessoal, iniciado em 2005, é uma visão e [...] [Meta]
- Dados públicos da UCSC [Meta]
- UniGene [Meta]
- Recurso Universal de Proteína (UniProt) - O Recurso Universal de Proteína (UniProt) é um [...] [Meta]
- Rfam - O banco de dados Rfam é uma coleção de famílias de RNA, cada uma representada por múltiplos [...] [Meta]
Química
- Banco de dados de líquidos iônicos - ILThermo [Meta]
Clima+Tempo
- Índice Climático Atuário [Meta]
- Clima australiano [Meta]
- Aviation Weather Center - Informações meteorológicas consistentes, oportunas e precisas para o mundo [...] [Meta]
- Clima Brasileiro - Dados históricos (em português) - Dados relacionados ao clima e ao tempo [...] [Meta]
- Vários conjuntos de dados climáticos - O C3S Climate Data Store (CDS) é um balcão único para [...] [Meta]
- Centro Meteorológico Canadense [Meta]
- Caravan - um conjunto de dados para hidrologia de grandes amostras - Caravan é um conjunto de dados comunitário aberto de [...] [Meta]
- Dados climáticos da UEA (atualizados mensalmente) [Meta]
- Clima holandês - O portal KNMI Data Center (KDC) fornece acesso aos dados KNMI sobre clima, [...] [Meta]
- Avaliação e conjunto de dados climáticos europeus [Meta]
- Centro de dados climáticos alemão [Meta]
- Dados climáticos globais desde 1929 [Meta]
- Traçando a narrativa das notícias sobre mudanças climáticas globais 2009-2020 - Esses quatro conjuntos de dados representam [...] [Meta]
- Serviços de navegação de imagens globais da NASA [Meta]
- Clima do Mar de Bering NOAA [Meta]
- Conjuntos de dados climáticos da NOAA [Meta]
- Modelos meteorológicos em tempo real NOAA [Meta]
- Conjuntos de dados de meteorologia e radiação NOAA SURFRAD [Meta]
- Open-Meteo - API meteorológica de código aberto - API meteorológica de código aberto com acesso gratuito para não [...] [Meta]
- Recursos de dados abertos do Banco Mundial para mudanças climáticas [Meta]
- Unidade de Pesquisa Climática da UEA [Meta]
- Histórico meteorológico WU em todo o mundo [Meta]
- Wahington Post Mudanças Climáticas - Para analisar o aquecimento das temperaturas nos Estados Unidos, o [...] [Meta]
- WorldClim - Dados climáticos globais [Meta]
Redes Complexas
- Conjunto de dados da rede de citações AMiner [Meta]
- URLs DOI CrossRef [Meta]
- Conjunto de dados de citação DBLP [Meta]
- Coleção de redes rodoviárias DIMACS [Meta]
- Citações de patentes NBER [Meta]
- Coleta de dados de redes complexas NIST [Meta]
- Repositório de rede com ferramentas interativas de análise exploratória [Meta]
- Rede de interação proteína-proteína [Meta]
- Rede de dependência PyPI e Maven [Meta]
- Banco de dados de citações Scopus [Meta]
- Dados de rede pequena [Meta]
- Stanford GraphBase [Meta]
- Coleção de conjuntos de dados de grande rede de Stanford [Meta]
- Fontes de dados da rede longitudinal de Stanford [Meta]
- A coleção da rede Koblenz [Meta]
- Laboratório de Algoritmos Web (UNIMI) [Meta]
- Repositório de dados da rede UCI [Meta]
- Coleção de matrizes esparsas UFL [Meta]
- Banco de dados gráfico WSU [Meta]
- Recurso comunitário para arquivamento de dados sem fio em Dartmouth - Contém conjuntos de dados de arquivos pcap [...] [Meta]
Redes de Computadores
- 3,5 bilhões de páginas da Web do CommonCrawl 2012 [Meta]
- 53,5 bilhões de cliques na Web de 100 mil usuários na Indiana Univ. [Meta]
- Conjuntos de dados da Internet CAIDA [Meta]
- Conjuntos de dados CRAWDAD Wireless da Dartmouth Univ. [Meta]
- ClueWeb09 - páginas da web 1B [Meta]
- ClueWeb12 - 733 milhões de páginas da web [Meta]
- Dados da Web CommonCrawl ao longo de 7 anos [Meta]
- Previsão da intenção do comprador a partir de dados de comércio eletrônico de fluxo de cliques com informações mínimas de navegação [Meta]
- Dados de cliques da Criteo [Meta]
- Repositório de dados de digitalização em toda a Internet [Meta]
- MIRAGE-2019 - MIRAGE-2019 é um conjunto de dados gerado por humanos para análise de tráfego móvel com [...] [Meta]
- Conjunto de dados de registros DNS Merklemap - Contém mais de 4 bilhões de registros DNS em 700 milhões de exclusivos [...] [Meta]
- OONI: Observatório Aberto de Interferência de Rede - dados de censura na Internet [Meta]
- Dados móveis abertos por MobiPerf [Meta]
- The Peer-to-Peer Trace Archive - Medições do mundo real desempenham um papel fundamental no estudo do [...] [Meta]
- Varreduras de Internet do Rapid7 Sonar [Meta]
- Telescópio de rede UCSD, rede IPv4 /8 [Meta]
Cibersegurança
- CCCS-CIC-AndMal-2020 - O conjunto de dados inclui 200 mil amostras de malware benigno e 200 mil de malware, totalizando [...] [Meta]
- Dados de tráfego e registro capturados durante um exercício de defesa cibernética - Este conjunto de dados foi adquirido [...] [Meta]
Desafios de dados
- Competições AIcrowd [Meta]
- Banco de dados Bruteforce [Meta]
- Desafios no aprendizado de máquina [Meta]
- CrowdANALYTIX dadosX [Meta]
- Desafio D4D de Orange [Meta]
- Competições DrivenData para o Bem Social [Meta]
- Desafio de dados ICWSM (desde 2009) [Meta]
- Copa KDD da Tencent 2012 [Meta]
- Dados de competição Kaggle [Meta]
- Desafio de visualização de dados localytics [Meta]
- Prêmio Netflix [Meta]
- Desafio de aplicativos espaciais [Meta]
- Desafio de Big Data da Telecom Italia [Meta]
- Conjunto de dados TravisTorrent - Desafio de mineração MSR'2017 [Meta]
- TunedIT - Mineração de dados e conjuntos de dados de aprendizado de máquina, algoritmos, desafios [Meta]
- Desafio do conjunto de dados do Yelp - O conjunto de dados do Yelp é um subconjunto de nossos negócios, avaliações e usuários [...] [Meta]
Ciências da Terra
- 38-Cloud (Cloud Detection) - Contém 38 imagens de cena Landsat 8 e suas extraídas manualmente [...] [Meta]
- AQUASTAT - Recursos e usos globais da água [Meta]
- BODC - dados marítimos de aproximadamente 22 mil vars [Meta]
- EOSDIS - dados do sistema de observação da Terra da NASA [Meta]
- Modelos da Terra [Meta]
- Global Wind Atlas - O Global Wind Atlas é um aplicativo gratuito baseado na web desenvolvido para ajudar [...] [Meta]
- Sistema Integrado de Observação Marinha (IMOS) - aproximadamente 30 TB de medições oceânicas [Meta]
- Marineexplore - Dados Oceanográficos Abertos [Meta]
- Sistema de observação costeira em tempo real do Alabama [Meta]
- Programa Nacional de Monitoramento de Reservas Estuarinas de Pesquisa em Todo o Sistema - estuarino de longo prazo [...] [Meta]
- Dados abertos da Autoridade de Petróleo e Gás - O conjunto de dados cobre 12.500 poços offshore, 5.000 estudos sísmicos [...] [Meta]
- Banco de dados global de vulcões e erupções do Smithsonian Institution [Meta]
- Arquivos do terremoto do USGS [Meta]
- Previsão da Área de Proteção da Cabeça do Poço (zona de proteção) usando curvas de avanço - Este [...] [Meta]
Economia
- Organização Asiática de Produtividade (APO) - A AEPM fornece uma visualização gráfica do painel de [...] [Meta]
- ASEAN Stats - O ASEANstatsDataPortal foi lançado pela primeira vez em junho de 2018. O Portal é [...] [Meta]
- Associação Econômica Americana (AEA) [Meta]
- Asian KLEMS - Asia KLEMS é um consórcio de pesquisa regional asiático para promover a construção [...] [Meta]
- Harvard Atlas of Economic Complexity - Um banco de dados para as pessoas explorarem os fluxos comerciais globais [...] [Meta]
- Banco de dados financeiro do BIS - Os arquivos contêm os mesmos dados do BIS Statistics Explorer [...] [Meta]
- Desempenho educacional de Barro-Lee - Dados de desempenho educacional de Barro-Lee de 1950 a 2010. [...] [Meta]
- Base de dados CEPII - Uma base de dados da economia mundial, através dos perfis de seus países e regiões, em [...] [Meta]
- EUKLEMS - EU KLEMS é um projeto de pesquisa de nível industrial, crescimento e produtividade. KLEMS da UE [...] [Meta]
- Liberdade Econômica dos Dados Mundiais [Meta]
- Contas Nacionais Históricas - O datahub sobre Contas Nacionais Históricas Comparativas [...] [Meta]
- Estatísticas Macroeconômicas Históricas [Meta]
- INFORUM - Previsão Intersetorial da Universidade de Maryland [Meta]
- DBnomics - o banco de dados econômico mundial - Agrega centenas de milhões de séries temporais [...] [Meta]
- Estatísticas do Comércio Internacional [Meta]
- Banco de dados de códigos de produtos da Internet [Meta]
- Centro Conjunto de Dados da Dívida Externa [Meta]
- Links de dados comerciais internacionais de Jon Haveman [Meta]
- América Latina KLEMS - LAKLEMS é um projeto de cooperação técnica financiado pela Inter- [...] [Meta]
- Banco de dados de produtividade de longo prazo - O banco de dados de produtividade de longo prazo foi criado como um [...] [Meta]
- Banco de dados do projeto Maddison - O banco de dados do projeto Maddison fornece informações comparativas [...] [Meta]
- Contas de Transferência Nacionais - O objetivo do projeto Contas de Transferência Nacionais (NTA) é [...] [Meta]
- Banco de dados OpenCorporates de empresas do mundo [Meta]
- Nosso mundo em dados [Meta]
- Penn World Table - PWT versão 10.0 é um banco de dados com informações sobre níveis relativos de [...] [Meta]
- Conjuntos de dados de gravidade do comércio mundial da SciencesPo [Meta]
- O Atlas da Complexidade Econômica [Meta]
- O Centro de Dados Internacionais [Meta]
- O Observatório da Complexidade Econômica [Meta]
- Estatísticas do comércio de commodities da ONU [Meta]
- Relatórios de Desenvolvimento Humano da ONU [Meta]
- Banco de dados mundial de insumos e produtos - Tabelas mundiais de insumos e produtos e dados subjacentes, cobrindo 43 [...] [Meta]
- World KLEMS – Conjuntos de dados analíticos do tipo KLEMS para um amplo conjunto de países ao redor do mundo. [...] [meta]
Educação
- Dados do scorecard da faculdade [Meta]
- Dados do Departamento de Educação do Estado de Nova York - O Departamento de Educação do Estado de Nova York (NYSED) é [...] [Meta]
- Programa de Avaliação de Alunos Internacionais (PISA) - Contém alunos de 15 anos [...] [Meta]
- Dados de alunos do Free Code Camp [Meta]
Energia
- AMPds - conjunto de dados The Almanac of Minutely Power [Meta]
- BLUEd - Conjunto de dados de desagregação de eletricidade totalmente rotulado em nível de edifício [Meta]
- PENTEADO [Meta]
- DBFC - Conjunto de dados de célula de combustível de borohidreto direto (DBFC) [Meta]
- DEL - Conjuntos de dados de estudo de carga elétrica doméstica para a África do Sul (1994 - 2014) [Meta]
- ECO - O conjunto de dados ECO é um conjunto de dados abrangente para monitoramento de carga não intrusivo e [...] [Meta]
- AIA [Meta]
- Banco de dados global de usinas de energia - O banco de dados global de usinas de energia é um banco de dados abrangente e de código aberto [...] [Meta]
- HES - Estudo de Eletricidade Doméstica, Reino Unido [Meta]
- HFED [Meta]
- MORED: um conjunto de dados de consumo de eletricidade em edifícios marroquinos - Desde a primavera de 2019, um conjunto de dados [...] [Meta]
- Marktstammdatenregister - O Marktstammdatenregister alemão (MaStR) é um banco de dados de todos [...] [Meta]
- PEM1 - Conjunto de dados de célula de combustível de membrana de troca de prótons (PEM) [Meta]
- PLAID - O conjunto de dados de identificação do dispositivo Plug Load [Meta]
- O Projeto de Liberação de Dados de Utilidade Pública (PUDL) - PUDL torna os dados de energia dos EUA mais fáceis de [...] [Meta]
- REDD [Meta]
- SYND - Um conjunto de dados de energia sintética para monitoramento de carga não intrusivo - Com SynD, apresentamos um [...] [Meta]
- Portal de Dados do Medidor Inteligente - O Portal de Dados do Medidor Inteligente faz parte do Programa Nacional de Ciência [...] [Meta]
- Base de rastreamento [Meta]
- Conjuntos de dados do Centro de Energia da Ucrânia [Meta]
- UK-DALE - Eletricidade em nível de eletrodomésticos no Reino Unido [Meta]
- BRANCO [Meta]
- iAWE [Meta]
Entretenimento
- Principais streamers no Twitch - Contém dados dos 1.000 melhores streamers do ano passado. [Meta]
Financiar
- Estatísticas do BIS - Estatísticas do BIS, compiladas em cooperação com bancos centrais e outros [...] [Meta]
- Blockmodo Coin Registry - Um registro de arquivos de informações formatados em JSON que é principalmente [...] [Meta]
- Bolsa de Futuros CBOE [Meta]
- Dados completos de estoque FAANG - Este conjunto de dados contém todos os dados de estoque de empresas FAANG de [...] [Meta]
- Google Finanças [Meta]
- Tendências do Google [Meta]
- NASDAQ [meta]
- Dados de mercado da NYSE [Meta]
- OANDA [Meta]
- Dados financeiros da OSU [Meta]
- Quandl [Meta]
- SEC EDGAR - EDGAR, o sistema eletrônico de coleta, análise e recuperação de dados, é o [...] [Meta]
- Federal de São Luís [Meta]
- Yahoo Finanças [Meta]
SIG
- Impressionantes modelos de cidades semânticas em 3D - Coleção de modelos abertos de cidades e regiões semânticas em 3D. [Meta]
- Portal de dados abertos ArcGIS [Meta]
- Cambridge, MA, EUA, dados GIS no GitHub [Meta]
- Base de dados de todos os continentes, países, Estados/Subdivisões/Províncias e Cidades - Base de dados [...] [Meta]
- Dados factuais de localização global [Meta]
- Site DASE da Sociedade de Geociências e Sensoriamento Remoto do IEEE [Meta]
- Mapas geográficos - mapas GeoJSON de alta qualidade gerados programaticamente [Meta]
- Dados geoespaciais da ASU [Meta]
- Projeto Geo Wiki - Monitoramento Ambiental Cidadão [Meta]
- GeoFabrik - Dados OSM extraídos para uma variedade de formatos e áreas [Meta]
- GeoNames em todo o mundo [Meta]
- Banco de Dados de Áreas Administrativas Globais (GADM) - Dados geoespaciais organizados por país. Inclui [...] [Meta]
- Dados de nível básico de infraestrutura interna [Meta]
- Landsat 8 na AWS [Meta]
- Lista de todos os países em todos os idiomas [Meta]
- Portal de dados GIS do Serviço Meteorológico Nacional [Meta]
- Terra Natural - vetores e rasters do mundo [Meta]
- Endereços abertos [Meta]
- OpenStreetMap (OSM) [Meta]
- Plêiades - Diário e gráfico de lugares antigos [Meta]
- Geocodificador reverso usando dados OSM [Meta]
- Robin Wilson - Conjuntos de dados GIS gratuitos [Meta]
- Mapas de acumulação de sombra - O repositório contém as informações de sombra acumuladas para Nova York [...] [Meta]
- TIGER/Line - fronteiras e estradas dos EUA [Meta]
- Shapefile de fusos horários TZ [Meta]
- TwoFishes - geocodificador grosseiro do Foursquare [Meta]
- Dados Ambientais da ONU [Meta]
- Limites mundiais do Departamento de Estado dos EUA [Meta]
- Países do mundo em vários formatos [Meta]
Governo
- Alberta, Província do Canadá [Meta]
- Antuérpia, Bélgica [Meta]
- Argentina (não oficial) [Meta]
- Dados Argentina - Portal de dados abertos da República Argentina. Encontrar dados públicos [...] [Meta]
- Austin, Texas, EUA [Meta]
- Austrália (abs.gov.au) [Meta]
- Austrália (data.gov.au) [Meta]
- Áustria (data.gv.at) [Meta]
- Baton Rouge, Los Angeles, EUA [Meta]
- Beersheba, Israel - Portal de dados abertos (Smart7 OpenData) [Meta]
- Bélgica [Meta]
- Dados abertos da cidade de Berkeley [Meta]
- Brasil [Meta]
- Buenos Aires, Argentina [Meta]
- Calgary, AB, Canadá [Meta]
- Cambridge, MA, EUA [Meta]
- Canadá [Meta]
- Chicago [meta]
- Chile [Meta]
- China [meta]
- Dados abertos de Dallas [Meta]
- DataBC - dados da Província da Colúmbia Britânica [Meta]
- Debt to the Penny - O conjunto de dados Debt to the Penny fornece informações sobre o total [...] [Meta]
- Dados abertos de Denver [Meta]
- Dados abertos de Durham, NC [Meta]
- Edmonton, AB, Canadá [Meta]
- Inglaterra LGInform [Meta]
- EuroStat [Meta]
- EveryPolitician - Projeto em andamento de coleta e compartilhamento de dados sobre todos os políticos. [Meta]
- Comitê Federal de Metodologia Estatística (FCSM) (anteriormente FedStats) [Meta]
- Finlândia [Meta]
- França [Meta]
- Fredericton, NB, Canadá [Meta]
- Gatineau, QC, Canadá [Meta]
- Alemanha [Meta]
- Gante, Bélgica [Meta]
- Glasgow, Escócia, Reino Unido [Meta]
- Grécia [Meta]
- Governos mundiais guardiões [Meta]
- Halifax, NS, Canadá [Meta]
- Região de Helsinque, Finlândia [Meta]
- Hong Kong, China [Meta]
- Houston, Texas, EUA [Meta]
- Dados do governo indiano [Meta]
- Portal de dados indonésio [Meta]
- Iowa – Bem-vindo ao portal de dados do estado de Iowa. Por favor, explore dados sobre Iowa e seu [...] [Meta]
- Portal de dados abertos da Irlanda [Meta]
- Portal de dados abertos de Israel [Meta]
- Portal de dados abertos do município de Istambul [Meta]
- Itália - Il Portale dati.gov.it è il catalogo nazionale dei metadati relativi ai dati [...] [Meta]
- Mortes em prisões na América - O governo dos EUA não divulga dados de mortalidade prisão por prisão, [...] [Meta]
- Japão [Meta]
- Laval, QC, Canadá [Meta]
- Lexington, Kentucky [Meta]
- Datastore de Londres, Reino Unido [Meta]
- Londres, ON, Canadá [Meta]
- Dados abertos de Los Angeles [Meta]
- Luxemburgo - Portal Luxemburguês de Dados Abertos [Meta]
- MassGIS, Massachusetts, EUA [Meta]
- Comissão Metropolitana de Transporte (MTC), Califórnia, EUA [Meta]
- México [Meta]
- Mississauga, ON, Canadá [Meta]
- Moldávia [Meta]
- Moncton, NB, Canadá [Meta]
- Montreal, QC, Canadá [Meta]
- Mountain View, Califórnia, EUA (GIS) [Meta]
- Dados abertos de Nova York [Meta]
- Betânia de Nova York [Meta]
- Holanda [Meta]
- Tonelagem mensal do Departamento de Saneamento de Nova York - Os dados mensais de tonelagem do DSNY fornecem [...] [Meta]
- Nova Zelândia [Meta]
- OCDE [Meta]
- Oakland, Califórnia, EUA [Meta]
- Oklahoma [Meta]
- Dados Abertos para África [Meta]
- Plataforma de dados governamentais abertos (OGD) Índia [Meta]
- Lista de 1.600 dados abertos da OpenDataSoft [Meta]
- Oregon [Meta]
- Ottawa, ON, Canadá [Meta]
- Palo Alto, Califórnia, EUA [Meta]
- OpenDataPhilly - OpenDataPhilly é um catálogo de dados abertos na região da Filadélfia. Em [...] [Meta]
- Portland, Oregon [Meta]
- Portugal - Organização Pordata [Meta]
- Governo de Porto Rico [Meta]
- Cidade de Quebec, QC, Canadá [Meta]
- Província de Quebec do Canadá [Meta]
- Regina SK, Canadá [Meta]
- Rio de Janeiro, Brasil [Meta]
- Romênia [Meta]
- Rússia [Meta]
- San Diego, Califórnia [Meta]
- San Antonio, TX - Community Information Now - CI:Now é uma organização sem fins lucrativos que atende Bexar (San [...] [Meta]
- Conjuntos de dados de São Francisco [Meta]
- San Jose, Califórnia, EUA [Meta]
- Condado de San Mateo, Califórnia, EUA [Meta]
- Saskatchewan, Província do Canadá [Meta]
- Seattle [Meta]
- Dados do governo de Singapura [Meta]
- Estatísticas comerciais da África do Sul [Meta]
- África do Sul [Meta]
- Estado de Utah, EUA [Meta]
- Suíça [Meta]
- Governo de Taiwan [Meta]
- Taiwan [Meta]
- Dados abertos de Tel-Aviv [Meta]
- Dados abertos do Texas [Meta]
- O Banco Mundial [Meta]
- Toronto, ON, Canadá [Meta]
- Tunísia [Meta]
- Dados do governo do Reino Unido [Meta]
- Pesquisa da comunidade americana dos EUA [Meta]
- Conjuntos de dados de saúde pública do CDC dos EUA [Meta]
- Escritório do Censo dos EUA [Meta]
- Departamento de Habitação e Desenvolvimento Urbano dos EUA (HUD) [Meta]
- Agências do Governo Federal dos EUA [Meta]
- Catálogo de dados do governo federal dos EUA [Meta]
- Administração de Alimentos e Medicamentos dos EUA (FDA) [Meta]
- Centro Nacional de Estatísticas Educacionais dos EUA (NCES) [Meta]
- Governo Aberto dos EUA [Meta]
- Projeto Atlas Aberto do Censo do Reino Unido 2011 [Meta]
- Condados dos EUA - Este é um repositório de vários dados, divididos por condado dos EUA. Embora a maior parte de [...] [Meta]
- Produtos de dados em massa do Escritório de Marcas e Patentes dos EUA (USPTO) [Meta]
- Departamento de Estatísticas de Uganda [Meta]
- Ucrânia [Meta]
- Nações Unidas [Meta]
- Uruguai [Meta]
- Valley Transportation Authority (VTA), Califórnia, EUA [Meta]
- Catálogo de dados abertos de Vancouver, BC [Meta]
- Victoria, BC, Canadá [Meta]
- Viena, Áustria [Meta]
- Estatísticas do Escritório Geral de Estatísticas do Vietnã - Dados em diferentes categorias são [...] [Meta]
- Relatórios do Serviço de Pesquisa do Congresso dos EUA (CRS) [Meta]
Assistência médica
- Conjuntos de dados AWS COVID-19 - Estamos trabalhando com organizações que produzem dados relacionados ao COVID-19 [...] [Meta]
- Dados de uso público de vigilância de casos COVID-19 - O banco de dados do sistema de vigilância de casos COVID-19 [...] [Meta]
- Dados não processados da Covid-19 do Equador - É um projeto que fornece conjuntos de dados não processados [...] [Meta]
- Repositório de dados do novo Coronavirus COVID-19 de 2019 por Johns Hopkins CSSE - Estes são os dados [...] [Meta]
- Dados do Coronavírus (Covid-19) nos Estados Unidos - O New York Times está lançando uma série [...] [Meta]
- Impacto relatado do COVID-19 no paciente e capacidade hospitalar por instalação - O seguinte conjunto de dados [...] [Meta]
- Composição de alimentos crus, processados e preparados Banco de dados nacional de nutrientes do USDA para padrão [...] [Meta]
- The COVID Tracking Project - O COVID Tracking Project coleta e publica a maioria [...] [Meta]
- Grandes conjuntos de dados de saúde EHDP [Meta]
- GDC - GDC apoia vários programas de genoma do câncer para CCG, TCGA, TARGET etc.
- Bancos de dados demográficos mundiais do Gapminder [Meta]
- MeSH, o dicionário de sinônimos de vocabulário usado para indexar artigos no PubMed [Meta]
- MeDAL - Um grande conjunto de dados de textos médicos com curadoria para desambiguação de abreviaturas - Médico [...] [Meta]
- Banco de dados de cobertura do Medicare (MCD), EUA [Meta]
- Mecanismo de dados do Medicare de dados do medicare.gov [Meta]
- Arquivo de dados do Medicare [Meta]
- Ciência Aberta Nightingale [Meta]
- Número de casos e mortes de Ebola nos países afetados (2014) [Meta]
- Open-ODS (estrutura do NHS do Reino Unido) [Meta]
- OpenPaymentsData, dados de relacionamento financeiro de saúde [Meta]
- Bancos de dados PhysioBank - Um arquivo grande e crescente de dados fisiológicos. [Meta]
- Arquivo de imagens do câncer (TCIA) [Meta]
- O projeto Atlas do Genoma do Câncer (TCGA) [Meta]
- Observatório de Saúde Global da Organização Mundial da Saúde [Meta]
- Conjuntos de dados COVID-19 do Yahoo Knowledge Graph - A equipe do Yahoo Knowledge Graph da Verizon Media está [...] [Meta]
- Informática para Integração da Biologia e da cabeceira [Meta]
Processamento de imagens
- Banco de dados de 10 mil rostos adultos dos EUA [Meta]
- 2 GB de fotos de gatos [Meta]
- Público-alvo Rostos não filtrados para classificação de gênero e idade [Meta]
- Classificação de imagens afetivas [Meta]
- Detecção e rastreamento de objetos aerotransportados - O conjunto de dados Airborne Object Tracking (AOT) é um [...] [Meta]
- Animais com atributos [Meta]
- Conjunto de dados CADDY Underwater Stereo-Vision de gestos manuais de mergulhadores - Contém par estéreo de 10K [...] [Meta]
- Conjunto de dados de citologia - CCAgT: Imagens de células cervicais com técnica de coloração AgNOR - Contém 9339 [...] [Meta]
- Referência de detecção de pedestres da Caltech [Meta]
- Conjunto de dados Chars74K - Reconhecimento de caracteres em imagens naturais (estão disponíveis em inglês e Kannada) [Meta]
- Cube++ - 4890 imagens brutas de 18 megapixels, cada uma contendo um alvo colorido SpyderCube em seu [...] [Meta]
- Conjunto de dados de condução de vídeo densamente anotado - Este conjunto de dados consiste em 28 sequências de vídeo de [...] [Meta]
- Danbooru Tagged Anime Illustration Dataset - Um banco de dados de imagens de anime em grande escala com mais de 3,33 milhões [...] [Meta]
- Conjunto de dados DukeMTMC - DukeMTMC visa acelerar avanços em multi-alvo e multicâmera [...] [Meta]
- Coleção Entomológica ETH (ETHEC) Imagens de borboleta de granulação fina (Lepidoptra) [Meta]
- Referência de reconhecimento facial [Meta]
- Flickr: logotipos de marcas de 32 classes [Meta]
- GDXray - Imagens de raios X para testes de raios X e visão computacional [Meta]
- Conjunto de dados HumanEva - O conjunto de dados HumanEva-I contém 7 sequências de vídeo calibradas (4 em tons de cinza [...] [Meta]
- ImageNet (na hierarquia WordNet) [Meta]
- Reconhecimento de cena interna [Meta]
- Sistema Internacional de Imagens Afetivas, UFL [Meta]
- Suíte de referência KITTI Vision [Meta]
- Biblioteca de informações rotuladas de Alexandria - Biologia e Conservação - Contém mais de 10 [...] [Meta]
- Banco de dados MNIST de dígitos manuscritos, perto de 1 milhão de exemplos [Meta]
- Conjunto de dados de previsão de região de interesse de visualização múltipla para direção autônoma - contém 16 direções [...] [Meta]
- Estímulos massivos de memória visual, MIT [Meta]
- Newspaper Navigator - Este conjunto de dados consiste em conteúdo visual extraído de 16.358.041 [...] [Meta]
- Open Images From Google - Imagens com máscaras de segmentação para 2,8 milhões de instâncias de objetos [...] [Meta]
- RuFa - Contém imagens de texto escrito em uma das duas fontes árabes (Ruqaa e Nastaliq [...] [Meta]
- Banco de dados SUN, MIT [Meta]
- Ocupação do assento traseiro do interior do veículo sintético SVIRO - 25.000 cenários sintéticos em dez [...] [Meta]
- Vários conjuntos de dados Shape-from-Silhouette [Meta]
- Conjunto de dados de cães de Stanford [Meta]
- O desafio da rotulagem de similaridade de ações (ASLAN) [Meta]
- Conjunto de dados de animais de estimação Oxford-IIIT [Meta]
- Violent-Flows - Banco de dados de violência/não-violência de multidões e benchmark [Meta]
- Genoma visual [Meta]
- Banco de dados de rostos do YouTube [Meta]
Aprendizado de máquina
- Conjunto de dados All-Age-Faces - Contém 13.322 imagens de rostos asiáticos distribuídas em todas as idades (de 2 [...] [Meta]
- Audi Autonomous Driving Dataset - Publicamos o Audi Autonomous Driving Dataset [...] [Meta]
- B3FD - Conjunto de dados de estimativa de idade facial (e gênero) com 375 mil imagens - O conjunto de dados B3FD é um [...] [Meta]
- Conjuntos de dados sensíveis ao contexto de cinco domínios [Meta]
- Delve Datasets para classificação e regressão [Meta]
- Dados mensais do Discogs [Meta]
- Células Neuronais Fluorescentes - Ao lançar este conjunto de dados, pretendemos fornecer um novo ambiente de teste para [...] [Meta]
- Arquivo de música grátis [Meta]
- Banco de dados IMDb [Meta]
- Iranis - Um conjunto de dados em grande escala de caracteres de placas de veículos farsi/árabe [Meta]
- Repositório Keel para classificação, regressão e séries temporais [Meta]
- LLVIP - Este conjunto de dados contém 30.976 imagens, ou 15.488 pares, a maioria das quais foram tiradas em muito [...] [Meta]
- Rostos rotulados na natureza (LFW) [Meta]
- Dados de empréstimo do clube de empréstimo [Meta]
- Repositório de conjuntos de dados de aprendizado de máquina [Meta]
- Conjunto de dados de um milhão de músicas [Meta]
- Mais conjuntos de dados de músicas [Meta]
- Conjuntos de dados MovieLens [Meta]
- Classificações do concurso de legendas da New Yorker [Meta]
- RDataMining - dados do e-book "R e mineração de dados" [Meta]
- Meteoritos registrados na Terra [Meta]
- Dados de pontuação de saúde de restaurantes em São Francisco [Meta]
- Conjunto de dados TikTok - Mais de 300 vídeos de dança que capturam uma única pessoa dançando [...] [Meta]
- Repositório de aprendizado de máquina UCI [Meta]
- Yahoo! Avaliações e dados de classificação [Meta]
- Caixas delimitadoras do YouTube [Meta]
- Youtube 8m [Meta]
- Leilões online do eBay (2012) [Meta]
Museus
- Dados abertos da Canada Science and Technology Museums Corporation [Meta]
- Banco de dados de coleção da Cooper-Hewitt [Meta]
- API da coleção do Museu Metropolitano de Arte [Meta]
- Metadados do Instituto de Artes de Minneapolis [Meta]
- Portal de dados do Museu de História Natural (Londres) [Meta]
- Coleção de Arte Histórica do Rijksmuseum [Meta]
- Metadados da Coleção Tate [Meta]
- Os vocabulários Getty [Meta]
Linguagem Natural
- Extração automática de frase-chave [Meta]
- O grande banco de dados de PNL ruim [Meta]
- Discurso do Desafio da Blizzard - Os dados de fala + texto vêm de audiolivros profissionais [...] [Meta]
- Corpus do Blogger [Meta]
- Corpus de investigação de estilometria CLIPS [Meta]
- ClueWeb09 FACC [Meta]
- ClueWeb12 FACC [Meta]
- DBpedia - Dados estruturados da Wikipedia [Meta]
- Dirty Words - Com milhões de imagens em nossa biblioteca e bilhões de palavras-chave enviadas por usuários, [...] [Meta]
- Taxonomias pessoais do Flickr [Meta]
- Base livre de pessoas, lugares e coisas [Meta]
- Corpus de discursos políticos alemães - Coleção de discursos políticos do alemão [...] [Meta]
- Ngrams do Google Livros (2,2 TB) [Meta]
- Google MC-AFP - gerado com base no conjunto de dados Gigaword disponível ao público usando vetores de parágrafo [Meta]
- Google Web 5 gramas (1 TB, 2006) [Meta]
- Lista de e-books de Gutenberg [Meta]
- Pedaços de texto de Hansards do Parlamento Canadense [Meta]
- LJ Speech - Conjunto de dados de fala que consiste em 13.100 clipes de áudio curtos da leitura de um único locutor [...] [Meta]
- Fala M-AILabs - O conjunto de dados de fala M-AILABS é o primeiro grande conjunto de dados que estamos [...] [Meta]
- Conjunto de dados de compreensão de leitura do Microsoft MAchine (ou MS MARCO) [Meta]
- Teste de compreensão de máquina (MCTest) de texto da Microsoft Research [Meta]
- Tradução automática de línguas europeias [Meta]
- Fazendo sentido dos microposts 2013 - Extração de conceito [Meta]
- Fazendo sentido dos Microposts 2016 - Reconhecimento e vinculação de entidades nomeadas [Meta]
- Conjunto de dados de sentimento multidomínio (versão 2.0) [Meta]
- No Language Left Behind (NLLB - 200vo) - Conjunto de dados baseado nos metadados do Meta para bitexto extraído. [...] [meta]
- Banco de dados de fala ruidosa para treinamento de algoritmos de aprimoramento de fala e modelos TTS - Limpo e [...] [Meta]
- Abra Wordnet multilíngue [Meta]
- Dados anotados POS/NER/Chunk [Meta]
- Personae Corpus [Meta]
- Coleta de spam de SMS em inglês [Meta]
- Coleção SaudiNewsNet de artigos de jornais sauditas (árabe, 30 mil artigos) [Meta]
- Conjunto de dados de resposta a perguntas de Stanford (SQuAD) [Meta]
- Corpus de postagens da USENET de 2005 a 2011 [Meta]
- Dependências Universais [Meta]
- Webhose - Notícias/Blogs em vários idiomas [Meta]
- Wikidata - bancos de dados da Wikipédia [Meta]
- Dados de links da Wikipedia - 40 milhões de entidades em contexto [Meta]
- Bancos de dados e ferramentas WordNet [Meta]
- Wordbank - Banco de dados aberto e desidentificado de desenvolvimento de vocabulário de 84.138 crianças e [...] [Meta]
- WorldTree Corpus de gráficos explicativos para questões de ciências elementares - um corpus de [...] [Meta]
Neurociência
- Conjuntos de dados do Allen Institute [Meta]
- Catálogo de Cérebros [Meta]
- Brainômica [Meta]
- Conjuntos de dados CodeNeuro [Meta]
- Pesquisa Colaborativa em Neurociência Computacional (CRCNS) [Meta]
- FCP-INDI [Meta]
- Projeto Conectoma Humano [Meta]
- NDAR [Meta]
- Arquivo de dados NIMH [Meta]
- NeuroDados [Meta]
- NeuroMorpho - NeuroMorpho.Org é um inventário com curadoria central de reconstruídos digitalmente [...] [Meta]
- Neuroeletro [Meta]
- OÁSIS [Meta]
- OpenNEURO [Meta]
- OpenfMRI [Meta]
- Estude Floresta [Meta]
- O conjunto de dados de NENCKI-SYMFONIA EEG/ERP-um conjunto de dados eletroencefalografia de alta densidade (EEG) [...] [meta]
Física
- Portal de dados abertos do CERN [meta]
- Banco de dados aberto de cristalografia [meta]
- Icecube - Observatório de Neutrinos do Pólo Sul [Meta]
- LIGO Open Science Center (LOSC) - Dados de ondas gravitacionais do Ligo Hanford e [...] [Meta]
- NASA EXOLAnet Archive [Meta]
- Dados NSSDC (NASA) de 550 espaçonave espacial [meta]
- Simulações quânticas de um elétron em um poço bidimensional - os dados eram [...] [meta]
- Sloan Digital Sky Survey (SDSS) - Mapeando o universo [meta]
ProstatateCancer
- EOPC-De-Orely-Oset-Prostate-Câncer-Alemanha-Câncer de Próstata de início precoce-Alemanha. [...] [Meta]
- Genie - Dados do projeto Genomics Evidence Neoplasia Information Exchange (Genie) do [...] [meta]
- Hallmarks-prostato-adenocarcinoma-cpc-gene-perfil genômico abrangente de 477 [...] [meta]
- MSK-IMPACT-CLINICAL-SEMENTO-COHORT-MSKCC-PROSTESTE-CANCER-Sequenciação direcionada de clínica [...] [Meta]
- Metastatic-Prostate-Adenocarcinoma-MCTP-Perfil abrangente de 61 câncer de próstata [...] [Meta]
- Metastatic-Prostate-Câncer-Su2CPCF-Dream-Team-Análise abrangente de 150 metastáticos [...] [Meta]
- NPCR-2001-2015-Banco de dados do Programa Nacional de Registros de Câncer do CDC (NPCR). O [...] [meta]
- NPCR-2005-2015-Banco de dados do Programa Nacional de Registros de Câncer do CDC (NPCR). O [...] [meta]
- NAF-PROSTATE-NAF A próstata é uma coleção de tomografia por emissão de pósitrons F-18 de NAF/calculado [...] [meta]
- Câncer Neuroendócrino-Exome inteiro e Dados de RNA seq de castração resistentes [...] [Meta]
- PROCEDUROS PLCO-PROSTATE-DIAGNOSTIC-PROCEDUROS-O conjunto de dados de procedimentos de diagnóstico da próstata (95.837 [...] [meta]
- Complicações-Médicas-Prostate-Prostate-O conjunto de dados de complicações médicas da próstata (3.350 [...] [meta]
- PLCO-PROSTATE-SCREENING-ABNOMALIDADES-O conjunto de dados de anormalidades de triagem da próstata (10.527 [...] [meta]
- PLCO-Prostate-screening-o conjunto de dados de triagem da próstata (177.315 registros, 35.875 sujeitos, [...] [meta]
- PLCO-PROSTATE-TRATAMENTOS-O conjunto de dados de tratamentos de próstata (13.409 registros, 7.614 sujeitos, [...] [meta]
- PLCO -PROSTATE - O conjunto de dados da próstata é um conjunto de dados abrangente que contém quase todos os [...] [meta]
- Prad-CA-Prostate-Adenocarcinoma-Canadá-adenocarcinoma da próstata-Canadá. Coletado pelo [...] [meta]
- Prad-FR-Prostate-Adenocarcinoma-France-Próstata Adenocarcinoma-França. Coletado por dez [...] [meta]
- Prad-uk-prostato-adenocarcinoma-rei unido-adenocarcinoma da próstata-Reino Unido. [...] [Meta]
- Prostatex -Challening - Conjunto retrospectivo de estudos de RM de próstata. Todos os estudos incluíram [...] [meta]
- Prostate-3T-O Projeto Prostate-3T forneceu dados de imagem para o TCIA como parte de um ISBI [...] [meta]
- Próstata-adenocarcinoma-Broad-Cornell-2012-Perfil abrangente de 112 câncer de próstata [...] [Meta]
- Próstata-Adenocarcinoma-Broad-Cornell-2013-Perfil abrangente de 57 câncer de próstata [...] [Meta]
- Prostate-Adenocarcinoma-CNA-Study-MSKCC-Perfil de número de cópias de 103 próstata primária [...] [Meta]
- Próstata-Adenocarcinoma-Fred-Hutchinson-CRC-Perfil abrangente do câncer de próstata [...] [Meta]
- Adenocarcinoma da próstata (MSKCC/DFCI) - Sequenciamento de exoma inteiro de 1013 amostras de câncer de próstata. [Meta]
- Próstata-Adenocarcinoma-MSKCC-Projeto MSKCC Prostate Oncogenome. 181 Primário, 37 metastático [...] [Meta]
- Próstata-Adenocarcinoma-Organóides-MSKCC-Profil de Exoma de amostras de câncer de próstata e [...] [Meta]
- Prostata-Adenocarcinoma-Sun-Lab-Genome inteiro e sequenciamento de transcriptoma de 65 próstata [...] [Meta]
- Próstata-adenocarcinoma-tcga-pancan-atlas-Dados abrangentes do TCGA Pancanatlas de 11k [...] [meta]
- Próstata-Adenocarcinoma-TCGA-Perfil integrado de 333 amostras de adenocarcinoma da próstata primária. [Meta]
- O diagnóstico da próstata- imagens de ressonância magnética ponderadas por PCA e T2 (ressonância magnética) foram adquiridas [...] [meta]
- A coleção de patologia de mRI-ri-patologia da próstata-a próstata é uma combinação [...] [meta]
- Prostate-MRI-A coleção de imagens de ressonância magnética da próstata-MRI (MRIs) foi [...] [meta]
- Prostate -R - O pacote R 'elemstatlearn' contém um conjunto de dados de câncer de próstata de Stamey et [...] [meta]
- Qin-prostate-repeatabilidade-O conjunto de dados de repetibilidade de prostato Qin é um conjunto de dados com [...] [meta]
- Qin -Prostate - A coleção de próstata Qin da Rede de Imagem Quantitativa (QIN) contém [...] [meta]
- SEER -IND1973_2015.SEER9 - O SEER novembro de 2017 Arquivos de dados de pesquisa de nove registros de vidente [...] [Meta]
- SEER-ARI1992_2015.SJ_LA_RG_AK- O SEER novembro de 2017 Pesquisa Arquivos de dados do San Jose- [...] [Meta]
- SEER -IRL2000_2015.CA_KY_LO_NJ_GA - O SEER novembro de 2017 Pesquisa Arquivos de dados do maior [...] [Meta]
- SEER -IRL2000_2015.CA_KY_LO_NJ_GA - O julho a dezembro de 2005 diagnostose para a Louisiana a partir de [...] [meta]
- TCGA-PRAD-US-adenocarcinoma da próstata TCGA (499 amostras). [Meta]
Psicologia+cognição
- Conjuntos de dados de repositório de modelagem cognitiva da OSU [meta]
- Dados de ciência cognitiva aberta - conjuntos de dados comportamentais disponíveis ao público de todo o cognitivo [...] [meta]
Publicdomains
- Dados de tempo real habilmente abertos [meta]
- Amazon [meta]
- Conjuntos de dados do Archive.org [meta]
- Arquivo-it do Internet Archive [meta]
- Arquivo de dados CMU Jasa [Meta]
- Coleções CMU Statlab [meta]
- Data.world [meta]
- Data360 [Meta]
- Enigma público [meta]
- Google [meta]
- Grand Comics Database - O Grand Comics Database (GCD) é uma organização sem fins lucrativos, baseada na Internet [...] [meta]
- Infochimps [Meta]
- Coleções de dados Kdnuggets [Meta]
- DataSets gratuitos do mercado de dados do Microsoft Azure [Meta]
- Microsoft Data Science for Research [Meta]
- Microsoft Research Open Data [Meta]
- Abra os dumps de dados da biblioteca [meta]
- DataSets de Reddit [Meta]
- Coleção RevolutionAnalytics [Meta]
- Amostra r conjuntos de dados [meta]
- Pesquisa anual de desenvolvedores do Stack Overflow - Desenvolvedor anual Surverys Completos conjuntos de dados de 2011 [...] [Meta]
- Statsci.org [meta]
- STATS4STEM R Conjuntos de dados (arquivados) [Meta]
- A Lista de Post Washington [Meta]
- Coleção de dados da UCLA SOCR [meta]
- Relatórios de OVNI [meta]
- WikiLeaks 911 pager intercepta [meta]
- Yahoo Webscope [meta]
SearchNgines
- Torrentes acadêmicos de compartilhamento de dados da UMB [meta]
- Base Dos Dados - Base de dados: Repositório de dados aberto para o Brasil [Meta]
- Datahub.io [meta]
- Projeto Domínios - Lista classificada de domínios da Internet [Meta]
- Rede de dados científicos do Harvard DataSverse [Meta]
- ICPSR (Umich) [Meta]
- Instituto de Ciências da Educação [Meta]
- Biblioteca Nacional de Relatórios Técnicos [Meta]
- Certificados de dados abertos (beta) [Meta]
- Opendatanetwork - um mecanismo de pesquisa de todos os portais de dados alimentados por Socrata [meta]
- Statista.com - Estatísticas e estudos [meta]
- Zenodo - uma casa aberta confiável para a cauda longa da ciência [meta]
SocialNetworks
- 2021 Eleições portuguesas do Twitter DataSet - 57m+ tweets, 1m+ usuários - Este conjunto de dados contém [...] [meta]
- 72 horas #gamergate twitter scrape [meta]
- Email da CMU Enron de 150 usuários [meta]
- Cheng-caverlee-Lee setembro de 2009-janeiro de 2010 Scrape Twitter [Meta]
- Banco de dados biográfico da China - O banco de dados biográfico da China é um [...] [...] [meta] gratuitamente [...]
- Conjunto de dados do clube [meta]
- Um conjunto de dados do Twitter de mais de 40 milhões de tweets relacionados ao Covid -19 - devido à relevância do [...] [meta]
- 43K+ Donald Trump Twitter Twitter Screenshots - Este arquivo contém capturas de tela de 43.475 Donald [...] [Meta]
- Email da EDRM Enron de 151 usuários, hospedado no S3 [meta]
- Data Scrape (2005) do Facebook [Meta]
- Índice de Connectação Social do Facebook - Usamos um instantâneo anônimo de todo o Facebook ativo [...] [Meta]
- Redes sociais do Facebook da Law (desde 2007) [Meta]
- Foursquare de UMN/Sarwat (2013) [Meta]
- Arquivo de colaboração do Github [meta]
- Google Scholar Citation Relações [Meta]
- Redes de contato de alta resolução de sensores vestíveis [meta]
- Mapa indie: gráfico social e rastreamento dos sites Indieweb [meta] [meta]
- Redes sociais móveis da UMass [meta]
- Dados do Twitter de rede [meta]
- Comentários do Reddit [Meta]
- Skytrax 'Air Travel Reviews DataSet [Meta]
- Dados sociais do Twitter [meta]
- Dados de pesquisa da fonte deforgem.NET [meta]
- O conjunto de dados do Reddit CoVID - este conjunto de dados tenta capturar toda a extensão do CoVID -19 [...] [meta]
- Dados do strelfrear Twitch Top [meta]
- Dados do Twitter para gerenciamento de reputação on -line [meta]
- Dados do Twitter para análise de sentimentos [meta]
- Gráfico do Twitter de todo o site do Twitter [meta]
- Twitter Scrape Calufa maio de 2011 [Meta]
- Conjuntos de dados de redes sociais da Unimi/Law [meta]
- Dados do Twitter do Congresso dos Estados Unidos - conjuntos de dados diários com tweets de mais de 1100 contas associadas [...] [meta]
- Yahoo! Gráfico e dados sociais [meta]
- Gráfico social de vídeo do YouTube em 2007,2008 [Meta]
Socialsciences
- Acled (Localização de conflito armado e projeto de dados de eventos) [Meta]
- Banco de dados de elites de decisão autoritária - O banco de dados de elites da decisão autoritária (ARED) é um [...] [meta]
- Instituto de Informação Jurídica Canadense [Meta]
- Centro de conjuntos de dados sistêmicos de paz - tendências de conflito, políticas, fragilidade do estado, etc [meta]
- Projeto Correlates of War [Meta]
- Itens da teoria da conspiração criptômica [meta]
- Datacards [meta]
- Pesquisa Social Europeia [Meta]
- FBI Hate Crime 2013 - Dados agregados [meta]
- Índice de estados frágeis [meta]
- Banco de dados de eventos globais do GDELT [meta]
- Pesquisa Social Geral (GSS) Desde 1972 [Meta]
- Pesquisa Social Alemã [Meta]
- Projeto global de futuros religiosos [meta]
- Dados de violência armada - um banco de dados abrangente e acessível que contém registros de mais de 260k [...] [meta]
- Troca de dados humanitários [Meta]
- Informar Índice para Gerenciamento de Riscos [Meta]
- Instituto de Estudos Demográficos [Meta]
- Dados abertos do Banco de Desenvolvimento Interamericano [Meta]
- Arquivo de Redes Internacionais [Meta]
- Programa Internacional de Pesquisa Social ISSP [Meta]
- Projeto de Compêndio de Estudos Internacionais [Meta]
- James McGuire Cross National Data [Meta]
- MIT Reality Mining DataSet [Meta]
- Guia de Macrodata por Norsk Samfunnsvitenskapelig Datatjeneste [Meta]
- Projeto de dados de mobilização em massa - Os dados de mobilização em massa (MM) são um esforço para entender [...] [meta]
- Gráfico de conhecimento acadêmico da Microsoft - O gráfico de conhecimento acadêmico da Microsoft é um grande RDF [...] [meta]
- Minnesota Population Center [Meta]
- Notre Dame Global Adapation Index (ND-GAIN) [Meta]
- Dados de crime e policiamento aberto na Inglaterra, País de Gales e Irlanda do Norte [Meta]
- OpenSanctions - um banco de dados global de pessoas e empresas de político, criminoso ou [...] [meta]
- Paul Hensel General International Data Page [Meta]
- Projeto de pesquisa da Internet Pewresearch [Meta]
- Coleção de dados da Pewresearch Society [Meta]
- Dados de polaridade política [meta]
- StackexChange Data Explorer [Meta]
- Consórcio de Pesquisa e Análise do Terrorismo [Meta]
- Internos do Texas executados desde 1984 [Meta]
- Conjunto de dados de sobrevivência do Titanic [Meta]
- O Arquivo de Dados de Ciências Sociais da UCB (D-LAB) [Meta]
- UCLA Social Sciences Data Archive [meta]
- Banco de dados da sociedade civil da ONU [meta]
- Upjohn para pesquisa de emprego trabalhista [meta]
- Universidades em todo o mundo [Meta]
- Programa de dados de conflito Uppsala [Meta]
- Dados abertos do Banco Mundial [Meta]
- Banco de Dados de Desigualdade Mundial - O banco de dados de desigualdade mundial (wid.world) tem como objetivo fornecer aberto [...] [meta]
- Projeto Worldpop - Distribuições Mundiais da População Humana [Meta]
Programas
- Dados do Flossmole sobre o desenvolvimento de software gratuito, Libre e de código aberto [Meta]
- GHTORRENT - Espelho escalável, consultável e offline dos dados oferecidos através da API REST GITHUB. [Meta]
- Libraries.io Repositório de código aberto e metadados de dependência [Meta]
- Public Git Archive - Um grande conjunto de dados de código para todos - conjunto de dados de 182.014 GIT de livros mais importantes [...] [meta]
- Duplicatas de código - arquivo Java 2K e 600 pares de funções Java rotulados como semelhantes ou diferentes por [...] [meta]
- Mensagens de comprometimento - 1,3 bilhão de github cometem mensagens até março de 2019 [Meta]
- Comentários de revisão da solicitação de puxar - 25,3 milhões de comentários de revisão do Github PR desde janeiro de 2015 até [...] [Meta]
- Identificadores de código -fonte - 41,7 milhões de identificadores dividíveis distintos coletados de 182.014 [...] [meta]
Esportes
- Obstáculos guerreiros ninjas americanos - contém todos os obstáculos da história do ninja americano [...] [meta]
- Betfair Historical Exchange Data [Meta]
- CRICSHEET MACHES (CRICKET) [Meta]
- Equidade no atletismo - A ferramenta de corte de análise de dados de atletismo é trazida a você por [...] [Meta]
- Ergast Fórmula 1, de 1950 atualizada (API) [Meta]
- Recursos de futebol/futebol (dados e APIs) [Meta]
- Banco de dados de beisebol de Lahman [Meta]
- Dados de reprodução por peça da NFL-dados de reprodução por peça da NFL provenientes de: [...] [meta]
- Pinhooker: Dados de venda de sangue de sangue puro -sangue [Meta]
- PRO KABADI Temporada 1 a 7 - A Pro Kabadi League é uma Liga Kabaddi de nível profissional na Índia. [...] [Meta]
- Estatísticas de beisebol retroscutas [meta]
- Banco de dados de tênis de classificação, resultados e estatísticas para ATP [meta]
- Banco de dados de tênis de classificação, resultados e estatísticas para WTA [meta]
- Dados transferidos de Dados de futebol limpos, estruturados e atualizados automaticamente (futebol) [...] [meta]
- Equipes e locais de futebol dos EUA - equipes e locais de futebol dos EUA. MLS, NWSL e USL [...] [meta]
Timesseries
- DataSet 3W - Para o melhor conhecimento de seus autores, este é o primeiro realista e público [...] [meta]
- Databanks International Cross National Time Series Archive [Meta]
- Taxas de falha no disco rígido [meta]
- Série temporal da frequência cardíaca do MIT [meta]
- Biblioteca de dados de séries temporais (TSDL) da MU [meta]
- Conjunto de dados do ponto de mudança de Turing - contém 42 séries temporais anotadas coletadas para o desenvolvimento [...] [meta]
- Conjunto de dados da série temporal da UC Riverside [meta]
Transporte
- Airlines OD Data 1987-2008 [Meta]
- Dados da Ford Gobike (anteriormente Bay Area Bike Share Data) [Meta]
- Coleção de sistemas de compartilhamento de bicicleta (BSS) [Meta]
- Informações de tráfego holandês [meta]
- Geolife GPS Trajetória da Microsoft Research [Meta]
- Sistema de trem alemão por Deutsche Bahn [Meta]
- Hubway Million Rides em MA [meta]
- Contagem de pedestres de Melbourne - Este conjunto de dados contém contagens de pedestres por hora desde 2009 [...] [Meta]
- Montreal Bixi Bike Share [Meta]
- Dados de viagem de táxi de Nova York 2009- [Meta]
- Dados de Trip Taxi de Nova York 2013 (FOIA/FOILED) [Meta]
- Dados de Trip Uber de Nova York abril de 2014 a setembro de 2014 [Meta]
- Coleta de tráfego aberto [meta]
- Openflights - Aeroporto, companhia aérea e dados de rota [meta]
- Philadelphia Bike Share Stations (JSON) [Meta]
- Banco de dados de falhas de avião, desde 1920 [meta]
- Rita Airline On-time Deformation Data [Meta]
- Coleta de dados de transporte RITA/BTS (TRANSTAT) [Meta]
- Renfe (DataSet da Rede Ferroviária Nacional Espanhola) [Meta]
- Toronto Bike Share Stations (arquivos JSON e GBFS) [Meta]
- Transporte para Londres (TFL) [Meta]
- Pesquisa de rastreador de viagem (TTS) para Chicago [Meta]
- Bureau of Transportation Statistics dos EUA (BTS) [Meta]
- Voos Domésticos dos EUA 1990 a 2009 [Meta]
- Estrutura de análise de frete dos EUA desde 2007 [Meta]
- Administração Nacional de Segurança no Trânsito das Rodovias dos EUA - Fatalidades desde 1975 - Contém CSV [...] [Meta]
eSports
- CS: Go Competitive Matchmaking Data - Neste conjunto de dados, temos dados sobre o CSGO Matchmaking [...] [Meta]
- FIFA-2021 DATASET COMPLETO DE JOGADORES [META]
- Opendota Data Dump [meta]
Coleções complementares
- Dados de dados embalados de dados
- Opendatamonitor: Uma visão geral dos recursos de dados abertos disponíveis na Europa
- Quora: Onde posso encontrar grandes conjuntos de dados abertos ao público?
- Rs.io: mais de 100 conjuntos de dados interessantes para estatísticas
- Cvonline: bancos de dados de imagem
- Innotrek: alavancando dados abertos para entender vidas urbanas
- Documentos de CV: conjuntos de dados CV na web
Agradecimentos especiais a