Des ensembles de données publics impressionnants
Il s'agit d'une liste de sources de données publiques thématiques de haute qualité. Ils sont collectés et rangés à partir des blogs, des réponses et des réponses des utilisateurs. La plupart des ensembles de données répertoriés ci-dessous sont gratuits, mais certains ne le sont pas. Ce projet a été incubé à l'OMNILab de l'Université Jiao Tong de Shanghai pendant le doctorat de Xiaming Chen. études. OMNILab fait désormais partie de la communauté BaiYuLan Open AI. D'autres listes incroyablement impressionnantes peuvent être trouvées dans la liste géniale de Sindresorhus.
AVIS : Ce dépôt est automatiquement généré par apd-core. Veuillez NE PAS modifier ce fichier directement. Nous avons fourni une nouvelle façon de contribuer à ce dépôt. Rejoignez la communauté Slack pour une touche instantanée des mises à jour des données du siège.
- Je vais bien.
- S'il vous plaît, réparez-moi.
Table des matières
- Agriculture
- Architecture
- Biologie
- Chimie
- Climat+Météo
- Réseaux complexes
- Réseaux informatiques
- Cybersécurité
- Défis de données
- Sciences de la Terre
- Économie
- Éducation
- Énergie
- Divertissement
- Finance
- SIG
- Gouvernement
- Soins de santé
- Traitement d'image
- Apprentissage automatique
- Musées
- Langage Naturel
- Neurosciences
- Physique
- Cancer De La Prostate
- Psychologie+Cognition
- Domaines publics
- Moteurs de recherche
- Réseaux Sociaux
- Sciences Sociales
- Logiciel
- Sportif
- Série chronologique
- Transport
- eSports
- Collections complémentaires
Agriculture
- L'ensemble de données mondial sur les rendements historiques des principales cultures 1981-2016 - L'ensemble de données mondial de [...] [Méta]
- Ensemble de données de référence hyperspectrales sur l'humidité du sol - Cet ensemble de données a été mesuré sur une période de cinq jours [...] [Meta]
- Ensemble de données de contrôle qualité des citrons - L'ensemble de données sur les citrons a été préparé pour étudier le [...] [Méta]
- Indice de végétation optimisé ajusté au sol - L'IDB est un outil pour travailler avec la télédétection [...] [Meta]
- Base de données sur les éléments nutritifs du ministère américain de l'Agriculture [Méta]
- Base de données PLANTES du Département de l'Agriculture des États-Unis - La liste de contrôle complète des PLANTES compte près de 7 [...] [Méta]
Architecture
- Modèles d'appartements suisses - Cet ensemble de données contient des données détaillées sur 42 207 appartements (242 257 [...] [Meta]
Biologie
- 1000 Genomes - Le projet 1000 Genomes s'est déroulé entre 2008 et 2015, créant le plus grand projet [...] [Meta]
- ANHIR - Enregistrement automatique d'images histologiques non rigides (ANHIR) consiste en 2D [...] [Méta]
- American Gut (Microbiome Project) - Le projet American Gut est le plus grand projet participatif [...] [Meta]
- BCNB - Il existe des WSI de 1058 patients, une partie des régions tumorales est annotée dans les WSI. Sauf [...] [Méta]
- Broad Bioimage Benchmark Collection (BBBC) - La Broad Bioimage Benchmark Collection (BBBC) [...] [Méta]
- Encyclopédie des lignées cellulaires cancéreuses (CCLE) [Méta]
- CIMA - L'ensemble de données CIMA comprend des images de tranches de tissus en microscopie histologique 2D. [Méta]
- Cell Image Library - Cette bibliothèque est une base de données de ressources publique et facilement accessible de [...] [Meta]
- Données publiques génomiques complètes - Un ensemble de données diversifiées sur des génomes humains entiers sont librement accessibles [...] [Méta]
- CytoImageNet - Un ensemble de données à grande échelle d'images de microscopie. Contient 890 737 niveaux de gris au total [...] [Méta]
- EBI ArrayExpress - ArrayExpress Archive of Functional Genomics Data stocke des données de haute qualité [...] [Méta]
- Banque de données sur les protéines EBI en Europe - La banque de données de microscopie électronique (EMDB) est une banque publique [...] [Meta]
- Projet ENCODE - Le Consortium Encyclopédie des éléments d'ADN (ENCODE) est un projet en cours [...] [Meta]
- Archives d'images pilotes de microscopie électronique (EMPIAR) - EMPIAR, le service public de microscopie électronique [...] [Méta]
- Ensembler des génomes [méta]
- Gene Expression Omnibus (GEO) - GEO est un référentiel public de données génomiques fonctionnelles [...] [Meta]
- Gene Ontology (GO) - Fichiers d'annotation GO [Méta]
- Interactions biotiques globales (GloBI) [Méta]
- Projet LINCS de la Harvard Medical School (HMS) - Le centre LINCS de la Harvard Medical School (HMS) est [...] [Meta]
- Projet sur la diversité du génome humain - Un groupe de scientifiques de l'Université de Stanford a [...] [Meta]
- Human Microbiome Project (HMP) - Le HMP a séquencé plus de 2000 génomes de référence isolés de [...] [Méta]
- ICOS PSP Benchmark - Le référentiel de benchmarks ICOS PSP contient un outil ajustable du monde réel [...] [Méta]
- Projet international HapMap [Méta]
- Journal of Cell Biology DataViewer [Méta]
- KEGG - KEGG est une ressource de base de données permettant de comprendre les fonctions et utilitaires de haut niveau de [...] [Meta]
- Protéines NCBI [Méta]
- Taxonomie NCBI - La base de données de taxonomie NCBI est un ensemble organisé de noms et de classifications pour [...] [Meta]
- NCI Genomic Data Commons - Le portail de données GDC est une plate-forme robuste basée sur les données qui permet [...] [Meta]
- Données du NIH Microarray [Méta]
- Données de génotypes OpenSNP - openSNP permet aux clients de tests génétiques directs au client de [...] [Meta]
- Palmer Penguins - L'objectif des palmerpenguins est de fournir un excellent ensemble de données pour les données [...] [Meta]
- Pathguid - Catalogue des interactions protéine-protéine [Méta]
- Protein Data Bank - Cette ressource est alimentée par les archives d'informations de la Protein Data Bank [...] [Meta]
- Consortium de génomique psychiatrique - L'objectif du Consortium de génomique psychiatrique (PGC) est [...] [Meta]
- Projet PubChem - PubChem est la plus grande collection au monde de produits chimiques librement accessibles [...] [Meta]
- PubGene (maintenant Coremine Medical) - COREMINE™ est une famille d'outils développés par la société norvégienne [...] [Meta]
- Catalogue Sanger des mutations somatiques dans le cancer (COSMIC) - COSMIC, le catalogue des mutations somatiques [...] [Meta]
- Projet Sanger sur la génomique de la sensibilité aux médicaments dans le cancer (GDSC) [Meta]
- Sequence Read Archive (SRA) - L'archive de lecture de séquence (SRA) stocke les données de séquence brutes de [...] [Méta]
- Serratus - Analyse de 7,1 millions d'ensembles de données de séquençage d'ARN/ADN pour découvrir le total [...] [Méta]
- Données de puces à ADN de Stanford (retraitées MAINTENANT) [Méta]
- Dépôt de données originales du Stowers Institute [Méta]
- Base de données de la science des systèmes de la dynamique biologique (SSBD) - Science des systèmes de la dynamique biologique [...] [Méta]
- L'Atlas du génome du cancer (TCGA), disponible via Broad GDAC [Meta]
- Le Catalogue de la Vie - Le Catalogue de la Vie est une liste de contrôle de qualité assurée de plus de 1,8 [...] [Meta]
- Le Projet Génome Personnel - Le Projet Génome Personnel, initié en 2005, est une vision et [...] [Meta]
- Données publiques UCSC [Méta]
- UniGene [Méta]
- Ressource protéique universelle (UnitProt) - La ressource protéique universelle (UniProt) est une [...] [Méta]
- Rfam - La base de données Rfam est une collection de familles d'ARN, chacune représentée par plusieurs [...] [Meta]
Chimie
- Base de données sur les liquides ioniques - ILThermo [Meta]
Climat+Météo
- Indice climatique des actuaires [méta]
- Météo australienne [Meta]
- Centre météorologique pour l'aviation - Informations météorologiques cohérentes, actuelles et précises pour le monde entier [...] [Meta]
- Météo brésilienne - Données historiques (en portugais) - Données liées au climat et à la météo [...] [Meta]
- Plusieurs ensembles de données climatiques - Le C3S Climate Data Store (CDS) est un guichet unique pour [...] [Meta]
- Centre météorologique canadien [Méta]
- Caravan - un ensemble de données pour l'hydrologie à grand échantillon - Caravan est un ensemble de données communautaire ouvert de [...] [Méta]
- Données climatiques de l'UEA (mises à jour mensuelles) [Meta]
- Météo néerlandaise - Le portail KNMI Data Center (KDC) donne accès aux données KNMI sur la météo, [...] [Meta]
- Évaluation et ensemble de données sur le climat européen [Meta]
- Centre allemand de données climatiques [Meta]
- Données climatiques mondiales depuis 1929 [Meta]
- Cartographier le récit de l'actualité mondiale sur le changement climatique 2009-2020 - Ces quatre ensembles de données représentent [...] [Meta]
- Services de navigation d'images mondiales de la NASA [Méta]
- Climat de la mer de Béring de la NOAA [Méta]
- Ensembles de données climatiques de la NOAA [méta]
- Modèles météorologiques en temps réel de la NOAA [Méta]
- Ensembles de données de météorologie et de rayonnement de NOAA SURFRAD [Méta]
- Open-Meteo - Open-Source Weather API - API météo open source avec accès gratuit pour les non- [...] [Meta]
- Ressources de données ouvertes de la Banque mondiale sur le changement climatique [Meta]
- Unité de Recherche Climatique de l'UEA [Meta]
- Météo historique de WU dans le monde entier [Meta]
- Wahington Post Climate Change - Pour analyser le réchauffement des températures aux États-Unis, le [...] [Meta]
- WorldClim - Données climatiques mondiales [Méta]
Réseaux complexes
- Ensemble de données du réseau de citations AMiner [Méta]
- URL CrossRef DOI [Méta]
- Ensemble de données de citation DBLP [Méta]
- Collection de réseaux routiers DIMACS [Méta]
- Citations de brevets NBER [Méta]
- Collecte de données sur les réseaux complexes du NIST [Meta]
- Référentiel réseau avec outils d'analyse exploratoire interactifs [Méta]
- Réseau d'interaction protéine-protéine [Meta]
- PyPI et Maven Dependency Network [Méta]
- Base de données de citations Scopus [Méta]
- Données de petit réseau [méta]
- Stanford GraphBase [Méta]
- Collection d'ensembles de données sur un grand réseau de Stanford [Méta]
- Sources de données du réseau longitudinal de Stanford [Méta]
- La collection du réseau de Coblence [méta]
- Le Laboratoire d'Algorithmique du Web (UNIMI) [Meta]
- Référentiel de données du réseau UCI [Méta]
- Collection de matrices clairsemées UFL [Meta]
- Base de données graphique WSU [Méta]
- Ressource communautaire pour l'archivage des données sans fil à Dartmouth - Contient des ensembles de données de fichiers pcap [...] [Méta]
Réseaux informatiques
- 3,5 milliards de pages Web de CommonCrawl 2012 [Méta]
- 53,5 milliards de clics Web sur 100 000 utilisateurs dans l'Indiana Univ. [Méta]
- Ensembles de données Internet CAIDA [Méta]
- Ensembles de données sans fil CRAWDAD de Dartmouth Univ. [Méta]
- ClueWeb09 - 1 B de pages Web [Méta]
- ClueWeb12 - 733 millions de pages Web [Méta]
- Données Web CommonCrawl sur 7 ans [Méta]
- Prédiction de l'intention de l'acheteur à partir des données de commerce électronique Clickstream avec un minimum d'informations de navigation [Méta]
- Données de clics Criteo [Méta]
- Référentiel de données d'analyse sur Internet [Méta]
- MIRAGE-2019 - MIRAGE-2019 est un ensemble de données généré par l'homme pour l'analyse du trafic mobile avec [...] [Meta]
- Ensemble de données d'enregistrements DNS Merklemap - Contient plus de 4 milliards d'enregistrements DNS sur 700 millions d'enregistrements uniques [...] [Méta]
- OONI : Observatoire Ouvert des Interférences Réseaux - Données de censure sur Internet [Meta]
- Ouvrir les données mobiles par MobiPerf [Meta]
- The Peer-to-Peer Trace Archive - Les mesures du monde réel jouent un rôle clé dans l'étude de la [...] [Méta]
- Analyses Internet du sonar Rapid7 [Méta]
- Télescope réseau UCSD, IPv4/8 net [Méta]
Cybersécurité
- CCCS-CIC-AndMal-2020 - L'ensemble de données comprend 200 000 échantillons bénins et 200 000 échantillons de logiciels malveillants totalisant [...] [Méta]
- Données de trafic et de journal capturées lors d'un exercice de cyberdéfense - Cet ensemble de données a été acquis [...] [Meta]
Défis de données
- Compétitions AIcrowd [Méta]
- Base de données Bruteforce [Méta]
- Les défis de l'apprentissage automatique [méta]
- CrowdANALYTIX dataX [Méta]
- Défi D4D d'Orange [Méta]
- Concours DrivenData pour le bien social [Meta]
- ICWSM Data Challenge (depuis 2009) [Méta]
- Coupe KDD par Tencent 2012 [Méta]
- Données de compétition Kaggle [Méta]
- Défi de visualisation de données Localytics [Méta]
- Prix Netflix [Méta]
- Défi des applications spatiales [méta]
- Défi Big Data de Telecom Italia [Méta]
- Ensemble de données TravisTorrent - Défi minier MSR'2017 [Méta]
- TunedIT - Ensembles de données, algorithmes et défis d'exploration de données et d'apprentissage automatique [Meta]
- Défi de l'ensemble de données Yelp - L'ensemble de données Yelp est un sous-ensemble de nos entreprises, avis et utilisateurs [...] [Méta]
Sciences de la Terre
- 38-Cloud (Cloud Detection) - Contient 38 images de scène Landsat 8 et leurs images extraites manuellement [...] [Meta]
- AQUASTAT - Ressources mondiales en eau et utilisations [Meta]
- BODC - données marines d'environ 22 000 vars [Meta]
- EOSDIS - Données du système d'observation de la Terre de la NASA [Meta]
- Modèles terrestres [méta]
- Global Wind Atlas - Le Global Wind Atlas est une application Web gratuite développée pour aider [...] [Meta]
- Système intégré d'observation marine (IMOS) - environ 30 To de mesures océaniques [Meta]
- Marinexplore - Données océanographiques ouvertes [Méta]
- Système d'observation côtière en temps réel de l'Alabama [Meta]
- Programme de surveillance à l'échelle du système des réserves nationales de recherche estuarienne - programme estuarien à long terme [...] [Meta]
- Données ouvertes de l'Oil and Gas Authority - L'ensemble de données couvre 12 500 puits de forage offshore, 5 000 sismiques [...] [Meta]
- Base de données mondiale sur les volcans et les éruptions de la Smithsonian Institution [Méta]
- Archives du tremblement de terre de l'USGS [Méta]
- Prédiction de la zone de protection des têtes de puits (zone de protection) à l'aide de courbes de percée - Cette [...] [Méta]
Économie
- Asian Productivity Organization (APO) - L'AEPM fournit un tableau de bord graphique de [...] [Meta]
- ASEAN Stats - L'ASEANstatsDataPortal a été lancé pour la première fois en juin 2018. Le portail est [...] [Meta]
- Association économique américaine (AEA) [Méta]
- Asian KLEMS - Asia KLEMS est un consortium de recherche régional asiatique visant à promouvoir la construction [...] [Meta]
- Harvard Atlas of Economic Complexity - Une base de données permettant aux utilisateurs d'explorer les flux commerciaux mondiaux [...] [Meta]
- Base de données financière BIS - Les fichiers contiennent les mêmes données que dans l'Explorateur de statistiques BIS [...] [Méta]
- Niveau de scolarité de Barro-Lee - Données sur le niveau de scolarité de Barro-Lee de 1950 à 2010. [...] [Méta]
- Base de données CEPII - Une base de données sur l'économie mondiale, à travers ses profils de pays et de régions, en [...] [Meta]
- EUKLEMS - EU KLEMS est un projet de recherche au niveau industriel, sur la croissance et la productivité. UE KLEMS [...] [Méta]
- Données sur la liberté économique du monde [Meta]
- Comptes nationaux historiques - Le centre de données sur les comptes nationaux historiques comparatifs [...] [Méta]
- Statistiques macroéconomiques historiques [méta]
- INFORUM - Prévisions interindustrielles à l'Université du Maryland [Meta]
- DBnomics – la base de données économique mondiale – Regroupe des centaines de millions de séries chronologiques [...] [Meta]
- Statistiques du commerce international [méta]
- Base de données de codes de produits Internet [méta]
- Centre commun de données sur la dette extérieure [méta]
- Jon Haveman Liens vers les données du commerce international [Méta]
- Amérique latine KLEMS - LAKLEMS est un projet de coopération technique financé par l'Inter- [...] [Meta]
- Base de données sur la productivité à long terme - La base de données sur la productivité à long terme a été créée en tant que [...] [Méta]
- Base de données du projet Maddison - La base de données du projet Maddison fournit des informations sur les comparaisons [...] [Méta]
- Comptes nationaux de transfert - L'objectif du projet Comptes nationaux de transfert (NTA) est de [...] [Meta]
- Base de données OpenCorporates des entreprises dans le monde [Meta]
- Notre monde en données [Meta]
- Penn World Table - PWT version 10.0 est une base de données contenant des informations sur les niveaux relatifs de [...] [Meta]
- Ensembles de données gravitationnelles du commerce mondial de SciencesPo [Méta]
- L'Atlas de la complexité économique [Meta]
- Le Centre de données internationales [Meta]
- L'Observatoire de la complexité économique [Meta]
- Statistiques des Nations Unies sur le commerce des produits de base [méta]
- Rapports de l'ONU sur le développement humain [Meta]
- Base de données mondiale d'entrées-sorties - Tableaux d'entrées-sorties mondiales et données sous-jacentes, couvrant 43 [...] [Méta]
- World KLEMS - Ensembles de données analytiques de type KLEMS pour un large éventail de pays à travers le monde. [...] [Méta]
Éducation
- Données du tableau de bord universitaire [méta]
- Données du Département de l'Éducation de l'État de New York - Le Département de l'Éducation de l'État de New York (NYSED) est [...] [Méta]
- Programme d'évaluation des étudiants internationaux (PISA) - Contient les évaluations des étudiants de 15 ans [...] [Meta]
- Données des étudiants du Free Code Camp [Meta]
Énergie
- AMPds - Ensemble de données Almanach of Minutely Power [Méta]
- BLUEd - Ensemble de données de désagrégation de l'électricité entièrement étiquetées au niveau du bâtiment [Méta]
- PEIGNÉ [Méta]
- DBFC - Ensemble de données sur les piles à combustible à borohydrure direct (DBFC) [Méta]
- DEL - Ensembles de données de l'étude sur la charge électrique domestique pour l'Afrique du Sud (1994 - 2014) [Meta]
- ECO - L'ensemble de données ECO est un ensemble de données complet pour la surveillance non intrusive de la charge et [...] [Méta]
- EIA [Méta]
- Base de données mondiale des centrales électriques - La base de données mondiale des centrales électriques est une base de données complète et open source [...] [Méta]
- HES - Étude sur l'électricité domestique, Royaume-Uni [Meta]
- HFED [Méta]
- MORED : un ensemble de données sur la consommation électrique des bâtiments marocains - Depuis le printemps 2019, un ensemble de données [...] [Meta]
- Marktstammdatenregister - Le Marktstammdatenregister allemand (MaStR) est une base de données de tous [...] [Meta]
- PEM1 - Ensemble de données sur les piles à combustible à membrane échangeuse de protons (PEM) [Méta]
- PLAID - L'ensemble de données d'identification de l'appareil Plug Load [Méta]
- Le Public Utility Data Liberation Project (PUDL) - PUDL facilite la consultation des données énergétiques américaines [...] [Meta]
- REDD [Méta]
- SYND - Un ensemble de données énergétiques synthétiques pour la surveillance non intrusive de la charge - Avec SynD, nous présentons un [...] [Meta]
- Portail de données des compteurs intelligents - Le portail de données des compteurs intelligents fait partie du National Science [...] [Meta]
- Tracebase [Méta]
- Ensembles de données du Centre énergétique de l'Ukraine [Méta]
- UK-DALE - Électricité au niveau des appareils domestiques au Royaume-Uni [Meta]
- BLANCHI [Méta]
- iAWE [Méta]
Divertissement
- Top Streamers sur Twitch - Ceci contient les données des 1000 meilleurs streamers de l'année dernière. [Méta]
Finance
- Statistiques BRI - Statistiques BRI, compilées en coopération avec les banques centrales et autres [...] [Meta]
- Blockmodo Coin Registry - Un registre de fichiers d'informations au format JSON qui est principalement [...] [Meta]
- Bourse à terme CBOE [Méta]
- Données boursières complètes FAANG - Cet ensemble de données contient toutes les données boursières des sociétés FAANG de [...] [Méta]
- Google Finance [Méta]
- Google Tendances [Méta]
- NASDAQ [Méta]
- Données du marché du NYSE [Méta]
- OANDA [Méta]
- Données financières OSU [Méta]
- Quandl [Méta]
- SEC EDGAR - EDGAR, le système électronique de collecte, d'analyse et de récupération de données, est le [...] [Meta]
- St Louis fédéral [méta]
- Yahoo Finance [Méta]
SIG
- Modèles de villes sémantiques 3D impressionnants - Collection de modèles de villes et de régions sémantiques 3D ouverts. [Méta]
- Portail ArcGIS Open Data [Méta]
- Cambridge, MA, États-Unis, données SIG sur GitHub [Meta]
- Base de données de tous les continents, pays, États/subdivisions/provinces et villes - Base de données [...] [Meta]
- Données factuelles de localisation mondiale [méta]
- Site Web DASE de l'IEEE Geoscience and Remote Sensing Society [Méta]
- Geo Maps - Cartes GeoJSON de haute qualité générées par programme [Meta]
- Données géospatiales de l'ASU [Meta]
- Projet Geo Wiki - Surveillance environnementale pilotée par les citoyens [Meta]
- GeoFabrik - Données OSM extraites dans une variété de formats et de zones [Meta]
- GeoNames dans le monde entier [méta]
- Base de données mondiale sur les zones administratives (GADM) - Données géospatiales organisées par pays. Comprend [...] [Méta]
- Données au niveau de la base de l'infrastructure nationale [méta]
- Landsat 8 sur AWS [Méta]
- Liste de tous les pays dans toutes les langues [Meta]
- Portail de données SIG du Service météorologique national [Méta]
- Terre naturelle - vecteurs et rasters du monde [Meta]
- OpenAddresses [Méta]
- OpenStreetMap (OSM) [Méta]
- Pléiades - Répertoire géographique et graphique des lieux anciens [Meta]
- Géocodeur inversé utilisant les données OSM [Meta]
- Robin Wilson - Ensembles de données SIG gratuits [Méta]
- Shadow Accrual Maps - Le référentiel contient les informations fantômes accumulées pour New York [...] [Meta]
- TIGER/Line – Frontières et routes des États-Unis [Meta]
- Fichier de formes des fuseaux horaires TZ [méta]
- TwoFishes - Le géocodeur grossier de Foursquare [Meta]
- Données environnementales de l'ONU [méta]
- Frontières mondiales du Département d'État américain [Meta]
- Pays du monde dans plusieurs formats [Meta]
Gouvernement
- Alberta, province du Canada [Méta]
- Anvers, Belgique [Meta]
- Argentine (non officiel) [Meta]
- Datos Argentina - Portail des données ouvertes de la République Argentine. Encontra datos públicos [...] [Meta]
- Austin, Texas, États-Unis [Méta]
- Australie (abs.gov.au) [Méta]
- Australie (data.gov.au) [Méta]
- Autriche (data.gv.at) [Meta]
- Baton Rouge, LA, États-Unis [Méta]
- Beer Sheva, Israël - Portail de données ouvertes (Smart7 OpenData) [Meta]
- Belgique [Méta]
- Données ouvertes de la ville de Berkeley [Méta]
- Brésil [Méta]
- Buenos Aires, Argentine [Méta]
- Calgary, AB, Canada [Méta]
- Cambridge, MA, États-Unis [Méta]
- Canada [Méta]
- Chicago [Méta]
- Chili [Méta]
- Chine [Méta]
- Données ouvertes de Dallas [Méta]
- DataBC - données de la province de la Colombie-Britannique [Meta]
- Debt to the Penny - L'ensemble de données Debt to the Penny fournit des informations sur le total [...] [Meta]
- Denver Open Data [Méta]
- Durham, Caroline du Nord Open Data [Méta]
- Edmonton, AB, Canada [Méta]
- Angleterre LGInform [Méta]
- EuroStat [Méta]
- EveryPolitician - Projet en cours rassemblant et partageant des données sur chaque homme politique. [Méta]
- Comité fédéral de méthodologie statistique (FCSM) (anciennement FedStats) [Meta]
- Finlande [Méta]
- France [Méta]
- Fredericton, Nouveau-Brunswick, Canada [Méta]
- Gatineau, QC, Canada [Méta]
- Allemagne [Méta]
- Gand, Belgique [Meta]
- Glasgow, Écosse, Royaume-Uni [Méta]
- Grèce [Méta]
- Gouvernements mondiaux gardiens [Meta]
- Halifax, Nouvelle-Écosse, Canada [Méta]
- Région d'Helsinki, Finlande [Meta]
- Hong Kong, Chine [Méta]
- Houston, Texas, États-Unis [Méta]
- Données du gouvernement indien [méta]
- Portail de données indonésien [Meta]
- Iowa - Bienvenue sur le portail de données de l'État de l'Iowa. Veuillez explorer les données sur l'Iowa et votre [...] [Méta]
- Portail des données ouvertes de l'Irlande [Meta]
- Portail de données ouvertes d'Israël [Méta]
- Portail de données ouvertes de la municipalité d'Istanbul [Méta]
- Italie - Le portail dati.gov.it est le catalogue national des métadonnées relatives aux données [...] [Meta]
- Décès en prison en Amérique - Le gouvernement américain ne publie pas de données sur la mortalité en prison, [...] [Meta]
- Japon [Méta]
- Laval, QC, Canada [Méta]
- Lexington, Kentucky [Méta]
- Banque de données de Londres, Royaume-Uni [Méta]
- Londres, ON, Canada [Méta]
- Données ouvertes de Los Angeles [Méta]
- Luxembourg - Portail luxembourgeois des données ouvertes [Meta]
- MassGIS, Massachusetts, États-Unis [Méta]
- Metropolitan Transportation Commission (MTC), Californie, États-Unis [Meta]
- Mexique [Méta]
- Mississauga, ON, Canada [Méta]
- Moldavie [Méta]
- Moncton, Nouveau-Brunswick, Canada [Méta]
- Montréal, QC, Canada [Méta]
- Mountain View, Californie, États-Unis (GIS) [Méta]
- Données ouvertes de New York [méta]
- NYC betanyc [Méta]
- Pays-Bas [méta]
- Tonnage mensuel du Département de l'assainissement de New York - Les données de tonnage mensuel DSNY fournissent [...] [Méta]
- Nouvelle-Zélande [Méta]
- OCDE [Méta]
- Oakland, Californie, États-Unis [Méta]
- Oklahoma [Méta]
- Données ouvertes pour l'Afrique [Méta]
- Plateforme de données gouvernementales ouvertes (OGD) Inde [Méta]
- Liste OpenDataSoft de 1 600 données ouvertes [Meta]
- Oregon [Méta]
- Ottawa, ON, Canada [Méta]
- Palo Alto, Californie, États-Unis [Méta]
- OpenDataPhilly - OpenDataPhilly est un catalogue de données ouvertes dans la région de Philadelphie. Dans [...] [Méta]
- Portland, Oregon [Méta]
- Portugal - Organisation Pordata [Méta]
- Gouvernement de Porto Rico [Meta]
- Ville de Québec, QC, Canada [Méta]
- Province de Québec du Canada [Méta]
- Regina SK, Canada [Méta]
- Rio de Janeiro, Brésil [Méta]
- Roumanie [Méta]
- Russie [Méta]
- San Diego, Californie [Méta]
- San Antonio, TX - Community Information Now - CI:Now est une organisation à but non lucratif au service de Bexar (San [...] [Meta]
- Ensembles de données de San Francisco [Méta]
- San José, Californie, États-Unis [Méta]
- Comté de San Mateo, Californie, États-Unis [Méta]
- Saskatchewan, province du Canada [Méta]
- Seattle [Méta]
- Données du gouvernement de Singapour [Méta]
- Statistiques commerciales de l'Afrique du Sud [Meta]
- Afrique du Sud [Méta]
- État de l'Utah, États-Unis [Méta]
- Suisse [Méta]
- Gouvernement de Taiwan [Meta]
- Taïwan [Méta]
- Données ouvertes de Tel-Aviv [Méta]
- Texas Open Data [Méta]
- La Banque mondiale [Meta]
- Toronto, ON, Canada [Méta]
- Tunisie [Méta]
- Données du gouvernement britannique [méta]
- Enquête sur la communauté américaine des États-Unis [méta]
- Ensembles de données de santé publique du CDC des États-Unis [méta]
- Bureau du recensement des États-Unis [méta]
- Département américain du logement et du développement urbain (HUD) [Meta]
- Agences du gouvernement fédéral américain [méta]
- Catalogue de données du gouvernement fédéral américain [méta]
- Administration américaine des produits alimentaires et médicamenteux (FDA) [Méta]
- Centre national américain des statistiques de l'éducation (NCES) [Méta]
- Gouvernement ouvert aux États-Unis [méta]
- Projet d'atlas ouvert du recensement britannique de 2011 [méta]
- Comtés américains - Il s'agit d'un référentiel de diverses données, ventilées par comté américain. Alors que la plupart des [...] [Meta]
- Produits de données en masse de l'Office américain des brevets et des marques (USPTO) [Méta]
- Bureau ougandais des statistiques [Meta]
- Ukraine [Méta]
- Nations Unies [méta]
- Uruguay [Méta]
- Valley Transportation Authority (VTA), Californie, États-Unis [Meta]
- Catalogue de données ouvertes de Vancouver, Colombie-Britannique [Méta]
- Victoria, Colombie-Britannique, Canada [Méta]
- Vienne, Autriche [Meta]
- Statistiques de l'Office général des statistiques du Vietnam - Les données dans différentes catégories sont [...] [Meta]
- Rapports du Congressional Research Service (CRS) des États-Unis [Méta]
Soins de santé
- Ensembles de données AWS COVID-19 - Nous travaillons avec des organisations qui génèrent des données liées au COVID-19 [...] [Méta]
- Données à usage public de surveillance des cas de COVID-19 - La base de données du système de surveillance des cas de COVID-19 [...] [Méta]
- Données non traitées Covid-19 de l'Équateur - C'est un projet qui fournit des ensembles de données non traitées [...] [Meta]
- Référentiel de données sur le nouveau coronavirus COVID-19 2019 par Johns Hopkins CSSE - Ce sont les données [...] [Méta]
- Données sur le coronavirus (Covid-19) aux États-Unis - Le New York Times publie une série [...] [Meta]
- Impact du COVID-19 sur les patients et capacité hospitalière par établissement - L'ensemble de données suivant [...] [Méta]
- Composition des aliments crus, transformés et préparés Base de données nationale sur les éléments nutritifs de l'USDA pour les normes [...] [méta]
- Le projet de suivi COVID - Le projet de suivi COVID collecte et publie le plus [...] [Meta]
- Grands ensembles de données de santé EHDP [méta]
- GDC - GDC soutient plusieurs programmes sur le génome du cancer pour CCG, TCGA, TARGET, etc. [Meta]
- Bases de données démographiques Gapminder World [Méta]
- MeSH, le thésaurus de vocabulaire utilisé pour indexer les articles pour PubMed [Meta]
- MeDAL - Un grand ensemble de données de textes médicaux organisé pour la désambiguïsation des abréviations - Medical [...] [Meta]
- Base de données de couverture Medicare (MCD), États-Unis [méta]
- Moteur de données Medicare des données medicare.gov [Méta]
- Fichier de données Medicare [méta]
- Science ouverte de Nightingale [Méta]
- Nombre de cas et de décès d'Ebola dans les pays touchés (2014) [Meta]
- Open-ODS (structure du UK NHS) [Meta]
- OpenPaymentsData, données sur les relations financières des soins de santé [Meta]
- Bases de données PhysioBank - Une archive vaste et croissante de données physiologiques. [Méta]
- Les archives d'imagerie du cancer (TCIA) [Méta]
- Le projet Cancer Genome Atlas (TCGA) [Meta]
- Observatoire mondial de la santé de l'Organisation mondiale de la santé [Meta]
- Ensembles de données Yahoo Knowledge Graph COVID-19 - L'équipe Yahoo Knowledge Graph de Verizon Media est [...] [Méta]
- Informatique pour intégrer la biologie et le chevet [Meta]
Traitement d'image
- Base de données de 10 000 visages adultes américains [Méta]
- 2 Go de photos de chats [Meta]
- Audience Visages non filtrés pour la classification par sexe et par âge [Méta]
- Classification des images affectives [méta]
- Détection et suivi d'objets aéroportés - L'ensemble de données de suivi d'objets aéroportés (AOT) est un [...] [Méta]
- Animaux avec attributs [Meta]
- CADDY Underwater Stereo-Vision Ensemble de données de gestes de la main des plongeurs - Contient une paire stéréo 10K [...] [Méta]
- Ensemble de données cytologiques - CCAgT : Images de cellules cervicales avec la technique de coloration AgNOR - Contient 9339 [...] [Méta]
- Benchmark de détection des piétons Caltech [Meta]
- Ensemble de données Chars74K - Reconnaissance de caractères dans les images naturelles (l'anglais et le kannada sont disponibles) [Méta]
- Cube++ - 4 890 images brutes de 18 mégapixels, chacune contenant une cible de couleur SpyderCube dans leur [...] [Méta]
- Ensemble de données de conduite vidéo densément annotées - Cet ensemble de données se compose de 28 séquences vidéo de [...] [Méta]
- Danbooru Tagged Anime Illustration Dataset - Une base de données d'images d'anime à grande échelle avec plus de 3,33 millions [...] [Meta]
- Ensemble de données DukeMTMC - DukeMTMC vise à accélérer les progrès en matière de multi-caméras multi-cibles [...] [Meta]
- Images de papillons à grains fins (Lepidoptra) de la collection entomologique de l'ETH (ETHEC) [Meta]
- Benchmark de reconnaissance faciale [Méta]
- Flickr : 32 logos de marques de classe [Méta]
- GDXray - Images radiographiques pour les tests aux rayons X et la vision par ordinateur [Meta]
- Ensemble de données HumanEva - L'ensemble de données HumanEva-I contient 7 séquences vidéo calibrées (4 en niveaux de gris [...] [Méta]
- ImageNet (dans la hiérarchie WordNet) [Méta]
- Reconnaissance de scènes intérieures [Meta]
- Système international d'images affectives, UFL [Méta]
- Suite de référence KITTI Vision [Méta]
- Bibliothèque d'information labellisée d'Alexandrie - Biologie et conservation - Contient plus de 10 [...] [Meta]
- Base de données MNIST de chiffres manuscrits, près d'un million d'exemples [Meta]
- Ensemble de données de prévision de régions d'intérêt multi-vues pour la conduite autonome - Contient 16 indicateurs de conduite [...] [Méta]
- Stimuli massifs de la mémoire visuelle, MIT [Meta]
- Newspaper Navigator - Cet ensemble de données comprend du contenu visuel extrait pour 16 358 041 [...] [Meta]
- Open Images From Google - Images avec masques de segmentation pour 2,8 millions d'instances d'objets [...] [Méta]
- RuFa - Contient des images de texte écrit dans l'une des deux polices arabes (Ruqaa et Nastaliq [...] [Meta]
- Base de données SUN, MIT [Méta]
- Occupation des sièges arrière de l'intérieur du véhicule synthétique SVIRO - 25 000 scènes synthétiques réparties sur dix [...] [Meta]
- Plusieurs ensembles de données de forme à partir de la silhouette [Méta]
- Ensemble de données sur les chiens de Stanford [Méta]
- Le défi de l’étiquetage de similarité d’action (ASLAN) [Meta]
- L'ensemble de données sur les animaux de compagnie Oxford-IIIT [Méta]
- Violent-Flows - Base de données et benchmark sur la violence des foules/non-violence [Meta]
- Génome visuel [Méta]
- Base de données de visages YouTube [méta]
Apprentissage automatique
- Ensemble de données All-Age-Faces - Contient 13'322 images de visages asiatiques réparties sur tous les âges (de 2 [...] [Meta]
- Ensemble de données de conduite autonome Audi - Nous avons publié l'ensemble de données de conduite autonome Audi [...] [Méta]
- B3FD - Ensemble de données d'estimation de l'âge du visage (et du sexe) avec 375 000 images - L'ensemble de données B3FD est un [...] [Méta]
- Ensembles de données contextuelles provenant de cinq domaines [Meta]
- Delve Ensembles de données pour la classification et la régression [Meta]
- Données mensuelles Discogs [Méta]
- Cellules neuronales fluorescentes - En publiant cet ensemble de données, nous visons à fournir un nouveau banc d'essai pour [...] [Meta]
- Archives de musique gratuites [Méta]
- Base de données IMDb [Méta]
- Iranis - Un ensemble de données à grande échelle de caractères de plaque d'immatriculation farsi/arabe [Meta]
- Keel Repository pour la classification, la régression et les séries chronologiques [Meta]
- LLVIP - Cet ensemble de données contient 30976 images, soit 15488 paires, dont la plupart ont été prises à très [...] [Meta]
- Visages étiquetés dans la nature (LFW) [Méta]
- Données sur les prêts des clubs de prêt [méta]
- Référentiel d'ensembles de données d'apprentissage automatique [méta]
- Ensemble de données d'un million de chansons [méta]
- Plus d'ensembles de données de chansons [Méta]
- Ensembles de données MovieLens [méta]
- Notes du concours de sous-titres du New Yorker [Meta]
- RDataMining - Données de l'ebook "R et Data Mining" [Méta]
- Météorites enregistrées sur Terre [Meta]
- Données sur le score de santé des restaurants à San Francisco [Meta]
- Ensemble de données TikTok - Plus de 300 vidéos de danse qui capturent une seule personne exécutant de la danse [...] [Meta]
- Référentiel d'apprentissage automatique UCI [Méta]
- Yahoo! Données de notation et de classification [méta]
- YouTube-BoundingBoxes [Méta]
- Youtube 8 min [Méta]
- Enchères en ligne eBay (2012) [Méta]
Musées
- Données ouvertes de la Société des musées de sciences et technologies du Canada [Méta]
- Base de données de collection de Cooper-Hewitt [Méta]
- API de la collection du Metropolitan Museum of Art [Méta]
- Métadonnées du Minneapolis Institute of Arts [Méta]
- Portail de données du Musée d'histoire naturelle (Londres) [Meta]
- Collection d'art historique du Rijksmuseum [Méta]
- Métadonnées de la collection Tate [Méta]
- Les vocabulaires Getty [Meta]
Langage Naturel
- Extraction automatique de phrases clés [méta]
- La base de données Big Bad PNL [Méta]
- Blizzard Challenge Speech - Les données vocales + texte proviennent de livres audio professionnels [...] [Meta]
- Corpus des blogueurs [méta]
- Corpus d'investigation sur la stylométrie CLIPS [Méta]
- ClueWeb09 FACC [Méta]
- ClueWeb12 FACC [Méta]
- DBpedia - Données structurées de Wikipédia [Meta]
- Mots sales - Avec des millions d'images dans notre bibliothèque et des milliards de mots-clés soumis par les utilisateurs, [...] [Méta]
- Taxonomies personnelles Flickr [Méta]
- Base gratuite de personnes, de lieux et de choses [Meta]
- Corpus des discours politiques allemands - Collection de discours politiques de l'Allemagne [...] [Meta]
- Google Livres Ngrams (2,2 To) [Méta]
- Google MC-AFP - Généré sur la base de l'ensemble de données Gigaword accessible au public à l'aide de vecteurs de paragraphe [Méta]
- Google Web 5gram (1 To, 2006) [Méta]
- Liste des livres électroniques de Gutenberg [Méta]
- Des extraits de textes du hansard du Parlement canadien [Meta]
- LJ Speech - Ensemble de données vocales composé de 13 100 courts clips audio d'un seul locuteur lisant [...] [Méta]
- M-AILabs Speech - L'ensemble de données vocales M-AILABS est le premier grand ensemble de données que nous exploitons [...] [Méta]
- Ensemble de données Microsoft MAchine Reading COmprehension (ou MS MARCO) [Méta]
- Test de compréhension automatique (MCTest) du texte de Microsoft Research [Meta]
- Traduction automatique des langues européennes [Meta]
- Donner du sens aux microposts 2013 - Extraction de concepts [Méta]
- Donner du sens aux microposts 2016 - Reconnaissance et liaison des entités nommées [Meta]
- Ensemble de données de sentiment multi-domaines (version 2.0) [Méta]
- No Language Left Behind (NLLB - 200vo) - Ensemble de données basé sur les métadonnées de Meta pour le bitexte extrait. [...] [Méta]
- Base de données vocale bruyante pour la formation des algorithmes d'amélioration de la parole et des modèles TTS - Clean and [...] [Meta]
- Ouvrir Wordnet multilingue [Méta]
- Données annotées POS/NER/Chunk [Méta]
- Personae Corpus [Méta]
- Collecte de spam SMS en anglais [Meta]
- Collection SaudiNewsNet d'articles de journaux saoudiens (arabe, 30 000 articles) [Meta]
- Ensemble de données de réponse aux questions de Stanford (SQuAD) [Méta]
- Corpus de publications USENET de 2005 à 2011 [Méta]
- Dépendances universelles [méta]
- Webhose - Actualités/Blogs en plusieurs langues [Meta]
- Wikidata - Bases de données Wikipédia [Méta]
- Données de liens Wikipedia - 40 millions d'entités en contexte [Méta]
- Bases de données et outils WordNet [Méta]
- Banque de mots - Base de données ouverte et anonymisée sur le développement du vocabulaire de 84 138 enfants et [...] [Méta]
- Corpus WorldTree de graphiques explicatifs pour les questions scientifiques élémentaires - un corpus de [...] [Méta]
Neurosciences
- Ensembles de données de l'Institut Allen [Méta]
- Catalogue du cerveau [méta]
- Brainomique [Méta]
- Ensembles de données CodeNeuro [Méta]
- Recherche collaborative en neurosciences computationnelles (CRCNS) [Meta]
- FCP-INDI [Méta]
- Projet Connectome Humain [Méta]
- NDAR [Méta]
- Archives de données NIMH [Méta]
- NeuroData [Méta]
- NeuroMorpho - NeuroMorpho.Org est un inventaire centralisé de documents reconstruits numériquement [...] [Meta]
- Neuroélectro [Méta]
- OASIS [Méta]
- OpenNEURO [Méta]
- OpenfMRI [Méta]
- Étudier la forêt [méta]
- L'ensemble de données EEG / ERP NenCki-Symfonia - un ensemble de données d'électroencéphalographie à haute densité (EEG) [...] [Meta]
Physique
- CERN Open Data Portal [Meta]
- Crystallographing Open Database [META]
- Icecube - Observatoire de neutrinos du pôle Sud [META]
- LIGO Open Science Center (LOSC) - Données d'ondes gravitationnelles du Ligo Hanford et [...] [Meta]
- Archive d'exoplanet de la NASA [Meta]
- Données NSSDC (NASA) de 550 vaisseaux spatiaux spatiaux [META]
- Simulations quantiques d'un électron dans un puits de potentiel bidimensionnel - les données étaient [...] [Meta]
- Sloan Digital Sky Survey (SDSS) - Cartographie de l'univers [Meta]
Prostatecancer
- EOPC-de-de-Orly-Os-Postate-Cancer-Germany - Cancer de la prostate à début précoce - Allemagne. [...] [Meta]
- Genie - Données du projet Genomics Evidence Néoplasie Information Exchange (GENIE) du [...] [Meta]
- Genomic-Hallmarks-Prostate-adénocarcinome-CPC-Gene - Profil génomique complet de 477 [...] [META]
- MSK-IMPACT-Clinical-Sequencing-CoHORT-MSKCC-PROSTAT-CANCER - Séquençage ciblé de [...] [...] [META]
- Metastatic-prostate-adénocarcinome-MCTP - Profil complet du cancer de la prostate [...] [Meta] [Meta]
- Metastatic-Prostate-Cancer-Su2CPCF-Dream-Team - Analyse complète de 150 Metastatic [...] [Meta]
- NPCR-2001-2015 - Base de données du programme national des registres du cancer du CDC (NPCR). Le [...] [Meta]
- NPCR-2005-2015 - Base de données du programme national des registres du cancer du CDC (NPCR). Le [...] [Meta]
- NAF-ProState - NAF Prostate est une collection de tomographie par émission de positron NAF F-18 / calculée [...] [Meta]
- Cancer neuroendocrinien-prostate - Données entières de l'exome et de l'ARN de la castration [...] [META]
- PLCO-PROSTAT-DIAGNOSTIQUE-PROCEDURES - L'ENTRATION DES PROCÉDURES DE DIAGNOSTIC PROSTATE (95 837 [...] [META]
- PLCO-PROSTAT-MÉDICALES-COMPLICATIONS - L'ensemble de données des complications médicales de la prostate (3 350 [...] [Meta]
- PLCO-PROSTAT-SCREING-ABNORMALITÉS - L'ensemble de données d'anomalies de dépistage de la prostate (10 527 [...] [Meta]
- PLCO-ProState-Screening - L'ensemble de données de dépistage de la prostate (177 315 enregistrements, 35 875 sujets, [...] [Meta]
- PLCO-PROSTAT-TREATS - L'ensemble de données sur les traitements de la prostate (13 409 enregistrements, 7 614 sujets, [...] [Meta]
- PLCO-PROSTAT - L'ensemble de données de la prostate est un ensemble de données complet qui contient presque tous les [...] [Meta]
- PRAD-CA-PROSTATE-ADENOCARCINOMA-CANADA - Adénocarcinome de la prostate - Canada. Collecté par le [...] [méta]
- PRAD-FR-PROSTAT-Adénocarcinome-France - Adénocarcinome de la prostate - France. Collecté par dix [...] [Meta]
- PRAD-UK-Prostate-adénocarcinome-United-Kingdom - Adénocarcinome de la prostate - Royaume-Uni. [...] [Meta]
- Prostatex-challenge - Ensemble rétrospectif d'études MR de la prostate. Toutes les études incluaient [...] [Meta]
- Prostate-3T - Le projet Prostate-3T a fourni des données d'imagerie à TCIA dans le cadre d'un ISBI [...] [Meta]
- Prostate-adénocarcinome-Broad-Cornell-2012 - Profil complet de 112 cancer de la prostate [...] [Meta]
- Prostate-adénocarcinome-Broad-Cornell-2013 - Profil complet du cancer de la prostate 57 [...] [Meta]
- Prostate-adénocarcinoma-cNA-study-mskcc - profilage de numéro de copie de 103 prostate primaire [...] [Meta]
- Prostate-adénocarcinome-fred-hutchinson-CRC - Profil complet du cancer de la prostate [...] [Meta]
- Adénocarcinome de la prostate (MSKCC / DFCI) - Séquençage en exome entier de 1013 échantillons de cancer de la prostate. [Meta]
- Prostate-adénocarcinome-MSKCC - Projet de prostate MSKCC ONCOGENOME. 181 primaire, 37 métastatiques [...] [Meta]
- Prostate-adénocarcinome-organoïdes-MSKCC - Profil exome des échantillons de cancer de la prostate et [...] [Meta]
- Prostate-adénocarcinome-sun-lab - séquençage du génome entier et du transcriptome de 65 prostate [...] [Meta]
- Prostate-adénocarcinoma-TCGA-Pancancer-atlas - Données complètes de TCGA Pancanatlas de 11K [...] [Meta]
- Prostate-adénocarcinome-TCGA - Profil intégré de 333 échantillons d'adénocarcinome primaire de la prostate. [Meta]
- Diagnostic de la prostate - des images de résonance magnétique pondérées PCA T1 et T2 (IRM) ont été acquises [...] [META]
- Prostate Fused-MRI-Pathology - La collection de la prostate Fused-MRI-Pathology est une combinaison [...] [Meta]
- Prostate-MRI - La collection de la prostate-MRI d'images de résonance magnétique de la prostate (MRIS) était [...] [Meta]
- Prostate-R - Le package R 'elemstatlearn' contient un ensemble de données de cancer de la prostate de Stamey et [...] [Meta]
- Qin-Prostate-Repeatabilité - L'ensemble de données Qin-Prostate-Repeatabilité est un ensemble de données avec [...] [Meta]
- Qin-Prostate - La collection de prostate Qin du réseau d'imagerie quantitative (Qin) contient [...] [Meta]
- SEER-ALR1973_2015.SEER9 - Les fichiers de données de recherche SEER novembre 2017 de neuf registres SEER [...] [Meta]
- SEER-ALR1992_2015.SJ_LA_RG_AK - Les fichiers de données de recherche de novembre 2017 de SEER du San Jose- [...] [Meta]
- SEER-ALR2000_2015.CA_KY_LO_NJ_GA - Les fichiers de données de recherche de novembre 2017 de SEER de la plus grande [...] [Meta]
- SEER-ALR2000_2015.CA_KY_LO_NJ_GA - Les diagnostics de juillet - décembre 2005 pour la Louisiane de leur [...] [Meta]
- TCGA-PRAD-US - Adénocarcinome de la prostate TCGA (499 échantillons). [Meta]
Psychologie + cognition
- Ensembles de données de référentiel de modélisation cognitive OSU [META]
- Données de sciences cognitives ouvertes - ensembles de données comportementales accessibles au public à partir de tous les cognitives [...] [Meta]
Public
- Données en temps réel ouvertes et habilement [META]
- Amazon [Meta]
- Ensembles de données archive.org [Meta]
- Archive-it from Internet Archive [Meta]
- Archive de données CMU JASA [META]
- CMU StatLab Collections [META]
- Data.world [meta]
- DATA360 [META]
- Enigma Public [Meta]
- Google [Meta]
- Grand Comics Database - La base de données Grand Comics (GCD) est une organisation à but non lucratif et basée sur Internet [...] [Meta]
- Infochimps [Meta]
- Collections de données de Kdnuggets [META]
- Microsoft Azure Data Market Free DataSets [META]
- Microsoft Data Science for Research [Meta]
- Microsoft Research Open Data [Meta]
- Ouvrir des vidages de données de bibliothèque [Meta]
- Ensembles de données Reddit [Meta]
- RevolutionAnalytics Collection [Meta]
- Exemples d'ensembles de données R [META]
- Stack Overflow Annual Developer Survey - Annual Developer Survent les ensembles de données complets de 2011 [...] [META]
- Statsci.org [meta]
- Ensembles de données Stats4stem R (archivés) [META]
- La liste des Postes de Washington [Meta]
- Collection de données UCLA SOCR [META]
- Rapports d'UFO [META]
- WikiLeaks 911 Interceptions de téléavertisseur [Meta]
- Yahoo Webcope [Meta]
Recherche de recherche
- Torrents académiques du partage de données de l'UMB [Meta]
- Base DOS DADOS - Base de données: Open Data Repository pour le Brésil [META]
- Datahub.io [meta]
- Projet de domaines - Liste triée des domaines Internet [META]
- Harvard Dataverse Network of Scientific Data [Meta]
- ICPSR (UMICH) [META]
- Institut des sciences de l'éducation [META]
- Bibliothèque nationale des rapports techniques [Meta]
- Certificats de données ouverts (bêta) [META]
- OpenDatanetwork - un moteur de recherche de tous les portails de données alimentés par Socrata [Meta]
- Statista.com - Statistiques et études [Meta]
- Zenodo - Une maison ouverte fiable pour la longue queue de la science [Meta]
SocialNetworks
- 2021 Élections portugaises Twitter Dataset - 57m + tweets, 1m + utilisateurs - Cet ensemble de données contient [...] [Meta]
- 72 heures #GaMergate Twitter Scrape [Meta]
- Email CMU Enron de 150 utilisateurs [META]
- Cheng-Caverlee-Lee septembre 2009 - janvier 2010 Twitter Scrape [Meta]
- Base de données biographique chinoise - La base de données biographique chinoise est une [...] [...] [Meta] librement accessible
- Ensemble de données Clubhouse [Meta]
- Un ensemble de données Twitter de plus de 40 millions de tweets liés à Covid-19 - en raison de la pertinence du [...] [Meta]
- 43K + Donald Trump Twitter Captures d'écran - Cette archive contient des captures d'écran de 43 475 Donald [...] [Meta]
- EDRM ENRON Email de 151 utilisateurs, hébergé sur S3 [Meta]
- Facebook Data Scrape (2005) [Meta]
- Index de connectivité sociale Facebook - Nous utilisons un instantané anonymisé de tous les Facebook actifs [...] [Meta]
- Réseaux sociaux Facebook de la loi (depuis 2007) [Meta]
- Foursquare de UMN / Sarwat (2013) [Meta]
- Archive de collaboration GitHub [Meta]
- Google Scholar Relations de citation [Meta]
- Réseaux de contact haute résolution à partir de capteurs portables [META]
- Carte indépendante: graphique social et rampe des meilleurs sites indieweb [Meta]
- Réseaux sociaux mobiles de UMass [Meta]
- Network Twitter Data [Meta]
- Reddit commente [Meta]
- Ensemble de données sur les avis sur les voyages aériens de Skytrax [Meta]
- Données sociales sur Twitter [Meta]
- Sourceforge.net Research Data [META]
- L'ensemble de données Covid Reddit - Cet ensemble de données tente de saisir toute l'étendue de Covid-19 [...] [Meta]
- Twitch Top Streamer's Data [Meta]
- Données Twitter pour la gestion de la réputation en ligne [Meta]
- Données Twitter pour l'analyse des sentiments [Meta]
- Graphique Twitter du site Twitter entier [Meta]
- Twitter Scrape Calufa mai 2011 [Meta]
- Ensembles de données de réseaux sociaux Unimi / Law [META]
- United States Congress Twitter Données - ensembles de données quotidiens avec des tweets de plus de 1100 comptes associés [...] [Meta]
- Yahoo! Graphique et données sociales [Meta]
- Graphique social de la vidéo YouTube en 2007,2008 [Meta]
Sciences sociales
- ACLED (Armed Conflict Location & Event Data Project) [Meta]
- Base de données des élites dirigeantes autoritaires - La base de données autoritaire des élites dirigeantes (Ared) est un [...] [Meta]
- Institut d'information juridique canadien [META]
- Ensembles de données Systemic Peace - Tendances des conflits, politiques, fragilité de l'État, etc. [META]
- Corrélats du projet de guerre [Meta]
- Éléments de théorie du complot cryptome [Meta]
- Datacards [Meta]
- Enquête sociale européenne [META]
- FBI Hate Crime 2013 - Données agrégées [META]
- Index des États fragiles [META]
- Base de données GDELT Global Events [META]
- Enquête sociale générale (GSS) depuis 1972 [META]
- Enquête sociale allemande [Meta]
- Projet mondial des futurs religieux [Meta]
- Données sur la violence armée - Une base de données complète et accessible qui contient des enregistrements de plus de 260k [...] [Meta]
- Échange de données humanitaires [Meta]
- Informer l'indice de la gestion des risques [META]
- Institut d'études démographiques [META]
- Inter-American Development Bank Open Data [META]
- Archives de réseaux internationaux [Meta]
- Programme de levé social international ISSP [META]
- Projet de recueil d'études internationales [META]
- James McGuire Cross National Data [Meta]
- Ensemble de données de réalité MIT [META]
- Guide MacroTa par Norsk Samfunnsvitenskapelig DatatJeneste [Meta]
- Projet de données de mobilisation de masse - Les données de mobilisation de masse (MM) sont un effort pour comprendre [...] [Meta]
- Microsoft Academic Knowledge Graph - Le graphique de connaissances académiques Microsoft est un grand RDF [...] [Meta]
- Minnesota Population Center [Meta]
- Notre Dame Global Adaptation Index (ND-GAIN) [META]
- Données ouvertes sur la criminalité et la police en Angleterre, au Pays de Galles et en Irlande du Nord [Meta]
- OpenSanctions - Une base de données mondiale de personnes et d'entreprises de politique, criminel ou [...] [Meta]
- PAUL HENSEL PAGE GÉNÉRALE INTERNATIONAL [META]
- Projet d'enquête Internet PewResearch [META]
- Collection de données de la société Pewresearch [Meta]
- Données de polarité politique [Meta]
- StacKExchange Data Explorer [META]
- Consortium de recherche et d'analyse du terrorisme [META]
- Les détenus du Texas exécutés depuis 1984 [Meta]
- Ensemble de données de survie Titanic [META]
- Les archives des données des sciences sociales de l'UCB (D-Lab) [META]
- Archive de données des sciences sociales de l'UCLA [META]
- Base de données de la société civile des Nations Unies [Meta]
- Upjohn pour la recherche sur l'emploi du travail [META]
- Universités du monde [Meta]
- Programme de données de conflit Uppsala [META]
- Données ouvertes de la Banque mondiale [Meta]
- Base de données mondiale d'inégalité - La base de données mondiale d'inégalité (wid.world) vise à fournir des [...] [Meta] ouverts [...] [Meta]
- Projet WorldPop - Distributions mondiales de population humaine [Meta]
Logiciel
- Flossmole Données sur le développement de logiciels gratuits, libre et open source [META]
- GHTorrent - Miroir hors ligne évolutif, interrogable des données proposé via l'API GitHub REST. [Meta]
- Bibliothèques.io Metadata du référentiel open source et de dépendance [Meta]
- Archive Git Public - un ensemble de données Big Code pour tous - ensemble de données de 182 014 Top-Bookked Git [...] [Meta]
- Duplicats de code - Fichier Java 2K et 600 paires de fonctions Java étiquetées comme similaires ou différentes par [...] [Meta]
- Commissez les messages - 1,3 milliard de github commet les messages jusqu'en mars 2019 [Meta]
- Pull Demande Review Commentaires - 25,3 millions de commentaires GitHub PR depuis janvier 2015 jusqu'à [...] [Meta]
- Identificateurs de code source - 41,7 millions d'identifiants divisables distincts collectés de 182 014 [...] [Meta]
Sportif
- American Ninja Warrior Obstacles - Contient tous les obstacles dans l'histoire du ninja américain [...] [Meta]
- Données d'échange historique de Betfair [Meta]
- Matches de Cricsheet (Cricket) [Meta]
- Équité dans l'athlétisme - L'outil de coupe d'analyse des données de l'équité dans l'athlétisme vous est apporté par [...] [Meta]
- Formule Ergast 1, de 1950 à jour (API) [Meta]
- Ressources de football / soccer (données et API) [Meta]
- Base de données de baseball de Lahman [Meta]
- NFL Play-by-Play Data - NFL Play-by-Play Data provenant de: [...] [Meta]
- Pinhooker: Données de vente de BloodStock de pur-sang [Meta]
- Pro Kabadi Saison 1 à 7 - Pro Kabadi League est une ligue Kabaddi de niveau professionnel en Inde. [...] [Meta]
- Statistiques de baseball RetroSheet [META]
- Base de données de tennis des classements, des résultats et des statistiques pour ATP [META]
- Base de données de tennis des classements, des résultats et des statistiques pour WTA [META]
- Ensembles de données TransferMarkt - Données de football (Soccer) propres, structurés et automatiquement mis à jour [...] [META]
- Équipes et emplacements de football américains - équipes et emplacements de football américains. MLS, NWSL et USL [...] [Meta]
Séries inarnales
- Ensemble de données 3W - Au meilleur des connaissances de ses auteurs, il s'agit du premier réaliste et public [...] [Meta]
- Databanks International Cross National Series Time Series Archive [META]
- Taux de défaillance du disque dur [Meta]
- Série chronologique cardiaque du MIT [Meta]
- Bibliothèque de données sur séries chronologiques (TSDL) de Mu [Meta]
- Turing Change Point DataSet - contient 42 séries chronologiques annotées collectées pour le développement [...] [Meta]
- UC Riverside Time Series DataSet [META]
Transport
- Airlines OD Data 1987-2008 [META]
- Ford Gobike Data (anciennement Bay Area Bike Share Data) [Meta]
- Collection des systèmes de partage de vélos (BSS) [META]
- Informations sur le trafic néerlandais [Meta]
- Trajectoire GPS de Geolife de Microsoft Research [Meta]
- Système de train allemand par Deutsche Bahn [Meta]
- Hubway Million Rides dans MA [Meta]
- Melbourne Pitestrian Counting - Cet ensemble de données contient des comptes de piétons horaires depuis 2009 [...] [Meta]
- Montréal Bixi Bike Share [Meta]
- NYC Taxi Trip Data 2009- [Meta]
- NYC Taxi Trip Data 2013 (FOIA / Foiled) [Meta]
- NYC Uber Trip Data avril 2014 à septembre 2014 [Meta]
- Collection de trafic ouvert [Meta]
- OpenFlights - Données aéroport, aérienne et itinéraire [Meta]
- Philadelphia Bike Share Stations (JSON) [Meta]
- Base de données de crash d'avion, depuis 1920 [Meta]
- Rita Airline On Time Performance Data [META]
- Rita / BTS Transport Data Collection (TRANSTAT) [META]
- Ensemble de données Renfe (National Railway Network) [Meta]
- Toronto Bike Share Stations (fichiers JSON et GBFS) [Meta]
- Transport pour Londres (TFL) [Meta]
- Travel Tracker Survey (TTS) pour Chicago [Meta]
- Bureau américain des statistiques de transport (BTS) [META]
- Vols intérieurs américains 1990 à 2009 [META]
- Cadre d'analyse du fret américain depuis 2007 [META]
- US National Highway Traffic Safety Administration - Fatalités Depuis 1975 - contient CSV [...] [Meta]
eSports
- CS: Données de matchmaking compétitives - Dans cet ensemble de données, nous avons des données sur le matchmaking CSGO [...] [Meta]
- Ensemble de données de lecteur complet FIFA-2021 [META]
- OpenDota Data Dump [Meta]
Collections complémentaires
- Données de données de base emballées
- OpenDatamonitor: un aperçu des ressources de données ouvertes disponibles en Europe
- Quora: Où puis-je trouver de grands ensembles de données ouverts au public?
- Rs.IO: 100+ ensembles de données intéressants pour les statistiques
- Cvonline: bases de données d'image
- Innotrek: tirer parti des données ouvertes pour comprendre les vies urbaines
- Papiers CV: ensembles de données CV sur le Web
Un merci spécial à