Impresionantes conjuntos de datos públicos
Esta es una lista de fuentes de datos públicos centradas en temas de alta calidad. Se recopilan y ordenan a partir de blogs, respuestas y respuestas de los usuarios. La mayoría de los conjuntos de datos que se enumeran a continuación son gratuitos, aunque algunos no lo son. Este proyecto fue incubado en OMNILab, Universidad Jiao Tong de Shanghai durante el doctorado de Xiaming Chen. estudios. OMNILab ahora es parte de la comunidad BaiYuLan Open AI. Se pueden encontrar otras listas increíblemente impresionantes en la increíble lista de sindresorhus.
AVISO : este repositorio lo genera automáticamente apd-core. NO modifique este archivo directamente. Hemos proporcionado una nueva forma de contribuir a este repositorio. Únase a la comunidad de Slack para recibir un toque instantáneo de actualizaciones de datos de HQ.
- Yo soy así.
- Por favor arréglame.
Tabla de contenido
- Agricultura
- Arquitectura
- Biología
- Química
- Clima+Tiempo
- Redes complejas
- Redes Informáticas
- Ciberseguridad
- Desafíos de datos
- Ciencias de la Tierra
- Ciencias económicas
- Educación
- Energía
- Entretenimiento
- Finanzas
- SIG
- Gobierno
- Cuidado de la salud
- Procesamiento de imágenes
- Aprendizaje automático
- Museos
- Lenguaje Natural
- Neurociencia
- Física
- Cáncer De Próstata
- Psicología+Cognición
- Dominios públicos
- Motores de búsqueda
- Redes Sociales
- Ciencias Sociales
- Software
- Deportes
- Serie temporal
- Transporte
- deportes electrónicos
- Colecciones complementarias
Agricultura
- El conjunto de datos globales de rendimientos históricos de los principales cultivos 1981-2016: el conjunto de datos global de [...] [Meta]
- Conjunto de datos de referencia hiperespectrales sobre la humedad del suelo: este conjunto de datos se midió en un período de cinco días [...] [Meta]
- Conjunto de datos de control de calidad de limones: se ha preparado un conjunto de datos de limón para investigar la [...] [Meta]
- Índice de Vegetación Ajustado del Suelo Optimizado - El BID es una herramienta para trabajar con teledetección [...] [Meta]
- Base de datos de nutrientes del Departamento de Agricultura de EE. UU. [Meta]
- Base de datos PLANTS del Departamento de Agricultura de EE. UU.: la lista de verificación completa de PLANTS es de casi 7 [...] [Meta]
Arquitectura
- Modelos de apartamentos suizos: este conjunto de datos contiene datos detallados sobre 42,207 apartamentos (242,257 [...] [Meta]
Biología
- 1000 Genomas - El Proyecto 1000 Genomas se desarrolló entre 2008 y 2015, creando el mayor [...] [Meta]
- ANHIR - Registro automático de imágenes histológicas no rígidas (ANHIR) consta de 2D [...] [Meta]
- American Gut (Proyecto Microbioma): el proyecto American Gut es el mayor proyecto de crowdsourcing [...] [Meta]
- BCNB: hay WSI de 1058 pacientes, parte de las regiones tumorales están anotadas en los WSI. Excepto [...] [Meta]
- Colección Broad Bioimage Benchmark (BBBC) - Colección Broad Bioimage Benchmark (BBBC) [...] [Meta]
- Enciclopedia amplia de líneas celulares cancerosas (CCLE) [Meta]
- CIMA: el conjunto de datos CIMA incluye imágenes de cortes de tejido de microscopía histológica 2D. [Meta]
- Biblioteca de imágenes celulares: esta biblioteca es una base de datos de recursos pública y de fácil acceso de [...] [Meta]
- Datos públicos completos de genómica: un conjunto diverso de datos de genomas humanos completos se puede acceder libremente [...] [Meta]
- CytoImageNet: un conjunto de datos a gran escala de imágenes de microscopía. Contiene 890,737 escalas de grises totales [...] [Meta]
- EBI ArrayExpress: el archivo ArrayExpress de datos genómicos funcionales almacena datos de alta [...] [Meta]
- Banco de datos de proteínas EBI en Europa: el banco de datos de microscopía electrónica (EMDB) es un banco público [...] [Meta]
- Proyecto ENCODE: el consorcio de la Enciclopedia de elementos de ADN (ENCODE) es un proyecto en curso [...] [Meta]
- Archivo de Imágenes Piloto de Microscopía Electrónica (EMPIAR) - EMPIAR, el Archivo Público de Microscopía Electrónica [...] [Meta]
- Conjunto de genomas [Meta]
- Gene Expression Omnibus (GEO): GEO es un repositorio público de datos genómicos funcionales [...] [Meta]
- Ontología genética (GO): archivos de anotaciones GO [Meta]
- Interacciones bióticas globales (GloBI) [Meta]
- Proyecto LINCS de la Escuela de Medicina de Harvard (HMS) - El Centro LINCS de la Escuela de Medicina de Harvard (HMS) es [...] [Meta]
- Proyecto de Diversidad del Genoma Humano - Un grupo de científicos de la Universidad de Stanford ha [...] [Meta]
- Proyecto Microbioma Humano (HMP): el HMP secuenció más de 2000 genomas de referencia aislados de [...] [Meta]
- ICOS PSP Benchmark: el repositorio de puntos de referencia de ICOS PSP contiene un mundo real ajustable [...] [Meta]
- Proyecto Internacional HapMap [Meta]
- Revista de biología celular DataViewer [Meta]
- KEGG: KEGG es un recurso de base de datos para comprender funciones y utilidades de alto nivel de [...] [Meta]
- Proteínas NCBI [Meta]
- Taxonomía NCBI: la base de datos de taxonomía NCBI es un conjunto seleccionado de nombres y clasificaciones para [...] [Meta]
- NCI Genomic Data Commons: el portal de datos GDC es una plataforma sólida basada en datos que permite [...] [Meta]
- Datos de microarrays del NIH [Meta]
- Datos de genotipos OpenSNP: openSNP permite a los clientes de pruebas genéticas directas al cliente [...] [Meta]
- Palmer Penguins: el objetivo de Palmer Penguins es proporcionar un excelente conjunto de datos para datos [...] [Meta]
- Pathguid - Catálogo de interacciones proteína-proteína [Meta]
- Banco de datos de proteínas: este recurso funciona con información de archivo del Banco de datos de proteínas [...] [Meta]
- Consorcio de Genómica Psiquiátrica - El propósito del Consorcio de Genómica Psiquiátrica (PGC) es [...] [Meta]
- Proyecto PubChem: PubChem es la colección más grande del mundo de productos químicos de libre acceso [...] [Meta]
- PubGene (ahora Coremine Medical): COREMINE™ es una familia de herramientas desarrolladas por el noruego [...] [Meta]
- Catálogo Sanger de mutaciones somáticas en cáncer (COSMIC) - COSMIC, el catálogo de mutaciones somáticas [...] [Meta]
- Proyecto Sanger de Genómica de la Sensibilidad a los Medicamentos en el Cáncer (GDSC) [Meta]
- Archivo de lectura de secuencia (SRA): el archivo de lectura de secuencia (SRA) almacena datos de secuencia sin procesar de [...] [Meta]
- Serratus - Análisis de 7,1 millones de conjuntos de datos de secuenciación de ARN/ADN para descubrir el total [...] [Meta]
- Datos de microarrays de Stanford (retirado AHORA) [Meta]
- Repositorio de datos originales del Instituto Stowers [Meta]
- Base de datos de ciencia de sistemas de dinámica biológica (SSBD) - Ciencia de sistemas de dinámica biológica [...] [Meta]
- Atlas del genoma del cáncer (TCGA), disponible a través de Broad GDAC [Meta]
- El Catálogo de la Vida - El Catálogo de la Vida es una lista de verificación de calidad asegurada de más de 1,8 [...] [Meta]
- El Proyecto Genoma Personal - El Proyecto Genoma Personal, iniciado en 2005, es una visión y [...] [Meta]
- Datos públicos de la UCSC [Meta]
- UniGene [Meta]
- Recurso Proteico Universal (UnitProt) - El Recurso Proteico Universal (UniProt) es un [...] [Meta]
- Rfam: la base de datos Rfam es una colección de familias de ARN, cada una representada por múltiples [...] [Meta]
Química
- Base de datos de líquidos iónicos - ILThermo [Meta]
Clima+Tiempo
- Índice climático de actuarios [Meta]
- Clima australiano [Meta]
- Centro meteorológico de aviación: información meteorológica consistente, oportuna y precisa para el mundo [...] [Meta]
- Clima Brasileño - Datos históricos (En portugués) - Datos relacionados con el clima y el tiempo [...] [Meta]
- Varios conjuntos de datos climáticos: el C3S Climate Data Store (CDS) es una ventanilla única para [...] [Meta]
- Centro Meteorológico Canadiense [Meta]
- Caravan: un conjunto de datos para hidrología de muestras grandes: Caravan es un conjunto de datos comunitario abierto de [...] [Meta]
- Datos climáticos de la UEA (actualizados mensualmente) [Meta]
- Clima holandés: el portal KNMI Data Center (KDC) brinda acceso a datos de KNMI sobre el clima, [...] [Meta]
- Conjunto de datos y evaluación del clima europeo [Meta]
- Centro alemán de datos climáticos [Meta]
- Datos climáticos globales desde 1929 [Meta]
- Trazando la narrativa de noticias sobre el cambio climático global 2009-2020: estos cuatro conjuntos de datos representan [...] [Meta]
- Servicios de exploración de imágenes globales de la NASA [Meta]
- NOAA Clima del Mar de Bering [Meta]
- Conjuntos de datos climáticos de la NOAA [Meta]
- Modelos meteorológicos en tiempo real de la NOAA [Meta]
- Conjuntos de datos de radiación y meteorología de NOAA SURFRAD [Meta]
- Open-Meteo - API meteorológica de código abierto - API meteorológica de código abierto con acceso gratuito para personas no [...] [Meta]
- Recursos de datos abiertos del Banco Mundial para el cambio climático [Meta]
- Unidad de Investigación Climática de la UEA [Meta]
- Clima histórico de WU en todo el mundo [Meta]
- Wahington Post Cambio Climático - Para analizar el calentamiento de las temperaturas en los Estados Unidos, The [...] [Meta]
- WorldClim - Datos climáticos globales [Meta]
Redes complejas
- Conjunto de datos de la red de citas AMiner [Meta]
- URL DOI de CrossRef [Meta]
- Conjunto de datos de citas DBLP [Meta]
- Colección DIMACS Redes Viales [Meta]
- Citas de patentes NBER [Meta]
- Recopilación de datos de redes complejas del NIST [Meta]
- Repositorio de red con herramientas interactivas de análisis exploratorio [Meta]
- Red de interacción proteína-proteína [Meta]
- Red de dependencia de PyPI y Maven [Meta]
- Base de datos de citas de Scopus [Meta]
- Datos de red pequeña [Meta]
- GraphBase de Stanford [Meta]
- Colección de conjuntos de datos de la gran red de Stanford [Meta]
- Fuentes de datos de la red longitudinal de Stanford [Meta]
- La colección de la red Koblenz [Meta]
- El Laboratorio de Algorítmica Web (UNIMI) [Meta]
- Repositorio de datos de la red UCI [Meta]
- Colección de matrices dispersas de UFL [Meta]
- Base de datos de gráficos WSU [Meta]
- Recurso comunitario para archivar datos inalámbricos en Dartmouth: contiene conjuntos de datos de archivos pcap [...] [Meta]
Redes Informáticas
- 3.500 millones de páginas web de CommonCrawl 2012 [Meta]
- 53.500 millones de clics web de 100.000 usuarios en la Universidad de Indiana. [Meta]
- Conjuntos de datos de Internet CAIDA [Meta]
- Conjuntos de datos inalámbricos CRAWDAD de Dartmouth Univ. [Meta]
- ClueWeb09 - Mil millones de páginas web [Meta]
- ClueWeb12 - 733 millones de páginas web [Meta]
- Datos web CommonCrawl durante 7 años [Meta]
- Predicción de la intención del comprador a partir de datos de comercio electrónico de Clickstream con información de navegación mínima [Meta]
- Datos de clics de Criteo [Meta]
- Repositorio de datos de escaneo en Internet [Meta]
- MIRAGE-2019 - MIRAGE-2019 es un conjunto de datos generado por humanos para análisis de tráfico móvil con [...] [Meta]
- Conjunto de datos de registros DNS de Merklemap: contiene más de 4 mil millones de registros DNS en 700 millones de únicos [...] [Meta]
- OONI: Observatorio Abierto de Interferencias en la Red - Datos de censura en Internet [Meta]
- Abrir datos móviles por MobiPerf [Meta]
- The Peer-to-Peer Trace Archive: las mediciones del mundo real desempeñan un papel clave en el estudio del [...] [Meta]
- Escaneos de Internet con sonda Rapid7 [Meta]
- Telescopio de red UCSD, IPv4 /8 net [Meta]
Ciberseguridad
- CCCS-CIC-AndMal-2020: el conjunto de datos incluye 200.000 muestras benignas y 200.000 muestras de malware por un total de [...] [Meta]
- Datos de tráfico y registros capturados durante un ejercicio de ciberdefensa: este conjunto de datos fue adquirido [...] [Meta]
Desafíos de datos
- Competiciones de IAcrowd [Meta]
- Base de datos de fuerza bruta [Meta]
- Desafíos del aprendizaje automático [Meta]
- Datos de CrowdANALYTIXX [Meta]
- Desafío D4D de Naranja [Meta]
- Concursos DrivenData para el bien social [Meta]
- Desafío de datos ICWSM (desde 2009) [Meta]
- Copa KDD por Tencent 2012 [Meta]
- Datos de competencia de Kaggle [Meta]
- Desafío de visualización de datos de Localytics [Meta]
- Premio Netflix [Meta]
- Desafío de aplicaciones espaciales [Meta]
- Desafío de Big Data de Telecom Italia [Meta]
- Conjunto de datos de TravisTorrent: desafío minero MSR'2017 [Meta]
- TunedIT: conjuntos de datos, algoritmos y desafíos de minería de datos y aprendizaje automático [Meta]
- Desafío del conjunto de datos de Yelp: el conjunto de datos de Yelp es un subconjunto de nuestras empresas, reseñas y usuarios [...] [Meta]
Ciencias de la Tierra
- 38-Cloud (Detección de nubes): contiene 38 imágenes de escenas Landsat 8 y sus extraídas manualmente [...] [Meta]
- AQUASTAT - Recursos y usos mundiales del agua [Meta]
- BODC - datos marinos de ~22K vars [Meta]
- EOSDIS: datos del sistema de observación de la Tierra de la NASA [Meta]
- Modelos terrestres [Meta]
- Global Wind Atlas: Global Wind Atlas es una aplicación web gratuita desarrollada para ayudar [...] [Meta]
- Sistema Integrado de Observación Marina (IMOS): aproximadamente 30 TB de mediciones oceánicas [Meta]
- Marinexplore - Datos oceanográficos abiertos [Meta]
- Sistema de observación costera en tiempo real de Alabama [Meta]
- Programa de Monitoreo de Todo el Sistema de Reservas Nacionales de Investigación Estuarina - estuarinos a largo plazo [...] [Meta]
- Datos abiertos de la Autoridad de Petróleo y Gas: el conjunto de datos cubre 12.500 pozos marinos, 5.000 sísmicos [...] [Meta]
- Base de datos global de volcanes y erupciones del Instituto Smithsonian [Meta]
- Archivos de terremotos del USGS [Meta]
- Predicción del área de protección del cabezal de pozo (zona de protección) mediante curvas de avance: este [...] [Meta]
Ciencias económicas
- Organización Asiática de Productividad (APO): la AEPM proporciona una vista gráfica del panel de [...] [Meta]
- Estadísticas de la ASEAN: el ASEANstatsDataPortal se lanzó por primera vez en junio de 2018. El portal es [...] [Meta]
- Asociación Económica Estadounidense (AEA) [Meta]
- Asian KLEMS - Asia KLEMS es un consorcio de investigación regional asiático para promover la construcción [...] [Meta]
- Atlas de complejidad económica de Harvard: una base de datos para que las personas exploren los flujos comerciales globales [...] [Meta]
- Base de datos financiera del BIS: los archivos contienen los mismos datos que el Explorador de estadísticas del BIS [...] [Meta]
- Nivel educativo de Barro-Lee: datos de nivel educativo de Barro-Lee de 1950 a 2010. [...] [Meta]
- Base de datos CEPII: una base de datos de la economía mundial, a través de sus perfiles de países y regiones, en [...] [Meta]
- EUKLEMS - EU KLEMS es un proyecto de investigación a nivel industrial, de crecimiento y productividad. KLEMS de la UE [...] [Meta]
- Datos sobre la libertad económica del mundo [Meta]
- Cuentas Nacionales Históricas: el centro de datos sobre Cuentas Nacionales Históricas Comparadas [...] [Meta]
- Estadísticas macroeconómicas históricas [Meta]
- INFORUM - Pronóstico interindustrial en la Universidad de Maryland [Meta]
- DBnomics – la base de datos económica del mundo - Agrega cientos de millones de series temporales [...] [Meta]
- Estadísticas de comercio internacional [Meta]
- Base de datos de códigos de productos de Internet [Meta]
- Centro conjunto de datos sobre la deuda externa [Meta]
- Enlaces de datos de comercio internacional de Jon Haveman [Meta]
- América Latina KLEMS - LAKLEMS es un proyecto de cooperación técnica financiado por la Inter- [...] [Meta]
- Base de datos de productividad a largo plazo: la base de datos de productividad a largo plazo se creó como una [...] [Meta]
- Base de datos del Proyecto Maddison: la base de datos del Proyecto Maddison proporciona información comparativa [...] [Meta]
- Cuentas Nacionales de Transferencia - El objetivo del proyecto Cuentas Nacionales de Transferencia (NTA) es [...] [Meta]
- Base de datos OpenCorporates de empresas del mundo [Meta]
- Nuestro mundo en datos [Meta]
- Penn World Table - PWT versión 10.0 es una base de datos con información sobre niveles relativos de [...] [Meta]
- Conjuntos de datos de gravedad del comercio mundial de SciencesPo [Meta]
- El Atlas de la Complejidad Económica [Meta]
- El Centro de Datos Internacionales [Meta]
- El Observatorio de la Complejidad Económica [Meta]
- Estadísticas de comercio de productos básicos de la ONU [Meta]
- Informes de Desarrollo Humano de la ONU [Meta]
- Base de datos mundial de insumos y productos: tablas de insumos y productos mundiales y datos subyacentes, que cubren 43 [...] [Meta]
- World KLEMS: conjuntos de datos analíticos de tipo KLEMS para un amplio conjunto de países de todo el mundo. [...] [Meta]
Educación
- Datos del cuadro de mando universitario [Meta]
- Datos del Departamento de Educación del Estado de Nueva York: El Departamento de Educación del Estado de Nueva York (NYSED) es [...] [Meta]
- Programa de Evaluación de Estudiantes Internacionales (PISA) - Contiene los resultados de estudiantes de 15 años [...] [Meta]
- Datos de estudiantes del Free Code Camp [Meta]
Energía
- AMPds: conjunto de datos del Almanaque de Minutely Power [Meta]
- BLUEd: conjunto de datos de desagregación de electricidad completamente etiquetados a nivel de edificio [Meta]
- PEINADO [Meta]
- DBFC: conjunto de datos de pila de combustible de borohidruro directo (DBFC) [Meta]
- DEL - Conjuntos de datos del estudio de carga eléctrica doméstica para Sudáfrica (1994 - 2014) [Meta]
- ECO: el conjunto de datos ECO es un conjunto de datos completo para el monitoreo de carga no intrusivo y [...] [Meta]
- EIA [Meta]
- Base de datos global de plantas de energía: la base de datos global de plantas de energía es una base de datos completa y de código abierto [...] [Meta]
- HES - Estudio sobre electricidad doméstica, Reino Unido [Meta]
- HFED [Meta]
- MÁS: un conjunto de datos sobre el consumo de electricidad de los edificios marroquíes: desde la primavera de 2019, un dato [...] [Meta]
- Marktstammdatenregister: el Marktstammdatenregister alemán (MaStR) es una base de datos de todos [...] [Meta]
- PEM1 - Conjunto de datos de pilas de combustible de membrana de intercambio de protones (PEM) [Meta]
- PLAID: conjunto de datos de identificación de dispositivos de carga enchufable [Meta]
- El Proyecto de Liberación de Datos de Servicios Públicos (PUDL) - PUDL hace que los datos energéticos de EE. UU. sean más fáciles de acceder [...] [Meta]
- REDD [Meta]
- SYND: un conjunto de datos de energía sintética para el monitoreo de carga no intrusivo. Con SynD, presentamos un [...] [Meta]
- Portal de datos de medidores inteligentes: el portal de datos de medidores inteligentes es parte del National Science [...] [Meta]
- Base de seguimiento [Meta]
- Conjuntos de datos del Centro de Energía de Ucrania [Meta]
- UK-DALE - Electricidad a nivel de electrodomésticos del Reino Unido [Meta]
- BLANQUEADO [Meta]
- iAWE [Meta]
Entretenimiento
- Top Streamers en Twitch: contiene datos de los 1000 mejores streamers del año pasado. [Meta]
Finanzas
- Estadísticas del BPI: estadísticas del BPI, compiladas en cooperación con bancos centrales y otros [...] [Meta]
- Blockmodo Coin Registry: un registro de archivos de información con formato JSON que es principalmente [...] [Meta]
- Bolsa de futuros CBOE [Meta]
- Datos completos de acciones de FAANG: este conjunto de datos contiene todos los datos de acciones de las empresas FAANG de [...] [Meta]
- Finanzas de Google [Meta]
- Tendencias de Google [Meta]
- NASDAQ [Meta]
- Datos de mercado de la Bolsa de Nueva York [Meta]
- OANDA [Meta]
- Datos financieros de OSU [Meta]
- Quandl [Meta]
- SEC EDGAR - EDGAR, el sistema electrónico de recopilación, análisis y recuperación de datos, es el [...] [Meta]
- Federal de San Luis [Meta]
- Yahoo Finanzas [Meta]
SIG
- Impresionantes modelos de ciudades semánticas en 3D: colección de modelos abiertos de ciudades y regiones semánticas en 3D. [Meta]
- Portal de datos abiertos de ArcGIS [Meta]
- Cambridge, MA, EE. UU., datos SIG en GitHub [Meta]
- Base de datos de todos los continentes, países, Estados/Subdivisiones/Provincias y Ciudades - Base de datos [...] [Meta]
- Datos fácticos de ubicación global [Meta]
- Sitio web DASE de la Sociedad de Geociencia y Teledetección del IEEE [Meta]
- Mapas geográficos: mapas GeoJSON de alta calidad generados mediante programación [Meta]
- Datos geoespaciales de ASU [Meta]
- Proyecto Geo Wiki - Monitoreo ambiental impulsado por los ciudadanos [Meta]
- GeoFabrik: datos de OSM extraídos en una variedad de formatos y áreas [Meta]
- GeoNames en todo el mundo [Meta]
- Base de datos de áreas administrativas globales (GADM): datos geoespaciales organizados por país. Incluye [...] [Meta]
- Datos a nivel de la Fundación de Infraestructura Nacional [Meta]
- Landsat 8 en AWS [Meta]
- Lista de todos los países en todos los idiomas [Meta]
- Portal de datos SIG del Servicio Meteorológico Nacional [Meta]
- Tierra natural: vectores y rásteres del mundo [Meta]
- Direcciones abiertas [Meta]
- OpenStreetMap (OSM) [Meta]
- Pléyades - Diccionario geográfico y gráfico de lugares antiguos [Meta]
- Geocodificador inverso usando datos OSM [Meta]
- Robin Wilson - Conjuntos de datos SIG gratuitos [Meta]
- Mapas de acumulación de sombras: el repositorio contiene la información de acumulación de sombras para Nueva York [...] [Meta]
- TIGER/Line - Fronteras y carreteras de EE. UU. [Meta]
- Archivo de forma de zonas horarias TZ [Meta]
- TwoFishes: geocodificador aproximado de Foursquare [Meta]
- Datos medioambientales de la ONU [Meta]
- Fronteras mundiales del Departamento de Estado de EE. UU. [Meta]
- Países del mundo en múltiples formatos [Meta]
Gobierno
- Alberta, Provincia de Canadá [Meta]
- Amberes, Bélgica [Meta]
- Argentina (no oficial) [Meta]
- Datos Argentina - Portal de datos abiertos de la República Argentina. Encontrá datos públicos [...] [Meta]
- Austin, Texas, EE. UU. [Meta]
- Australia (abs.gov.au) [Meta]
- Australia (data.gov.au) [Meta]
- Austria (data.gv.at) [Meta]
- Baton Rouge, Los Ángeles, EE. UU. [Meta]
- Beersheba, Israel - Portal de datos abiertos (Smart7 OpenData) [Meta]
- Bélgica [Meta]
- Datos abiertos de la ciudad de Berkeley [Meta]
- Brasil [Meta]
- Buenos Aires, Argentina [Meta]
- Calgary, AB, Canadá [Meta]
- Cambridge, MA, EE. UU. [Meta]
- Canadá [Meta]
- Chicago [Meta]
- chile [meta]
- China [Meta]
- Datos abiertos de Dallas [Meta]
- DataBC - datos de la provincia de Columbia Británica [Meta]
- Deuda por centavo: el conjunto de datos Deuda por centavo proporciona información sobre el total [...] [Meta]
- Datos abiertos de Denver [Meta]
- Datos abiertos de Durham, Carolina del Norte [Meta]
- Edmonton, AB, Canadá [Meta]
- Inglaterra LGInform [Meta]
- EuroStat [Meta]
- EveryPolitician: proyecto en curso que recopila y comparte datos sobre cada político. [Meta]
- Comité Federal de Metodología Estadística (FCSM) (anteriormente FedStats) [Meta]
- Finlandia [Meta]
- Francia [Meta]
- Fredericton, NB, Canadá [Meta]
- Gatineau, QC, Canadá [Meta]
- Alemania [Meta]
- Gante, Bélgica [Meta]
- Glasgow, Escocia, Reino Unido [Meta]
- Grecia [Meta]
- Gobiernos mundiales guardianes [Meta]
- Halifax, NS, Canadá [Meta]
- Región de Helsinki, Finlandia [Meta]
- Hong Kong, China [Meta]
- Houston, TX, EE. UU. [Meta]
- Datos del gobierno indio [Meta]
- Portal de datos de Indonesia [Meta]
- Iowa: bienvenido al portal de datos del estado de Iowa. Por favor explore datos sobre Iowa y su [...] [Meta]
- Portal de datos abiertos de Irlanda [Meta]
- Portal de datos abiertos de Israel [Meta]
- Portal de datos abiertos del municipio de Estambul [Meta]
- Italia - Il Portale dati.gov.it è il catalogo nazionale dei metadati relativi ai dati [...] [Meta]
- Muertes en prisión en Estados Unidos: el gobierno de EE. UU. no publica datos de mortalidad cárcel por cárcel, [...] [Meta]
- Japón [Meta]
- Laval, QC, Canadá [Meta]
- Lexington, Kentucky [Meta]
- Almacén de datos de Londres, Reino Unido [Meta]
- Londres, ON, Canadá [Meta]
- Datos abiertos de Los Ángeles [Meta]
- Luxemburgo - Portal luxemburgués de datos abiertos [Meta]
- MassGIS, Massachusetts, EE. UU. [Meta]
- Comisión de Transporte Metropolitano (MTC), California, EE. UU. [Meta]
- México [Meta]
- Mississauga, ON, Canadá [Meta]
- Moldavia [Meta]
- Moncton, NB, Canadá [Meta]
- Montreal, QC, Canadá [Meta]
- Mountain View, California, EE. UU. (SIG) [Meta]
- Datos abiertos de Nueva York [Meta]
- Betanyc de Nueva York [Meta]
- Países Bajos [Meta]
- Tonelaje mensual del Departamento de Saneamiento de Nueva York: los datos de tonelaje mensual del DSNY proporcionan [...] [Meta]
- Nueva Zelanda [Meta]
- OCDE [Meta]
- Oakland, California, EE. UU. [Meta]
- Oklahoma [Meta]
- Datos abiertos para África [Meta]
- Plataforma de datos de gobierno abierto (OGD) India [Meta]
- Lista de OpenDataSoft de 1.600 datos abiertos [Meta]
- Oregón [Meta]
- Ottawa, ON, Canadá [Meta]
- Palo Alto, California, EE. UU. [Meta]
- OpenDataPhilly: OpenDataPhilly es un catálogo de datos abiertos en la región de Filadelfia. En [...] [Meta]
- Portland, Oregón [Meta]
- Portugal - Organización Pordata [Meta]
- Gobierno de Puerto Rico [Meta]
- Ciudad de Quebec, QC, Canadá [Meta]
- Provincia de Quebec en Canadá [Meta]
- Regina SK, Canadá [Meta]
- Río de Janeiro, Brasil [Meta]
- Rumania [Meta]
- Rusia [Meta]
- San Diego, California [Meta]
- San Antonio, TX - Community Information Now - CI:Now es una organización sin fines de lucro que presta servicios en Bexar (San [...] [Meta]
- Conjuntos de datos de San Francisco [Meta]
- San José, California, EE. UU. [Meta]
- Condado de San Mateo, California, EE. UU. [Meta]
- Saskatchewan, Provincia de Canadá [Meta]
- Seattle [Meta]
- Datos del gobierno de Singapur [Meta]
- Estadísticas comerciales de Sudáfrica [Meta]
- Sudáfrica [Meta]
- Estado de Utah, EE. UU. [Meta]
- Suiza [Meta]
- Gobierno de Taiwán [Meta]
- Taiwán [Meta]
- Datos abiertos de Tel Aviv [Meta]
- Datos abiertos de Texas [Meta]
- El Banco Mundial [Meta]
- Toronto, ON, Canadá [Meta]
- Túnez [Meta]
- Datos del gobierno del Reino Unido [Meta]
- Encuesta sobre la comunidad estadounidense de EE. UU. [Meta]
- Conjuntos de datos de salud pública de los CDC de EE. UU. [Meta]
- Oficina del Censo de EE. UU. [Meta]
- Departamento de Vivienda y Desarrollo Urbano de EE. UU. (HUD) [Meta]
- Agencias del gobierno federal de EE. UU. [Meta]
- Catálogo de datos del gobierno federal de EE. UU. [Meta]
- Administración de Alimentos y Medicamentos de EE. UU. (FDA) [Meta]
- Centro Nacional de Estadísticas Educativas (NCES) de EE. UU. [Meta]
- Gobierno abierto de EE. UU. [Meta]
- Proyecto Atlas Abierto del Censo 2011 del Reino Unido [Meta]
- Condados de EE. UU.: este es un depósito de diversos datos, desglosados por condado de EE. UU. Mientras que la mayoría de [...] [Meta]
- Productos de datos masivos de la Oficina de Patentes y Marcas de EE. UU. (USPTO) [Meta]
- Oficina de Estadísticas de Uganda [Meta]
- Ucrania [Meta]
- Naciones Unidas [Meta]
- Uruguay[Meta]
- Autoridad de Transporte del Valle (VTA), California, EE. UU. [Meta]
- Catálogo de datos abiertos de Vancouver, BC [Meta]
- Victoria, BC, Canadá [Meta]
- Viena, Austria [Meta]
- Estadísticas de la Oficina General de Estadísticas de Vietnam: los datos en diferentes categorías son [...] [Meta]
- Informes del Servicio de Investigación del Congreso (CRS) de EE. UU. [Meta]
Cuidado de la salud
- Conjuntos de datos de AWS COVID-19: estamos trabajando con organizaciones que crean datos relacionados con COVID-19 [...] [Meta]
- Datos de uso público de vigilancia de casos de COVID-19: la base de datos del sistema de vigilancia de casos de COVID-19 [...] [Meta]
- Datos no procesados Covid-19 de Ecuador - Es un proyecto que proporciona conjuntos de datos no procesados [...] [Meta]
- Repositorio de datos del nuevo coronavirus COVID-19 de 2019 de Johns Hopkins CSSE: estos son los datos [...] [Meta]
- Datos del coronavirus (Covid-19) en Estados Unidos - The New York Times publica una serie [...] [Meta]
- Impacto en los pacientes informado por COVID-19 y capacidad hospitalaria por centro: el siguiente conjunto de datos [...] [Meta]
- Composición de los alimentos crudos, procesados y preparados Base de datos nacional de nutrientes del USDA para el estándar [...] [Meta]
- El Proyecto de Seguimiento de COVID - El Proyecto de Seguimiento de COVID recopila y publica la mayoría [...] [Meta]
- Grandes conjuntos de datos de salud de EHDP [Meta]
- GDC: GDC apoya varios programas de genoma del cáncer para CCG, TCGA, TARGET, etc. [Meta]
- Bases de datos demográficas mundiales de Gapminder [Meta]
- MeSH, el tesauro de vocabulario utilizado para indexar artículos en PubMed [Meta]
- MeDAL: un gran conjunto de datos de textos médicos seleccionados para la desambiguación de abreviaturas - Médico [...] [Meta]
- Base de datos de cobertura de Medicare (MCD), EE. UU. [Meta]
- Motor de datos de Medicare de datos de medicare.gov [Meta]
- Archivo de datos de Medicare [Meta]
- Ciencia abierta Nightingale [Meta]
- Número de casos de ébola y muertes en los países afectados (2014) [Meta]
- Open-ODS (estructura del NHS del Reino Unido) [Meta]
- OpenPaymentsData, datos de relaciones financieras de atención médica [Meta]
- Bases de datos de PhysioBank: un archivo grande y en crecimiento de datos fisiológicos. [Meta]
- Archivo de imágenes del cáncer (TCIA) [Meta]
- El proyecto Atlas del Genoma del Cáncer (TCGA) [Meta]
- Observatorio Mundial de la Salud de la Organización Mundial de la Salud [Meta]
- Conjuntos de datos de Yahoo Knowledge Graph COVID-19: el equipo de Yahoo Knowledge Graph de Verizon Media es [...] [Meta]
- Informática para integrar la biología y la cabecera [Meta]
Procesamiento de imágenes
- Base de datos de 10.000 rostros de adultos de EE. UU. [Meta]
- 2GB de Fotos de Gatos [Meta]
- Audiencia Rostros sin filtrar para clasificación de género y edad [Meta]
- Clasificación de imágenes afectivas [Meta]
- Detección y seguimiento de objetos en el aire: el conjunto de datos de seguimiento de objetos en el aire (AOT) es un [...] [Meta]
- Animales con atributos [Meta]
- CADDY Conjunto de datos de visión estéreo subacuática de los gestos de las manos de los buceadores: contiene un par estéreo de 10K [...] [Meta]
- Conjunto de datos de citología - CCAgT: imágenes de células cervicales con técnica de tinción AgNOR - Contiene 9339 [...] [Meta]
- Punto de referencia de detección de peatones de Caltech [Meta]
- Conjunto de datos Chars74K: reconocimiento de caracteres en imágenes naturales (tanto en inglés como en kannada están disponibles) [Meta]
- Cube++: 4890 imágenes sin procesar de 18 megapíxeles, cada una de las cuales contiene un objetivo de color SpyderCube en su [...] [Meta]
- Conjunto de datos de conducción de vídeo densamente anotado: este conjunto de datos consta de 28 secuencias de vídeo de [...] [Meta]
- Danbooru Tagged Anime Illustration Dataset: una base de datos de imágenes de anime a gran escala con más de 3,33 millones [...] [Meta]
- Conjunto de datos de DukeMTMC: DukeMTMC tiene como objetivo acelerar los avances en múltiples cámaras y objetivos múltiples [...] [Meta]
- Colección Entomológica ETH (ETHEC) Imágenes de mariposas de grano fino (Lepidoptra) [Meta]
- Punto de referencia de reconocimiento facial [Meta]
- Flickr: 32 logotipos de marcas de clase [Meta]
- GDXray: imágenes de rayos X para pruebas de rayos X y visión por computadora [Meta]
- Conjunto de datos HumanEva: el conjunto de datos HumanEva-I contiene 7 secuencias de vídeo calibradas (4 en escala de grises [...] [Meta]
- ImageNet (en la jerarquía de WordNet) [Meta]
- Reconocimiento de escenas interiores [Meta]
- Sistema Internacional de Imagen Afectiva, UFL [Meta]
- Kitti Vision Benchmark Suite [Meta]
- Biblioteca de información etiquetada de Alejandría - Biología y conservación - Contiene más de 10 [...] [Meta]
- Base de datos MNIST de dígitos escritos a mano, cerca de 1 millón de ejemplos [Meta]
- Conjunto de datos de predicción de regiones de interés de vista múltiple para conducción autónoma: contiene 16 mapas de conducción [...] [Meta]
- Estímulos masivos de memoria visual, MIT [Meta]
- Newspaper Navigator: este conjunto de datos consta de contenido visual extraído de 16.358.041 [...] [Meta]
- Abrir imágenes de Google: imágenes con máscaras de segmentación para 2,8 millones de instancias de objetos [...] [Meta]
- RuFa: contiene imágenes de texto escrito en una de dos fuentes árabes (Ruqaa y Nastaliq [...] [Meta]
- Base de datos SUN, MIT [Meta]
- Ocupación del asiento trasero del interior del vehículo sintético SVIRO: 25 000 escenarios sintéticos en diez [...] [Meta]
- Varios conjuntos de datos de formas a partir de siluetas [Meta]
- Conjunto de datos de perros de Stanford [Meta]
- El desafío del etiquetado de similitud de acciones (ASLAN) [Meta]
- El conjunto de datos de mascotas Oxford-IIIT [Meta]
- Violent-Flows - Base de datos y punto de referencia sobre violencia colectiva/no violencia [Meta]
- Genoma visual [Meta]
- Base de datos de caras de YouTube [Meta]
Aprendizaje automático
- Conjunto de datos de rostros para todas las edades: contiene 13'322 imágenes de rostros asiáticos distribuidas en todas las edades (desde 2 [...] [Meta]
- Conjunto de datos de conducción autónoma de Audi: hemos publicado el conjunto de datos de conducción autónoma de Audi [...] [Meta]
- B3FD: conjunto de datos de estimación de edad facial (y género) con 375.000 imágenes: el conjunto de datos B3FD es un [...] [Meta]
- Conjuntos de datos contextuales de cinco dominios [Meta]
- Profundizar conjuntos de datos para clasificación y regresión [Meta]
- Datos mensuales de Discogs [Meta]
- Células neuronales fluorescentes: al publicar este conjunto de datos, nuestro objetivo es proporcionar un nuevo banco de pruebas para [...] [Meta]
- Archivo de música gratuito [Meta]
- Base de datos IMDb [Meta]
- Iraníes: un conjunto de datos a gran escala de caracteres de matrículas farsi/árabes [Meta]
- Keel Repository para clasificación, regresión y series temporales [Meta]
- LLVIP: este conjunto de datos contiene 30976 imágenes, o 15488 pares, la mayoría de las cuales fueron tomadas a muy [...] [Meta]
- Rostros etiquetados en la naturaleza (LFW) [Meta]
- Datos de préstamos del club de préstamos [Meta]
- Repositorio de conjuntos de datos de aprendizaje automático [Meta]
- Conjunto de datos de millones de canciones [Meta]
- Más conjuntos de datos de canciones [Meta]
- Conjuntos de datos MovieLens [Meta]
- Calificaciones del concurso de subtítulos del New Yorker [Meta]
- RDataMining - Datos del libro electrónico "R y minería de datos" [Meta]
- Meteoritos registrados en la Tierra [Meta]
- Datos de puntuación de salud de restaurantes en San Francisco [Meta]
- Conjunto de datos de TikTok: más de 300 videos de baile que capturan a una sola persona bailando [...] [Meta]
- Repositorio de aprendizaje automático de la UCI [Meta]
- Yahoo! Calificaciones y datos de clasificación [Meta]
- Cuadros delimitadores de YouTube [Meta]
- Youtube 8m [Meta]
- Subastas en línea de eBay (2012) [Meta]
Museos
- Datos abiertos de la Corporación de Museos de Ciencia y Tecnología de Canadá [Meta]
- Base de datos de la colección de Cooper-Hewitt [Meta]
- API de la colección del Museo Metropolitano de Arte [Meta]
- Metadatos del Instituto de Artes de Minneapolis [Meta]
- Portal de datos del Museo de Historia Natural (Londres) [Meta]
- Colección de arte histórico del Rijksmuseum [Meta]
- Metadatos de la colección Tate [Meta]
- Los vocabularios de Getty [Meta]
Lenguaje Natural
- Extracción automática de frases clave [Meta]
- La base de datos de PNL más mala [Meta]
- Blizzard Challenge Speech: los datos de voz y texto provienen de audiolibros profesionales [...] [Meta]
- Corpus de Blogger [Meta]
- Corpus de investigación de estilometría CLiPS [Meta]
- ClueWeb09 FACC [Meta]
- ClueWeb12 FACC [Meta]
- DBpedia - Datos estructurados de Wikipedia [Meta]
- Palabras sucias: con millones de imágenes en nuestra biblioteca y miles de millones de palabras clave enviadas por los usuarios, [...] [Meta]
- Taxonomías personales de Flickr [Meta]
- Base libre de personas, lugares y cosas [Meta]
- Corpus de discursos políticos alemanes - Colección de discursos políticos del idioma alemán [...] [Meta]
- Ngrams de Google Libros (2,2 TB) [Meta]
- Google MC-AFP: generado en base al conjunto de datos de Gigaword disponible públicamente utilizando vectores de párrafo [Meta]
- Google Web 5 gramos (1 TB, 2006) [Meta]
- Lista de libros electrónicos de Gutenberg [Meta]
- Hansards envía fragmentos de texto al Parlamento canadiense [Meta]
- LJ Speech: conjunto de datos de voz que consta de 13.100 clips de audio cortos de la lectura de un solo hablante [...] [Meta]
- M-AILabs Speech: el conjunto de datos de voz M-AILABS es el primer conjunto de datos grande que tenemos [...] [Meta]
- Conjunto de datos de comprensión de lectura de Microsoft MAchine (o MS MARCO) [Meta]
- Prueba de comprensión automática (MCTest) de texto de Microsoft Research [Meta]
- Traducción automática de idiomas europeos [Meta]
- Dar sentido a las micropublicaciones 2013: extracción de conceptos [Meta]
- Cómo entender las micropublicaciones 2016: reconocimiento y vinculación de entidades nombradas [Meta]
- Conjunto de datos de sentimiento multidominio (versión 2.0) [Meta]
- No Language Left Behind (NLLB - 200vo): conjunto de datos basado en los metadatos de Meta para bitexto extraído. [...] [Meta]
- Base de datos de voz ruidosa para entrenar algoritmos de mejora del habla y modelos TTS: limpio y [...] [Meta]
- Abrir Wordnet multilingüe [Meta]
- Datos anotados POS/NER/fragmentos [Meta]
- Personae Corpus [Meta]
- Recogida de spam por SMS en inglés [Meta]
- Colección SaudiNewsNet de artículos de periódicos saudíes (árabe, 30.000 artículos) [Meta]
- Conjunto de datos de respuesta a preguntas de Stanford (SQuAD) [Meta]
- Corpus de publicaciones de USENET de 2005 a 2011 [Meta]
- Dependencias universales [Meta]
- Webhose - Noticias/Blogs en varios idiomas [Meta]
- Wikidata - Bases de datos de Wikipedia [Meta]
- Datos de enlaces de Wikipedia: 40 millones de entidades en contexto [Meta]
- Bases de datos y herramientas de WordNet [Meta]
- Wordbank: base de datos abierta y no identificada sobre el desarrollo del vocabulario de 84,138 niños y [...] [Meta]
- Corpus WorldTree de gráficos explicativos para preguntas de ciencias elementales: un corpus de [...] [Meta]
Neurociencia
- Conjuntos de datos del Instituto Allen [Meta]
- Catálogo de cerebros [Meta]
- Brainómica [Meta]
- Conjuntos de datos de CodeNeuro [Meta]
- Investigación colaborativa en neurociencia computacional (CRCNS) [Meta]
- FCP-INDI [Meta]
- Proyecto Conectoma Humano [Meta]
- NDAR[Meta]
- Archivo de datos del NIMH [Meta]
- Neurodatos [Meta]
- NeuroMorpho - NeuroMorpho.Org es un inventario curado centralmente de reconstruidos digitalmente [...] [Meta]
- Neuroelectro [Meta]
- OASIS [Meta]
- AbrirNEURO [Meta]
- OpenfMRI [Meta]
- Estudiar Forrest [Meta]
- El conjunto de datos Nencki-Symfonia EEG/ERP: un conjunto de datos de electroencefalografía (EEG) de alta densidad [...] [Meta]
Física
- Portal de datos abiertos del CERN [meta]
- Base de datos abierta de cristalografía [meta]
- ICECUBE - Observatorio de neutrinos del polo sur [meta]
- LIGO Open Science Center (LOSC) - Datos de onda gravitacional del Ligo Hanford y [...] [Meta]
- Archivo de Exoplanet de la NASA [meta]
- Datos de NSSDC (NASA) de 550 naves espaciales espaciales [meta]
- Simulaciones cuánticas de un electrón en un pozo de potencial bidimensional: los datos fueron [...] [meta]
- Sloan Digital Sky Survey (SDSS) - Mapeo del universo [meta]
ProstateCancer
- EOPC-DE-AR-ARTENTE-PROSTATE-CANCER-GERMANY-Cáncer de próstata de inicio temprano-Alemania. [...] [meta]
- Genie - Datos del proyecto de Exchange de información de neoplasia de evidencia genómica del [...] [meta]
- Genómico-hallmarks-adenocarcinoma-cpc-gen-perfil genómico integral de 477 [...] [meta]
- MSK-Impacto Clínico-Seguridad-Cohort-MSKCC-Cancer-Cancer-Cancerador objetivo de clínica [...] [meta]
- Metastásico-adenocarcinoma-MCTP-Perfil integral de 61 cáncer de próstata [...] [meta]
- Metastásico-Cancer-Cancer-SU2CPCF-Dream-Team-Análisis integral de 150 metastásicos [...] [meta]
- NPCR-2001-2015-Base de datos del Programa Nacional de Registros de Cáncer de CDC (NPCR). El [...] [meta]
- NPCR-2005-2015-Base de datos del Programa Nacional de Registros de Cáncer de CDC (NPCR). El [...] [meta]
- NAF-PROSTATE-NAF PROSTATE es una colección de Tomografía de emisión de positrones NAF F-18/calculado [...] [meta]
- Cancerio-cáncer de neuroendocrino-Datos de exoma completo y ARN SEQ de castración resistente [...] [meta]
- PROCEDUROS DE DIAGNOSTICO PLCO: el conjunto de datos de procedimientos de diagnóstico de próstata (95,837 [...] [meta]
- PLCO-PROSTATA MEDICAL-COMPLICACIONES-El conjunto de datos de complicaciones médicas de próstata (3,350 [...] [meta]
- PLCO-PROSTATA-SCREING-ANMALIDADES-El conjunto de datos de anomalías de detección de próstata (10,527 [...] [meta]
- PLCO-PROSTATE-SECCIÓN-El conjunto de datos de detección de próstata (177,315 registros, 35,875 sujetos, [...] [meta]
- PLCO-PROSTATOS-TRATAMIENTOS: el conjunto de datos de tratamientos de próstata (13,409 registros, 7,614 sujetos, [...] [meta]
- PLCO -PROSTATE: el conjunto de datos de próstata es un conjunto de datos integral que contiene casi todos los [...] [meta]
- Prad-CA-Prostate-Adenocarcinoma-Canadá-Adenocarcinoma de próstata-Canadá. Recogido por [...] [meta]
- Prad-Fr-prostato-adenocarcinoma-france-adenocarcinoma de próstata-Francia. Recogido por diez [...] [meta]
- Prad-UK-Prostate-Adenocarcinoma-Reino Unido-Adenocarcinoma de próstata-Reino Unido. [...] [meta]
- Prostatex -Challenge - Conjunto retrospectivo de estudios de próstata MR. Todos los estudios incluyeron [...] [meta]
- Prostate-3T-El proyecto de próstata-3T proporcionó datos de imágenes a TCIA como parte de un ISBI [...] [meta]
- Prostate-Adenocarcinoma-Broad-Cornell-2012-Perfil integral de 112 cáncer de próstata [...] [meta]
- Prostate-Adenocarcinoma-Broad-Cornell-2013-Perfil integral de 57 cáncer de próstata [...] [meta]
- Prostate-Adenocarcinoma-CNA-Study-MSKCC-Perfil de número de copia de 103 prostata primaria [...] [meta]
- Prostata-adenocarcinoma-hutchinson-CRC-Perfil integral del cáncer de próstata [...] [meta]
- Adenocarcinoma de próstata (MSKCC/DFCI): secuenciación de exoma completo de 1013 muestras de cáncer de próstata. [Meta]
- Prostate-Adenocarcinoma-MSKCC-Proyecto de oncogenome de próstata MSKCC. 181 primario, 37 metastásico [...] [meta]
- Prostate-adenocarcinoma-organides-MSKCC-Perfil de exoma de muestras de cáncer de próstata y [...] [meta]
- Prostate-adenocarcinoma-SUN-Lab-secuenciación de genoma completo y transcriptoma de 65 prostatos [...] [meta]
- Prostate-Adenocarcinoma-TCGA-Pancancer-Atlas-Datos integrales de TCGA Pancanatlas de 11k [...] [meta]
- Prostato-adenocarcinoma-TCGA-Perfil integrado de 333 muestras de adenocarcinoma de próstata primario. [Meta]
- Se adquirieron un diagnóstico de próstata: se adquirieron imágenes de resonancia magnética ponderada por PCA T1 y T2 (MRI) [...] [meta]
- Patología-Mri-Pathology de próstata: la colección de próstata Fused-Mri-Pathology es una combinación [...] [meta]
- Prostate-MRI-La colección de próstata-MRI de imágenes de resonancia magnética de próstata (MRI) fue [...] [meta]
- Prostate -r - El paquete R 'Elemstatlearn' contiene un conjunto de datos de cáncer de próstata de Stamey et [...] [meta]
- QIN-PROSTATE Repiabilidad: el conjunto de datos de reputabilidad de Qin-Prostate es un conjunto de datos con [...] [meta]
- Qin -Prostate: la colección de próstata Qin de la red de imágenes cuantitativas (Qin) contiene [...] [meta]
- SEER -PRO1973_2015.SEER9 - Los archivos de datos de investigación de noviembre de 2017 de nueve registros de SEER [...] [meta]
- SEER-PRO1992_2015.SJ_LA_RG_AK- The SEER Noviembre 2017 Investigación de datos de datos del San José- [...] [Meta]
- SEER -PROY2000_2015.CA_KY_LO_NJ_GA - The SEER Noviembre 2017 Los archivos de datos de investigación del mayor [...] [meta]
- SEER -PROY2000_2015.CA_KY_LO_NJ_GA - DIAGNOSTOS DE DICISMO DE DICIEMBRE DE JULIO 2005 PARA LOUISIANA DE SU [...] [Meta]
- TCGA-PRAD-US-ADENOCINOMA DE PROSTATA TCGA (499 muestras). [Meta]
Psicología+cognición
- Conjuntos de datos del repositorio de modelado cognitivo de OSU [meta]
- Datos de ciencias cognitivas abiertas: conjuntos de datos de comportamiento disponibles públicamente de todo cognitivo [...] [meta]
Publicdomains
- Hábilmente abre datos en tiempo real [meta]
- Amazon [meta]
- Archive.org DataSets [meta]
- Archivo-IT del archivo de Internet [meta]
- Archivo de datos CMU Jasa [meta]
- CMU STATLAB COLECCIONES [meta]
- Data.world [meta]
- Data360 [meta]
- Enigma público [meta]
- Google [meta]
- Base de datos de Grand Comics: la base de datos de Grand Comics (GCD) es una organización sin fines de lucro, basada en Internet [...] [meta]
- InfóChimps [meta]
- Kdnuggets Collections [meta]
- Los conjuntos de datos gratuitos del mercado de datos de Microsoft Azure [meta]
- Microsoft Data Science for Research [meta]
- Datos abiertos de Microsoft Research [meta]
- Abra los volcados de datos de la biblioteca [meta]
- Conjuntos de datos Reddit [meta]
- RevolutionAnalytics Collection [meta]
- Muestra de conjuntos de datos R [meta]
- Encuesta anual de desarrolladores de Overflow de Stack - Desarrollador anual Surviers Conjuntos de datos completos de 2011 [...] [meta]
- Statsci.org [meta]
- STATS4stem R Conjuntos de datos (archivados) [meta]
- La lista de Washington Post [meta]
- Recopilación de datos de UCLA SOCR [meta]
- Informes de ovnis [meta]
- WikiLeaks 911 Pager Interess [meta]
- Yahoo Webscope [meta]
SearchEngines
- Torrentes académicos de intercambio de datos de UMB [meta]
- Base DOS DADOS - Base de datos: repositorio de datos abiertos para Brasil [meta]
- Datahub.io [meta]
- Proyecto de dominios: lista ordenada de dominios de Internet [meta]
- Harvard Dataverse Red de datos científicos [meta]
- ICPSR (Umich) [meta]
- Instituto de Ciencias de la Educación [Meta]
- Biblioteca Nacional de Informes Técnicos [meta]
- Abrir certificados de datos (beta) [meta]
- OpenDatanetwork: un motor de búsqueda de todos los portales de datos alimentados por Socrata [meta]
- Statista.com - Estadísticas y estudios [meta]
- ZenoDo: un hogar abierta confiable para la cola larga de la ciencia [meta]
Socialnetworks
- 2021 Elecciones portuguesas de datos de Twitter - 57m+ tweets, 1m+ usuarios - este conjunto de datos contiene [...] [meta]
- 72 horas #gamergate twitter raspe [meta]
- CMU Enron Correo electrónico de 150 usuarios [meta]
- Cheng-Caverlee-Lee Septiembre de 2009-Enero 2010 Twitter Scrape [meta]
- Base de datos biográfica de China: la base de datos biográfica de China es una [...] [meta] de acceso libre libremente
- Conjunto de datos de casa club [meta]
- Un conjunto de datos de Twitter de más de 40 millones de tweets relacionados con Covid -19, debido a la relevancia del [...] [meta]
- 43k+ Donald Trump Capturas de pantalla de Twitter: este archivo contiene capturas de pantalla de 43,475 Donald [...] [meta]
- EDRM Enron Correo electrónico de 151 usuarios, alojados en S3 [meta]
- Facebook Data Scrape (2005) [meta]
- Índice de conexión social de Facebook: utilizamos una instantánea anónima de todos los Facebook activo [...] [meta]
- Facebook Social Networks del derecho (desde 2007) [meta]
- Foursquare de Umn/Sarwat (2013) [meta]
- Archivo de colaboración de Github [meta]
- Relaciones de citas de Google Scholar [meta]
- Redes de contacto de alta resolución de sensores portátiles [meta]
- Mapa independiente: gráfico social y rastreo de los sitios de Top Indieweb [meta]
- Redes sociales móviles de UMass [meta]
- Datos de la red Twitter [meta]
- Comentarios de Reddit [meta]
- SkyTrax 'Air Travel Reviews DataSet [meta]
- Datos sociales de Twitter [meta]
- SourceForge.net Datos de investigación [meta]
- El conjunto de datos Reddit Covid: este conjunto de datos intenta capturar la extensión total de Covid -19 [...] [meta]
- Datos de Twitch Top Streamer [meta]
- Datos de Twitter para la gestión de reputación en línea [meta]
- Datos de Twitter para análisis de sentimientos [meta]
- Gráfico de Twitter de todo el sitio de Twitter [meta]
- Twitter Scrape Calufa Mayo de 2011 [meta]
- Unimi/Law Social Networkes de datos [meta]
- Datos de Twitter del Congreso de los Estados Unidos: conjuntos de datos diarios con tweets de más de 1100 cuentas asociadas [...] [meta]
- Yahoo! Datos gráficos y sociales [meta]
- Gráfico de video social de YouTube en 2007,2008 [meta]
Socialsciences
- Acled (Proyecto de datos de ubicación y eventos de conflicto armado) [meta]
- Base de datos de Elites de Elites Authoritary Goberning: la base de datos de Elites de la Elites Authoritary Goberning (ARED) es una [...] [meta]
- Instituto de Información Legal Canadiense [Meta]
- Centro de conjuntos de datos de paz sistémicos: tendencias de conflicto, políticas, fragilidad del estado, etc. [meta]
- Proyecto de correlatos de guerra [meta]
- Ítems de la teoría de la conspiración de la criptoma [meta]
- Datacards [meta]
- Encuesta social europea [meta]
- FBI Hate Crime 2013 - Datos agregados [meta]
- Índice de estados frágiles [meta]
- Base de datos de eventos globales de GDELT [meta]
- Encuesta Social General (GSS) desde 1972 [meta]
- Encuesta social alemana [meta]
- Proyecto Global de Futuros Religiosos [Meta]
- Datos de violencia armada: una base de datos integral y accesible que contiene registros de más de 260k [...] [meta]
- Intercambio de datos humanitario [meta]
- Informar el índice para la gestión de riesgos [meta]
- Instituto de Estudios demográficos [meta]
- Datos abiertos del Banco Interamericano de Desarrollo [Meta]
- Archivo de redes internacionales [meta]
- Programa de encuestas sociales internacionales ISSP [meta]
- Proyecto de Compendio de Estudios Internacionales [Meta]
- Datos nacionales de James McGuire Cross [meta]
- MIT Reality Mining DataSet [meta]
- Guía de macrodatos por Norsk Samfunnsvitenskapelig DatatJeneste [meta]
- Proyecto de datos de movilización de masa: los datos de movilización de masas (MM) son un esfuerzo para comprender [...] [meta]
- Gráfico de conocimiento académico de Microsoft: el gráfico de conocimiento académico de Microsoft es un gran RDF [...] [meta]
- Centro de población de Minnesota [meta]
- Índice de adaptación global de Notre Dame (ND-Gain) [meta]
- Datos abiertos del crimen y vigilancia en Inglaterra, Gales e Irlanda del Norte [meta]
- OpenSance: una base de datos global de personas y empresas de políticas, criminales o [...] [meta]
- Paul Hensel General International Data Página [meta]
- Proyecto de encuesta de Internet de Pewresearch [meta]
- Pewresearch Society Data Collection [meta]
- Datos de polaridad política [meta]
- STACKEXCHIVE DATA Explorer [meta]
- Investigación y análisis de terrorismo Consorcio [meta]
- Los reclusos de Texas ejecutados desde 1984 [meta]
- Conjunto de datos de supervivencia titánica [meta]
- Archivo de Datos de Ciencias Sociales de la UCB (D-LAB) [meta]
- Archivo de datos de ciencias sociales de UCLA [meta]
- Base de datos de la sociedad civil de la ONU [meta]
- Upjohn para la investigación laboral de empleo [meta]
- Universidades de todo el mundo [meta]
- Programa de datos de conflictos de uppsala [meta]
- Datos abiertos del Banco Mundial [meta]
- Base de datos de desigualdad mundial: la base de datos de desigualdad mundial (wid.world) tiene como objetivo proporcionar abierto [...] [meta]
- Proyecto WorldPop - Distribuciones mundiales de población humana [meta]
Software
- Datos de base de hilo dental sobre desarrollo de software libre, libre y de código abierto [meta]
- GhTorrent: espejo de datos escalable, consultable, fuera de línea ofrecido a través de la API REST GitHub. [Meta]
- Bibliotecas.io repositorio de código abierto y metadatos de dependencia [meta]
- Public Git Archive: un conjunto de datos de Big Code para todos - conjunto de datos de 182,014 Git de libro superior [...] [meta]
- Duplicados de código: archivo Java 2k y 600 pares de funciones Java etiquetadas como similares o diferentes por [...] [meta]
- Mensajes de confirmación - 1.300 millones de mensajes de confirmación de Github hasta marzo de 2019 [meta]
- Comentarios de revisión de la solicitud de extracción - 25.3 millones de comentarios de revisión de relaciones públicas desde enero de 2015 hasta [...] [meta]
- Identificadores del código fuente: 41.7 millones de identificadores divisibles distintos recopilados de 182,014 [...] [meta]
Deportes
- Obstáculos de guerrero ninja americano: contiene todos los obstáculos en la historia del ninja estadounidense [...] [meta]
- Betfair Datos de intercambio histórico [meta]
- Cricsheet partidos (Cricket) [meta]
- Equidad en el atletismo: [...] [meta]
- Ergast Fórmula 1, desde 1950 hasta la fecha (API) [meta]
- Recursos de fútbol/fútbol (datos y API) [meta]
- Base de datos de béisbol de Lahman [meta]
- Datos de juego por juego de la NFL-Datos de juego por juego de la NFL procedentes de: [...] [meta]
- Pinhooker: Datos de venta de StoroBred Bloodstock [meta]
- Pro Kabadi Temporada 1 a 7: la Liga Pro Kabadi es una Liga Kabaddi de nivel profesional en India. [...] [meta]
- Estadísticas de béisbol de retroheet [meta]
- Base de datos de tenis de clasificaciones, resultados y estadísticas para ATP [meta]
- Base de datos de tenis de clasificaciones, resultados y estadísticas para WTA [meta]
- Conjuntos de datos TransferMarkt: datos limpios, estructurados y actualizados automáticamente de fútbol (fútbol) [...] [meta]
- Equipos y ubicaciones de USA Soccer: equipos y ubicaciones de fútbol de EE. UU. MLS, NWSL y USL [...] [meta]
Timeseries
- 3W DataSet: según lo mejor del conocimiento de sus autores, este es el primer realista y público [...] [meta]
- Databanks International Cross National Time Series Data Archive [meta]
- Tasas de falla del disco duro [meta]
- Serie de tiempo de frecuencia cardíaca del MIT [meta]
- Biblioteca de datos de series de tiempo (TSDL) de MU [meta]
- Turing Change Point DataSet: contiene 42 series de tiempo anotadas recopiladas para el desarrollo [...] [meta]
- UC Riverside Time Series DataSet [meta]
Transporte
- Airlines OD Data 1987-2008 [meta]
- Datos de Ford Gobike (anteriormente Datos de compartir bicicletas del área de Bay) [meta]
- Colección de sistemas de compartir bicicletas (BSS) [meta]
- Información de tráfico holandesa [meta]
- Trayectoria GPS de Geolife de Microsoft Research [meta]
- Sistema de trenes alemán de Deutsche Bahn [meta]
- Hubway millones de viajes en Ma [meta]
- Contado de peatones de Melbourne: este conjunto de datos contiene recuentos de peatones por hora desde 2009 [...] [meta]
- Montreal Bixi Bike Share [meta]
- Datos de viaje de taxi de Nueva York 2009- [meta]
- Datos de viaje de taxi de Nueva York 2013 (FOIA/Foiled) [meta]
- Datos de viaje de NYC Uber de abril de 2014 a septiembre de 2014 [meta]
- Colección de tráfico abierto [meta]
- OpenFlights: datos de aeropuerto, aerolínea y ruta [meta]
- Estaciones de compartir bicicletas de Filadelfia (JSON) [meta]
- Base de datos de bloqueo de avión, desde 1920 [meta]
- Rita Airline Data de rendimiento de tiempo a tiempo [meta]
- Recopilación de datos de transporte Rita/BTS (Transtat) [meta]
- Renfe (Spanish National Railway Network) DataSet [meta]
- Estaciones de compartir bicicletas de Toronto (archivos JSON y GBFS) [meta]
- Transporte para Londres (TFL) [meta]
- Encuesta de seguimiento de viajes (TTS) para Chicago [meta]
- Oficina de Estadísticas de Transporte de los Estados Unidos (BTS) [meta]
- Vuelos nacionales de EE. UU. 1990 a 2009 [meta]
- Marco de análisis de flete de EE. UU. Desde 2007 [meta]
- Administración de Seguridad del Tráfico Nacional de Carreteras de EE. UU. - Matalidades desde 1975 - Contiene CSV [...] [meta]
deportes electrónicos
- CS: GO Datos de emparejamiento competitivo: en este conjunto de datos tenemos datos sobre el emparejamiento de CSGO [...] [meta]
- FIFA-2021 Complete Jugador DataSet [meta]
- Opendota Data volcado [meta]
Colecciones complementarias
- Conjuntos de datos del núcleo envasado por datos
- OpenDatamonitor: una descripción general de los recursos de datos abiertos disponibles en Europa
- Quora: ¿Dónde puedo encontrar grandes conjuntos de datos abiertos al público?
- Rs.io: más de 100 conjuntos de datos interesantes para estadísticas
- Cvonline: bases de datos de imágenes
- Innotrek: aprovechando los datos abiertos para comprender la vida urbana
- Documentos CV: conjuntos de datos CV en la web
agradecimiento especial a