很棒的公共数据集
这是一个以主题为中心的高质量公共数据源列表。它们是从博客、答案和用户响应中收集和整理的。下面列出的大多数数据集都是免费的,但有些则不是。该项目是陈夏明博士期间在上海交通大学OMNILab孵化的。研究。 OMNILab 现已成为白玉兰开放人工智能社区的一部分。其他令人惊叹的精彩列表可以在 sindresorhus 的精彩列表中找到。
注意:此存储库由 apd-core 自动生成。请不要直接修改此文件。我们提供了一种为该存储库做出贡献的新方法。加入 Slack 社区,即时获取总部数据更新。
目录
- 农业
- 建筑学
- 生物学
- 化学
- 气候+天气
- 复杂网络
- 计算机网络
- 网络安全
- 数据挑战
- 地球科学
- 经济学
- 教育
- 活力
- 娱乐
- 金融
- 地理信息系统
- 政府
- 卫生保健
- 图像处理
- 机器学习
- 博物馆
- 自然语言
- 神经科学
- 物理
- 前列腺癌
- 心理学+认知
- 公共领域
- 搜索引擎
- 社交网络
- 社会科学
- 软件
- 运动的
- 时间序列
- 运输
- 电子竞技
- 补充系列
农业
- 1981-2016 年主要农作物历史产量的全球数据集 - [...] [Meta] 的全球数据集
- 土壤湿度高光谱基准数据集 - 该数据集是在五天的时间内测量的 [...] [Meta]
- 柠檬质量控制数据集 - 柠檬数据集已准备好调查 [...] [元]
- 优化土壤调整植被指数 - IDB 是一种用于遥感工作的工具 [...] [Meta]
- 美国农业部的营养数据库 [元]
- 美国农业部植物数据库 - 完整的植物清单近 7 [...] [元]
建筑学
- 瑞士公寓模型 - 该数据集包含 42,207 套公寓的详细数据(242,257 [...] [元]
生物学
- 1000 个基因组 - 1000 个基因组项目于 2008 年至 2015 年间运行,创造了最大的 [...] [元]
- ANHIR - 自动非刚性组织学图像配准 (ANHIR) 由 2D [...] [Meta] 组成
- American Gut(微生物组项目)- American Gut 项目是最大的众包 [...] [Meta]
- BCNB - 有 1058 名患者的 WSI,部分肿瘤区域在 WSI 中注释。除了[...] [元]
- Broad Bioimage Benchmark Collection (BBBC) - Broad Bioimage Benchmark Collection (BBBC) [...] [元]
- 广泛的癌细胞系百科全书(CCLE)[元]
- CIMA - CIMA 数据集包括 2D 组织学显微镜组织切片的图像。 [元]
- 细胞图像库 - 该库是一个公共且易于访问的资源数据库 [...] [Meta]
- 完整的基因组学公共数据 - 整个人类基因组的多样化数据集是免费的 [...] [Meta]
- CytoImageNet - 大型显微镜图像数据集。包含 890,737 总灰度 [...] [元]
- EBI ArrayExpress - 功能基因组数据的 ArrayExpress 存档存储来自高 [...] [元] 的数据
- 欧洲 EBI 蛋白质数据库 - 电子显微镜数据库 (EMDB) 是一个公共 [...] [Meta]
- ENCODE 项目 - DNA 元素百科全书 (ENCODE) 联盟是一个正在进行的 [...] [Meta]
- 电子显微镜试点图像档案 (EMPIAR) - EMPIAR,电子显微镜公共 [...] [元]
- 整体基因组 [元]
- 基因表达综合 (GEO) - GEO 是一个公共功能基因组学数据存储库 [...] [元]
- Gene Ontology (GO) - GO 注释文件 [元]
- 全球生物相互作用 (GloBI) [元]
- 哈佛医学院 (HMS) LINCS 项目 - 哈佛医学院 (HMS) LINCS 中心 [...] [元]
- 人类基因组多样性计划 - 斯坦福大学的一组科学家 [...] [Meta]
- 人类微生物组计划 (HMP) - HMP 对从 [...] [Meta] 分离的 2000 多个参考基因组进行了测序
- ICOS PSP 基准 - ICOS PSP 基准存储库包含一个可调整的现实世界 [...] [Meta]
- 国际单体型图项目 [元]
- 细胞生物学杂志数据查看器 [元]
- KEGG - KEGG 是一种数据库资源,用于了解 [...] [Meta] 的高级功能和实用程序
- NCBI 蛋白质 [元]
- NCBI 分类法 - NCBI 分类法数据库是一组精选的名称和分类 [...] [元]
- NCI 基因组数据共享 - GDC 数据门户是一个强大的数据驱动平台,允许 [...] [元]
- NIH 微阵列数据 [元]
- OpenSNP 基因型数据 - openSNP 允许客户进行直接面向客户的基因测试 [...] [Meta]
- Palmer Penguins - palmerpenguins 的目标是为数据提供一个很棒的数据集 [...] [Meta]
- Pathguid - 蛋白质-蛋白质相互作用目录 [元]
- 蛋白质数据库 - 该资源由蛋白质数据库档案信息提供支持 [...] [元]
- 精神病学基因组学联盟 - 精神病学基因组学联盟 (PGC) 的目的是 [...] [Meta]
- PubChem 项目 - PubChem 是世界上最大的免费化学品集合 [...] [Meta]
- PubGene(现为 Coremine Medical)- COREMINE™ 是由挪威 [...] [Meta] 开发的一系列工具
- 癌症体细胞突变桑格目录 (COSMIC) - COSMIC,体细胞突变目录 [...] [Meta]
- 桑格癌症药物敏感性基因组学项目 (GDSC) [Meta]
- 序列读取存档 (SRA) - 序列读取存档 (SRA) 存储来自 [...] [元] 的原始序列数据
- Serratus - 分析 710 万个 RNA/DNA 测序数据集以发现总 [...] [Meta]
- 斯坦福微阵列数据(现已退休)[元]
- 斯托尔斯研究所原始数据存储库 [元]
- 生物动力学系统科学 (SSBD) 数据库 - 生物系统科学 [...] [元]
- 癌症基因组图谱 (TCGA),可通过 Broad GDAC [Meta] 获得
- 生命目录 - 生命目录是一份有质量保证的清单,包含超过 1.8 [...] [元]
- 个人基因组计划 - 个人基因组计划于 2005 年启动,是一个愿景和 [...] [Meta]
- UCSC 公共数据 [元]
- UniGene [元]
- 通用蛋白质资源 (UnitProt) - 通用蛋白质资源 (UniProt) 是一个 [...] [Meta]
- Rfam - Rfam 数据库是 RNA 家族的集合,每个家族由多个 [...] [Meta] 表示
化学
气候+天气
- 精算师景气指数[元]
- 澳大利亚天气 [元]
- 航空气象中心 - 为世界提供一致、及时和准确的天气信息 [...] [元]
- 巴西天气 - 历史数据(葡萄牙语) - 与气候和天气相关的数据 [...] [元]
- 多个气候数据集 - C3S 气候数据存储 (CDS) 是 [...] [Meta] 的一站式商店
- 加拿大气象中心[元]
- Caravan - 大样本水文学数据集 - Caravan 是 [...] [Meta] 的开放社区数据集
- 来自 UEA 的气候数据(每月更新)[元]
- 荷兰天气 - KNMI 数据中心 (KDC) 门户提供对 KNMI 天气数据的访问,[...] [元]
- 欧洲气候评估和数据集 [元]
- 德国气候数据中心 [元]
- 1929 年以来的全球气候数据 [元]
- 绘制 2009-2020 年全球气候变化新闻叙述图表 - 这四个数据集代表 [...] [元]
- NASA 全球图像浏览服务 [元]
- NOAA 白令海气候 [元]
- NOAA 气候数据集 [元]
- NOAA 实时天气模型 [元]
- NOAA SURFRAD 气象和辐射数据集 [元]
- Open-Meteo - 开源天气 API - 开源天气 API,可供非 [...] [Meta] 免费访问
- 世界银行气候变化开放数据资源 [元]
- UEA 气候研究单位 [元]
- WU 全球历史天气 [元]
- 华盛顿邮报气候变化 - 为了分析美国气温变暖,[...] [Meta]
- WorldClim - 全球气候数据 [元]
复杂网络
- AMiner 引文网络数据集 [元]
- CrossRef DOI URL [元]
- DBLP 引文数据集 [元]
- DIMACS 道路网络集合 [元]
- NBER 专利引文 [元]
- NIST 复杂网络数据收集 [Meta]
- 具有交互式探索性分析工具的网络存储库 [元]
- 蛋白质-蛋白质相互作用网络[Meta]
- PyPI 和 Maven 依赖网络 [元]
- Scopus 引文数据库 [元]
- 小网络数据[元]
- 斯坦福 GraphBase [元]
- 斯坦福大学大型网络数据集[元]
- 斯坦福纵向网络数据源[元]
- 科布伦茨网络集合 [元]
- 网络算法实验室 (UNIMI) [Meta]
- UCI 网络数据存储库 [元]
- UFL稀疏矩阵集合[元]
- WSU 图数据库 [元]
- 达特茅斯归档无线数据的社区资源 - 包含 pcap 文件数据集 [...] [元]
计算机网络
- 来自 CommonCrawl 2012 的 3.5B 网页 [元]
- 印第安纳大学 10 万用户的 53.5B 网络点击量[元]
- CAIDA 互联网数据集 [元]
- 来自达特茅斯大学的 CRAWDAD 无线数据集。 [元]
- ClueWeb09 - 1B 网页 [元]
- ClueWeb12 - 733M 网页 [元]
- CommonCrawl 7 年多的网络数据 [元]
- 使用最少浏览信息从点击流电子商务数据预测购物者意图 [元]
- Criteo 点击率数据 [元]
- 互联网范围的扫描数据存储库 [元]
- MIRAGE-2019 - MIRAGE-2019 是一个人工生成的数据集,用于移动流量分析 [...] [Meta]
- Merklemap DNS 记录数据集 - 包含 7 亿条独特的 4B+ DNS 记录 [...] [元]
- OONI:网络干扰开放观察站 - 互联网审查数据 [元]
- 通过 MobiPerf 打开移动数据 [Meta]
- 点对点跟踪档案 - 现实世界的测量在研究 [...] [元] 中发挥着关键作用
- Rapid7 声纳互联网扫描 [元]
- UCSD 网络望远镜,IPv4 /8 网络 [元]
网络安全
- CCCS-CIC-AndMal-2020 - 该数据集包括 200K 个良性样本和 200K 个恶意软件样本,总计 [...] [Meta]
- 在网络防御演习期间捕获的流量和日志数据 - 该数据集是获取的 [...] [元]
数据挑战
- AIcrowd 竞赛 [元]
- 暴力破解数据库 [元]
- 机器学习的挑战 [元]
- CrowdANALYTIX dataX [元]
- 橙色的D4D挑战[元]
- DrivenData 社会公益竞赛 [元]
- ICWSM 数据挑战(自 2009 年起)[元]
- 2012 腾讯 KDD 杯 [元]
- Kaggle 竞赛数据 [元]
- Localytics 数据可视化挑战 [元]
- Netflix 奖 [元]
- 太空应用挑战赛 [元]
- 意大利电信大数据挑战赛 [Meta]
- TravisTorrent 数据集 - MSR'2017 挖矿挑战赛 [元]
- TunedIT - 数据挖掘和机器学习数据集、算法、挑战 [元]
- Yelp 数据集挑战 - Yelp 数据集是我们的业务、评论和用户的子集[...] [元]
地球科学
- 38-Cloud(云检测)- 包含 38 张 Landsat 8 场景图像及其手动提取的 [...] [元]
- AQUASTAT - 全球水资源和利用 [元]
- BODC - 约 22K vars 的海洋数据 [元]
- EOSDIS - NASA 的地球观测系统数据 [元]
- 地球模型 [元]
- Global Wind Atlas - Global Wind Atlas 是一款免费的、基于网络的应用程序,旨在帮助 [...] [Meta]
- 综合海洋观测系统 (IMOS) - 大约 30TB 的海洋测量数据 [元]
- Marineexplore - 开放海洋学数据 [元]
- 阿拉巴马州实时海岸观测系统 [元]
- 国家河口研究储备全系统监测计划 - 长期河口 [...] [Meta]
- 石油和天然气管理局开放数据 - 数据集涵盖 12,500 个海上井眼、5,000 个地震 [...] [元]
- 史密森学会全球火山和喷发数据库 [元]
- 美国地质勘探局地震档案 [元]
- 使用突破曲线进行井口保护区(保护区)预测 - 此 [...] [Meta]
经济学
- 亚洲生产力组织 (APO) - AEPM 提供了 [...] [元] 的图形仪表板视图
- 东盟统计 - 东盟统计数据门户于 2018 年 6 月首次推出。该门户 [...] [元]
- 美国经济协会 (AEA) [元]
- 亚洲 KLEMS - 亚洲 KLEMS 是一个亚洲区域研究联盟,旨在促进建设 [...] [Meta]
- 哈佛经济复杂性地图集 - 供人们探索全球贸易流动的数据库 [...] [元]
- BIS 金融数据库 - 这些文件包含与 BIS 统计资源管理器中相同的数据 [...] [元]
- Barro-Lee 教育程度 - 1950 年至 2010 年的 Barro-Lee 教育程度数据。[...] [元]
- CEPII 数据库 - 世界经济数据库,通过其国家和地区概况,在 [...] [Meta]
- EUKLEMS - EU KLEMS 是一个行业水平、增长和生产力研究项目。 EU KLEMS [...] [元]
- 世界经济自由度数据[元]
- 历史国民账户 - 比较历史国民账户数据中心 [...] [元]
- 历史宏观经济统计[元]
- INFORUM - 马里兰大学的行业间预测 [Meta]
- DBnomics – 世界经济数据库 – 聚合了数亿个时间序列 [...] [Meta]
- 国际贸易统计[元]
- 互联网产品代码数据库 [元]
- 联合外债数据中心[元]
- 乔恩·哈夫曼国际贸易数据链接 [元]
- 拉丁美洲 KLEMS - LAKLEMS 是一个由 Inter-[...] [Meta] 资助的技术合作项目
- 长期生产力数据库 - 长期生产力数据库是作为 [...] [元] 创建的
- 麦迪逊项目数据库 - 麦迪逊项目数据库提供了有关比较 [...] [元] 的信息
- 国民转移账户 - 国民转移账户 (NTA) 项目的目标是 [...] [Meta]
- OpenCorporates 全球公司数据库 [元]
- 我们的数据世界 [元]
- Penn World Table - PWT 10.0 版是一个数据库,其中包含 [...] [Meta] 相对水平的信息
- SciencePo 世界贸易重力数据集 [元]
- 经济复杂性地图集 [元]
- 国际数据中心[元]
- 经济复杂性观察站 [Meta]
- 联合国商品贸易统计[元]
- 联合国人类发展报告[元]
- 世界投入产出数据库 - 世界投入产出表和基础数据,涵盖 43 [...] [元]
- World KLEMS - 适用于世界各地众多国家的分析 KLEMS 类型数据集。 [...] [元]
教育
- 大学记分卡数据[元]
- 纽约州教育部数据 - 纽约州教育部 (NYSED) [...] [元]
- 国际学生评估计划 (PISA) - 包含 15 岁学生的 [...] [Meta]
- 来自免费编程营的学生数据 [元]
活力
- AMPds - 分钟功率年鉴数据集 [元]
- BLUEd - 建筑级完全标记的电力分解数据集 [元]
- 梳理[元]
- DBFC - 直接硼氢化物燃料电池 (DBFC) 数据集 [元]
- DEL - 南非国内电力负荷研究数据集(1994 - 2014)[元]
- ECO - ECO 数据集是一个用于非侵入式负载监控和 [...] [Meta] 的综合数据集
- 环境影响评估[元]
- 全球电厂数据库 - 全球电厂数据库是一个全面的开源 [...] [Meta]
- HES - 英国家庭电力研究 [元]
- HFED [元]
- 更多:摩洛哥建筑物的用电量数据集 - 自 2019 年春季以来,数据 [...] [元]
- Marktstammdatenregister - 德国 Marktstammdatenregister (MaStR) 是所有 [...] [Meta] 的数据库
- PEM1 - 质子交换膜 (PEM) 燃料电池数据集 [元]
- PLAID - 即插即用设备识别数据集 [元]
- 公共事业数据解放项目 (PUDL) - PUDL 使美国能源数据更容易 [...] [Meta]
- REDD [元]
- SYND - 用于非侵入式负载监控的合成能源数据集 - 通过 SynD,我们提出了 [...] [Meta]
- 智能电表数据门户 - 智能电表数据门户是国家科学 [...] [Meta] 的一部分
- 追踪库 [元]
- 乌克兰能源中心数据集 [元]
- UK-DALE - 英国家用电器级电力 [元]
- 白色[元]
- iAWE [元]
娱乐
- Twitch 上的热门主播 - 这包含去年 1000 名主播的数据。 [元]
金融
- 国际清算银行统计数据 - 国际清算银行统计数据,与中央银行和其他[...] [元]合作编制
- Blockmodo 硬币注册表 - JSON 格式信息文件的注册表,主要是 [...] [元]
- 芝加哥期权交易所期货交易所 [元]
- 完整的 FAANG 股票数据 - 该数据集包含来自 [...] [Meta] 的 FAANG 公司的所有股票数据
- 谷歌财经 [元]
- 谷歌趋势 [元]
- 纳斯达克[元]
- 纽约证券交易所市场数据[元]
- 万达 [元]
- OSU 财务数据 [元]
- 昆德尔 [元]
- SEC EDGAR - EDGAR,电子数据收集、分析和检索系统,是 [...] [元]
- 圣路易斯联邦 [元]
- 雅虎财经 [元]
地理信息系统
- Awesome 3D Semantic City Models - 开放 3D 语义城市和区域模型的集合。 [元]
- ArcGIS 开放数据门户 [元]
- 美国马萨诸塞州剑桥,GitHub 上的 GIS 数据 [元]
- 所有大陆、国家、州/分区/省和城市的数据库 - 数据库 [...] [元]
- 事实的全球位置数据[元]
- IEEE 地球科学与遥感协会 DASE 网站 [元]
- 地理地图 - 以编程方式生成的高质量 GeoJSON 地图 [元]
- 来自 ASU 的地理空间数据 [元]
- Geo Wiki 项目 - 公民驱动的环境监测 [元]
- GeoFabrik - 提取到各种格式和区域的 OSM 数据 [元]
- 全球地名 [元]
- 全球行政区域数据库 (GADM) - 按国家/地区组织的地理空间数据。包括 [...] [元]
- 国土基础设施基础级数据[元]
- AWS 上的 Landsat 8 [元]
- 所有语言的所有国家/地区列表 [元]
- 国家气象局 GIS 数据门户 [元]
- 自然地球 - 世界的矢量和栅格 [元]
- 开放地址 [元]
- OpenStreetMap (OSM) [元]
- Pleiades - 古代地点的地名词典和图表 [元]
- 使用 OSM 数据进行反向地理编码 [元]
- Robin Wilson - 免费 GIS 数据集 [元]
- Shadow Accrual Maps - 存储库包含纽约累积的影子信息 [...] [Meta]
- TIGER/Line - 美国边界和道路 [元]
- TZ 时区 shapefile [元]
- TwoFishes - Foursquare 的粗略地理编码器 [元]
- 联合国环境数据[元]
- 美国国务院的世界边界 [Meta]
- 多种格式的世界国家[元]
政府
- 加拿大艾伯塔省 [元]
- 比利时安特卫普 [元]
- 阿根廷(非官方)[元]
- 阿根廷数据 - 阿根廷共和国数据门户。 Encontrá datos públicos [...] [元]
- 美国德克萨斯州奥斯汀 [元]
- 澳大利亚 (abs.gov.au) [元]
- 澳大利亚 (data.gov.au) [元]
- 奥地利 (data.gv.at) [元]
- 美国路易斯安那州巴吞鲁日 [元]
- 以色列贝尔谢巴 - 开放数据门户 (Smart7 OpenData) [元]
- 比利时 [元]
- 伯克利市开放数据 [元]
- 巴西 [元]
- 阿根廷布宜诺斯艾利斯 [元]
- 加拿大艾伯塔省卡尔加里 [元]
- 美国马萨诸塞州剑桥 [元]
- 加拿大[元]
- 芝加哥 [元]
- 智利 [元]
- 中国[元]
- 达拉斯开放数据 [元]
- DataBC - 来自不列颠哥伦比亚省的数据 [元]
- Debt to the Penny - Debt to the Penny 数据集提供了有关总 [...] [元] 的信息
- 丹佛开放数据 [元]
- 北卡罗来纳州达勒姆开放数据 [元]
- 加拿大艾伯塔省埃德蒙顿 [元]
- 英格兰 LGInform [元]
- 欧盟统计局[元]
- EveryPolitician - 正在进行的项目,整理和共享每个政治家的数据。 [元]
- 联邦统计方法委员会 (FCSM)(前身为 FedStats)[元]
- 芬兰 [元]
- 法国[元]
- 加拿大新不伦瑞克省弗雷德里克顿 [元]
- 加蒂诺,QC,加拿大 [元]
- 德国[元]
- 比利时根特 [元]
- 英国苏格兰格拉斯哥 [元]
- 希腊 [元]
- 守护世界政府[元]
- 加拿大新斯科舍省哈利法克斯 [元]
- 芬兰赫尔辛基地区 [元]
- 中国香港 [元]
- 美国德克萨斯州休斯顿 [元]
- 印度政府数据[元]
- 印度尼西亚数据门户 [元]
- 爱荷华州 - 欢迎来到爱荷华州的数据门户。请探索有关爱荷华州和您的[...] [元]的数据
- 爱尔兰的开放数据门户 [元]
- 以色列的开放数据门户 [元]
- 伊斯坦布尔市开放数据门户 [元]
- 意大利 - Il Portale dati.gov.it è il Catalogo nazionale dei metadati relativi ai dati [...] [Meta]
- 美国监狱死亡人数 - 美国政府不会根据监狱死亡率数据发布监狱情况,[...] [元]
- 日本[元]
- 加拿大魁北克省拉瓦尔 [元]
- 肯塔基州列克星敦 [元]
- 英国伦敦数据存储 [元]
- 加拿大安大略省伦敦 [元]
- 洛杉矶开放数据 [元]
- 卢森堡 - 卢森堡开放数据门户 [元]
- MassGIS,美国马萨诸塞州 [元]
- 美国加利福尼亚州大都会交通委员会 (MTC) [元]
- 墨西哥 [元]
- 加拿大安大略省密西沙加 [元]
- 摩尔多瓦 [元]
- 加拿大新布伦特蒙克顿 [元]
- 加拿大魁北克省蒙特利尔 [元]
- 美国加利福尼亚州山景城 (GIS) [元]
- 纽约市开放数据 [元]
- 纽约 betanyc [元]
- 荷兰[元]
- 纽约卫生局每月吨位 - DSNY 每月吨位数据提供 [...] [元]
- 新西兰[元]
- 经合组织[元]
- 奥克兰,加利福尼亚州,美国 [元]
- 俄克拉荷马州[元]
- 非洲开放数据 [元]
- 印度开放政府数据 (OGD) 平台 [元]
- OpenDataSoft 的 1,600 个开放数据列表 [Meta]
- 俄勒冈州[元]
- 加拿大安大略省渥太华 [元]
- 帕洛阿尔托,加利福尼亚州,美国 [元]
- OpenDataPhilly - OpenDataPhilly 是费城地区开放数据的目录。在[...] [元]
- 俄勒冈州波特兰 [元]
- 葡萄牙 - Pordata 组织 [Meta]
- 波多黎各政府 [元]
- 加拿大魁北克市 [元]
- 加拿大魁北克省 [元]
- Regina SK,加拿大 [元]
- 巴西里约热内卢 [元]
- 罗马尼亚 [元]
- 俄罗斯[元]
- 加利福尼亚州圣地亚哥 [元]
- 德克萨斯州圣安东尼奥 - 现在社区信息 - CI:Now 是一家为 Bexar 服务的非营利组织(圣 [...] [元]
- 旧金山数据集 [元]
- 美国加利福尼亚州圣何塞 [元]
- 美国加利福尼亚州圣马特奥县 [元]
- 加拿大萨斯喀彻温省 [元]
- 西雅图[元]
- 新加坡政府数据[元]
- 南非贸易统计[元]
- 南非 [元]
- 美国犹他州 [元]
- 瑞士 [元]
- 台湾政府[元]
- 台湾[元]
- 特拉维夫开放数据 [元]
- 德克萨斯州开放数据 [元]
- 世界银行[元]
- 加拿大安大略省多伦多 [元]
- 突尼斯[元]
- 英国政府数据[元]
- 美国社区调查[元]
- 美国疾病预防控制中心公共卫生数据集 [元]
- 美国人口普查局 [元]
- 美国住房和城市发展部 (HUD) [元]
- 美国联邦政府机构 [元]
- 美国联邦政府数据目录 [元]
- 美国食品和药物管理局 (FDA) [元]
- 美国国家教育统计中心 (NCES) [元]
- 美国开放政府[元]
- 英国 2011 年人口普查开放地图集项目 [元]
- 美国县 - 这是各种数据的存储库,按美国县细分。虽然大多数[...] [元]
- 美国专利商标局 (USPTO) 批量数据产品 [元]
- 乌干达统计局[元]
- 乌克兰[元]
- 联合国[元]
- 乌拉圭 [元]
- 美国加利福尼亚州山谷交通管理局 (VTA) [元]
- 温哥华,不列颠哥伦比亚省开放数据目录 [元]
- 加拿大不列颠哥伦比亚省维多利亚 [元]
- 奥地利维也纳 [元]
- 越南统计总局的统计数据 - 不同类别的数据[...] [元]
- 美国国会研究服务处 (CRS) 报告 [元]
卫生保健
- AWS COVID-19 数据集 - 我们正在与制作 COVID-19 相关数据的组织合作 [...] [元]
- COVID-19 病例监测公共使用数据 - COVID-19 病例监测系统数据库 [...] [元]
- 厄瓜多尔的 Covid-19 未处理数据 - 这是一个提供未处理数据集的项目 [...] [Meta]
- 约翰霍普金斯大学 CSSE 的 2019 年新型冠状病毒 COVID-19 数据存储库 - 这是数据 [...] [元]
- 美国的冠状病毒 (Covid-19) 数据 - 《纽约时报》正在发布一系列 [...] [Meta]
- 按设施划分的 COVID-19 报告的患者影响和医院容量 - 以下数据集 [...] [元]
- 生食品、加工食品、预制食品的成分 美国农业部国家营养数据库标准 [...] [Meta]
- 新冠肺炎追踪项目 - 新冠肺炎追踪项目收集并发布了最 [...] [元]
- EHDP 大型健康数据集 [元]
- GDC - GDC 支持 CCG、TCGA、TARGET 等多种癌症基因组计划。 [元]
- Gapminder 世界人口数据库 [元]
- MeSH,用于为 PubMed 索引文章的词汇词库 [Meta]
- MeDAL - 一个大型医学文本数据集,用于缩写消歧 - 医学 [...] [元]
- 美国医疗保险覆盖数据库 (MCD) [元]
- medicare.gov 数据的医疗保险数据引擎 [元]
- 医疗保险数据文件 [元]
- 南丁格尔开放科学 [元]
- 受影响国家的埃博拉病例和死亡人数(2014 年)[元]
- Open-ODS(英国 NHS 的结构)[元]
- OpenPaymentsData,医疗保健财务关系数据 [元]
- PhysioBank 数据库 - 一个庞大且不断增长的生理数据档案。 [元]
- 癌症影像档案 (TCIA) [元]
- 癌症基因组图谱项目 (TCGA) [元]
- 世界卫生组织全球卫生观察站[元]
- 雅虎知识图谱 COVID-19 数据集 - Verizon Media 的雅虎知识图谱团队 [...] [元]
- 整合生物学和床边的信息学 [元]
图像处理
- 10k 美国成人面孔数据库 [元]
- 2GB 猫的照片 [元]
- 受众未过滤的性别和年龄分类面孔[元]
- 情感图像分类[元]
- 机载物体检测和跟踪 - 机载物体跟踪 (AOT) 数据集是一个 [...] [元]
- 具有属性的动物[元]
- CADDY 潜水员手势水下立体视觉数据集 - 包含 10K 立体对 [...] [元]
- 细胞学数据集 – CCAgT:采用 AgNOR 染色技术的宫颈细胞图像 – 包含 9339 [...] [元]
- 加州理工学院行人检测基准 [元]
- Chars74K数据集-自然图像中的字符识别(英语和卡纳达语均可用)[Meta]
- Cube++ - 4890 个原始 18 兆像素图像,每个图像在其 [...] [Meta] 中包含一个 SpyderCube 颜色目标
- 密集注释视频驾驶数据集 - 该数据集包含 28 个视频序列 [...] [元]
- Danbooru Tagged Anime Illustration Dataset - 3.33m+的大型动漫图像数据库 [...] [Meta]
- DukeMTMC 数据集 - DukeMTMC 旨在加速多目标多相机的进步 [...] [Meta]
- ETH 昆虫学收藏 (ETHEC) 细粒蝴蝶(鳞翅类)图像 [元]
- 人脸识别基准[元]
- Flickr:32 类品牌徽标 [元]
- GDXray - 用于 X 射线测试和计算机视觉的 X 射线图像 [元]
- HumanEva 数据集 - HumanEva-I 数据集包含 7 个校准视频序列(4 个灰度 [...] [元]
- ImageNet(在 WordNet 层次结构中)[元]
- 室内场景识别[元]
- 国际情感图片系统,UFL [Meta]
- KITTI 视觉基准套件 [元]
- 亚历山大标记信息图书馆 - 生物学和保护 - 包含超过 10 [...] [元]
- MNIST 手写数字数据库,近 100 万个示例 [Meta]
- 自动驾驶的多视图感兴趣区域预测数据集 - 包含 16 个驾驶 [...] [元]
- 大量视觉记忆刺激,麻省理工学院[元]
- Newspaper Navigator - 该数据集包含 16,358,041 个提取的视觉内容 [...] [元]
- Open Images From Google - 带有 280 万个对象实例分割掩码的图片 [...] [Meta]
- RuFa - 包含以两种阿拉伯字体之一编写的文本图像(Ruqaa 和 Nastaliq [...] [Meta]
- SUN 数据库,麻省理工学院 [元]
- SVIRO 合成车辆内部后座占用率 - 十个地区的 25.000 个合成场景 [...] [元]
- 几个形状轮廓数据集 [元]
- 斯坦福狗数据集 [元]
- 动作相似性标签 (ASLAN) 挑战 [元]
- Oxford-IIIT 宠物数据集 [元]
- Violent-Flows - 人群暴力/非暴力数据库和基准 [元]
- 视觉基因组[元]
- YouTube 面孔数据库 [元]
机器学习
- 全年龄面孔数据集 - 包含分布在所有年龄段的 13'322 幅亚洲人脸图像(来自 2 [...] [Meta]
- 奥迪自动驾驶数据集 - 我们发布了奥迪自动驾驶数据集 [...] [元]
- B3FD - 包含 375k 图像的面部年龄(和性别)估计数据集 - B3FD 数据集是一个 [...] [元]
- 来自五个领域的上下文感知数据集 [Meta]
- 深入研究数据集进行分类和回归 [元]
- Discogs 每月数据 [元]
- 荧光神经元细胞 - 通过发布此数据集,我们的目标是为 [...] [Meta] 提供一个新的测试平台
- 免费音乐档案 [元]
- IMDb 数据库 [元]
- Iranis - 波斯语/阿拉伯语车牌字符的大型数据集 [元]
- 用于分类、回归和时间序列的 Keel 存储库 [Meta]
- LLVIP - 该数据集包含 30976 张图像或 15488 对,其中大部分是在非常[...] [Meta] 拍摄的
- 野外标记面孔 (LFW) [元]
- Lending Club 贷款数据 [元]
- 机器学习数据集存储库 [元]
- 百万歌曲数据集 [元]
- 更多歌曲数据集 [元]
- MovieLens 数据集 [元]
- 《纽约客》标题比赛收视率 [元]
- RDataMining - 《R 与数据挖掘》电子书数据 [元]
- 地球上已登记的陨石[元]
- 旧金山餐厅健康评分数据 [元]
- TikTok 数据集 - 超过 300 个捕捉单个人表演舞蹈的舞蹈视频 [...] [Meta]
- UCI 机器学习存储库 [元]
- 雅虎!评级和分类数据 [元]
- YouTube-BoundingBoxes [元]
- YouTube 8m [元]
- eBay 在线拍卖 (2012) [元]
博物馆
- 加拿大科技博物馆公司的开放数据[元]
- 库珀-休伊特收藏数据库 [元]
- 大都会艺术博物馆藏品 API [元]
- 明尼阿波利斯艺术学院元数据 [元]
- 自然历史博物馆(伦敦)数据门户 [元]
- 国立博物馆历史艺术收藏 [元]
- 泰特美术馆元数据 [元]
- 盖蒂词汇表 [元]
自然语言
- 自动关键短语提取[元]
- 大坏NLP数据库[元]
- 暴雪挑战赛演讲 - 演讲+文字数据来自专业有声读物 [...] [Meta]
- Blogger 语料库 [元]
- CLiPS 风格测量研究语料库 [元]
- ClueWeb09 FACC [元]
- ClueWeb12 FACC [元]
- DBpedia - 来自维基百科的结构化数据 [元]
- 脏话 - 我们的库中有数百万张图像和数十亿个用户提交的关键字,[...] [Meta]
- Flickr 个人分类法 [元]
- 人物、地点和事物的自由库 [元]
- 德国政治演讲语料库 - 德国政治演讲集 [...] [元]
- Google 图书 Ngrams (2.2TB) [元]
- Google MC-AFP - 使用段落向量根据公共可用的 Gigaword 数据集生成 [元]
- Google Web 5gram(1TB,2006)[元]
- 古腾堡电子书列表 [元]
- 加拿大议会的议事录文本块 [元]
- LJ Speech - 语音数据集,由单个说话者朗读的 13,100 个短音频片段组成 [...] [Meta]
- M-AILabs 语音 - M-AILABS 语音数据集是我们 [...] [元] 的第一个大型数据集
- Microsoft 机器阅读理解数据集(或 MS MARCO)[元]
- 微软研究院文本的机器理解测试 (MCTest) [元]
- 欧洲语言的机器翻译 [元]
- 理解微帖子 2013 - 概念提取 [元]
- 理解微博 2016 - 命名实体识别和链接 [元]
- 多域情感数据集(2.0版)[元]
- No Language Left Behind (NLLB - 200vo) - 基于 Meta 元数据的挖掘双文本数据集。 [...] [元]
- 用于训练语音增强算法和 TTS 模型的噪声语音数据库 - Clean 和 [...] [Meta]
- 打开多语言 Wordnet [元]
- POS/NER/Chunk 注释数据 [Meta]
- 人物语料库 [元]
- 英文垃圾短信收集[元]
- 沙特新闻网沙特报纸文章合集(阿拉伯文,3 万篇文章)[元]
- 斯坦福问答数据集 (SQuAD) [元]
- 2005~2011年USENET帖子语料库[元]
- 通用依赖关系[元]
- Webhose - 多种语言的新闻/博客 [元]
- 维基数据 - 维基百科数据库 [元]
- 维基百科链接数据 - 上下文中的 4000 万个实体 [元]
- WordNet 数据库和工具 [Meta]
- Wordbank - 开放、去识别化的词汇发展数据库,包含 84,138 名儿童和 [...] [Meta]
- WorldTree 基本科学问题解释图语料库 - [...] [元] 语料库
神经科学
- 艾伦研究所数据集 [元]
- 大脑目录[元]
- 脑组学 [元]
- CodeNeuro 数据集 [元]
- 计算神经科学合作研究(CRCNS)[元]
- FCP-INDI [元]
- 人类连接组计划 [元]
- NDAR [元]
- NIMH 数据存档 [元]
- 神经数据 [元]
- NeuroMorpho - NeuroMorpho.Org 是一个集中策划的数字重建清单 [...] [Meta]
- 神经电学[元]
- 绿洲 [元]
- OpenNEURO [元]
- OpenfMRI [元]
- 研究福雷斯特 [元]
- Nencki-Symfonia EEG/ERP 数据集 - 高密度脑电图 (EEG) 数据集 [...] [元]
物理
- CERN 开放数据门户 [元]
- 晶体学开放数据库 [元]
- IceCube - 南极中微子观测站 [元]
- Ligo 开放科学中心 (LOSC) - 来自 LIGO Hanford 和 [...] [Meta] 的引力波数据
- NASA 系外行星档案 [元]
- NSSDC(NASA)550艘太空飞船的数据[元]
- 电子在二维电位井中对电子的量子模拟 - 数据是[...] [META]
- 斯隆数字天空调查(SDSS) - 映射宇宙[meta]
Prostatecancer
- EOPC-末期 - 局长 - 癌 - 早期前列腺癌 - 德国。 [...] [元]
- Genie-来自基因组学证据的数据[...] [Meta]的肿瘤信息交流(Genie)项目
- 基因组 - 霍尔标准 - 局部 - 腺癌-CPC基因 - 477 [...] [Meta]的综合基因组分析
- MSK-IMPACT-Clinical-sequinicer-cohort-MSKCC - 局长 - 临床靶向测序[...] [META]
- 转移性 - 抗腺癌-MCTP- 61个前列腺癌的综合分析[...] [Meta]
- 转移性 - 局长-SU2CPCF-Dream-team团队 - 150转移性[...] [META]的综合分析
- NPCR-2001-2015 - 来自 CDC 国家癌症登记计划 (NPCR) 的数据库。 [...] [meta]
- NPCR-2005-2015 - 来自 CDC 国家癌症登记计划 (NPCR) 的数据库。 [...] [meta]
- NAF-PROSTATE-NAF前列腺是F-18 NAF正电子发射断层扫描/计算的集合[...] [Meta]
- 神经内分泌 - 局部 - 癌 - 全外显子组和RNA耐castration抗性[...] [meta]
- PLCO-PROSTATE-DINASTIC-PROCEDURES-PROSTATE诊断程序数据集(95,837 [...] [Meta]
- PLCO-PROSTATE-MEDICAL-COMPITACTION-PROSTATE医学并发症数据集(3,350 [...] [Meta]
- PLCO-PROSTATE-SCREENINE-SCRETINE-ABNORALITY-PROSTATE筛选异常数据集(10,527 [...] [Meta]
- PLCO-PROSTATE-SCREENINE-PROSTATE筛选数据集(177,315个记录,35,875名受试者,[...] [Meta]
- PLCO-PROSTATE-FEALMENTS-前列腺治疗数据集(13,409个记录,7,614个受试者,[...] [Meta]
- PLCO -PROSTATE -PROSTATE数据集是一个综合数据集,几乎包含所有[...] [Meta]
- PRAD-CA局 - 加拿大 - 前列腺腺癌 - 加拿大 - 加拿大。由[...] [meta]收集
- PRAD-FR-FR-PROTSTATE-ADENOCARCINAMAMAMO-FRANCE-PROSTATE腺癌 - 法国。由十个[...] [meta]收集
- PRAD-UK-OUK-PROSTATE-ADENOCARCINOMA-KING-KINGDON-PROSTATE腺癌 - 英国。 [...] [元]
- 前列腺挑战 - 前列腺MR研究的回顾性集。所有研究包括[...] [META]
- Prostate-3T-前列腺3T项目为TCIA提供了成像数据,作为ISBI [...] [META]的一部分
- 前列腺 - 腺癌大众2012年 - 112个前列腺癌的综合分析[...] [Meta]
- 前列腺 - 腺癌大众2013年 - 57个前列腺癌的综合分析[...] [META]
- 前列腺 - 腺癌 - cna-study-mskcc- 103个初级前列腺[...] [META]的复制编码分析
- 前列腺 - 腺癌 - 弗雷德 - 荷兰森-CRC-前列腺癌的综合分析[...] [Meta]
- 前列腺腺癌(MSKCC/DFCI) - 1013个前列腺癌样品的整个外显子组测序。 [元]
- 前列腺腺癌MSKCC-MSKCC前列腺致病组项目。 181主要,37转移[...] [Meta]
- 前列腺 - 腺癌 - 甲状腺瘤-MSKCC-前列腺癌样品和[...] [Meta]的外部分析
- 前列腺 - 腺癌 - 肺癌 - 65个前列腺的全基因组和转录组测序[...] [Meta]
- 前列腺腺癌-TCGA-PANCANCER-ATLAS-全面的TCGA Pancanatlas数据来自11K [...] [META]
- 前列腺腺癌-TCGA- 333个原发性前列腺腺癌样品的综合分析。 [元]
- 前列腺诊断-PCA T1-和T2加权磁共振图像(MRI)[...] [META]
- 前列腺融合的MRI-PATHOLOGY-PROSTATE FUSE-MRI-PATHOLOCY COLLECTOR是一种组合[...] [Meta]
- 前列腺MRI-前列腺磁共振图像(MRIS)的前列腺MRI收集为[...] [meta]
- Prostate -r- r软件包“ Elemstatleln”包含来自Stamey et [...] [Meta]的前列腺癌数据集
- QIN-PROSTATE-REPEATIABLE-QIN-PROSTATE-REPEATIABITY DATASET是一个具有[...] [META]的数据集
- QIN -PROSTATE-定量成像网络(QIN)的QIN前列腺集合包含[...] [META]
- Seer -yr1973_2015.Seer9- SEER 2017年11月的研究数据文件来自9个SEER注册表[...] [META]
- Seer-yr1992_2015.sj_la_rg_ak- SEER 2017年11月的研究数据文件来自圣何塞 - [...] [META]
- Seer -yr2000_2015.CA_KY_LO_LO_NJ_GA- SEER 2017年11月的研究数据文件来自大[...] [META]
- Seer -yr2000_2015.ca_ky_lo_nj_ga- 2005年7月至12月的路易斯安那州的[...] [Meta]
- TCGA-PRAD-US-TCGA前列腺腺癌(499个样品)。 [元]
心理学+认知
- OSU认知建模存储库数据集[META]
- 开放认知科学数据 - 来自认知的公开行为数据集[...] [META]
公共事物
- 可以打开实时数据[meta]
- 亚马逊[meta]
- Archive.org数据集[META]
- Internet存档的存档-IT [META]
- CMU JASA数据存档[META]
- CMU Statlab收集[meta]
- data.world [meta]
- Data360 [Meta]
- 谜公众[meta]
- Google [meta]
- Grand Comics数据库 - Grand Comics Database(GCD)是一个基于Internet的非营利性[...] [Meta]
- Infochimps [meta]
- kdnuggets数据收集[meta]
- Microsoft Azure数据市场免费数据集[META]
- Microsoft研究数据科学[META]
- 微软研究开放数据[meta]
- 开放库数据转储[META]
- reddit数据集[meta]
- RevolutionAnalytics Collection [Meta]
- 样本R数据集[META]
- 堆栈溢出年度开发人员调查 - 2011年的年度开发人员Surverys完整数据集[...] [META]
- Statsci.org [meta]
- Stats4Stem R数据集(存档)[META]
- 《华盛顿邮报》名单[meta]
- UCLA SOCR数据收集[meta]
- UFO报告[META]
- WikiLeaks 911 Pager拦截[META]
- Yahoo WebScope [meta]
SearchEngines
- UMB [META]的数据共享学术洪流
- 基本DOS DADOS-数据基础:巴西的开放数据存储库[meta]
- datahub.io [meta]
- 域项目 - 互联网域的排序列表[meta]
- 哈佛大学数据科学数据网络[meta]
- ICPSR(UMICH)[META]
- 教育科学研究所[meta]
- 国家技术报告图书馆[META]
- 打开数据证书(beta)[meta]
- OPENDATANETWORK-所有Socrata动力数据门户的搜索引擎[META]
- Statista.com-统计和研究[meta]
- Zenodo-长尾科学的开放式住宅[meta]
社交网络
- 2021葡萄牙选举Twitter数据集-57m+推文,1M+用户 - 此数据集包含[...] [META]
- 72小时#gamergate Twitter Scrape [meta]
- 150位用户的CMU Enron电子邮件[META]
- Cheng-Caverlee-Lee 2009年9月 - 2010年1月Twitter Scrape [Meta]
- 中国传记数据库 - 中国传记数据库是一个可以自由访问的[...] [META]
- 会所数据集[meta]
- 与Covid -19相关的40多个推文的Twitter数据集 - 由于[...] [Meta]的相关性
- 43K+唐纳德·特朗普Twitter屏幕截图 - 此档案包含43,475 Donald [...] [Meta]的屏幕截图
- 151个用户的EDRM Enron电子邮件,在S3 [Meta]上托管
- Facebook数据刮擦(2005)[META]
- Facebook社交连接索引 - 我们使用所有活跃的Facebook的匿名快照[...] [META]
- 法律的Facebook社交网络(自2007年以来)[META]
- Umn/Sarwat(2013)的Foursquare [Meta]
- GitHub协作档案馆[meta]
- Google Scholar引文关系[META]
- 可穿戴传感器的高分辨率接触网络[meta]
- 独立地图:顶级工业网站的社交图和爬网[meta]
- 来自UMass [Meta]的移动社交网络
- 网络Twitter数据[meta]
- reddit评论[meta]
- SkyTrax的航空旅行评论数据集[META]
- 社交Twitter数据[META]
- SourceForge.NET研究数据[META]
- REDDIT COVID数据集 - 此数据集试图捕获COVID -19 [...] [META]的全部范围
- Twitch顶级流媒体的数据[META]
- 在线声誉管理的Twitter数据[META]
- Twitter数据进行情感分析[META]
- 整个Twitter网站的Twitter图[meta]
- Twitter Scrape Calufa 2011年5月[META]
- UNIMI/LAW社交网络数据集[META]
- 美国国会Twitter数据 - 每日数据集,带有1100多个帐户的推文[...] [META]
- 雅虎!图和社交数据[meta]
- YouTube视频社交图2007,2008 [Meta]
社会景观
- ACLED(武装冲突地点和事件数据项目)[META]
- 威权统治精英数据库 - 威权统治精英数据库(ARED)是[...] [Meta]
- 加拿大法律信息研究所[META]
- 系统性和平数据集的中心 - 冲突趋势,政体,国家脆弱性等[META]
- 战争项目的关联[meta]
- 隐秘阴谋论项目[meta]
- 数据卡[meta]
- 欧洲社会调查[META]
- 联邦调查局仇恨犯罪2013年 - 汇总数据[META]
- 脆弱状态索引[meta]
- GDELT全球事件数据库[META]
- 一般社会调查(GSS)自1972年以来[META]
- 德国社会调查[meta]
- 全球宗教期货项目[META]
- 枪支暴力数据 - 一个全面的,可访问的数据库,其中包含超过260K的记录[...] [META]
- 人道主义数据交换[meta]
- 告知风险管理指数[meta]
- 人口研究所[META]
- 美洲开发银行开放数据[meta]
- 国际网络档案[meta]
- 国际社会调查计划ISSP [META]
- 国际研究纲要项目[META]
- James McGuire Cross National Data [Meta]
- 麻省理工学院现实采矿数据集[META]
- Norsk Samfunnsvitenskapelig Datatjeneste [Meta]的Macrodata指南
- 群众动员数据项目 - 质量动员(MM)数据是为了理解[...] [META]的努力
- Microsoft学术知识图 - Microsoft学术知识图是一个大的RDF [...] [META]
- 明尼苏达州人口中心[meta]
- 巴黎圣母院全球适应指数(ND-GEAN)[META]
- 英格兰,威尔士和北爱尔兰的公开犯罪和警务数据[META]
- 开放式 - 政治,犯罪或[...] [Meta]的人和公司的全球数据库
- Paul Hensel General International Data Page [Meta]
- Pewresearch Internet调查项目[META]
- Pewresearch Society数据收集[META]
- 政治极性数据[META]
- stackexchange数据资源管理器[meta]
- 恐怖主义研究与分析财团[META]
- 得克萨斯州囚犯自1984年以来被处决[Meta]
- 泰坦尼克号生存数据集[META]
- UCB的社会科学数据档案(D-LAB)[META]
- 加州大学洛杉矶分校社会科学数据存档[meta]
- 联合国民间社会数据库[meta]
- Upjohn劳动就业研究[META]
- 全球大学[meta]
- Uppsala冲突数据程序[META]
- 世界银行开放数据[meta]
- 世界不平等数据库 - 世界不平等数据库(WID.WORLD)旨在提供开放[...] [META]
- WorldPop项目 - 全球人口分布[META]
软件
- 关于免费,Libre和开源软件开发的Flossmole数据[META]
- Ghtorrent-可扩展,可查询的,通过GitHub REST API提供的数据镜像。 [元]
- libraries.io开源存储库和依赖关系元数据[meta]
- 公共git档案 - 所有的大型代码数据集 - 182,014的数据集,顶级标记GIT [...] [META]
- 代码重复项-2K Java文件和600个Java功能对标记为相似或不同的标记为[...] [Meta]
- 提交消息-13亿GitHub提交消息,直到2019年3月[META]
- 拉申请评论评论 - 自2015年1月以来,2530万Github PR评论评论直到[...] [META]
- 源代码标识符 - 从182,014 [...] [Meta]收集的4170万个不同的可分解标识符
运动的
- 美国忍者战士障碍 - 包含美国忍者历史上的所有障碍[...] [Meta]
- BETFAIR历史交换数据[META]
- cricsheet比赛(板球)[meta]
- 田径公平性 - 田径数据分析切割工具的公平性是由[...] [Meta]带给您的
- Ergast Formula 1,从1950年最新(API)[META]
- 足球/足球资源(数据和API)[META]
- 拉曼的棒球数据库[meta]
- NFL逐播数据 - NFL逐场播放数据来自:[...] [META]
- Pinhooker:纯种血茎销售数据[META]
- Pro Kabadi第1-7季-Pro Kabadi League是印度的专业级卡巴迪联赛。 [...] [元]
- Retrosheet棒球统计[META]
- ATP的排名,结果和统计数据库[META]
- WTA的排名,结果和统计数据库[META]
- Transfermarkt数据集 - 清洁,结构化和自动更新足球(足球)数据[...] [META]
- 美国足球队和地点 - 美国足球队和位置。 MLS,NWSL和USL [...] [META]
时间,时间
- 3W数据集 - 据其作者所知,这是第一个现实和公开[...] [META]
- 数据库国际交叉国家时间序列数据档案库[meta]
- 硬盘驱动故障率[meta]
- MIT的心率时间序列[meta]
- 来自MU [META]的时间序列数据库(TSDL)
- 图灵变更点数据集 - 包含42个注释的时间序列,用于开发[...] [META]
- UC Riverside时间序列数据集[META]
运输
- 航空公司OD数据1987-2008 [META]
- 福特Gobike数据(以前是湾区自行车共享数据)[META]
- 自行车共享系统(BSS)收集[META]
- 荷兰交通信息[meta]
- Microsoft Research [Meta]的Geolife GP轨迹
- 德意志Bahn的德国火车系统[Meta]
- Hubway Million Rides in Ma [Meta]
- 墨尔本人行人计数 - 此数据集自2009年以来包含每小时的行人计数[...] [meta]
- 蒙特利尔比克西自行车共享[meta]
- 纽约市出租车旅行数据2009- [meta]
- 纽约市出租车旅行数据2013(FOIA/FOLED)[META]
- NYC Uber Trip Data 2014年4月至2014年9月[META]
- 打开交通收集[meta]
- OpenFlights - 机场,航空公司和路线数据[META]
- 费城自行车共享站(JSON)[META]
- 飞机失事数据库,自1920年以来
- 丽塔航空公司的准时绩效数据[meta]
- RITA/BTS运输数据收集(TranStat)[META]
- Renfe(西班牙国家铁路网络)数据集[META]
- 多伦多自行车共享站(JSON和GBFS文件)[META]
- 伦敦运输(TFL)[meta]
- 芝加哥的旅行追踪器调查(TTS)[META]
- 美国交通统计局(BTS)[META]
- 美国国内航班1990年至2009年[meta]
- 自2007年以来的美国货运分析框架[meta]
- 美国国家公路交通安全管理局 - 自1975年以来的死亡 - 包含CSV [...] [META]
电子竞技
- CS:进行竞争激烈的对接数据 - 在此数据集中,我们有有关CSGO对接的数据[...] [META]
- FIFA-2021完整播放器数据集[META]
- opendota数据转储[meta]
补充收藏
- 数据包装的核心数据集
- OPENDATAMONITOR:欧洲可用的开放数据资源的概述
- Quora:在哪里可以找到向公众开放的大型数据集?
- RS.IO:100多个有趣的统计数据集
- CVONLINE:图像数据库
- Innotrek:利用开放数据来了解城市生活
- 简历论文:网络上的CV数据集
特别感谢