很棒的公共數據集
這是一個以主題為中心的高品質公共資料來源清單。它們是從部落格、答案和用戶回應中收集和整理的。下面列出的大多數資料集都是免費的,但有些則不是。該計畫是陳夏明博士期間在上海交通大學OMNILab孵化的。研究。 OMNILab 現已成為白玉蘭開放人工智慧社群的一部分。其他令人驚嘆的精彩清單可以在 sindresorhus 的精彩清單中找到。
注意:此儲存庫由 apd-core 自動產生。請不要直接修改此文件。我們提供了一種為該存儲庫做出貢獻的新方法。加入 Slack 社區,即時取得總部資料更新。
目錄
- 農業
- 建築學
- 生物學
- 化學
- 氣候+天氣
- 複雜網路
- 電腦網路
- 網路安全
- 數據挑戰
- 地球科學
- 經濟學
- 教育
- 活力
- 娛樂
- 金融
- 地理資訊系統
- 政府
- 衛生保健
- 影像處理
- 機器學習
- 博物館
- 自然語言
- 神經科學
- 物理
- 攝護腺癌
- 心理學+認知
- 公共領域
- 搜尋引擎
- 社群網路
- 社會科學
- 軟體
- 運動的
- 時間序列
- 運輸
- 電競
- 補充系列
農業
- 1981-2016 年主要農作物歷史產量的全球資料集 - [...] [Meta] 的全球資料集
- 土壤濕度高光譜基準資料集 - 此資料集是在五天的時間內測量的 [...] [Meta]
- 檸檬品管資料集 - 檸檬資料集已準備好調查 [...] [元]
- 優化土壤調整植被指數 - IDB 是一種用於遙感工作的工具 [...] [Meta]
- 美國農業部的營養資料庫 [元]
- 美國農業部植物資料庫 - 完整的植物清單近 7 [...] [元]
建築學
- 瑞士公寓模型 - 此資料集包含 42,207 套公寓的詳細資料(242,257 [...] [元]
生物學
- 1000 個基因組 - 1000 個基因組計畫於 2008 年至 2015 年間運行,創造了最大的 [...] [元]
- ANHIR - 自動非剛性組織學影像配準 (ANHIR) 由 2D [...] [Meta] 組成
- American Gut(微生物組計畫)- American Gut 計畫是最大的眾包 [...] [Meta]
- BCNB - 有 1058 名患者的 WSI,部分腫瘤區域在 WSI 中註釋。除了[...] [元]
- Broad Bioimage Benchmark Collection (BBBC) - Broad Bioimage Benchmark Collection (BBBC) [...] [元]
- 廣泛的癌細胞系百科全書(CCLE)[元]
- CIMA - CIMA 資料集包括 2D 組織學顯微鏡組織切片的影像。 [元]
- 細胞圖像庫 - 該庫是一個公共且易於存取的資源資料庫 [...] [Meta]
- 完整的基因組學公共數據 - 整個人類基因組的多樣化數據集是免費的 [...] [Meta]
- CytoImageNet - 大型顯微鏡影像資料集。包含 890,737 總灰階 [...] [元]
- EBI ArrayExpress - 功能基因組數據的 ArrayExpress 存檔儲存來自高 [...] [元] 的數據
- 歐洲 EBI 蛋白質資料庫 - 電子顯微鏡資料庫 (EMDB) 是一個公共 [...] [Meta]
- ENCODE 計畫 - DNA 元素百科全書 (ENCODE) 聯盟是一個正在進行的 [...] [Meta]
- 電子顯微鏡試驗影像檔案 (EMPIAR) - EMPIAR,電子顯微鏡公共 [...] [元]
- 整體基因組 [元]
- 基因表現綜合 (GEO) - GEO 是一個公共功能基因組學資料儲存庫 [...] [元]
- Gene Ontology (GO) - GO 註釋文件 [元]
- 全球生物交互作用 (GloBI) [元]
- 哈佛醫學院 (HMS) LINCS 計畫 - 哈佛醫學院 (HMS) LINCS 中心 [...] [元]
- 人類基因組多樣性計畫 - 史丹佛大學的一群科學家 [...] [Meta]
- 人類微生物組計劃 (HMP) - HMP 對從 [...] [Meta] 分離的 2000 多個參考基因組進行了測序
- ICOS PSP 基準 - ICOS PSP 基準儲存庫包含一個可調整的現實世界 [...] [Meta]
- 國際單體型圖計畫 [元]
- 細胞生物學雜誌數據檢視器 [元]
- KEGG - KEGG 是一種資料庫資源,用於了解 [...] [Meta] 的高級功能和實用程式
- NCBI 蛋白質 [元]
- NCBI 分類法 - NCBI 分類法資料庫是一組精選的名稱和分類 [...] [元]
- NCI 基因組資料共享 - GDC 資料入口網站是一個強大的資料驅動平台,允許 [...] [元]
- NIH 微陣列資料 [元]
- OpenSNP 基因型資料 - openSNP 允許客戶進行直接面向客戶的基因測試 [...] [Meta]
- Palmer Penguins - palmerpenguins 的目標是為資料提供一個很棒的資料集 [...] [Meta]
- Pathguid - 蛋白質-蛋白質交互作用目錄 [元]
- 蛋白質資料庫 - 此資源由蛋白質資料庫檔案資訊提供支援 [...] [元]
- 精神病學基因組學聯盟 - 精神病學基因組學聯盟 (PGC) 的目的是 [...] [Meta]
- PubChem 專案 - PubChem 是世界上最大的免費化學品集合 [...] [Meta]
- PubGene(現為 Coremine Medical)- COREMINE™ 是由挪威 [...] [Meta] 開發的一系列工具
- 癌症體細胞突變桑格目錄 (COSMIC) - COSMIC,體細胞突變目錄 [...] [Meta]
- 桑格癌症藥物敏感性基因組學計畫 (GDSC) [Meta]
- 序列讀取存檔 (SRA) - 序列讀取存檔 (SRA) 儲存來自 [...] [元] 的原始序列數據
- Serratus - 分析 710 萬個 RNA/DNA 定序資料集以發現總 [...] [Meta]
- 史丹佛微陣列數據(現已退休)[元]
- 斯托爾斯研究所原始資料儲存庫 [元]
- 生物動力學系統科學 (SSBD) 資料庫 - 生物系統科學 [...] [元]
- 癌症基因組圖譜 (TCGA),可透過 Broad GDAC [Meta] 取得
- 生命目錄 - 生命目錄是一份有品質保證的清單,包含超過 1.8 [...] [元]
- 個人基因組計畫 - 個人基因組計畫於 2005 年啟動,是一個願景和 [...] [Meta]
- UCSC 公共資料 [元]
- UniGene [元]
- 通用蛋白質資源 (UnitProt) - 通用蛋白質資源 (UniProt) 是一個 [...] [Meta]
- Rfam - Rfam 資料庫是 RNA 家族的集合,每個家族由多個 [...] [Meta] 表示
化學
氣候+天氣
- 精算師景氣指數[元]
- 澳洲天氣 [元]
- 航空氣像中心 - 為世界提供一致、及時和準確的天氣資訊 [...] [元]
- 巴西天氣 - 歷史資料(葡萄牙語) - 與氣候和天氣相關的資料 [...] [元]
- 多個氣候資料集 - C3S 氣候資料儲存 (CDS) 是 [...] [Meta] 的一站式商店
- 加拿大氣像中心[元]
- Caravan - 大樣本水文學資料集 - Caravan 是 [...] [Meta] 的開放社區資料集
- 來自 UEA 的氣候數據(每月更新)[元]
- 荷蘭天氣 - KNMI 資料中心 (KDC) 入口網站提供對 KNMI 天氣資料的訪問,[...] [元]
- 歐洲氣候評估和資料集 [元]
- 德國氣候資料中心 [元]
- 1929 年以來的全球氣候數據 [元]
- 繪製 2009-2020 年全球氣候變遷新聞敘事圖表 - 這四個資料集代表 [...] [元]
- NASA 全球圖像瀏覽服務 [元]
- NOAA 白令海氣候 [元]
- NOAA 氣候資料集 [元]
- NOAA 即時天氣模型 [元]
- NOAA SURFRAD 氣象與輻射資料集 [元]
- Open-Meteo - 開源天氣 API - 開源天氣 API,可供非 [...] [Meta] 免費訪問
- 世界銀行氣候變遷開放資料資源 [元]
- UEA 氣候研究單位 [元]
- WU 全球歷史天氣 [元]
- 華盛頓郵報氣候變遷 - 為了分析美國氣溫變暖,[...] [Meta]
- WorldClim - 全球氣候資料 [元]
複雜網路
- AMiner 引文網絡資料集 [元]
- CrossRef DOI URL [元]
- DBLP 引文資料集 [元]
- DIMACS 道路網絡集合 [元]
- NBER 專利引文 [元]
- NIST 複雜網路資料收集 [Meta]
- 具有互動式探索性分析工具的網路儲存庫 [元]
- 蛋白質-蛋白質交互作用網絡[Meta]
- PyPI 和 Maven 依賴網路 [元]
- Scopus 引文資料庫 [元]
- 小網路資料[元]
- 斯坦福 GraphBase [元]
- 史丹佛大學大型網路資料集[元]
- 史丹佛縱向網路資料來源[元]
- 科布倫茨網路集合 [元]
- 網路演算法實驗室 (UNIMI) [Meta]
- UCI 網路資料儲存庫 [元]
- UFL稀疏矩陣集合[元]
- WSU 圖資料庫 [元]
- 達特茅斯歸檔無線資料的社群資源 - 包含 pcap 檔案資料集 [...] [元]
電腦網路
- 來自 CommonCrawl 2012 的 3.5B 網頁 [元]
- 印第安納大學 10 萬用戶的 53.5B 網路點擊量[元]
- CAIDA 互聯網資料集 [元]
- 來自達特茅斯大學的 CRAWDAD 無線資料集。 [元]
- ClueWeb09 - 1B 網頁 [元]
- ClueWeb12 - 733M 網頁 [元]
- CommonCrawl 7 年多的網路資料 [元]
- 使用最少瀏覽資訊從點擊流電子商務資料預測購物者意圖 [元]
- Criteo 點擊率資料 [元]
- 互聯網範圍的掃描資料儲存庫 [元]
- MIRAGE-2019 - MIRAGE-2019 是一個人工生成的資料集,用於行動流量分析 [...] [Meta]
- Merklemap DNS 記錄資料集 - 包含 7 億筆獨特的 4B+ DNS 記錄 [...] [元]
- OONI:網路幹擾開放觀察站 - 網路審查資料 [元]
- 透過 MobiPerf 開啟行動數據 [Meta]
- 點對點追蹤檔案 - 現實世界的測量在研究 [...] [元] 中發揮關鍵作用
- Rapid7 聲納互聯網掃描 [元]
- UCSD 網路望遠鏡,IPv4 /8 網路 [元]
網路安全
- CCCS-CIC-AndMal-2020 - 此資料集包括 200K 個良性樣本和 200K 個惡意軟體樣本,總計 [...] [Meta]
- 在網路防禦演習期間捕獲的流量和日誌資料 - 此資料集是獲取的 [...] [元]
數據挑戰
- AIcrowd 競賽 [元]
- 暴力破解資料庫 [元]
- 機器學習的挑戰 [元]
- CrowdANALYTIX dataX [元]
- 橙色的D4D挑戰[元]
- DrivenData 社會公益競賽 [元]
- ICWSM 資料挑戰(自 2009 年起)[元]
- 2012 騰訊 KDD 杯 [元]
- Kaggle 競賽資料 [元]
- Localytics 資料視覺化挑戰 [元]
- Netflix 獎 [元]
- 太空應用挑戰賽 [元]
- 義大利電信大數據挑戰賽 [Meta]
- TravisTorrent 資料集 - MSR'2017 挖礦挑戰賽 [元]
- TunedIT - 資料探勘與機器學習資料集、演算法、挑戰 [元]
- Yelp 資料集挑戰 - Yelp 資料集是我們的業務、評論和使用者的子集[...] [元]
地球科學
- 38-Cloud(雲端偵測)- 包含 38 張 Landsat 8 場景影像及其手動擷取的 [...] [元]
- AQUASTAT - 全球水資源與利用 [元]
- BODC - 約 22K vars 的海洋資料 [元]
- EOSDIS - NASA 的地球觀測系統資料 [元]
- 地球模型 [元]
- Global Wind Atlas - Global Wind Atlas 是一款免費的、基於網路的應用程序,旨在幫助 [...] [Meta]
- 綜合海洋觀測系統 (IMOS) - 約 30TB 的海洋測量資料 [元]
- Marineexplore - 開放海洋學資料 [元]
- 阿拉巴馬州即時海岸觀測系統 [元]
- 國家河口研究儲備全系統監測計畫 - 長期河口 [...] [Meta]
- 石油與天然氣管理局開放資料 - 資料集涵蓋 12,500 個海上井眼、5,000 個地震 [...] [元]
- 史密森學會全球火山與噴發資料庫 [元]
- 美國地質勘探局地震檔案 [元]
- 使用突破曲線進行井口保護區(保護區)預測 - 此 [...] [Meta]
經濟學
- 亞洲生產力組織 (APO) - AEPM 提供了 [...] [元] 的圖形儀表板視圖
- 東協統計 - 東協統計資料入口網站於 2018 年 6 月首次推出。
- 美國經濟協會 (AEA) [元]
- 亞洲 KLEMS - 亞洲 KLEMS 是一個亞洲區域研究聯盟,旨在促進建設 [...] [Meta]
- 哈佛經濟複雜性地圖集 - 供人們探索全球貿易流動的資料庫 [...] [元]
- BIS 金融資料庫 - 這些文件包含與 BIS 統計資源管理器相同的資料 [...] [元]
- Barro-Lee 教育程度 - 1950 年至 2010 年的 Barro-Lee 教育程度資料。
- CEPII 資料庫 - 世界經濟資料庫,透過其國家和地區概況,在 [...] [Meta]
- EUKLEMS - EU KLEMS 是一個產業層級、成長和生產力研究計畫。 EU KLEMS [...] [元]
- 世界經濟自由度資料[元]
- 歷史國民帳戶 - 比較歷史國民帳戶資料中心 [...] [元]
- 歷史宏觀經濟統計[元]
- INFORUM - 馬裡蘭大學的產業間預測 [Meta]
- DBnomics – 世界經濟資料庫 – 聚合了數億個時間序列 [...] [Meta]
- 國際貿易統計[元]
- 網路產品代碼資料庫 [元]
- 聯合外債資料中心[元]
- 喬恩哈夫曼國際貿易數據連結 [元]
- 拉丁美洲 KLEMS - LAKLEMS 是一個由 Inter-[...] [Meta] 資助的技術合作項目
- 長期生產力資料庫 - 長期生產力資料庫是作為 [...] [元] 創建的
- 麥迪遜計畫資料庫 - 麥迪遜計畫資料庫提供了有關比較 [...] [元] 的信息
- 國民轉移帳戶 - 國民轉移帳戶 (NTA) 項目的目標是 [...] [Meta]
- OpenCorporates 全球公司資料庫 [元]
- 我們的資料世界 [元]
- Penn World Table - PWT 10.0 版是一個資料庫,其中包含 [...] [Meta] 相對水平的信息
- SciencePo 世界貿易重力資料集 [元]
- 經濟複雜性地圖集 [元]
- 國際資料中心[元]
- 經濟複雜性觀察站 [Meta]
- 聯合國商品貿易統計[元]
- 聯合國人類發展報告[元]
- 世界投入產出資料庫 - 世界投入產出表和基礎數據,涵蓋 43 [...] [元]
- World KLEMS - 適用於世界各地眾多國家的分析 KLEMS 類型資料集。 [...] [元]
教育
- 大學記分卡資料[元]
- 紐約州教育部數據 - 紐約州教育部 (NYSED) [...] [元]
- 國際學生評估計劃 (PISA) - 包含 15 歲學生的 [...] [Meta]
- 來自免費程式設計營的學生資料 [元]
活力
- AMPds - 分鐘功率年鑑資料集 [元]
- BLUEd - 建築級完全標記的電力分解資料集 [元]
- 梳理[元]
- DBFC - 直接硼氫化物燃料電池 (DBFC) 資料集 [元]
- DEL - 南非國內電力負載研究資料集(1994 - 2014)[元]
- ECO - ECO 資料集是一個用於非侵入式負載監控和 [...] [Meta] 的綜合資料集
- 環境影響評估[元]
- 全球電廠資料庫 - 全球電廠資料庫是一個全面的開源 [...] [Meta]
- HES - 英國家庭電力研究 [元]
- HFED [元]
- 更多:摩洛哥建築物的用電量資料集 - 自 2019 年春季以來,資料 [...] [元]
- Marktstammdatenregister - 德國 Marktstammdatenregister (MaStR) 是所有 [...] [Meta] 的資料庫
- PEM1 - 質子交換膜 (PEM) 燃料電池資料集 [元]
- PLAID - 即插即用裝置識別資料集 [元]
- 公共事業資料解放專案 (PUDL) - PUDL 讓美國能源資料更容易 [...] [Meta]
- REDD [元]
- SYND - 用於非侵入式負載監控的合成能源資料集 - 透過 SynD,我們提出了 [...] [Meta]
- 智慧電錶資料入口網站 - 智慧電錶資料入口網站是國家科學 [...] [Meta] 的一部分
- 追蹤庫 [元]
- 烏克蘭能源中心資料集 [元]
- UK-DALE - 英國家用電器級電力 [元]
- 白色[元]
- iAWE [元]
娛樂
- Twitch 上的熱門主播 - 這包含去年 1000 名主播的數據。 [元]
金融
- 國際清算銀行統計數據 - 國際清算銀行統計數據,與中央銀行和其他[...] [元]合作編制
- Blockmodo 硬幣註冊表 - JSON 格式資訊文件的註冊表,主要是 [...] [元]
- 芝加哥選擇權交易所期貨交易所 [元]
- 完整的 FAANG 股票數據 - 該數據集包含來自 [...] [Meta] 的 FAANG 公司的所有股票數據
- Google財經 [元]
- 谷歌趨勢 [元]
- 納斯達克[元]
- 紐約證券交易所市場數據[元]
- 萬達 [元]
- OSU 財務數據 [元]
- 昆德爾 [元]
- SEC EDGAR - EDGAR,電子資料收集、分析和檢索系統,是 [...] [元]
- 聖路易聯邦 [元]
- 雅虎財經 [元]
地理資訊系統
- Awesome 3D Semantic City Models - 開放 3D 語意城市和區域模型的集合。 [元]
- ArcGIS 開放資料入口網站 [元]
- 美國麻薩諸塞州劍橋,GitHub 上的 GIS 資料 [元]
- 所有大陸、國家、州/分區/省和城市的資料庫 - 資料庫 [...] [元]
- 事實的全球位置資料[元]
- IEEE 地球科學與遙感協會 DASE 網站 [元]
- 地理地圖 - 以程式設計方式產生的高品質 GeoJSON 地圖 [元]
- 來自 ASU 的地理空間資料 [元]
- Geo Wiki 計畫 - 公民驅動的環境監測 [元]
- GeoFabrik - 提取到各種格式和區域的 OSM 資料 [元]
- 全球地名 [元]
- 全球行政區域資料庫 (GADM) - 按國家/地區組織的地理空間資料。包括 [...] [元]
- 國土基礎建設基礎級資料[元]
- AWS 上的 Landsat 8 [元]
- 所有語言的所有國家/地區列表 [元]
- 國家氣象局 GIS 資料入口網站 [元]
- 自然地球 - 世界的向量和柵格 [元]
- 開放地址 [元]
- OpenStreetMap (OSM) [元]
- Pleiades - 古代地點的地名詞典和圖表 [元]
- 使用 OSM 資料進行反向地理編碼 [元]
- Robin Wilson - 免費 GIS 資料集 [元]
- Shadow Accrual Maps - 儲存庫包含紐約累積的影子資訊 [...] [Meta]
- TIGER/Line - 美國邊界與道路 [元]
- TZ 時區 shapefile [元]
- TwoFishes - Foursquare 的粗略地理編碼器 [元]
- 聯合國環境數據[元]
- 美國國務院的世界邊界 [Meta]
- 多種格式的世界國家[元]
政府
- 加拿大艾伯塔省 [元]
- 比利時安特衛普 [元]
- 阿根廷(非官方)[元]
- 阿根廷資料 - 阿根廷共和國資料入口網站。 Encontrá datos públicos [...] [元]
- 美國德克薩斯州奧斯汀 [元]
- 澳洲 (abs.gov.au) [元]
- 澳洲 (data.gov.au) [元]
- 奧地利 (data.gv.at) [元]
- 美國路易斯安那州巴吞魯日 [元]
- 以色列貝爾謝巴 - 開放資料入口網站 (Smart7 OpenData) [元]
- 比利時 [元]
- 伯克利市開放資料 [元]
- 巴西 [元]
- 阿根廷布宜諾斯艾利斯 [元]
- 加拿大艾伯塔省卡加利 [元]
- 美國麻薩諸塞州劍橋 [元]
- 加拿大[元]
- 芝加哥 [元]
- 智利 [元]
- 中國[元]
- 達拉斯開放資料 [元]
- DataBC - 來自不列顛哥倫比亞省的資料 [元]
- Debt to the Penny - Debt to the Penny 資料集提供了有關總 [...] [元] 的信息
- 丹佛開放資料 [元]
- 北卡羅來納州達勒姆開放資料 [元]
- 加拿大艾伯塔省埃德蒙頓 [元]
- 英格蘭 LGInform [元]
- 歐盟統計局[元]
- EveryPolitician - 正在進行的項目,整理和分享每個政治家的數據。 [元]
- 聯邦統計方法委員會 (FCSM)(前身為 FedStats)[元]
- 芬蘭 [元]
- 法國[元]
- 加拿大新不倫瑞克省弗雷德里克頓 [元]
- 加蒂諾,QC,加拿大 [元]
- 德國[元]
- 比利時根特 [元]
- 英國蘇格蘭格拉斯哥 [元]
- 希臘 [元]
- 守護世界政府[元]
- 加拿大新斯科細亞省哈利法克斯 [元]
- 芬蘭赫爾辛基地區 [元]
- 中國香港 [元]
- 美國德克薩斯州休斯頓 [元]
- 印度政府資料[元]
- 印尼資料入口網站 [元]
- 愛荷華州 - 歡迎來到愛荷華州的資料入口網站。請探索有關愛荷華州和您的[...] [元]的數據
- 愛爾蘭的開放資料入口網站 [元]
- 以色列的開放資料入口網站 [元]
- 伊斯坦堡市開放資料入口網站 [元]
- 義大利 - Il Portale dati.gov.it è il Catalogo nazionale dei metadati relativi ai dati [...] [Meta]
- 美國監獄死亡人數 - 美國政府不會根據監獄死亡率數據發布監獄情況,[...] [元]
- 日本[元]
- 加拿大魁北克省拉瓦爾 [元]
- 肯塔基州列剋星敦 [元]
- 英國倫敦資料儲存 [元]
- 加拿大安大略省倫敦 [元]
- 洛杉磯開放資料 [元]
- 盧森堡 - 盧森堡開放資料入口網站 [元]
- MassGIS,美國麻薩諸塞州 [元]
- 美國加州大都會交通委員會 (MTC) [元]
- 墨西哥 [元]
- 加拿大安大略省密西沙加 [元]
- 摩爾多瓦 [元]
- 加拿大新布倫特蒙克頓 [元]
- 加拿大魁北克省蒙特婁 [元]
- 美國加州山景城 (GIS) [元]
- 紐約市開放資料 [元]
- 紐約 betanyc [元]
- 荷蘭[元]
- 紐約衛生局每月噸位 - DSNY 每月噸位資料提供 [...] [元]
- 紐西蘭[元]
- 經合組織[元]
- 奧克蘭,加州,美國 [元]
- 俄克拉荷馬州[元]
- 非洲開放資料 [元]
- 印度開放政府資料 (OGD) 平台 [元]
- OpenDataSoft 的 1,600 個開放資料清單 [Meta]
- 俄勒岡州[元]
- 加拿大安大略省渥太華 [元]
- 帕洛阿爾托,加利福尼亞州,美國 [元]
- OpenDataPhilly - OpenDataPhilly 是費城地區開放資料的目錄。在[...] [元]
- 俄勒岡州波特蘭 [元]
- 葡萄牙 - Pordata 組織 [Meta]
- 波多黎各政府 [元]
- 加拿大魁北克市 [元]
- 加拿大魁北克省 [元]
- Regina SK,加拿大 [元]
- 巴西里約熱內盧 [元]
- 羅馬尼亞 [元]
- 俄羅斯[元]
- 加州聖地牙哥 [元]
- 德州聖安東尼奧 - 現在社區資訊 - CI:Now 是為 Bexar 服務的非營利組織(聖 [...] [元]
- 舊金山資料集 [元]
- 美國加州聖荷西 [元]
- 美國加州聖馬刁縣 [元]
- 加拿大薩斯喀徹溫省 [元]
- 西雅圖[元]
- 新加坡政府資料[元]
- 南非貿易統計[元]
- 南非 [元]
- 美國猶他州 [元]
- 瑞士 [元]
- 台灣政府[元]
- 台灣[元]
- 特拉維夫開放資料 [元]
- 德克薩斯州開放資料 [元]
- 世界銀行[元]
- 加拿大安大略省多倫多 [元]
- 突尼斯[元]
- 英國政府數據[元]
- 美國社區調查[元]
- 美國疾病預防控制中心公共衛生資料集 [元]
- 美國人口普查局 [元]
- 美國住房和城市發展部 (HUD) [元]
- 美國聯邦政府機構 [元]
- 美國聯邦政府資料目錄 [元]
- 美國食品藥物管理局 (FDA) [元]
- 美國國家教育統計中心 (NCES) [元]
- 美國開放政府[元]
- 英國 2011 年人口普查開放地圖集計畫 [元]
- 美國縣 - 這是各種資料的儲存庫,按美國縣細分。雖然大多數[...] [元]
- 美國專利商標局 (USPTO) 批量資料產品 [元]
- 烏幹達統計局[元]
- 烏克蘭[元]
- 聯合國[元]
- 烏拉圭 [元]
- 美國加州山谷交通管理局 (VTA) [元]
- 溫哥華,不列顛哥倫比亞省開放資料目錄 [元]
- 加拿大不列顛哥倫比亞省維多利亞 [元]
- 奧地利維也納 [元]
- 越南統計總局的統計數據 - 不同類別的數據[...] [元]
- 美國國會研究服務處 (CRS) 報告 [元]
衛生保健
- AWS COVID-19 資料集 - 我們正在與製作 COVID-19 相關資料的組織合作 [...] [元]
- COVID-19 病例監測公共使用資料 - COVID-19 病例監測系統資料庫 [...] [元]
- 厄瓜多爾的 Covid-19 未處理數據 - 這是一個提供未處理數據集的項目 [...] [Meta]
- 約翰霍普金斯大學 CSSE 的 2019 年新型冠狀病毒 COVID-19 數據存儲庫 - 這是數據 [...] [元]
- 美國的冠狀病毒 (Covid-19) 數據 - 《紐約時報》正在發布一系列 [...] [Meta]
- 按設施劃分的 COVID-19 報告的患者影響和醫院容量 - 以下數據集 [...] [元]
- 生食品、加工食品、預製食品的成分 美國農業部國家營養資料庫標準 [...] [Meta]
- 新冠肺炎追蹤計畫 - 新冠肺炎追蹤計畫收集並發布了最 [...] [元]
- EHDP 大型健康資料集 [元]
- GDC - GDC 支持 CCG、TCGA、TARGET 等多種癌症基因組計畫。
- Gapminder 世界人口資料庫 [元]
- MeSH,用於為 PubMed 索引文章的詞彙詞庫 [Meta]
- MeDAL - 一個大型醫學文本資料集,用於縮寫消歧 - 醫學 [...] [元]
- 美國醫療保險覆蓋資料庫 (MCD) [元]
- medicare.gov 資料的醫療保險資料引擎 [元]
- 醫療保險資料檔 [元]
- 南丁格爾開放科學 [元]
- 受影響國家的伊波拉病例和死亡人數(2014 年)[元]
- Open-ODS(英國 NHS 的結構)[元]
- OpenPaymentsData,醫療保健財務關係資料 [元]
- PhysioBank 資料庫 - 一個龐大且不斷成長的生理資料檔案。 [元]
- 癌症影像檔案 (TCIA) [元]
- 癌症基因組圖譜計畫 (TCGA) [元]
- 世界衛生組織全球衛生觀察站[元]
- 雅虎知識圖譜 COVID-19 資料集 - Verizon Media 的雅虎知識圖譜團隊 [...] [元]
- 整合生物學和床邊的資訊學 [元]
影像處理
- 10k 美國成人面孔資料庫 [元]
- 2GB 貓的照片 [元]
- 受眾未過濾的性別和年齡分類面孔[元]
- 情感影像分類[元]
- 機載物件偵測與追蹤 - 機載物件追蹤 (AOT) 資料集是一個 [...] [元]
- 具有屬性的動物[元]
- CADDY 潛水員手勢水下立體視覺資料集 - 包含 10K 立體對 [...] [元]
- 細胞學資料集 – CCAgT:採用 AgNOR 染色技術的子宮頸細胞影像 – 包含 9339 [...] [元]
- 加州理工學院行人檢測基準 [元]
- Chars74K資料集-自然影像中的字元辨識(英文和卡納達語均可使用)[Meta]
- Cube++ - 4890 個原始 1800 萬像素影像,每個影像在其 [...] [Meta] 中包含一個 SpyderCube 色彩目標
- 密集註釋影片駕駛資料集 - 此資料集包含 28 個影片序列 [...] [元]
- Danbooru Tagged Anime Illustration Dataset - 3.33m+的大型動畫影像資料庫 [...] [Meta]
- DukeMTMC 資料集 - DukeMTMC 旨在加速多目標多相機的進步 [...] [Meta]
- ETH 昆蟲學收藏 (ETHEC) 細粒蝴蝶(鱗翅類)圖像 [元]
- 人臉辨識基準[元]
- Flickr:32 類品牌標誌 [元]
- GDXray - 用於 X 射線測試和電腦視覺的 X 光影像 [元]
- HumanEva 資料集 - HumanEva-I 資料集包含 7 個校準視訊序列(4 個灰階 [...] [元]
- ImageNet(在 WordNet 層次結構中)[元]
- 室內場景辨識[元]
- 國際情緒圖片系統,UFL [Meta]
- KITTI 視覺基準套件 [元]
- 亞歷山大標記資訊圖書館 - 生物學和保護 - 包含超過 10 [...] [元]
- MNIST 手寫數位資料庫,近 100 萬個範例 [Meta]
- 自動駕駛的多視圖感興趣區域預測資料集 - 包含 16 個駕駛 [...] [元]
- 大量視覺記憶刺激,麻省理工學院[元]
- Newspaper Navigator - 此資料集包含 16,358,041 個擷取的視覺內容 [...] [元]
- Open Images From Google - 帶有 280 萬個物件實例分割遮罩的圖片 [...] [Meta]
- RuFa - 包含以兩種阿拉伯字體之一編寫的文字圖像(Ruqaa 和 Nastaliq [...] [Meta]
- SUN 資料庫,麻省理工學院 [元]
- SVIRO 合成車輛內部後座佔用率 - 十個地區的 25.000 個合成場景 [...] [元]
- 幾個形狀輪廓資料集 [元]
- 史丹佛狗資料集 [元]
- 動作相似性標籤 (ASLAN) 挑戰 [元]
- Oxford-IIIT 寵物資料集 [元]
- Violent-Flows - 人群暴力/非暴力資料庫和基準 [元]
- 視覺基因組[元]
- YouTube 臉孔資料庫 [元]
機器學習
- 全年齡臉孔資料集 - 包含分佈在所有年齡層的 13'322 張亞洲人臉影像(來自 2 [...] [Meta]
- 奧迪自動駕駛資料集 - 我們發布了奧迪自動駕駛資料集 [...] [元]
- B3FD - 包含 375k 影像的臉部年齡(和性別)估計資料集 - B3FD 資料集是一個 [...] [元]
- 來自五個領域的上下文感知資料集 [Meta]
- 深入研究資料集進行分類與迴歸 [元]
- Discogs 每月資料 [元]
- 螢光神經元細胞 - 透過發布此資料集,我們的目標是為 [...] [Meta] 提供一個新的測試平台
- 免費音樂檔案 [元]
- IMDb 資料庫 [元]
- Iranis - 波斯語/阿拉伯語車牌字符的大型資料集 [元]
- 用於分類、回歸和時間序列的 Keel 儲存庫 [Meta]
- LLVIP - 此資料集包含 30976 張影像或 15488 對,其中大部分是在非常[...] [Meta] 拍攝的
- 野外標記臉孔 (LFW) [元]
- Lending Club 貸款資料 [元]
- 機器學習資料集儲存庫 [元]
- 百萬歌曲資料集 [元]
- 更多歌曲資料集 [元]
- MovieLens 資料集 [元]
- 《紐約客》標題比賽收視率 [元]
- RDataMining - 《R 與資料探勘》電子書資料 [元]
- 地球上已登記的隕石[元]
- 舊金山餐廳健康評分數據 [元]
- TikTok 資料集 - 超過 300 個捕捉單一人表演舞蹈的舞蹈影片 [...] [Meta]
- UCI 機器學習儲存庫 [元]
- 雅虎!評級和分類資料 [元]
- YouTube-BoundingBoxes [元]
- YouTube 8m [元]
- eBay 線上拍賣 (2012) [元]
博物館
- 加拿大科技博物館公司的開放資料[元]
- 庫柏-休伊特收藏資料庫 [元]
- 大都會藝術博物館藏品 API [元]
- 明尼阿波利斯藝術學院元數據 [元]
- 自然歷史博物館(倫敦)資料入口網站 [元]
- 國立博物館歷史藝術收藏 [元]
- 泰特美術館元資料 [元]
- 蓋蒂詞彙表 [元]
自然語言
- 自動關鍵短語提取[元]
- 大壞NLP資料庫[元]
- 暴雪挑戰賽演講 - 演講+文字資料來自專業有聲書 [...] [Meta]
- Blogger 語料庫 [元]
- CLiPS 風格測量研究語料庫 [元]
- ClueWeb09 FACC [元]
- ClueWeb12 FACC [元]
- DBpedia - 來自維基百科的結構化資料 [元]
- 髒話 - 我們的庫中有數百萬張圖像和數十億個用戶提交的關鍵字,[...] [Meta]
- Flickr 個人分類法 [元]
- 人物、地點和事物的自由庫 [元]
- 德國政治演講語料庫 - 德國政治演講集 [...] [元]
- Google 圖書 Ngrams (2.2TB) [元]
- Google MC-AFP - 使用段落向量根據公共可用的 Gigaword 資料集產生 [元]
- Google Web 5gram(1TB,2006)[元]
- 古騰堡電子書清單 [元]
- 加拿大議會的議事錄文本區塊 [元]
- LJ Speech - 語音資料集,由單一說話者朗讀的 13,100 個短音訊片段組成 [...] [Meta]
- M-AILabs 語音 - M-AILABS 語音資料集是我們 [...] [元] 的第一個大型資料集
- Microsoft 機器閱讀理解資料集(或 MS MARCO)[元]
- 微軟研究院文本的機器理解測試 (MCTest) [元]
- 歐洲語言的機器翻譯 [元]
- 理解微帖子 2013 - 概念提取 [元]
- 理解微博 2016 - 命名實體識別和連結 [元]
- 多域情感資料集(2.0版)[元]
- No Language Left Behind (NLLB - 200vo) - 基於 Meta 元資料的挖掘雙文字資料集。 [...] [元]
- 用於訓練語音增強演算法和 TTS 模型的噪音語音資料庫 - Clean 和 [...] [Meta]
- 開啟多語言 Wordnet [元]
- POS/NER/Chunk 註釋資料 [Meta]
- 人物語料庫 [元]
- 英文垃圾簡訊收集[元]
- 沙烏地阿拉伯新聞網沙烏地阿拉伯報紙文章集(阿拉伯文,3 萬篇)[元]
- 史丹佛問答資料集 (SQuAD) [元]
- 2005~2011年USENET貼文語料庫[元]
- 一般依賴關係[元]
- Webhose - 多種語言的新聞/部落格 [元]
- 維基資料 - 維基百科資料庫 [元]
- 維基百科連結資料 - 上下文中的 4000 萬個實體 [元]
- WordNet 資料庫與工具 [Meta]
- Wordbank - 開放、去識別化的詞彙發展資料庫,包含 84,138 名兒童和 [...] [Meta]
- WorldTree 基本科學問題解釋圖語料庫 - [...] [元] 語料庫
神經科學
- 艾倫研究所資料集 [元]
- 大腦目錄[元]
- 腦組學 [元]
- CodeNeuro 資料集 [元]
- 計算神經科學合作研究(CRCNS)[元]
- FCP-INDI [元]
- 人類連結組計劃 [元]
- NDAR [元]
- NIMH 資料存檔 [元]
- 神經數據 [元]
- NeuroMorpho - NeuroMorpho.Org 是一個集中策劃的數位重建清單 [...] [Meta]
- 神經電學[元]
- 綠洲 [元]
- OpenNEURO [元]
- OpenfMRI [元]
- 研究福雷斯特 [元]
- Nencki-Symfonia EEG/ERP 資料集 - 高密度腦電圖 (EEG) 資料集 [...] [元]
物理
- CERN 開放資料入口網站 [元]
- 晶體學開放資料庫 [元]
- IceCube - 南極中微子觀測站 [元]
- Ligo 開放科學中心 (LOSC) - 來自 LIGO Hanford 和 [...] [Meta] 的引力波數據
- NASA 系外行星檔案 [元]
- NSSDC(NASA)550艘太空船的數據[元]
- 二維勢阱中電子的量子模擬 - 數據是 [...] [Meta]
- 斯隆數位巡天 (SDSS) - 繪製宇宙圖 [元]
攝護腺癌
- EOPC-DE-早發性攝護腺癌-德國 - 早發攝護腺癌 - 德國。 [...] [元]
- GENIE - 來自 [...] [Meta] 基因組學證據腫瘤資訊交換 (GENIE) 計畫的數據
- 基因組標誌-前列腺-腺癌-CPC-GENE - 477 [...] [元] 的綜合基因組分析
- MSK-IMPACT-Clinical-Sequencing-Cohort-MSKCC-Prostate-Cancer - 臨床 [...] [Meta] 的標靶定序
- 轉移性前列腺癌-MCTP - 61 種前列腺癌的綜合分析 [...] [Meta]
- 轉移性前列腺癌-SU2CPCF-Dream-Team - 150個轉移性癌症的綜合分析[...] [Meta]
- NPCR-2001-2015 - 來自 CDC 國家癌症登記計劃 (NPCR) 的資料庫。 [...] [元]
- NPCR-2005-2015 - 來自 CDC 國家癌症登記計劃 (NPCR) 的資料庫。 [...] [元]
- NaF-Prostate - NaF 前列腺是 F-18 NaF 正子斷層掃描/計算 [...] [Meta] 的集合
- 神經內分泌-前列腺癌 - 去勢抗性的全外顯子組和 RNA 定序資料 [...] [Meta]
- PLCO-Prostate-Diagnostic-Procedures - 前列腺診斷程序資料集(95,837 [...] [元]
- PLCO-Prostate-Medical-Complications - 前列腺醫療併發症資料集(3,350 [...] [元]
- PLCO-前列腺篩檢異常 - 前列腺篩檢異常資料集(10,527 [...] [元]
- PLCO-前列腺篩檢 - 前列腺篩檢資料集(177,315 筆記錄,35,875 名受試者,[...] [元]
- PLCO-Prostate-Treatments - 前列腺治療資料集(13,409 筆記錄,7,614 名受試者,[...] [元]
- PLCO-Prostate - 前列腺資料集是一個綜合資料集,包含幾乎所有[...] [元]
- PRAD-CA-前列腺腺癌-加拿大-前列腺腺癌-加拿大。由 [...] [Meta] 收集
- PRAD-FR-前列腺腺癌-法國 - 前列腺腺癌 - 法國。由十個[...] [元]收集
- PRAD-UK-前列腺腺癌-英國-前列腺腺癌-英國。 [...] [元]
- PROSTATEx-Challenge - 前列腺 MR 研究的回顧性研究。所有研究都包括[...] [元]
- Prostate-3T - Prostate-3T 專案向 TCIA 提供成像數據,作為 ISBI [...] [Meta] 的一部分
- 前列腺-腺癌-Broad-Cornell-2012 - 112 種前列腺癌的綜合分析 [...] [Meta]
- 前列腺腺癌-Broad-Cornell-2013 - 57 種前列腺癌的綜合分析 [...] [Meta]
- 前列腺-腺癌-CNA-研究-MSKCC - 103 個原發性前列腺的拷貝數分析 [...] [Meta]
- 前列腺-腺癌-Fred-Hutchinson-CRC - 前列腺癌的綜合分析 [...] [Meta]
- 前列腺腺癌 (MSKCC/DFCI) - 1013 個前列腺癌樣本的全外顯子定序。 [元]
- 前列腺-腺癌-MSKCC - MSKCC 前列腺癌基因組計畫。 181 個原發性,37 個轉移性 [...] [元]
- 前列腺-腺癌-類器官-MSKCC - 前列腺癌樣本的外顯子組分析和 [...] [Meta]
- 前列腺腺癌-Sun-Lab - 65 個前列腺的全基因組和轉錄組測序 [...] [Meta]
- 前列腺-腺癌-TCGA-PanCancer-Atlas - 來自 11k [...] [元] 的綜合 TCGA PanCanAtlas 數據
- 前列腺-腺癌-TCGA - 333 個原發性前列腺腺癌樣本的綜合分析。 [元]
- 前列腺診斷 - 取得 PCa T1 和 T2 加權磁振造影 (MRI) [...] [Meta]
- 前列腺融合 MRI 病理學 - 前列腺融合 MRI 病理學集合是 [...] [Meta] 的組合
- 前列腺 MRI - 前列腺磁振造影 (MRI) 的前列腺 MRI 集合是 [...] [元]
- Prostate-R - R 套件「ElemStatLearn」包含來自 Stamey 等人的前列腺癌資料集 [...] [Meta]
- QIN-PROSTATE-Repeatability - QIN-PROSTATE-Repeatability 資料集是一個具有 [...] [Meta] 的資料集
- QIN-PROSTATE - 定量成像網路 (QIN) 的 QIN PROSTATE 集合包含 [...] [Meta]
- SEER-YR1973_2015.SEER9 - 來自九個 SEER 註冊機構的 SEER 2017 年 11 月研究資料檔 [...] [Meta]
- SEER-YR1992_2015.SJ_LA_RG_AK - 來自聖荷西的 SEER 2017 年 11 月研究資料檔 - [...] [Meta]
- SEER-YR2000_2015.CA_KY_LO_NJ_GA - 來自大 [...] [元] 的 SEER 2017 年 11 月研究資料文件
- SEER-YR2000_2015.CA_KY_LO_NJ_GA - 路易斯安那州 2005 年 7 月至 12 月的診斷來自他們的 [...] [Meta]
- TCGA-PRAD-US - TCGA 前列腺腺癌(499 個樣本)。 [元]
心理學+認知
- OSU 認知建模儲存庫資料集 [元]
- 開放認知科學資料 - 來自認知領域的公開行為資料集 [...] [元]
公共領域
- 巧妙地開放即時資料 [元]
- 亞馬遜[元]
- Archive.org 資料集 [元]
- 將其從互聯網檔案館存檔 [元]
- CMU JASA 資料檔案 [元]
- CMU StatLab 集合 [元]
- 數據世界 [元]
- Data360 [元]
- 謎公共[元]
- 谷歌[元]
- Grand Comics Database - Grand Comics Database (GCD) 是一個非營利的、基於互聯網的 [...] [Meta]
- 資訊黑猩猩 [元]
- KDNuggets 資料集合 [元]
- Microsoft Azure 資料市場免費資料集 [元]
- 微軟研究資料科學 [元]
- 微軟研究院開放資料 [元]
- 開放庫資料轉儲 [元]
- Reddit 資料集 [元]
- RevolutionAnalytics 集合 [元]
- R 資料集範例 [元]
- Stack Overflow 年度開發者調查 - 年度開發者調查自 2011 年以來的完整資料集 [...] [Meta]
- StatSci.org [元]
- Stats4Stem R 資料集(已存檔)[元]
- 華盛頓郵報名單 [元]
- 加州大學洛杉磯分校 SOCR 資料收集 [元]
- UFO 報告 [元]
- 維基解密 911 尋呼機攔截 [元]
- 雅虎 Webscope [元]
搜尋引擎
- UMB 資料共享的學術洪流 [Meta]
- Base dos Dados - 資料基礎:巴西開放資料儲存庫 [元]
- Datahub.io [元]
- 網域項目 - 網路網域排序清單 [元]
- 哈佛 Dataverse 科學資料網 [元]
- ICPSR (UMICH) [元]
- 教育科學研究所[元]
- 國家技術報告庫[元]
- 開放資料憑證(測試版)[元]
- OpenDataNetwork - 所有 Socrata 支援的資料入口網站的搜尋引擎 [Meta]
- Statista.com - 統計與研究 [元]
- Zenodo - 科學長尾的開放可靠之家 [Meta]
社群網路
- 2021 年葡萄牙選舉 Twitter 資料集 - 5700 萬條以上推文,100 萬以上用戶 - 此資料集包含 [...] [元]
- 72 小時 #gamergate Twitter 抓取 [元]
- CMU Enron 150 位使用者的電子郵件 [元]
- Cheng-Caverlee-Lee 2009 年 9 月 - 2010 年 1 月 Twitter 抓取 [元]
- 中國傳記資料庫 - 中國傳記資料庫是一個可免費存取的 [...] [元]
- 俱樂部會所資料集 [元]
- Twitter 資料集,包含 40 多萬條與 COVID-19 相關的推文 - 由於 [...] [Meta] 的相關性
- 43k+ 唐納德川普 Twitter 螢幕截圖 - 此存檔包含 43,475 個唐納德川普的螢幕截圖 [...] [元]
- 151 位使用者的 EDRM 安然電子郵件,託管在 S3 上 [元]
- Facebook 資料擷取 (2005) [元]
- Facebook 社群聯絡指數 - 我們使用所有活躍 Facebook 的匿名快照 [...] [元]
- LAW 的 Facebook 社群網路(自 2007 年起)[元]
- 來自 UMN/Sarwat 的 Foursquare (2013) [元]
- GitHub 協作存檔 [元]
- 谷歌學術引用關係 [元]
- 穿戴式感測器的高解析度接觸網路 [Meta]
- 獨立地圖:頂級獨立網站的社交圖和爬網 [元]
- 來自 UMASS 的行動社交網路 [Meta]
- 網路 Twitter 資料 [元]
- Reddit 評論 [元]
- Skytrax 的航空旅行評論資料集 [元]
- 社群 Twitter 資料 [元]
- SourceForge.net 研究資料 [元]
- Reddit COVID 數據集 - 該數據集試圖捕獲 COVID-19 的全部範圍 [...] [元]
- Twitch 頂尖主播的資料 [元]
- 用於線上聲譽管理的 Twitter 資料 [元]
- 用於情緒分析的 Twitter 資料 [元]
- 整個 Twitter 網站的 Twitter 圖 [元]
- Twitter 抓取 Calufa 2011 年 5 月 [元]
- UNIMI/LAW 社交網路資料集 [元]
- 美國國會 Twitter 資料 - 每日資料集,包含 1100 多個相關帳戶的推文 [...] [元]
- 雅虎!圖和社交數據[元]
- 2007,2008 年 Youtube 影片社交圖譜 [元]
社會科學
- ACLED(武裝衝突地點和事件資料項目)[元]
- 威權統治菁英資料庫 - 威權統治菁英資料庫 (ARED) 是一個 [...] [元]
- 加拿大法律資訊研究所 [元]
- 系統和平資料集中心 - 衝突趨勢、政治、國家脆弱性等 [元]
- 戰爭相關項目[元]
- Cryptome 陰謀論物品 [元]
- 資料卡 [元]
- 歐洲社會調查[元]
- FBI 仇恨犯罪 2013 年 - 總結資料 [元]
- 脆弱國家指數[元]
- GDELT 全球事件資料庫 [元]
- 1972 年以來的綜合社會調查 (GSS) [元]
- 德國社會調查[元]
- 全球宗教期貨計畫 [元]
- 槍枝暴力資料 - 一個全面、可存取的資料庫,包含超過 26 萬筆記錄 [...] [元]
- 人道主義資料交換 [元]
- INFORM 風險管理指數 [元]
- 人口研究所[元]
- 美洲開發銀行開放資料 [元]
- 國際網絡檔案 [元]
- 國際社會調查計劃 ISSP [元]
- 國際研究綱要計畫 [元]
- 詹姆斯麥奎爾跨國數據 [元]
- 麻省理工學院現實挖掘資料集 [元]
- Norsk samfunnsvitenskapelig datatjeneste 的宏觀資料指南 [元]
- 大規模動員資料專案 - 大規模動員 (MM) 資料是為了理解 [...] [元]
- Microsoft 學術知識圖 - Microsoft 學術知識圖是一個大型 RDF [...] [元]
- 明尼蘇達州人口中心 [元]
- 聖母大學全球適應指數 (ND-GAIN) [元]
- 英格蘭、威爾斯和北愛爾蘭的開放犯罪和警務資料 [元]
- OpenSanctions - 政治、犯罪或[...] [元]個人和公司的全球資料庫
- Paul Hensel 一般國際資料頁 [元]
- 皮尤研究中心網路調查計畫 [元]
- 皮尤研究協會資料收集 [元]
- 政治極性資料 [元]
- StackExchange 資料瀏覽器 [元]
- 恐怖主義研究與分析聯盟 [元]
- 德州囚犯自 1984 年起被處決 [元]
- 泰坦尼克號生存資料集 [元]
- UCB 社會科學資料檔案 (D-Lab) [元]
- 加州大學洛杉磯分校社會科學資料檔案 [元]
- 聯合國民間社會資料庫[元]
- UPJOHN 勞工就業研究 [元]
- 世界各地的大學 [元]
- 烏普薩拉衝突資料計畫 [元]
- 世界銀行開放資料 [元]
- 世界不平等資料庫 - 世界不平等資料庫 (WID.world) 旨在提供開放的 [...] [Meta]
- WorldPop 計畫 - 全球人口分佈 [元]
軟體
- 關於免費、自由和開源軟體開發的 FLOSSmole 資料 [元]
- GHTorrent - 透過 GitHub REST API 提供的可擴充、可查詢、離線資料鏡像。 [元]
- Libraries.io 開源儲存庫和依賴元資料 [元]
- 公共 Git 檔案 - 所有人的大代碼資料集 - 182,014 個頂級書籤的 Git 資料集 [...] [元]
- 程式碼重複 - 2k Java 檔案和 600 個 Java 函數對,被 [...] [Meta] 標記為相似或不同
- 提交訊息 - 截至 2019 年 3 月,共有 13 億則 GitHub 提交訊息 [元]
- Pull Request 審查評論 - 自 2015 年 1 月起至 [...] [Meta] 已有 2530 萬條 GitHub PR 審核評論
- 原始碼標識符 - 從 182,014 個 [...] [元] 中收集了 4170 萬個不同的可拆分標識符
運動的
- 美國忍者武士障礙 - 包含美國忍者歷史上的所有障礙 [...] [元]
- Betfair 歷史交易資料 [元]
- Cricsheet 比賽(板球)[元]
- 田徑公平 - 田徑公平數據分析切割工具由 [...] [Meta] 為您帶來
- Ergast Formula 1,從 1950 年至今 (API) [元]
- 橄欖球/足球資源(數據和 API)[元]
- 拉赫曼的棒球資料庫 [元]
- NFL 逐場比賽數據 - NFL 逐場比賽數據來自:[...] [Meta]
- Pinhooker:純種純種馬銷售數據 [元]
- 職業卡巴迪賽季 1 至 7 - 職業卡巴迪聯賽是印度的職業級別卡巴迪聯賽。 [...] [元]
- Retrosheet 棒球統計 [元]
- ATP 排名、結果和統計數據的網球資料庫 [元]
- WTA 排名、結果和統計數據的網球資料庫 [Meta]
- Transfermarkt 資料集 - 乾淨、結構化且自動更新的足球資料 [...] [元]
- 美國足球隊和地點 - 美國足球隊和地點。 MLS、NWSL 和 USL [...] [元]
時間序列
- 3W 資料集 - 據作者所知,這是第一個現實且公開的 [...] [Meta]
- 國際資料庫跨國家時間序列資料檔案 [元]
- 硬碟故障率 [元]
- 麻省理工學院的心率時間序列 [Meta]
- MU [元] 的時間序列資料庫 (TSDL)
- 圖靈變化點資料集 - 包含為開發而收集的 42 個註釋的時間序列 [...] [元]
- 加州大學河濱分校時間序列資料集 [元]
運輸
- 1987-2008 年航空公司 OD 資料 [元]
- 福特 GoBike 數據(以前稱為灣區自行車共享數據)[元]
- 自行車共享系統 (BSS) 系列 [元]
- 荷蘭交通資訊 [元]
- 微軟研究院的 GeoLife GPS 軌跡 [Meta]
- 德國鐵路公司的德國火車系統 [Meta]
- Hubway 在麻薩諸塞州的百萬騎行 [Meta]
- 墨爾本行人數 - 此資料集包含自 2009 年以來每小時的行人計數 [...] [元]
- 蒙特婁 BIXI 共享單車 [元]
- 2009 年紐約市出租車出行資料 - [元]
- 2013 年紐約市計程車行程資料 (FOIA/FOILed) [元]
- 2014 年 4 月至 2014 年 9 月紐約市 Uber 行程資料 [元]
- 開放流量收集[元]
- OpenFlights - 機場、航空公司和航線資料 [元]
- 費城自行車共享站 (JSON) [元]
- 飛機失事資料庫,自 1920 年以來 [元]
- RITA 航空公司準點率數據 [元]
- RITA/BTS 運輸資料收集 (TranStat) [元]
- Renfe(西班牙國家鐵路網)資料集 [元]
- 多倫多自行車共享站(JSON 和 GBFS 檔案)[元]
- 倫敦交通局 (TFL) [元]
- 芝加哥旅行追蹤調查 (TTS) [Meta]
- 美國交通統計局 (BTS) [元]
- 1990 年至 2009 年美國國內航班 [元]
- 2007年以來的美國貨運分析架構 [Meta]
- 美國國家公路交通安全管理局 - 自 1975 年以來的死亡人數 - 包含 CSV [...] [元]
電競
- CS:GO 競技對接會資料 - 在此資料集中,我們有 CSGO 對接會的資料 [...] [元]
- FIFA-2021 完整球員資料集 [元]
- OpenDota 資料轉儲 [元]
補充系列
- 資料打包核心資料集
- OpenDataMonitor:歐洲可用開放資料資源概述
- Quora:在哪裡可以找到向公眾開放的大型資料集?
- RS.io:100 多個有趣的統計數據集
- CVonline:影像資料庫
- InnoTrek:利用開放資料了解城市生活
- 簡歷論文:網路上的簡歷資料集
特別感謝