Потрясающие наборы общедоступных данных
Это список тематических общедоступных источников данных в высоком качестве. Они собираются и систематизируются на основе блогов, ответов и ответов пользователей. Большинство наборов данных, перечисленных ниже, бесплатны, однако некоторые — нет. Этот проект был задуман в OMNILab Шанхайского университета Цзяо Тонг во время работы Сямина Чена над докторской диссертацией. исследования. OMNILab теперь является частью сообщества BaiYuLan Open AI. Другие удивительные списки можно найти в потрясающем списке Sindresorhus.
ВНИМАНИЕ . Этот репозиторий автоматически создается apd-core. Пожалуйста, НЕ изменяйте этот файл напрямую. Мы предоставили новый способ внести свой вклад в это репо. Присоединяйтесь к сообществу Slack, чтобы мгновенно получать обновления данных штаб-квартиры.
- У меня все в порядке.
- Пожалуйста, исправьте меня.
Оглавление
- Сельское хозяйство
- Архитектура
- Биология
- Химия
- Климат+Погода
- Комплексные сети
- Компьютерные Сети
- Кибербезопасность
- Проблемы с данными
- ЗемляНаука
- Экономика
- Образование
- Энергия
- Развлечение
- Финансы
- ГИС
- Правительство
- Здравоохранение
- Обработка изображений
- Машинное обучение
- Музеи
- ЕстественныйЯзык
- Неврология
- Физика
- Рак Простаты
- Психология+Познание
- Публичные домены
- Поисковые системы
- Социальные сети
- СоциальныеНауки
- Программное обеспечение
- Спорт
- Временной ряд
- Транспорт
- Киберспорт
- Дополнительные коллекции
Сельское хозяйство
- Глобальный набор данных об исторической урожайности основных сельскохозяйственных культур за 1981–2016 годы - Глобальный набор данных [...] [Мета]
- Набор гиперспектральных эталонных данных о влажности почвы. Этот набор данных был измерен за пятидневный [...] [Мета]
- Набор данных контроля качества лимонов — набор данных лимонов был подготовлен для исследования [...] [Мета]
- Оптимизированный индекс растительности с поправкой на почву — IDB — это инструмент для работы с дистанционным зондированием [...] [Мета]
- База данных питательных веществ Министерства сельского хозяйства США [мета]
- База данных PLANTS Министерства сельского хозяйства США. Полный контрольный список PLANTS составляет почти 7 [...] [Мета]
Архитектура
- Модели швейцарских квартир. Этот набор данных содержит подробные данные о 42 207 квартирах (242 257 [...] [Мета]
Биология
- 1000 геномов. Проект «1000 геномов» осуществлялся в период с 2008 по 2015 год, в результате чего был создан крупнейший [...] [Мета]
- ANHIR - Автоматическая регистрация нежестких гистологических изображений (ANHIR) состоит из 2D [...] [Мета]
- American Gut (Проект «Микробиом») — Проект American Gut является крупнейшим краудсорсинговым [...] [Мета]
- BCNB - Имеются WSI 1058 пациентов, в WSI аннотирована часть участков опухоли. Кроме [...] [Мета]
- Широкая коллекция эталонных биоизображений (BBBC) - Широкая коллекция эталонных биоизображений (BBBC) [...] [Мета]
- Широкая энциклопедия линий раковых клеток (CCLE) [мета]
- CIMA — набор данных CIMA включает изображения срезов тканей, полученных при гистологической микроскопии 2D. [Мета]
- Библиотека изображений клеток. Эта библиотека представляет собой общедоступную и легкодоступную базу данных ресурсов [...] [Мета]
- Полные общедоступные данные по геномике. Разнообразный набор данных о полных геномах человека находится в свободном доступе [...] [Мета]
- CytoImageNet — крупномасштабный набор данных микроскопических изображений. Содержит 890 737 оттенков серого [...] [Мета]
- EBI ArrayExpress - Архив данных функциональной геномики ArrayExpress хранит данные из высоко- [...] [Мета]
- Банк данных белков EBI в Европе - Банк данных электронной микроскопии (EMDB) является общедоступным [...] [Мета]
- Проект ENCODE — Консорциум Энциклопедии элементов ДНК (ENCODE) — это постоянный [...] [Мета]
- Архив пилотных изображений электронной микроскопии (EMPIAR) — EMPIAR, общедоступная электронная микроскопия [...] [Мета]
- Ансамбль геномов [мета]
- Gene Expression Omnibus (GEO) — GEO — это общедоступное хранилище данных функциональной геномики [...] [Мета]
- Gene Ontology (GO) — файлы аннотаций GO [Мета]
- Глобальные биотические взаимодействия (GloBI) [Мета]
- Проект LINCS Гарвардской медицинской школы (HMS) - Центр LINCS Гарвардской медицинской школы (HMS) [...] [Мета]
- Проект разнообразия генома человека. Группа ученых из Стэнфордского университета [...] [Мета]
- Проект микробиома человека (HMP) - HMP секвенировал более 2000 эталонных геномов, выделенных из [...] [Мета]
- ICOS PSP Benchmark — репозиторий тестов ICOS PSP содержит настраиваемый реальный [...] [Мета]
- Международный проект HapMap [Мета]
- Средство просмотра данных журнала клеточной биологии [мета]
- KEGG — KEGG — это ресурс базы данных для понимания высокоуровневых функций и утилит [...] [Meta]
- Белки NCBI [мета]
- Таксономия NCBI. База данных таксономии NCBI представляет собой тщательно подобранный набор названий и классификаций для [...] [Мета]
- NCI Genomic Data Commons — Портал данных GDC — это надежная платформа, управляемая данными, которая позволяет [...] [Мета]
- Данные микроматрицы NIH [мета]
- Данные генотипов OpenSNP - openSNP позволяет клиентам, проводящим генетические тесты напрямую к клиенту, [...] [Мета]
- Palmer Penguins. Цель Palmerpenguins — предоставить отличный набор данных для [...] [Мета]
- Pathguid - Каталог белок-белковых взаимодействий [Мета]
- Банк данных протеинов. Этот ресурс основан на архивно-информационном банке данных протеинов [...] [Мета]
- Консорциум психиатрической геномики. Целью Консорциума психиатрической геномики (PGC) является [...] [Мета]
- Проект PubChem — PubChem — это крупнейшая в мире коллекция свободно доступных химических веществ [...] [Мета]
- PubGene (теперь Coremine Medical) — COREMINE™ — это семейство инструментов, разработанных норвежской [...] [Meta]
- Каталог соматических мутаций при раке Сэнгера (COSMIC) - COSMIC, Каталог соматических [...] [Мета]
- Проект Сэнгера по геномике чувствительности к лекарствам при раке (GDSC) [Мета]
- Архив чтения последовательностей (SRA) — Архив чтения последовательностей (SRA) хранит необработанные данные последовательностей из [...] [Meta]
- Серратус - Анализ 7,1 миллиона наборов данных секвенирования РНК/ДНК для выявления общего [...] [Мета]
- Данные Стэнфордского микрочипа (СЕЙЧАС снято с производства) [Мета]
- Хранилище исходных данных Института Стоуэрса [мета]
- База данных системной науки биологической динамики (SSBD) - Системная наука биологической [...] [Мета]
- Атлас генома рака (TCGA), доступен через Broad GDAC [Meta]
- Каталог жизни. Каталог жизни представляет собой контрольный список из более чем 1,8 [...] [Мета] гарантированного качества.
- Проект «Личный геном» - Проект «Личный геном», начатый в 2005 году, представляет собой видение и [...] [Мета]
- Публичные данные UCSC [мета]
- UniGene [Мета]
- Универсальный ресурс белка (UniProt) – Универсальный ресурс белка (UniProt) представляет собой [...] [Мета]
- Rfam. База данных Rfam представляет собой набор семейств РНК, каждое из которых представлено несколькими [...] [Мета]
Химия
- База данных ионных жидкостей - ILThermo [Мета]
Климат+Погода
- Климатический индекс актуариев [мета]
- Погода в Австралии [Мета]
- Авиационный метеорологический центр — последовательная, своевременная и точная информация о погоде во всем мире [...] [Мета]
- Погода в Бразилии – Исторические данные (на португальском языке) – Данные, относящиеся к климату и погоде [...] [Мета]
- Несколько наборов климатических данных. Хранилище климатических данных C3S (CDS) — это универсальный магазин для [...] [Мета]
- Канадский метеорологический центр [Мета]
- Караван — набор данных для гидрологии больших выборок — Караван — это открытый набор данных сообщества [...] [Мета]
- Климатические данные от UEA (обновляются ежемесячно) [Мета]
- Погода в Голландии. Портал Центра данных KNMI (KDC) предоставляет доступ к данным KNMI о погоде, [...] [Мета]
- Европейская оценка климата и набор данных [мета]
- Немецкий центр климатических данных [Мета]
- Глобальные климатические данные с 1929 года [Мета]
- Составление диаграммы новостей о глобальном изменении климата на 2009-2020 годы. Эти четыре набора данных представляют собой [...] [Мета]
- Службы НАСА по просмотру глобальных изображений [мета]
- Климат Берингова моря NOAA [Мета]
- Наборы климатических данных NOAA [мета]
- Модели погоды NOAA в реальном времени [Мета]
- Наборы метеорологических и радиационных данных NOAA SURFRAD [мета]
- Open-Meteo — API погоды с открытым исходным кодом — API погоды с открытым исходным кодом и бесплатным доступом для не- [...] [Мета]
- Ресурсы открытых данных Всемирного банка об изменении климата [Мета]
- Отдел климатических исследований UEA [Мета]
- WU Историческая погода по всему миру [Мета]
- «Wahington Post Climate Change» - Чтобы проанализировать потепление в Соединенных Штатах, The [...] [Meta]
- WorldClim - Глобальные климатические данные [Мета]
Комплексные сети
- Набор сетевых данных AMiner Citation [мета]
- URL-адреса CrossRef DOI [Мета]
- Набор данных DBLP Citation [Мета]
- Коллекция дорожных сетей DIMACS [Мета]
- Ссылки на патенты NBER [мета]
- Сбор данных о сложных сетях NIST [Мета]
- Сетевой репозиторий с инструментами интерактивного исследовательского анализа [мета]
- Сеть белок-белкового взаимодействия [Мета]
- Сеть зависимостей PyPI и Maven [мета]
- База данных цитирования Scopus [мета]
- Малые сетевые данные [мета]
- Стэнфордская GraphBase [мета]
- Стэнфордская коллекция больших сетевых наборов данных [мета]
- Источники данных Стэнфордской продольной сети [мета]
- Сетевая коллекция Кобленца [Мета]
- Лаборатория веб-алгоритмики (UNIMI) [Мета]
- Репозиторий сетевых данных UCI [мета]
- Коллекция разреженных матриц UFL [Мета]
- База данных графов WSU [мета]
- Ресурс сообщества по архивированию беспроводных данных в Дартмуте — содержит наборы данных файлов pcap [...] [Мета]
Компьютерные Сети
- 3,5 миллиарда веб-страниц по данным CommonCrawl 2012 [мета]
- 53,5 млрд веб-кликов 100 тыс. пользователей Университета Индианы. [Мета]
- Интернет-наборы данных CAIDA [мета]
- Наборы данных CRAWDAD Wireless от Дартмутского университета. [Мета]
- ClueWeb09 – 1 млрд веб-страниц [мета]
- ClueWeb12 – 733 миллиона веб-страниц [мета]
- Веб-данные CommonCrawl за 7 лет [мета]
- Прогноз намерений покупателя на основе данных электронной коммерции по потоку кликов с минимальной информацией о просмотре [мета]
- Данные о кликах Criteo [мета]
- Интернет-хранилище данных сканирования [мета]
- МИРАЖ-2019 - МИРАЖ-2019 представляет собой созданный человеком набор данных для анализа мобильного трафика с помощью [...] [Мета]
- Набор данных DNS-записей Merklemap — содержит более 4 млрд DNS-записей из 700 миллионов уникальных [...] [Мета]
- OONI: Открытая обсерватория сетевых помех — данные интернет-цензуры [Мета]
- Открытые мобильные данные от MobiPerf [Мета]
- Архив одноранговой трассировки. Реальные измерения играют ключевую роль в изучении [...] [Мета]
- Сонар Rapid7 Интернет-сканирование [Мета]
- Сетевой телескоп UCSD, сеть IPv4/8 [Мета]
Кибербезопасность
- CCCS-CIC-AndMal-2020 — Набор данных включает 200 тысяч образцов доброкачественного и 200 тысяч вредоносных программ на общую сумму [...] [Мета]
- Данные о трафике и журналах, собранные во время учений по киберзащите. Этот набор данных был получен [...] [Мета]
Проблемы с данными
- Соревнования AIcrowd [Мета]
- База данных брутфорса [мета]
- Проблемы машинного обучения [мета]
- CrowdANALYTIX dataX [Мета]
- D4D Challenge of Orange [Мета]
- Конкурсы DrivenData на благо общества [мета]
- ICWSM Data Challenge (с 2009 г.) [Мета]
- Кубок KDD от Tencent 2012 [Мета]
- Данные о соревнованиях Kaggle [мета]
- Проблема визуализации данных Localytics [мета]
- Премия Netflix [Мета]
- Конкурс космических приложений [мета]
- Telecom Italia Big Data Challenge [мета]
- Набор данных TravisTorrent - MSR'2017 Mining Challenge [Мета]
- TunedIT — наборы данных, алгоритмы и задачи интеллектуального анализа данных и машинного обучения [Мета]
- Задача набора данных Yelp. Набор данных Yelp представляет собой подмножество наших предприятий, обзоров и пользователей [...] [Мета]
ЗемляНаука
- 38-Cloud (обнаружение облаков) — содержит 38 изображений сцен со спутника Landsat 8 и их извлечения вручную [...] [Мета]
- АКВАСТАТ - Глобальные водные ресурсы и использование [Мета]
- BODC — морские данные ~22 тыс. переменных [Мета]
- EOSDIS - данные системы наблюдения Земли НАСА [Мета]
- Модели Земли [Мета]
- Глобальный атлас ветров. Глобальный атлас ветров — это бесплатное веб-приложение, разработанное в помощь [...] [Мета]
- Интегрированная система морских наблюдений (IMOS) — около 30 ТБ данных измерений океана [Мета]
- Marinexplore — открытые океанографические данные [мета]
- Система прибрежных наблюдений в реальном времени в Алабаме [Мета]
- Общесистемная программа мониторинга национальных исследовательских заповедников эстуариев - долгосрочная [...] [Мета]
- Открытые данные Управления нефти и газа. Набор данных охватывает 12 500 морских скважин, 5 000 сейсмических [...] [Мета]
- Глобальная база данных вулканов и извержений Смитсоновского института [мета]
- Архивы землетрясений Геологической службы США [мета]
- Прогнозирование защитной зоны (зоны защиты) устья скважины с использованием кривых прорыва - это [...] [Мета]
Экономика
- Азиатская организация производительности (APO) — AEPM предоставляет графическую панель мониторинга [...] [Мета]
- Статистика АСЕАН. Портал ASEANstatsDataPortal был впервые запущен в июне 2018 года. Портал [...] [Мета]
- Американская экономическая ассоциация (AEA) [Мета]
- Азиатский KLEMS - Азиатский KLEMS - это азиатский региональный исследовательский консорциум, занимающийся продвижением строительства [...] [Мета]
- Гарвардский атлас экономической сложности — база данных, позволяющая людям изучать глобальные торговые потоки [...] [Мета]
- Финансовая база данных BIS — файлы содержат те же данные, что и в обозревателе статистики BIS [...] [Мета]
- Уровень образования Барро-Ли - Данные об уровне образования Барро-Ли с 1950 по 2010 год. [...] [Мета]
- База данных CEPII — база данных мировой экономики с профилями стран и регионов в [...] [Мета]
- EUKLEMS – EU KLEMS – это исследовательский проект отраслевого уровня, роста и производительности. ЕС КЛЕМС [...] [Мета]
- Данные об экономической свободе в мире [Мета]
- Исторические национальные счета - Центр данных по сравнительным историческим национальным счетам [...] [Мета]
- Историческая макроэкономическая статистика [Мета]
- ИНФОРУМ - Межотраслевое прогнозирование в Университете Мэриленда [Мета]
- DBnomics – мировая экономическая база данных – объединяет сотни миллионов временных рядов [...] [Мета]
- Статистика международной торговли [мета]
- Интернет-база данных кодов продуктов [мета]
- Объединенный центр данных по внешнему долгу [мета]
- Джон Хавеман Ссылки на данные о международной торговле [Мета]
- Латинская Америка KLEMS – LAKLEMS – это проект технического сотрудничества, финансируемый Интер- [...] [Мета]
- База данных долгосрочной производительности. База данных долгосрочной производительности была создана как [...] [Мета]
- База данных проекта Мэддисон. База данных проекта Мэддисон предоставляет информацию о сравнительном [...] [мета]
- Национальные трансферные счета. Целью проекта Национальных трансферных счетов (НТА) является [...] [Мета]
- База данных компаний мира OpenCorporates [Мета]
- Наш мир в данных [мета]
- Penn World Table - PWT версии 10.0 представляет собой базу данных с информацией об относительных уровнях [...] [Мета]
- Наборы данных о гравитации мировой торговли SciencesPo [мета]
- Атлас экономической сложности [Мета]
- Центр международных данных [Мета]
- Обсерватория экономической сложности [Мета]
- Статистика торговли сырьевыми товарами ООН [мета]
- Отчеты ООН о человеческом развитии [Мета]
- Мировая база данных «затраты-выпуск» — мировые таблицы «затраты-выпуск» и соответствующие данные, охватывающие 43 [...] [Мета]
- World KLEMS — аналитические наборы данных типа KLEMS для широкого круга стран по всему миру. [...] [Мета]
Образование
- Данные системы показателей колледжа [мета]
- Данные Департамента образования штата Нью-Йорк. Департамент образования штата Нью-Йорк (NYSED) [...] [Мета]
- Программа международной оценки учащихся (PISA) – содержит материалы [...] [Мета] для 15-летних учащихся.
- Данные учащихся из лагеря Free Code [мета]
Энергия
- AMPds — набор данных «Альманах Minutely Power» [мета]
- СИНИЙ — полностью помеченный набор данных по дезагрегации электроэнергии на уровне зданий [мета]
- ПРИЧЕСАННЫЙ [Мета]
- DBFC - Набор данных для топливных элементов с прямым боргидридным соединением (DBFC) [Мета]
- DEL — наборы данных исследования внутренней электрической нагрузки для Южной Африки (1994–2014 гг.) [Мета]
- ECO - Набор данных ECO представляет собой комплексный набор данных для неинтрузивного мониторинга нагрузки и [...] [Мета]
- ОВОС [Мета]
- Глобальная база данных электростанций. Глобальная база данных электростанций представляет собой комплексную базу данных с открытым исходным кодом [...] [Мета]
- HES – Исследование электроснабжения домашних хозяйств, Великобритания [Мета]
- HFED [Мета]
- МОРЕД: набор данных о потреблении электроэнергии в марокканских зданиях. С весны 2019 года данные [...] [Мета]
- Marktstammdatenregister - Немецкий Marktstammdatenregister (MaStR) представляет собой базу данных всех [...] [Мета]
- PEM1 — Набор данных о топливных элементах протонообменной мембраны (PEM) [Мета]
- PLAID — набор данных идентификации устройств с вилочной нагрузкой [мета]
- Проект освобождения данных коммунальных предприятий (PUDL) - PUDL упрощает сбор данных об энергетике в США [...] [Мета]
- РЕДД [Мета]
- SYND — набор синтетических энергетических данных для неинтрузивного мониторинга нагрузки. С помощью SynD мы представляем [...] [Мета]
- Портал данных интеллектуальных счетчиков. Портал данных интеллектуальных счетчиков является частью Национального научного [...] [Мета]
- База трассировки [мета]
- Наборы данных Энергетического центра Украины [Мета]
- UK-DALE – Электроэнергия на уровне бытовых приборов в Великобритании [Мета]
- БЕЛЫЙ [Мета]
- iAWE [Мета]
Развлечение
- Лучшие стримеры на Twitch — здесь собраны данные о 1000 лучших стримеров за прошлый год. [Мета]
Финансы
- Статистика БМР - статистика БМР, составленная в сотрудничестве с центральными банками и другими [...] [Мета]
- Реестр монет Blockmodo — реестр информационных файлов в формате JSON, который в основном [...] [Мета]
- Фьючерсная биржа CBOE [мета]
- Полные данные о запасах FAANG. Этот набор данных содержит все данные о запасах компаний FAANG из [...] [Meta]
- Google Финансы [мета]
- Google Тренды [мета]
- НАСДАК [мета]
- Рыночные данные NYSE [мета]
- ОАНДА [Мета]
- Финансовые данные OSU [Мета]
- Квандл [Мета]
- SEC EDGAR - EDGAR, электронная система сбора, анализа и поиска данных, представляет собой [...] [Мета]
- Федерал Сент-Луиса [Мета]
- Yahoo Finance [мета]
ГИС
- Потрясающие 3D-модели семантических городов — коллекция открытых 3D-семантических моделей городов и регионов. [Мета]
- Портал открытых данных ArcGIS [Мета]
- Кембридж, Массачусетс, США, данные ГИС на GitHub [мета]
- База данных всех континентов, стран, штатов/подразделений/провинций и городов - База данных [...] [Мета]
- Фактические глобальные данные о местоположении [мета]
- Веб-сайт DASE Общества геонаук и дистанционного зондирования IEEE [мета]
- Геокарты — высококачественные карты GeoJSON, созданные программным способом [Мета]
- Геопространственные данные от ASU [Мета]
- Проект Geo Wiki — Мониторинг окружающей среды, управляемый гражданами [Мета]
- GeoFabrik — данные OSM, извлеченные в различные форматы и области [Мета]
- GeoNames по всему миру [мета]
- Глобальная база данных административных территорий (GADM) — геопространственные данные, организованные по странам. Включает [...] [Мета]
- Данные базового уровня Homeland Infrastructure [Мета]
- Landsat 8 на AWS [мета]
- Список всех стран на всех языках [Мета]
- Портал ГИС-данных Национальной метеорологической службы [Мета]
- Natural Earth — векторы и растры мира [Мета]
- OpenAddresses [Мета]
- OpenStreetMap (OSM) [Мета]
- Плеяды - справочник и график древних мест [Мета]
- Обратный геокодер с использованием данных OSM [Мета]
- Робин Уилсон — Бесплатные наборы ГИС-данных [Мета]
- Карты теневых начислений — хранилище содержит накопленную теневую информацию для Нью-Йорка [...] [Мета]
- TIGER/Line — границы и дороги США [Мета]
- Шейп-файл часовых поясов TZ [Мета]
- TwoFishes — грубый геокодер Foursquare [Мета]
- Экологические данные ООН [Мета]
- Границы мира от Государственного департамента США [Мета]
- Страны мира в нескольких форматах [Мета]
Правительство
- Альберта, провинция Канады [Мета]
- Антверпен, Бельгия [Мета]
- Аргентина (неофициально) [Мета]
- Датос Аргентина - Портал данных о вещах де ла Республика Аргентина. Encontra datos publicos [...] [Мета]
- Остин, Техас, США [Мета]
- Австралия (abs.gov.au) [Мета]
- Австралия (data.gov.au) [мета]
- Австрия (data.gv.at) [Мета]
- Батон-Руж, Луизиана, США [Мета]
- Беэр-Шева, Израиль — Портал открытых данных (Smart7 OpenData) [Мета]
- Бельгия [Мета]
- Открытые данные города Беркли [мета]
- Бразилия [Мета]
- Буэнос-Айрес, Аргентина [Мета]
- Калгари, AB, Канада [Мета]
- Кембридж, Массачусетс, США [Мета]
- Канада [Мета]
- Чикаго [Мета]
- Чили [Мета]
- Китай [Мета]
- Открытые данные Далласа [мета]
- DataBC — данные провинции Британская Колумбия [Мета]
- «Долг до пенни» — набор данных «Долг до пенни» предоставляет информацию об общей [...] [Мета]
- Открытые данные Денвера [мета]
- Дарем, Северная Каролина Открытые данные [мета]
- Эдмонтон, AB, Канада [Мета]
- Англия LGInform [Мета]
- Евростат [Мета]
- EveryPolitician — действующий проект по сбору и обмену данными о каждом политике. [Мета]
- Федеральный комитет по статистической методологии (FCSM) (ранее FedStats) [Мета]
- Финляндия [Мета]
- Франция [Мета]
- Фредериктон, Северная Каролина, Канада [Мета]
- Гатино, королевский адвокат, Канада [Мета]
- Германия [Мета]
- Гент, Бельгия [Мета]
- Глазго, Шотландия, Великобритания [Мета]
- Греция [Мета]
- Мировые правительства-хранители [Мета]
- Галифакс, Северная Каролина, Канада [Мета]
- Регион Хельсинки, Финляндия [Мета]
- Гонконг, Китай [Мета]
- Хьюстон, Техас, США [Мета]
- Данные правительства Индии [мета]
- Индонезийский портал данных [мета]
- Айова – Добро пожаловать на портал данных штата Айова. Пожалуйста, изучите данные об Айове и вашем [...] [Мета]
- Портал открытых данных Ирландии [мета]
- Портал открытых данных Израиля [Мета]
- Портал открытых данных муниципалитета Стамбула [Мета]
- Италия — Il Portale dati.gov.it — национальный каталог метаданных, относящихся к данным [...] [Мета]
- Смертность в тюрьмах в Америке - Правительство США не публикует данные о смертности в тюрьмах, [...] [Мета]
- Япония [Мета]
- Лаваль, королевский адвокат, Канада [Мета]
- Лексингтон, Кентукки [Мета]
- Лондонский датастор, Великобритания [Мета]
- Лондон, Онтарио, Канада [Мета]
- Открытые данные Лос-Анджелеса [мета]
- Люксембург - Люксембургский портал открытых данных [Мета]
- MassGIS, Массачусетс, США [Мета]
- Городская транспортная комиссия (MTC), Калифорния, США [Мета]
- Мексика [Мета]
- Миссиссога, Онтарио, Канада [Мета]
- Молдова [Мета]
- Монктон, Северная Каролина, Канада [Мета]
- Монреаль, Квебек, Канада [Мета]
- Маунтин-Вью, Калифорния, США (ГИС) [Мета]
- Открытые данные Нью-Йорка [мета]
- Нью-Йорк бетаник [Мета]
- Нидерланды [Мета]
- Ежемесячный тоннаж Департамента санитарии Нью-Йорка — Ежемесячные данные о тоннаже DSNY предоставляют [...] [Мета]
- Новая Зеландия [Мета]
- ОЭСР [мета]
- Окленд, Калифорния, США [Мета]
- Оклахома [Мета]
- Открытые данные для Африки [Мета]
- Платформа открытых государственных данных (OGD) Индия [Мета]
- Список OpenDataSoft из 1600 открытых данных [Мета]
- Орегон [Мета]
- Оттава, Онтарио, Канада [Мета]
- Пало-Альто, Калифорния, США [Мета]
- OpenDataPhilly — OpenDataPhilly — каталог открытых данных в регионе Филадельфия. В [...] [Мета]
- Портленд, Орегон [Мета]
- Португалия – организация Pordata [Мета]
- Правительство Пуэрто-Рико [Мета]
- Квебек, Квебек, Канада [Мета]
- Провинция Квебек, Канада [Мета]
- Регина СК, Канада [Мета]
- Рио-де-Жанейро, Бразилия [Мета]
- Румыния [Мета]
- Россия [Мета]
- Сан-Диего, Калифорния [Мета]
- Сан-Антонио, Техас — Информация сообщества сейчас — CI:Now — это некоммерческая организация, обслуживающая Бексар (Сан [...] [Мета]
- Наборы данных Сан-Франциско [Мета]
- Сан-Хосе, Калифорния, США [Мета]
- Округ Сан-Матео, Калифорния, США [Мета]
- Саскачеван, провинция Канады [Мета]
- Сиэтл [Мета]
- Данные правительства Сингапура [мета]
- Торговая статистика Южной Африки [мета]
- Южная Африка [Мета]
- Штат Юта, США [Мета]
- Швейцария [Мета]
- Правительство Тайваня [Мета]
- Тайвань [Мета]
- Открытые данные Тель-Авива [Мета]
- Открытые данные Техаса [мета]
- Всемирный банк [Мета]
- Торонто, Онтарио, Канада [Мета]
- Тунис [Мета]
- Данные правительства Великобритании [мета]
- Опрос американского сообщества США [мета]
- Наборы данных общественного здравоохранения CDC США [мета]
- Бюро переписи населения США [мета]
- Министерство жилищного строительства и городского развития США (HUD) [мета]
- Агентства федерального правительства США [мета]
- Каталог данных федерального правительства США [мета]
- Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA) [мета]
- Национальный центр статистики образования США (NCES) [Мета]
- Открытое правительство США [Мета]
- Проект открытого атласа переписи населения Великобритании 2011 года [мета]
- Округа США. Это хранилище различных данных с разбивкой по округам США. Хотя большая часть [...] [Мета]
- Продукты массового хранения данных Ведомства США по патентам и товарным знакам (USPTO) [мета]
- Статистическое бюро Уганды [мета]
- Украина [Мета]
- Организация Объединенных Наций [Мета]
- Уругвай [Мета]
- Транспортное управление долины (VTA), Калифорния, США [Мета]
- Ванкувер, Британская Колумбия Каталог открытых данных [Мета]
- Виктория, Британская Колумбия, Канада [Мета]
- Вена, Австрия [Мета]
- Статистические данные Главного статистического управления Вьетнама. Данные в различных категориях [...] [Мета]
- Отчеты Исследовательской службы Конгресса США (CRS) [мета]
Здравоохранение
- Наборы данных AWS о COVID-19. Мы работаем с организациями, которые создают данные, связанные с COVID-19, [...] [Мета]
- Данные для публичного использования по надзору за случаями COVID-19 - База данных системы наблюдения за случаями COVID-19 [...] [Мета]
- Необработанные данные Эквадора о Covid-19. Это проект, который предоставляет необработанные наборы данных [...] [Мета]
- Хранилище данных о новом коронавирусе COVID-19 за 2019 год, созданное CSSE Джонса Хопкинса - это данные [...] [Мета]
- Данные о коронавирусе (Covid-19) в США - The New York Times выпускает серию [...] [Мета]
- Сообщаемое о воздействии COVID-19 на пациентов и пропускной способности больниц по учреждениям — следующий набор данных [...] [Мета]
- Состав сырых, обработанных и подготовленных продуктов питания Национальная база данных Министерства сельского хозяйства США по питательным веществам для стандартных [...] [мета]
- Проект отслеживания COVID. Проект отслеживания COVID собирает и публикует наиболее [...] [мета]
- Большие наборы данных о состоянии здоровья EHDP [мета]
- GDC – GDC поддерживает несколько программ генома рака для CCG, TCGA, TARGET и т. д. [Мета]
- Демографические базы данных Gapminder World [Мета]
- MeSH, словарный тезаурус, используемый для индексирования статей для PubMed [Meta]
- MeDAL — большой набор медицинских текстовых данных, созданный для устранения неоднозначности аббревиатур — Медицинские [...] [Мета]
- База данных покрытия Medicare (MCD), США [мета]
- Механизм данных Medicare данных medicare.gov [мета]
- Файл данных Medicare [мета]
- Найтингейл Открытая наука [Мета]
- Число случаев заболевания Эболой и смертей в затронутых странах (2014 г.) [мета]
- Open-ODS (структура Национальной службы здравоохранения Великобритании) [Мета]
- OpenPaymentsData, данные о финансовых отношениях в сфере здравоохранения [Мета]
- Базы данных PhysioBank — большой и постоянно растущий архив физиологических данных. [Мета]
- Архив изображений рака (TCIA) [Мета]
- Проект Атласа генома рака (TCGA) [Мета]
- Глобальная обсерватория здравоохранения Всемирной организации здравоохранения [мета]
- Наборы данных Yahoo Knowledge Graph о COVID-19 — команда Yahoo Knowledge Graph в Verizon Media [...] [Мета]
- Информатика для интеграции биологии и ухода за больными [Мета]
Обработка изображений
- База данных 10 тыс. лиц взрослых в США [мета]
- 2 ГБ фотографий кошек [мета]
- Аудитория Нефильтрованные лица по полу и возрасту [Мета]
- Классификация аффективных изображений [мета]
- Обнаружение и отслеживание воздушных объектов. Набор данных для отслеживания воздушных объектов (AOT) представляет собой [...] [Мета]
- Животные с атрибутами [Мета]
- CADDY Подводное стереозрение. Набор данных жестов рук дайверов. Содержит стереопару 10 тыс. [...] [Мета]
- Набор цитологических данных – CCAgT: изображения клеток шейки матки, полученные методом окрашивания AgNOR – содержит 9339 [...] [Мета]
- Тест Калифорнийского технологического института по обнаружению пешеходов [мета]
- Набор данных Chars74K — распознавание символов в естественных изображениях (доступны как английский, так и каннада) [мета]
- Cube++ — 4890 необработанных 18-мегапиксельных изображений, каждое из которых содержит цветовую цель SpyderCube в [...] [мета]
- Набор данных для видео с плотными аннотациями. Этот набор данных состоит из 28 видеопоследовательностей [...] [Мета]
- Danbooru Tagged Anime Illustration Dataset — крупномасштабная база данных изображений аниме с объемом более 3,33 млн [...] [Мета]
- Набор данных DukeMTMC - DukeMTMC стремится ускорить развитие многоцелевых многокамерных [...] [Мета]
- Энтомологическая коллекция ETH (ETHEC) Изображения мелкозернистой бабочки (Lepidoptra) [Мета]
- Тест распознавания лиц [мета]
- Flickr: 32 логотипа брендов класса [мета]
- GDXray — рентгеновские изображения для рентгеновского контроля и компьютерного зрения [Мета]
- Набор данных HumanEva. Набор данных HumanEva-I содержит 7 калиброванных видеопоследовательностей (4 в оттенках серого [...] [Мета]
- ImageNet (в иерархии WordNet) [Мета]
- Распознавание сцен в помещении [Мета]
- Международная система аффективных изображений, UFL [Мета]
- KITTI Vision Benchmark Suite [Мета]
- Маркированная информационная библиотека Александрии - Биология и охрана природы - Содержит более 10 [...] [Мета]
- База данных рукописных цифр MNIST, около 1 миллиона примеров [Мета]
- Набор данных прогнозирования области интереса с несколькими представлениями для автономного вождения - содержит 16 данных о вождении [...] [Мета]
- Массивные стимулы зрительной памяти, Массачусетский технологический институт [Мета]
- Газетный навигатор. Этот набор данных состоит из извлеченного визуального контента для 16 358 041 [...] [Мета]
- Открытые изображения из Google — изображения с масками сегментации для 2,8 миллионов экземпляров объектов [...] [Мета]
- RuFa — содержит изображения текста, написанного одним из двух арабских шрифтов (рукаа и насталик [...] [Мета]
- База данных SUN, Массачусетский технологический институт [Мета]
- Синтетический салон автомобиля SVIRO. Заполняемость задних сидений - 25 000 синтетических пейзажей на десяти [...] [Мета]
- Несколько наборов данных «Форма из силуэта» [Мета]
- Стэнфордский набор данных о собаках [мета]
- Проблема маркировки сходства действий (ASLAN) [мета]
- Набор данных о домашних животных Oxford-IIIT [мета]
- Violent-Flows — База данных и тест по толпому насилию/ненасилию [мета]
- Визуальный геном [Мета]
- База данных лиц YouTube [мета]
Машинное обучение
- Набор данных для всех возрастов — содержит 13 322 изображения лиц азиатов, распределенных по всем возрастам (от 2 [...] [Мета]
- Набор данных по автономному вождению Audi. Мы опубликовали набор данных по автономному вождению Audi [...] [Мета]
- B3FD — Набор данных для оценки возраста (и пола) лица с 375 тысячами изображений — Набор данных B3FD представляет собой [...] [Мета]
- Наборы контекстно-зависимых данных из пяти доменов [Мета]
- Наборы данных Delve для классификации и регрессии [мета]
- Ежемесячные данные Discogs [мета]
- Флуоресцентные нейрональные клетки. Выпуская этот набор данных, мы стремимся предоставить новый испытательный стенд для [...] [Мета]
- Бесплатный музыкальный архив [Мета]
- База данных IMDb [мета]
- Иранис — крупномасштабный набор данных символов фарси/арабского номерного знака [мета]
- Репозиторий Keel для классификации, регрессии и временных рядов [Мета]
- LLVIP — этот набор данных содержит 30976 изображений или 15488 пар, большинство из которых были сделаны при очень [...] [Мета]
- Маркированные лица в дикой природе (LFW) [Мета]
- Данные о кредитном клубе [Мета]
- Репозиторий наборов данных машинного обучения [мета]
- Набор данных «Миллион песен» [мета]
- Дополнительные наборы данных песен [Мета]
- Наборы данных MovieLens [мета]
- Рейтинги конкурса подписей New Yorker [мета]
- RDataMining — данные электронной книги «R и интеллектуальный анализ данных» [Мета]
- Зарегистрированные метеориты на Земле [Мета]
- Данные об оценке здоровья ресторанов в Сан-Франциско [Мета]
- Набор данных TikTok — более 300 танцевальных видеороликов, в которых запечатлен один человек, исполняющий танец [...] [Мета]
- Репозиторий машинного обучения UCI [мета]
- Yahoo! Рейтинги и классификационные данные [Мета]
- YouTube-BoundingBoxes [Мета]
- Ютуб 8 м [Мета]
- Интернет-аукционы eBay (2012) [Мета]
Музеи
- Открытые данные Канадской корпорации музеев науки и технологий [мета]
- База данных коллекции Купера-Хьюитта [мета]
- API коллекции Метрополитен-музея [Мета]
- Метаданные Института искусств Миннеаполиса [Мета]
- Портал данных Музея естественной истории (Лондон) [Мета]
- Коллекция исторического искусства Рейксмузеума [Мета]
- Метаданные коллекции Тейт [Мета]
- Словари Гетти [Мета]
ЕстественныйЯзык
- Автоматическое извлечение ключевой фразы [Мета]
- База данных Big Bad NLP [Мета]
- Речь Blizzard Challenge — речь + текстовые данные взяты из профессиональных аудиокниг [...] [Мета]
- Корпус блоггеров [мета]
- Корпус исследований CLiPS по стилометрии [мета]
- ClueWeb09 FACC [Мета]
- ClueWeb12 FACC [Мета]
- DBpedia — Структурированные данные из Википедии [Мета]
- Грязные слова — с миллионами изображений в нашей библиотеке и миллиардами ключевых слов, отправленных пользователями, [...] [Мета]
- Персональные таксономии Flickr [мета]
- Бесплатная база людей, мест и вещей [Мета]
- Корпус немецких политических речей - Сборник политических речей немецкого [...] [Мета]
- Google Книги Ngrams (2,2 ТБ) [мета]
- Google MC-AFP — создано на основе общедоступного набора данных Gigaword с использованием векторов абзацев [мета]
- Google Web 5gram (1 ТБ, 2006 г.) [мета]
- Список электронных книг Гутенберга [Мета]
- Hansards текстовые отрывки из канадского парламента [Мета]
- LJ Speech — набор речевых данных, состоящий из 13 100 коротких аудиоклипов, в которых один динамик читает [...] [Мета]
- M-AILabs Speech — набор речевых данных M-AILABS — это первый большой набор данных, который мы [...] [Мета]
- Набор данных Microsoft MAchine Reading COmprehension (или MS MARCO) [мета]
- Тест машинного понимания (MCTest) текста от Microsoft Research [Мета]
- Машинный перевод европейских языков [Мета]
- Осмысление микросообщений 2013 — Извлечение концепций [Мета]
- Осмысление микросообщений 2016 – распознавание именованных объектов и связывание [мета]
- Набор данных многодоменных настроений (версия 2.0) [мета]
- No Language Left Behind (NLLB — 200vo) — набор данных, основанный на метаданных Meta для добытого битового текста. [...] [Мета]
- База данных шумной речи для обучения алгоритмам улучшения речи и моделям TTS - Чисто и [...] [Мета]
- Открытая многоязычная сеть Wordnet [мета]
- Аннотированные данные POS/NER/Chunk [Мета]
- Корпус персонажей [Мета]
- Сбор SMS-спама на английском языке [Мета]
- SaudiNewsNet Сборник статей из саудовских газет (арабский язык, 30 тыс. статей) [Мета]
- Стэнфордский набор данных для ответов на вопросы (SQuAD) [Мета]
- Корпус сообщений USENET за 2005–2011 гг. [Мета]
- Универсальные зависимости [Мета]
- Webhose — новости/блоги на нескольких языках [мета]
- Викиданные — базы данных Википедии [Мета]
- Данные Wikipedia Links — 40 миллионов сущностей в контексте [мета]
- Базы данных и инструменты WordNet [Мета]
- Wordbank — открытая обезличенная база данных по развитию словарного запаса 84 138 детей и [...] [Мета]
- Корпус поясняющих графиков WorldTree для вопросов элементарной науки - корпус [...] [Мета]
Неврология
- Наборы данных Института Аллена [мета]
- Каталог мозга [Мета]
- Мозговая наука [Мета]
- Наборы данных CodeNeuro [мета]
- Совместные исследования в области вычислительной нейронауки (CRCNS) [Мета]
- FCP-INDI [Мета]
- Проект человеческого коннектома [мета]
- НДАР [Мета]
- Архив данных NIMH [мета]
- НейроДата [Мета]
- NeuroMorpho - NeuroMorpho.Org представляет собой централизованно управляемый каталог реконструированных в цифровом виде [...] [Мета]
- Нейроэлектро [Мета]
- ОАЗИС [Мета]
- OpenNEURO [Мета]
- OpenfMRI [Мета]
- Изучите Форрест [Мета]
- Набор данных Nencki-Symfonia EEG/ERP — набор данных электроэнцефалографии (ЭЭГ) высокой плотности [...] [Мета]
Физика
- CERN Open Data Portal [Meta]
- Кристаллография открытая база данных [Meta]
- Icecube - Обсерватория по нейтрино южного полюса [Meta]
- Ligo Open Science Center (LOSC) - Данные по гравитационным волнам от Лиго Хэнфорда и [...] [Мета]
- Архив экзопланета НАСА [мета]
- NSSDC (НАСА) Данные 550 космических кораблей [Meta]
- Квантовое моделирование электрона в двухмерной потенциальной скважине - данные были [...] [Meta]
- Sloan Digital Sky Survey (SDSS) - Картирование вселенной [Meta]
Простатекан
- EOPC-DE-Early-Anset-Prostate-Cancer-Germany-Раннее рак предстательной железы-Германия. [...] [Мета]
- Genie - Данные из доказательств геномики.
- Геном-сжигание-простат-аденокарцинома-CPC-Gene-Комплексное геномное профилирование 477 [...] [Meta]
- Msk-impact-clinical-sequencing-cohort-mskcc-prostate-cancer-целевое секвенирование клинического [...] [Meta]
- Метастатическая простата-аденокарцинома-MCTP-Комплексное профилирование 61 рака простаты [...] [Meta]
- Метастатическая простата-канцелярия-SU2CPCF-Dream-Team-Комплексный анализ 150 метастатических [...] [Meta]
- NPCR-2001-2015-База данных от CDC National Program of Cancer Sigries (NPCR). [...] [Мета]
- NPCR-2005-2015-База данных от CDC National Program of Cancer Sigries (NPCR). [...] [Мета]
- NAF-Prostate-NAF Prostate-это коллекция F-18 NAF позитронной эмиссионной томографии/Computered [...] [Meta]
- Нейроэндокрино-простатные раковины-Данные по всему экзоме и РНК SEQ устойчивого к кастрации [...] [Meta]
- PLCO-Простат-Диагностические Процедуры-набор данных процедур диагностики предстательной железы (95,837 [...] [Meta]
- PLCO-Простат-Медицинские Сопровождения-набор данных о медицинских осложнениях предстательной железы (3350 [...] [Meta]
- PLCO-Простат-скрининговые абнормалии-набор данных аномалий простаты (10,527 [...] [Meta]
- PLCO-Простата-набор данных скрининга предстательной железы (177 315 записей, 35 875 субъектов, [...] [Meta]
- PLCO-Простатная обработка-набор данных простаты (13 409 записей, 7614 субъектов, [...] [Meta]
- PLCO -Простат - набор данных простаты - это комплексный набор данных, который содержит почти все [...] [Meta]
- Prad-CA-Простата-Аденокарцинома-Канада-Аденокарцинома простаты-Канада. Собран [...] [Мета]
- PRAD-FR-Prostate-Adenocarcinoma-France-Аденокарцинома простаты-Франция. Собран по десять [...] [Мета]
- Prad-uk-prostate-adenocarcinoma-united-kingdom-аденокарцинома простаты-Великобритания. [...] [Мета]
- Простатекс -рамка - ретроспективный набор исследований простаты МР. Все исследования включали [...] [Мета]
- Простат-3T-Проект простаты-3T предоставил данные визуализации TCIA как часть ISBI [...] [Meta]
- Простата-аденокарцинома-бедон-конгнелл-2012-Комплексное профилирование 112 рака простаты [...] [Мета]
- Простата-аденокарцинома-бедон-конгнелл-2013-Комплексное профилирование 57 рака простаты [...] [Мета]
- Простата-Аденокарцинома-CNA-Study-MSKCC-Копировать профилирование 103 первичной простаты [...] [Meta]
- Простата-аденокарцинома-Фреда-Хатчинсон-КРК-Комплексное профилирование рака простаты [...] [Мета]
- Аденокарцинома простаты (MSKCC/DFCI) - целое секвенирование экзома 1013 образцов рака простаты. [Мета]
- Простата-Аденокарцинома-МСКСК-Проект простаты MSKCC. 181 Первичный, 37 Метастатический [...] [Мета]
- Простата-аденокарцинома-органаиды-MSKCC-профилирование экзома образцов рака простаты и [...] [Meta]
- Простата-аденокарцинома-сун-лаб-последовательность всего генома и транскриптома 65 простаты [...] [Мета]
- Простата-Аденокарцинома-TCGA-Pancancer-Atlas-Комплексные данные TCGA Pancanatlas из 11K [...] [Meta]
- Простата-аденокарцинома-TCGA-Интегрированное профилирование 333 первичных образцов аденокарциномы простаты. [Мета]
- Простата-диагностика- PCA T1- и T2-взвешенные магнитно-резонансные изображения (МРТ) были получены [...] [Мета]
- Простата-простата-патология-коллекция простат-пласной патологии-это комбинация [...] [Meta]
- Простата-МРТ-коллекция предстательной железы магнитно-резонансных изображений предстательной железы (MRI) была [...] [Meta]
- Prostate -R - R -пакет 'Elemstatlearn' содержит набор данных по раку простаты от Stamey et [...] [Meta]
- Цин-простатная воспроизводительность-набор данных Qin-Prostate Repecatibility-это набор данных с [...] [Meta]
- Цин -простата - Коллекция простаты Цинь в сети количественной визуализации (Qin) содержит [...] [Meta]
- SEER -IYR1973_2015.Seer9 - Сеер ноябрь 2017 г.
- SEER-IYR1992_2015.SJ_LA_RG_AK- SEER NOMAL 2017 Файлы данных исследований из Сан-Хосе- [...] [Meta]
- SEER -IYR2000_2015.CA_KY_LO_NJ_GA - SEER NOMAL 2017 Файлы данных исследований из Greater [...] [Meta]
- SEER -IR2000_2015.CA_KY_LO_NJ_GA - Диагнозы в июле - декабрь 2005 года для Луизианы из их [...] [Meta]
- TCGA-Prad-US-TCGA простата аденокарцинома простаты (499 образцов). [Мета]
Психология+познание
- Наборы данных хранилища когнитивного моделирования OSU [Meta]
- Данные открытой когнитивной науки - общедоступные поведенческие наборы данных со всей когнитивной [...] [Meta]
Publicdomains
- Умело открытые данные в реальном времени [мета]
- Amazon [Meta]
- Наборы данных Archive.org [Meta]
- Архив-это из интернет-архива [мета]
- Архив данных CMU JASA [Meta]
- CMU STATLAB Collections [Meta]
- Data.World [Meta]
- Data360 [Meta]
- Enigma public [Meta]
- Google [Meta]
- База данных Grand Comics - база данных Grand Comics (GCD) - это некоммерческая, интернет -[...] [Meta]
- Infokimps [Meta]
- Коллекции данных Kdnuggets [Meta]
- Бесплатные наборы данных Microsoft Azure Free [Meta]
- Microsoft Data Science for Research [Meta]
- Microsoft Research Open Data [Meta]
- Открыть дампы данных библиотеки [Meta]
- Наборы данных Reddit [Meta]
- Революционная коллекция [мета]
- Пример R наборов данных [Meta]
- Степень переполнения ежегодного опроса разработчиков - Годовой разработчик Surverys Полные наборы данных от 2011 года [...] [Meta]
- Statsci.org [meta]
- Наборы данных Stats4stem R (Archived) [Meta]
- Список Washington Post [Meta]
- Сбор данных UCLA SOCR [Meta]
- Отчеты НЛО [Мета]
- Wikileaks 911 Pager перехватывает [Meta]
- Yahoo Webscope [Meta]
Searchengines
- Академические потоки обмена данными от UMB [Meta]
- Базовая дос Дадос - Основа данных: Открытые данные хранилища для Бразилии [Meta]
- Datahub.io [meta]
- Домен проект - отсортированный список интернет -доменов [Meta]
- Гарвардская сеть научных данных [Meta]
- ICPSR (UMICH) [Мета]
- Институт наук о образовании [мета]
- Библиотека национальных технических отчетов [Meta]
- Сертификаты открытых данных (бета) [Meta]
- OpenDatanetWork - поисковая система всех порталов данных SoCrata Power, выпущенных [Meta]
- Statista.com - Статистика и исследования [Meta]
- Zenodo - открытый надежный дом для длинного хвоста науки [Meta]
SocialNetworks
- 2021 Португальские выборы набора данных Twitter - 57M+ твиты, 1M+ пользователи - этот набор данных содержит [...] [Meta]
- 72 часа #gamergate Twitter Scrape [Meta]
- Электронная почта CMU Enron 150 пользователей [Meta]
- Cheng-Caverlee-Lee Сентябрь 2009 г.-январь 2010 Twitter Scrape [Meta]
- Китайская биографическая база данных - Китайская биографическая база данных является свободно доступной [...] [Meta]
- Набор данных Clubhouse [Meta]
- Набор данных Twitter из 40 миллионов твитов, связанных с Covid -19 - из -за актуальности [...] [Meta]
- 43K+ Дональд Трамп Скриншоты в Твиттере - этот архив содержит скриншоты 43 475 Дональда [...] [Мета]
- Электронная почта EDRM Enron 151 пользователя, размещенных на S3 [Meta]
- Facebook Data Scrape (2005) [Meta]
- Индекс социальной связи Facebook - мы используем анонимный снимок всех активных Facebook [...] [Meta]
- Facebook социальные сети из закона (с 2007 года) [Meta]
- Foursquare от Umn/Sarwat (2013) [Meta]
- Архив сотрудничества GitHub [Meta]
- Google Scholar Citation Relations [Meta]
- Контактные сети высокого разрешения от носимых датчиков [Meta]
- Инди -карта: социальный график и сканирование лучших сайтов Indieweb [Meta]
- Мобильные социальные сети от UMass [Meta]
- Сеть Данные Twitter [Meta]
- Комментарии Reddit [Meta]
- Набор данных Skytrax 'Air Travel Reviews [Meta]
- Социальные данные в Твиттере [Мета]
- Данные исследований SourceForge.net [Meta]
- Набор данных COVID Reddit - этот набор данных пытается получить полную степень COVID -19 [...] [Meta]
- Данные Twitch Top Streater [Meta]
- Данные Twitter для управления репутацией онлайн [Meta]
- Данные Twitter для анализа настроений [Meta]
- График Twitter всего Twitter Sate [Meta]
- Twitter Scrape Calufa May 2011 [Meta]
- Наборы данных социальной сети Unimi/Law [Meta]
- Конгресс Соединенных Штатов Данные Твиттера - ежедневные наборы данных с твитами из 1100+ учетных записей [...] [Meta]
- Yahoo! График и социальные данные [Meta]
- Видео социального графика YouTube в 2007 2008 годах [Meta]
Социальные плюсы
- ACLED (Расположение вооруженного конфликта и проект данных о событиях) [Meta]
- Авторитарная база данных правящей элиты - база данных авторитарной правящей элиты (ARED) - это [...] [Мета]
- Канадский институт юридической информации [мета]
- Центр системных наборов данных мира - тенденции конфликтов, политики, хрупкость состояния и т. Д. [Meta]
- Корреляты военного проекта [Meta]
- Теория криптома, теория заговора [мета]
- DataCards [Meta]
- Европейский социальный опрос [Meta]
- ФБР преступление на почве ненависти 2013 - агрегированные данные [Meta]
- Индекс хрупких состояний [мета]
- Gdelt Global Events Database [Meta]
- Общее социальное обследование (GSS) с 1972 года [Meta]
- Немецкий социальный опрос [Meta]
- Глобальный религиозный фьючерсный проект [Meta]
- Данные о насилии с применением оружия - всеобъемлющая, доступная база данных, которая содержит записи более 260 тыс. [...] [Meta]
- Гуманитарный обмен данными [мета]
- Индекс индекса для управления рисками [Meta]
- Институт демографических исследований [Meta]
- Межамериканский банк развития открытые данные [Meta]
- Архив международных сетей [мета]
- Международная программа социального обследования ISSP [Meta]
- Международные исследования сборки сборника [Meta]
- James McGuire Cross National Data [Meta]
- Набор данных MIT Reality Mining [Meta]
- Руководство Macrodata от Norsk Samfunnsvitenskapelig Datatjeneste [Meta]
- Проект данных массовой мобилизации - данные массовой мобилизации (MM) - это попытка понять [...] [Meta]
- График академических знаний Microsoft - График академических знаний Microsoft - это большой RDF [...] [Meta]
- Миннесотаский населенный центр [мета]
- Нотр-Дам Глобальный индекс адаптации (ND-GAIN) [Meta]
- Открытые данные о преступности и полицейской деятельности в Англии, Уэльсе и Северной Ирландии [Meta]
- Открытия - глобальная база данных лиц и компаний политических, преступных или [...] [Meta]
- Пол Хенсель общая международная страница данных [Meta]
- Pewresearch Internet Survey Project [Meta]
- Сбор данных Pewresearch Society [Meta]
- Данные о политической полярности [мета]
- STACKEXCHANGE DATA Explorer [Meta]
- Исследование терроризма и консорциум анализа [Meta]
- Заключенные из Техаса казнены с 1984 года [Meta]
- Набор данных о выживании Титаника [Meta]
- Архив данных о социальных науках UCB (D-LAB) [Meta]
- Архив данных о социальных науках UCLA [Meta]
- База данных Гражданского общества ООН [мета]
- Upjohn для исследования трудовой работы [Meta]
- Университеты по всему миру [Мета]
- Программа данных о конфликтах UPPSALA [Meta]
- Открытые данные Всемирного банка [Meta]
- База данных по неравенству в мире - база данных мира по неравенству мира (Wid.World) направлена на то, чтобы обеспечить открытую [...] [Meta]
- Проект WorldPop - по всему миру распределения населения [Meta]
Программное обеспечение
- Данные Flossmole о бесплатной, Libre и разработке программного обеспечения с открытым исходным кодом [Meta]
- Ghtorrent - масштабируемое, запрашиваемое, автономное зеркало данных, предлагаемых через API Github Rest. [Мета]
- Libraries.io Репозиторий с открытым исходным кодом и метаданные зависимости [Meta]
- Public Git Archive - большой набор данных кода для всех - набор данных из 182 014 GIT с верхней книгой [...] [Meta]
- Duplicates Code - 2K Java -файл и 600 пары функций Java, помеченные как сходные или разные по [...] [Meta]
- Сообщения о коммите - 1,3 миллиарда сообщений GitHub до марта 2019 года [Meta]
- Комментарии просмотра запроса на вывод - Комментарии Github PR. Комментарии Github с января 2015 года до [...] [Meta]
- Идентификаторы исходного кода - 41,7 млн. Отличительных разбитых идентификаторов, собранных с 182 014 [...] [Мета]
Спорт
- Американские препятствия для воина ниндзя - содержит все препятствия в истории американского ниндзя [...] [Мета]
- Бетфэр Исторические данные обмена [мета]
- Cricsheet Matches (Cricket) [Meta]
- Собственное капитал в легкой атлетике - справедливость в области анализа атлетики.
- Ergast Formula 1, с 1950 года до настоящего времени (API) [Meta]
- Футбольные/футбольные ресурсы (данные и API) [Meta]
- Бейсбольная база данных Лахмана [Meta]
- НФЛ воспроизводить данные-данные NFL Play-By Play, полученные из: [...] [Meta]
- Pinhooker: данные о продаже кровопролития в чистокровных кровавых леса [Meta]
- Pro Kabadi Season 1-7 - Pro Kabadi League - это лига Кабадди на профессиональном уровне в Индии. [...] [Мета]
- Статистика бейсбола ретрошиста [мета]
- Теннисная база данных о рейтингах, результатах и статистике для АТФ [Meta]
- Теннисная база данных о рейтингах, результатах и статистике для WTA [Meta]
- Наборы данных Transfermarkt - Чистые, структурированные и автоматически обновленные данные футбола (футбол) [...] [Meta]
- США футбольные команды и местоположения - футбольные команды и местоположения США. MLS, NWSL и USL [...] [Мета]
Времена
- Набор данных 3W - насколько известно, это первый реалистичный и публичный [...] [Meta]
- DataBanks International Cross National Archive данных временных рядов [Meta]
- Уровень отказов жесткого диска [мета]
- Стоимость времени сердечного ритма от MIT [Meta]
- Библиотека данных временных рядов (TSDL) от MU [Meta]
- Набор данных точки изменения Тьюринга - содержит 42 аннотированных временных рядов, собранных для разработки [...] [Meta]
- Набор данных временных рядов UC Riverside [Meta]
Транспорт
- Авиакомпании OD Data 1987-2008 [Meta]
- Данные Ford Gobike (ранее данные обмена велосипедами Bay Area) [Meta]
- Коллекция велосипедных систем (BSS) [Meta]
- Голландская информация о трафике [мета]
- GPES GPS -траектория из Microsoft Research [Meta]
- Немецкая система поездов от Deutsche Bahn [Meta]
- Губэй миллион поездок в Массачусетс [Мета]
- Подсчет пешеходов Мельбурн - этот набор данных содержит почасовое количество пешеходов с 2009 года [...] [Meta]
- Montreal Bixi Bike Share [Meta]
- Данные о поездке на такси в Нью-Йорке 2009- [Мета]
- Данные о поездке на такси в Нью -Йорке 2013 (FOIA/FOILED) [Meta]
- Данные о поездке в Нью -Йорк Uber с апреля 2014 года по сентябрь 2014 года [Meta]
- Открытая коллекция трафика [мета]
- OpenFlights - Аэропорт, авиакомпания и данные маршрута [Meta]
- Филадельфийские велосипедные станции (JSON) [Meta]
- База данных о авиакатастрофе с 1920 года [Meta]
- Данные о выполнении авиакомпании Rita Airline [Meta]
- Сбор данных транспорта Rita/BTS (Transtat) [Meta]
- Ренф (испанская национальная железнодорожная сеть) Набор данных [Meta]
- Toronto Bike Share Stations (файлы JSON и GBFS) [Meta]
- Транспорт для Лондона (TFL) [Meta]
- Обследование Travel Tracker (TTS) для Чикаго [Meta]
- Американское бюро транспортной статистики (BTS) [Meta]
- Внутренние рейсы США с 1990 по 2009 год [Meta]
- Среда анализа грузовых перевозок с 2007 года [Meta]
- Национальное управление дорожного движения США - погибшие с 1975 года - содержит CSV [...] [Meta]
Киберспорт
- CS: Go Конкурентные данные о составании - в этом наборе данных у нас есть данные о совпадении CSGO [...] [Meta]
- FIFA-2021 Полный набор данных игроков [Meta]
- Opendota Data Damp [Meta]
Дополнительные коллекции
- Данные наборы данных, упакованные в данные,
- Opendatamonitor: обзор доступных ресурсов открытых данных в Европе
- Quora: Где я могу найти большие наборы данных, открытые для публики?
- Rs.io: 100+ интересных наборов данных для статистики
- Cvonline: базы данных изображений
- Innotrek: использует открытые данные для понимания городской жизни
- CV Papers: наборы данных CV в Интернете
Особая благодарность