Загрузка GPU Guide - Загрузка исходного кода GPU Guide

GPU Guide

Другой исходный код

1.0.0

Скачать

Руководство по графическому процессору

Руководство, описывающее работу графического процессора, включая приложения, библиотеки, оборудование и инструменты. Это также даст вам лучшее понимание того, как задачи на основе графического процессора работают во встроенных системах, мобильных телефонах, персональных компьютерах, профессиональных рабочих станциях и игровых консолях.

Примечание. Вы можете легко преобразовать этот файл уценки в PDF в VSCode, используя это удобное расширение Markdown PDF.

Как процессор и графический процессор работают вместе при выполнении кода приложения.

Единая архитектура памяти

Заряд и электрическая сила (закон Кулона): электрический заряд, поле и потенциал.
Электрическое поле: электрический заряд, поле и потенциал.
Электрическая потенциальная энергия, электрический потенциал и напряжение: электрический заряд, поле и потенциал.

Схемы

Закон Ома и схемы с резисторами: Схемы
Схемы с конденсаторами: Схемы

Магнитные силы, магнитные поля и закон Фарадея.

Магниты и магнитная сила: Магнитные силы, магнитные поля и закон Фарадея.
Магнитное поле, создаваемое током: Магнитные силы, магнитные поля и закон Фарадея.
Электродвигатели: магнитные силы, магнитные поля и закон Фарадея.
Магнитный поток и закон Фарадея

Электромагнитные волны и помехи

Введение в электромагнитные волны: Электромагнитные волны и помехи
Интерференция электромагнитных волн

Геометрическая оптика

Отражение и преломление: геометрическая оптика
Зеркала: Геометрическая оптика
Линзы

Линейная алгебра
Виртуализация
Параллельные вычисления
Разработка OpenCL
Разработка CUDA
Алгоритмы
Машинное обучение
Развитие глубокого обучения
Разработка компьютерного зрения
Игры
Разработка игр
OpenGL-разработка
Вулкан Девелопмент
Разработка DirectX
Профессиональная разработка аудио/видео
3D-графика и дизайн
Яблочный кремний
Основная разработка машинного обучения
Металл Девелопмент
МАТЛАБ Разработка
Разработка на C/C++
Разработка Python
Р Девелопмент
Юлия Девелопмент

Ресурсы для обучения графическому процессору

Вернуться к началу

Графический процессор (GPU) — это схема, состоящая из сотен ядер, которые могут обрабатывать тысячи потоков одновременно. Графические процессоры могут быстро манипулировать и изменять память для ускорения создания изображений в буфере кадров, предназначенном для вывода на устройство отображения. Они используются во встроенных системах, мобильных телефонах, персональных компьютерах, профессиональных рабочих станциях и игровых консолях.

Оперативная память (ОЗУ) — это форма компьютерной памяти, которую можно читать и изменять в любом порядке, обычно используемую для хранения рабочих данных и машинного кода. Устройство памяти с произвольным доступом позволяет считывать или записывать элементы данных практически за одно и то же время независимо от физического расположения данных внутри памяти, в отличие от других носителей данных с прямым доступом.

Оперативная память видео (VRAM) — это оперативная память, выделенная для хранения изображений или графических данных. Он функционирует так же, как ОЗУ, сохраняя определенные данные для облегчения доступа и повышения производительности. Данные изображения сначала считываются процессором и записываются в видеопамять. Затем он преобразуется с помощью RAMDAC или цифро-аналогового преобразователя RAM и отображается в виде графического вывода.

Графическая память с двойной скоростью передачи данных (GDDR) SDRAM — это тип синхронной графической памяти с произвольным доступом (SGRAM) с интерфейсом с высокой пропускной способностью («двойная скорость передачи данных»), предназначенной для использования в видеокартах, игровых консолях и высокопроизводительных вычислениях.

Интегрированный графический процессор (IGPU) — это компонент, построенный на одном кристалле (интегральной схеме) с центральным процессором (AMD Ryzen APU или Intel HD Graphics), который использует часть системной оперативной памяти компьютера, а не выделенную графическую память.

Тензор — это алгебраический объект, который описывает полилинейные отношения между наборами алгебраических объектов, связанных с векторным пространством. Объекты, которые тензоры могут отображать между векторами, скалярами и другими тензорами.

Тензоры — это многомерные массивы единого типа (называемого dtype).

Тензорные ядра — это ускоритель вывода искусственного интеллекта в графических процессорах NVIDIA, который обеспечивает на порядок более высокую производительность при пониженной точности, например TF32, bfloat16, FP16, INT8, INT4 и FP64, для ускорения научных вычислений с максимально необходимой точностью.

RT (трассировка лучей в реальном времени). Ядра — это аппаратное ускорение трассировки лучей, ускоряющее обход иерархии ограничивающего объема (BVH) и функции тестирования пересечения лучей и треугольников (приведение лучей). Ядра RT выполняют тестирование видимости от имени потоков, работающих в SM, позволяя ему обрабатывать другие вершины, пиксели и вычислять затенение.

Центральный процессор (ЦП) — это схема, состоящая из нескольких ядер, выполняющая инструкции, содержащие компьютерную программу. ЦП выполняет базовые арифметические, логические, управляющие операции и операции ввода/вывода (I/O), определенные инструкциями в программе. Он отличается от других внешних компонентов, таких как основная память, схемы ввода-вывода и графические процессоры (GPU).

AMD Accelerated Processing Unit (APU) — серия 64-битных микропроцессоров от Advanced Micro Devices (AMD), предназначенных для работы в качестве центрального процессора (ЦП) и графического процессора (ГП) на одном кристалле.

Векторный процессор — это центральный процессор (ЦП), который реализует набор команд, инструкции которого предназначены для эффективной и действенной работы с большими одномерными массивами данных, называемыми векторами.

Цифровая обработка сигналов (DSP) — это применение цифрового компьютера для модификации аналогового или цифрового сигнала. Он широко используется во многих приложениях, включая передачу видео/аудио/данных и создание сетей, медицинскую визуализацию и компьютерное зрение, синтез и кодирование речи, цифровое аудио и видео, а также управление сложными системами и промышленными процессами.

Обработка сигнала изображения (ISP) — это процесс преобразования изображения в цифровую форму путем выполнения таких операций, как шумоподавление, автоматическая экспозиция, автофокусировка, автоматический баланс белого, коррекция HDR и повышение резкости изображения с помощью медиапроцессора специализированного типа.

Интегральные схемы специального назначения (ASIC) — это микросхема интегральной схемы (IC), предназначенная для конкретного использования во встроенных системах, мобильных телефонах, персональных компьютерах, профессиональных рабочих станциях, а не предназначенная для общего использования.

Одна инструкция, несколько данных (SIMD) — это тип параллельной обработки, который описывает компьютеры с несколькими элементами обработки, которые выполняют одну и ту же операцию с несколькими точками данных одновременно.

Что такое графический процессор? Определены графические процессоры | Интел

Институт глубокого обучения и решения для обучения | NVIDIA

Онлайн-курсы глубокого обучения | NVIDIA

Существующие университетские курсы | Разработчик NVIDIA

Использование графических процессоров для масштабирования и ускорения глубокого обучения | edX

Лучшие онлайн-курсы по графическому процессору | Курсера

Программирование графического процессора CUDA от начинающего до продвинутого | Удеми

Вычисления на графическом процессоре в Vulkan | Удеми

Курс «Архитектура графических процессоров» | Университет Вашингтона

Электрический заряд, поле и потенциал

Вернуться к началу

 - Charge and electric force (Coulomb's law): Electric charge, field, and potential
 - Electric field: Electric charge, field, and potential
 - Electric potential energy, electric potential, and voltage: Electric charge, field, and potential

Электрическая потенциальная энергия. Источник: Искрафан

Схемы

Вернуться к началу

- Ohm's law and circuits with resistors: Circuits
- Circuits with capacitors: Circuits

Электрические цепи. Источник: сдсу-физика

Символы цепей. Источник: andrewpover.co.uk.

Магнитные силы, магнитные поля и закон Фарадея.

Вернуться к началу

- Magnets and Magnetic Force: Magnetic forces, magnetic fields, and Faraday's law
- Magnetic field created by a current: Magnetic forces, magnetic fields, and Faraday's law
- Electric motors: Magnetic forces, magnetic fields, and Faraday's law
- Magnetic flux and Faraday's law

Магнитное поле. Источник: vecteezy

Закон Амфера. Источник: сдсу-физика

Закон Фаради. Источник: сдсу-физика

Электромагнитные волны и помехи

Вернуться к началу

- Introduction to electromagnetic waves: Electromagnetic waves and interference
- Interference of electromagnetic waves

Электромагнитная волна. Источник: разница между

ЭМИ Спектр. Источник: electric4u

Геометрическая оптика

Вернуться к началу

- Reflection and refraction: Geometric optics
- Mirrors: Geometric optics
- Lenses

Геометрическая оптика — трассировка лучей. Источник: сдсу-физика

Геометрическая оптика - Отражение. Источник: сдсу-физика

Линейная алгебра

Вернуться к началу

Ресурсы для изучения линейной алгебры

Линейная алгебра — это математика векторов и матриц. Единственным необходимым условием для работы с этим руководством является базовое понимание таких школьных математических понятий, как числа, переменные, уравнения и фундаментальные арифметические операции с действительными числами: сложение (обозначается +), вычитание (обозначается -), умножение (обозначается неявно) и деление (доли). Кроме того, вы также должны быть знакомы с функциями, которые принимают действительные числа в качестве входных данных и выдают действительные числа в качестве выходных данных: f : R → R.

Линейная алгебра - Онлайн-курсы | Гарвардский университет

Линейная алгебра | Библиотека открытого обучения Массачусетского технологического института

Линейная алгебра - Академия Хана

Лучшие курсы по линейной алгебре на Coursera

Математика для машинного обучения: линейная алгебра на Coursera

Лучшие курсы по линейной алгебре на Udemy

Изучите линейную алгебру с помощью онлайн-курсов и классов на edX

Математика науки о данных: курс линейной алгебры на edX

Линейная алгебра в двадцати пяти лекциях | Калифорнийский университет в Дэвисе

Линейная алгебра | Расширение Калифорнийского университета в Сан-Диего

Линейная алгебра для машинного обучения | Расширение Калифорнийского университета в Сан-Диего

Введение в линейную алгебру, интерактивное онлайн-видео | Вольфрам

Ресурсы по линейной алгебре | Дартмут

Определения

я. Векторные операции

Теперь мы определим математические операции для векторов. Операции, которые мы можем выполнять с векторами ~u = (u1, u2, u3) и ~v = (v1, v2, v3): сложение, вычитание, масштабирование, норма (длина), скалярное произведение и векторное произведение:

Скалярное произведение и векторное произведение двух векторов также можно описать через угол θ между двумя векторами.

Векторные операции. Источник: слайдсерв

Векторные операции. Источник: пинтерест

ii. Матричные операции

Мы обозначаем A матрицу в целом и называем ее элементы aij . Математические операции, определенные для матриц, следующие:

• определитель (обозначается det(A) или |A|). Обратите внимание, что произведение матрицы не является коммутативной операцией.

Матричные операции. Источник: СДГУ Физика

Проверьте наличие модулей, которые позволяют выполнять матричные операции. Источник: Концепции DPS.

iii. Матрично-векторное произведение

Произведение матрицы-вектора является важным частным случаем матричного произведения.

Существует два принципиально разных, но эквивалентных способа интерпретации произведения матрицы-вектора. На изображении столбца (C) умножение матрицы A на вектор ~x дает линейную комбинацию столбцов матрицы: y = A x = x1A[:,1] + x2A[:,2], где A[:,1] и A[:,2] — первый и второй столбцы матрицы A. В изображении строки (R) умножение матрицы A на вектор ~x дает вектор-столбец с коэффициентами равен скалярному произведению строк матрицы с вектором ~x.

Матрично-векторное произведение. Источник: Викимедиа

Матрично-векторное произведение. Источник: mathisfun

iv. Линейные преобразования

Произведение матрицы-вектора используется для определения понятия линейного преобразования, которое является одним из ключевых понятий в изучении линейной алгебры. Умножение на матрицу A ∈ R m×n можно рассматривать как вычисление линейного преобразования TA, которое принимает n-векторов в качестве входных данных и производит m-векторы в качестве выходных данных:

Линейные преобразования. Источник: слайдсерв

Элементарные матрицы для линейных преобразований в R^2. Источник:Квора

v. Фундаментальные векторные пространства

Основная теорема линейной алгебры для векторных пространств. Источник: Викимедиа

Основная теорема линейной алгебры. Источник: вольфрам

Вычислительная линейная алгебра

я. Решение систем уравнений

Система линейных уравнений графическим способом. Источник: слайдшер

ii. Системы уравнений как матричные уравнения

Системы уравнений как матричные уравнения. Источник: mathisfun

Вычисление обратной матрицы

В этом разделе мы рассмотрим несколько различных подходов к вычислению обратной матрицы. Обратная матрица уникальна, поэтому независимо от того, какой метод мы используем для нахождения обратной матрицы, мы всегда получим один и тот же ответ.

Обратная матрица 2x2. Источник: пинтерест

я. Использование операций со строками

Одним из подходов к вычислению обратного процесса является использование процедуры исключения Гаусса – Жордана.

Операции со строками Elementray. Источник: YouTube

ii. Использование элементарных матриц

Каждая операция над строкой, которую мы выполняем над матрицей, эквивалентна умножению слева на элементарную матрицу.

Элементарные матрицы. Источник: СДГУ Физика

iii. Транспонирование матрицы

Для нахождения обратной матрицы используется метод Транспонирования.

Транспонирование матрицы. Источник: слайдсерв

Другие линейные темы

В этом разделе обсуждается ряд других важных тем линейной алгебры.

я. Основа

Интуитивно понятно, что базис — это любой набор векторов, который можно использовать в качестве системы координат векторного пространства. Вы наверняка знакомы со стандартной основой плоскости xy, состоящей из двух ортогональных осей: оси x и оси y.

Основа. Источник: Викимедиа

Изменение основы. Источник: Викимедиа

ii. Матричные представления линейных преобразований

Матричные представления линейных преобразований. Источник: слайдсерв

iii. Размерность и основа векторных пространств

Размерность векторного пространства определяется как количество векторов в основе этого векторного пространства. Рассмотрим следующее векторное пространство S = span{(1, 0, 0), (0, 1, 0), (1, 1, 0)}. Учитывая, что пространство описывается тремя векторами, мы могли бы подумать, что S трехмерно. Однако это не так, поскольку три вектора не являются линейно независимыми и не образуют основу для S. Двух векторов достаточно для описания любого вектора в S; мы можем написать S = span{(1, 0, 0), (0, 1, 0)}, и мы видим, что эти два вектора линейно независимы, поэтому они образуют базис и dim(S) = 2. Существует общий принцип процедура нахождения базиса векторного пространства. Предположим, вам дано описание векторного пространства в терминах m векторов V = span{~v1, ~v2, . . . , ~vm}, и вас попросят найти базис для V и размерность V. Чтобы найти базис для V, вы должны найти набор линейно независимых векторов, охватывающих V. Мы можем использовать процедуру исключения Гаусса – Жордана, чтобы выполнить эту задачу. Запишите векторы ~vi как строки матрицы M. Векторное пространство V соответствует пространству строк матрицы M. Затем используйте операции со строками, чтобы найти сокращенную форму эшелона строк (RREF) матрицы M. Поскольку операции со строками не меняйте пространство строк матрицы, пространство строк сокращенной формы эшелона строк матрицы M такое же, как пространство строк исходного набора векторов. Ненулевые строки в RREF матрицы образуют основу векторного пространства V, а количество ненулевых строк является размерностью V.

Основа и размерность. Источник: слайдерсерв

iv. Пространство строк, пространство столбцов и ранг матрицы

Вспомните фундаментальные векторные пространства для матриц, которые мы определили в разделе II-E: пространство столбцов C(A), нулевое пространство N (A) и пространство строк R(A). Стандартный экзаменационный вопрос по линейной алгебре состоит в том, чтобы дать вам определенную матрицу A и попросить вас найти размерность и основу для каждого из ее фундаментальных пространств. В предыдущем разделе мы описали процедуру, основанную на исключении Гаусса–Жордана, которую можно использовать для «отбора» набора линейно независимых векторов, образующих основу пространства строк R(A). Сейчас мы проиллюстрируем эту процедуру на примере, а также покажем, как использовать RREF матрицы A для нахождения оснований для C(A) и N(A).

Пространство строк и пространство столбцов. Источник: слайдшер

Ранг и ничтожность. Источник: слайдшер

v. Теорема об обратимой матрице

Существует важное различие между обратимыми матрицами и матрицами, которые не формализуются следующей теоремой. Теорема. Для матрицы A размера n×n следующие утверждения эквивалентны:

Теорема об обратимой матрице. Источник: СДГУ Физика

VI. Детерминанты

Определитель матрицы, обозначаемый det(A) или |A|, представляет собой особый способ объединения элементов матрицы, который служит для проверки того, является ли матрица обратимой или нет.

Определитель квадратной матрицы. Источник: стекбиржа

Определитель матрицы. Источник: onlinemathlearning

VII. Собственные значения и собственные векторы

Набор собственных векторов матрицы — это специальный набор входных векторов, для которого действие матрицы описывается как простое масштабирование. Когда матрица умножается на один из ее собственных векторов, на выходе получается тот же собственный вектор, умноженный на константу A eλ = λ eλ. Константа λ называется собственным значением A.

Обобщенные собственные векторы. Источник: YouTube

viii. Линейная регрессия

Линейная регрессия — это подход к моделированию взаимосвязи между двумя переменными путем подбора линейного уравнения к наблюдаемым данным. Одна переменная считается объясняющей, а другая — зависимой.

Множественная линейная регрессия. Источник: Средний

Виртуализация

Вернуться к началу

HVM (Аппаратная виртуальная машина) — это тип виртуализации, который обеспечивает возможность запуска операционной системы непосредственно поверх виртуальной машины без каких-либо изменений, как если бы она запускалась на «голом железе».

PV (ParaVirtualization) — это эффективный и легкий метод виртуализации, предложенный командой Xen Project, который позже был принят другими решениями виртуализации. PV не требует расширения виртуализации от центрального процессора и, таким образом, обеспечивает виртуализацию на аппаратных архитектурах, которые не поддерживают виртуализацию с аппаратной поддержкой.

Виртуализация сетевых функций (NFV) — это замена оборудования сетевых устройств виртуальными машинами. Виртуальные машины используют гипервизор для запуска сетевого программного обеспечения и таких процессов, как маршрутизация и балансировка нагрузки. NFV позволяет отделить службы связи от выделенного оборудования, такого как маршрутизаторы и межсетевые экраны. Такое разделение означает, что сетевые операции могут предоставлять новые услуги динамически и без установки нового оборудования. Развертывание сетевых компонентов с виртуализацией сетевых функций занимает всего несколько часов по сравнению с месяцами, как при использовании традиционных сетевых решений.

Программно-определяемая сеть (SDN) — это подход к организации сети, в котором используются программные контроллеры или интерфейсы прикладного программирования (API) для связи с базовой аппаратной инфраструктурой и направления трафика в сети. Эта модель отличается от модели традиционных сетей, в которых для управления сетевым трафиком используются выделенные аппаратные устройства (маршрутизаторы и коммутаторы).

Virtualized Infrastructure Manager (VIM) — это средство доставки услуг и снижения затрат за счет высокопроизводительного управления жизненным циклом. Управляйте полным жизненным циклом программного и аппаратного обеспечения, составляющего вашу инфраструктуру NFV (NFVI), а также поддерживайте действующую инвентаризацию и план распределения как физических, так и виртуальных ресурсов.

Management and Orchestration (MANO) — это инициатива ETSI по разработке программного стека управления и оркестрации NFV с открытым исходным кодом (MANO), соответствующего ETSI NFV. Двумя ключевыми компонентами архитектурной структуры ETSI NFV являются оркестратор NFV и менеджер VNF, известные как NFV MANO.

Magma — это программная платформа с открытым исходным кодом, которая предоставляет сетевым операторам открытое, гибкое и расширяемое решение базовой мобильной сети. Их миссия — соединить мир с более быстрой сетью, предоставив поставщикам услуг возможность создавать экономичные и расширяемые сети операторского класса. Magma — это поколение 3GPP (2G, 3G, 4G или будущие сети 5G) и независимая сеть доступа (сотовая связь или Wi-Fi). Он может гибко поддерживать сеть радиодоступа с минимальными усилиями по разработке и развертыванию.

OpenRAN — это интеллектуальная сеть радиодоступа (RAN), интегрированная на платформах общего назначения с открытым интерфейсом между программно-определяемыми функциями. Открытая RANecosystem обеспечивает огромную гибкость и совместимость с полной открытостью для развертываний от различных поставщиков.

Open vSwitch (OVS) — это качественный многоуровневый виртуальный коммутатор с открытым исходным кодом, лицензированный по лицензии Apache 2.0 с открытым исходным кодом. Он предназначен для обеспечения массовой автоматизации сети посредством программного расширения, сохраняя при этом поддержку стандартных интерфейсов и протоколов управления (NetFlow, sFlow, IPFIX, RSPAN, CLI, LACP, 802.1ag).

Edge — это платформа распределенных вычислений, которая приближает корпоративные приложения к источникам данных, таким как устройства Интернета вещей или локальные пограничные серверы. Такая близость к данным в их источнике может обеспечить значительные преимущества для бизнеса, включая более быстрое получение аналитической информации, сокращение времени отклика и лучшую доступность полосы пропускания.

Периферийные вычисления с множественным доступом (MEC) — это группа отраслевых спецификаций (ISG) в рамках ETSI, целью которой является создание стандартизированной открытой среды, которая обеспечит эффективную и плавную интеграцию приложений от поставщиков, поставщиков услуг и третьих сторон в мультивендорных мульти-вендорных средах. -доступ к платформам периферийных вычислений.

Виртуализированные сетевые функции (VNF) — это программное приложение, используемое в реализации виртуализации сетевых функций (NFV), которое имеет четко определенные интерфейсы и определенным образом обеспечивает одну или несколько сетевых функций компонентов. Например, VNF безопасности обеспечивает преобразование сетевых адресов (NAT) и функции компонентов брандмауэра.

Cloud-Native Network Functions (CNF) — это сетевая функция, разработанная и реализованная для работы внутри контейнеров. CNF наследуют все собственные архитектурные и эксплуатационные принципы облака, включая управление жизненным циклом Kubernetes(K8s), гибкость, отказоустойчивость и наблюдаемость.

Функция физической сети (PNF) — это физический узел сети, не подвергшийся виртуализации. И PNF, и VNF (виртуализированные сетевые функции) могут использоваться для формирования общей сетевой службы.

Инфраструктура виртуализации сетевых функций (NFVI) является основой общей архитектуры NFV. Он предоставляет физическое вычислительное, хранилище и сетевое оборудование, на котором размещаются VNF. Каждый блок NFVI можно рассматривать как узел NFVI, и многие узлы можно развернуть и контролировать географически.

Безопасность на основе виртуализации (VBS) — это функция аппаратной виртуализации, позволяющая создавать и изолировать безопасную область памяти от обычной операционной системы.

Целостность кода, обеспечиваемая гипервизором (HVCI), — это механизм, посредством которого гипервизор, такой как Hyper-V, использует аппаратную виртуализацию для защиты процессов режима ядра от внедрения и выполнения вредоносного или непроверенного кода. Проверка целостности кода выполняется в безопасной среде, устойчивой к атакам вредоносного программного обеспечения, а разрешения страниц для режима ядра устанавливаются и поддерживаются гипервизором.

KVM (для виртуальной машины на основе ядра) — это полное решение виртуализации для Linux на оборудовании x86, содержащее расширения виртуализации (Intel VT или AMD-V). Он состоит из загружаемого модуля ядра kvm.ko, который обеспечивает базовую инфраструктуру виртуализации, и модуля для конкретного процессора kvm-intel.ko или kvm-amd.ko.

QEMU — быстрый эмулятор процессора, использующий портативный динамический транслятор. QEMU эмулирует полную систему, включая процессор и различные периферийные устройства. Его можно использовать для запуска другой операционной системы без перезагрузки компьютера или для отладки системного кода.

Hyper-V позволяет запускать виртуализированные компьютерные системы поверх физического хоста. Эти виртуализированные системы можно использовать и управлять ими так же, как если бы они были физическими компьютерными системами, однако они существуют в виртуализированной и изолированной среде. Специальное программное обеспечение, называемое гипервизором, управляет доступом между виртуальными системами и физическими аппаратными ресурсами. Виртуализация обеспечивает быстрое развертывание компьютерных систем, способ быстрого восстановления систем до заведомо исправного состояния и возможность миграции систем между физическими хостами.

VirtManager — графический инструмент для управления виртуальными машинами через libvirt. Чаще всего используются виртуальные машины QEMU/KVM, но контейнеры Xen и libvirt LXC хорошо поддерживаются. Общие операции для любого драйвера libvirt должны работать.

oVirt — это решение распределенной виртуализации с открытым исходным кодом, предназначенное для управления всей инфраструктурой вашего предприятия. oVirt использует надежный гипервизор KVM и основан на нескольких других проектах сообщества, включая libvirt, Gluster, PatternFly и Ansible. Основан Red Hat как проект сообщества, на котором основана Red Hat Enterprise Virtualization, позволяющая централизованно управлять виртуальными машинами, вычислительными , хранилища и сетевые ресурсы из простого в использовании веб-интерфейса с независимым от платформы доступом.

HyperKit — это набор инструментов для внедрения возможностей гипервизора в ваше приложение. Он включает в себя полноценный гипервизор на основе xhyve/bhyve, оптимизированный для легких виртуальных машин и развертывания контейнеров. Он предназначен для взаимодействия с компонентами более высокого уровня, такими как VPNKit и DataKit. HyperKit в настоящее время поддерживает только macOS с использованием Hypervisor.framework, что делает его основным компонентом Docker Desktop для Mac.

Технология виртуализации графики Intel® (Intel® GVT) — это полное решение для виртуализации графических процессоров с опосредованным сквозным подключением, начиная с процессоров Intel Core (TM) 4-го поколения с процессорной графикой Intel (Broadwell и новее). Его можно использовать для виртуализации графического процессора для нескольких гостевых виртуальных машин, эффективно обеспечивая производительность графики, близкую к исходной, на виртуальной машине, но при этом позволяя вашему хосту нормально использовать виртуализированный графический процессор.

Apple Hypervisor — это фреймворк, который создает решения для виртуализации на базе легкого гипервизора без сторонних расширений ядра. Гипервизор предоставляет API C, поэтому вы можете взаимодействовать с технологиями виртуализации в пользовательском пространстве без написания расширений ядра (KEXT). В результате приложения, которые вы создаете с помощью этой платформы, подходят для распространения в Mac App Store.

Apple Virtualization Framework — это платформа, предоставляющая API-интерфейсы высокого уровня для создания и управления виртуальными машинами на компьютерах Apple на базе процессоров Apple и Intel Mac. Эта платформа используется для загрузки и запуска операционной системы на базе Linux в определяемой вами пользовательской среде. Он также поддерживает спецификацию Virtio, которая определяет стандартные интерфейсы для многих типов устройств, включая сетевые, сокетные, последовательные порты, устройства хранения, энтропийные устройства и устройства с памятью.

Apple Paravirtualized Graphics Framework — это платформа, которая реализует графику с аппаратным ускорением для macOS, работающую на виртуальной машине, называемой в дальнейшем гостевой. Операционная система предоставляет графический драйвер, который работает внутри гостевой системы и взаимодействует с платформой хостовой операционной системы, чтобы воспользоваться преимуществами графики с ускорением Metal.

Cloud Hypervisor — это монитор виртуальных машин (VMM) с открытым исходным кодом, который работает поверх KVM. Проект ориентирован исключительно на выполнение современных облачных рабочих нагрузок на ограниченном наборе аппаратных архитектур и платформ. К облачным рабочим нагрузкам относятся те, которые обычно выполняются клиентами внутри облачного провайдера. Облачный гипервизор реализован на Rust и основан на крейтах ржавчины-vmm.

VMware vSphere Hypervisor — это гипервизор без операционной системы, который виртуализирует серверы; позволяя вам консолидировать ваши приложения, экономя время и деньги на управлении вашей ИТ-инфраструктурой.

Xen ориентирован на развитие виртуализации в ряде различных коммерческих приложений и приложений с открытым исходным кодом, включая виртуализацию серверов, инфраструктуру как услугу (IaaS), виртуализацию настольных компьютеров, приложения безопасности, встроенные и аппаратные устройства, а также автомобильную и авиационную промышленность.

Ganeti — это инструмент управления кластером виртуальных машин, созданный на основе существующих технологий виртуализации, таких как Xen или KVM, а также другого программного обеспечения с открытым исходным кодом. После установки инструмент берет на себя управление виртуальными экземплярами (Xen DomU).

Packer — это инструмент с открытым исходным кодом для создания идентичных образов машин для нескольких платформ из одной конфигурации. Packer легкий, работает на всех основных операционных системах и обладает высокой производительностью, параллельно создавая образы машин для нескольких платформ. Packer не заменяет управление конфигурацией, такое как Chef или Puppet. Фактически, при создании образов Packer может использовать такие инструменты, как Chef или Puppet, для установки программного обеспечения в образ.

Vagrant — это инструмент для создания сред виртуальных машин и управления ими в рамках единого рабочего процесса. Благодаря простому в использовании рабочему процессу и сосредоточению внимания на автоматизации Vagrant сокращает время настройки среды разработки, повышает производственный паритет и превращает «работы на моей машине» в оправдание пережитка прошлого. Он обеспечивает легко настраиваемую, воспроизводимую и переносимую рабочую среду, созданную на основе стандартных отраслевых технологий и контролируемую единым согласованным рабочим процессом, что помогает максимизировать производительность и гибкость вас и вашей команды.

Parallels Desktop — это гипервизор для настольных компьютеров, который предоставляет самое быстрое, простое и мощное приложение для запуска Windows/Linux на Mac (включая новый чип Apple M1) и ChromeOS.

VMware Fusion — это настольный гипервизор, который предоставляет разработчикам и ИТ-специалистам на Mac виртуальные машины, контейнеры и кластеры Kubernetes для настольных и «серверных» компьютеров.

VMware Workstation — это размещенный гипервизор, работающий на 64-разрядных версиях операционных систем Windows и Linux; он позволяет пользователям настраивать виртуальные машины на одной физической машине и использовать их одновременно с реальной машиной.

Параллельные вычисления

Вернуться к началу

Ресурсы для обучения параллельным вычислениям

Параллельные вычисления — это вычислительная среда, в которой два или более процессоров (ядер, компьютеров) работают одновременно для решения одной задачи. Большие проблемы часто можно разделить на более мелкие, которые затем можно решить одновременно. Существует несколько различных форм параллельных вычислений: [битовый уровень]https://en.wikipedia.org/wiki/Bit-level_parallelism), параллелизм на уровне инструкций, данных и задач.

Ускоренные вычисления - Обучение | Разработчик NVIDIA

Курс Python «Основы ускоренных вычислений с помощью CUDA» | NVIDIA

Лучшие онлайн-курсы по параллельным вычислениям | Курсера

Лучшие онлайн-курсы по параллельным вычислениям | Удеми

Мастер-класс по научным вычислениям: параллельные и распределенные

Изучите параллельные вычисления на Python | Удеми

Вычисления на графическом процессоре в Vulkan | Удеми

Курсы высокопроизводительных вычислений | Удасити

Курсы параллельных вычислений | Стэнфорд Онлайн

Параллельные вычисления | MIT OpenCourseWare

Многопоточный параллелизм: языки и компиляторы | MIT OpenCourseWare

Параллельные вычисления с CUDA | Плюралсайт

Архитектура высокопроизводительных вычислений и проектирование систем | Интел

Инструменты, библиотеки и платформы параллельных вычислений

MATLAB Parallel Server™ — это инструмент, который позволяет масштабировать программы MATLAB® и симуляции Simulink® в кластеры и облака. Вы можете создавать прототипы своих программ и симуляций на рабочем столе, а затем запускать их в кластерах и облаках без перекодирования. MATLAB Parallel Server поддерживает пакетные задания, интерактивные параллельные вычисления и распределенные вычисления с большими матрицами.

Parallel Computing Toolbox™ — это инструмент, который позволяет решать проблемы с интенсивными вычислениями и данными с использованием многоядерных процессоров, графических процессоров и компьютерных кластеров. Конструкции высокого уровня, такие как параллельные циклы for, специальные типы массивов и распараллеленные числовые алгоритмы, позволяют распараллеливать приложения MATLAB® без программирования CUDA или MPI. Набор инструментов позволяет вам использовать параллельные функции в MATLAB и других наборах инструментов. Вы можете использовать набор инструментов с Simulink® для параллельного запуска нескольких симуляций модели. Программы и модели могут работать как в интерактивном, так и в пакетном режимах.

Статистика и Machine Learning Toolbox™ — это инструмент, который предоставляет функции и приложения для описания, анализа и моделирования данных. Вы можете использовать описательную статистику, визуализацию и кластеризацию для исследовательского анализа данных; подгонять распределения вероятностей к данным; генерировать случайные числа для моделирования Монте-Карло и выполнять проверку гипотез. Алгоритмы регрессии и классификации позволяют делать выводы на основе данных и строить прогнозные модели либо в интерактивном режиме с помощью приложений Classification and Reгрессия Learner, либо программно с помощью AutoML.

OpenMP — это API, который поддерживает многоплатформенное параллельное программирование с общей памятью на C/C++ и Fortran. API OpenMP определяет портативную масштабируемую модель с простым и гибким интерфейсом для разработки параллельных приложений на платформах от настольного компьютера до суперкомпьютера.

CUDA® — это платформа параллельных вычислений и модель программирования, разработанная NVIDIA для общих вычислений на графических процессорах (GPU). С помощью CUDA разработчики могут значительно ускорить вычислительные приложения, используя мощь графических процессоров.

Передача интерфейса сообщений (MPI)-это стандартизированный и портативный стандарт передачи сообщений, предназначенный для функционирования на параллельных вычислительных архитектурах.

Microsoft MPI (MS-MPI)-это реализация Microsoft стандарта передачи интерфейса сообщения для разработки и запуска параллельных приложений на платформе Windows.

Slurm-это бесплатный менеджер рабочей нагрузки с открытым исходным кодом, разработанный специально для удовлетворения требовательных потребностей высокопроизводительных вычислений.

Portable Batch System (PBS) Pro - это быстрый и мощный менеджер рабочей нагрузки, предназначенный для повышения производительности, оптимизации использования и эффективности, а также упростить администрирование для кластеров, облаков и суперкомпьютеров.

AWS ParallelCluster-это инструмент управления кластером с открытым исходным кодом, поддерживаемый AWS, который позволяет вам легко развернуть и управлять высокопроизводительными кластерами вычислений (HPC) на AWS. ParallelCluster использует простой текстовый файл для моделирования и предоставления всех ресурсов, необходимых для ваших приложений HPC в автоматическом и безопасном способе.

Numba-это оптимизирующий компилятор с открытым исходным кодом для Python для Python, спонсируемый Anaconda, Inc.. Он использует проект компилятора LLVM для генерации машинного кода из Python Syntax. Numba может собирать большую подмножество Python с численностью, включая множество функций Numpy. Кроме того, NUMBA поддерживает автоматическую параллелизацию петлей, генерации кода с ускорением графических процессоров, а также создания UFUNCS и C обратных вызовов.

Chainer-это основа на основе глубокого обучения на основе Python, направленная на гибкость. Он обеспечивает автоматическую дифференциацию API, основанные на подходе определяется (динамические вычислительные графики), а также объектно-ориентированные API высокого уровня для создания и обучения нейронных сетей. Он также поддерживает CUDA/CUDNN с использованием Cupy для высокопроизводительных тренировок и вывода.

XGBOOST - это оптимизированная библиотека повышения распределенного градиента, предназначенная для высокоэффективной, гибкой и портативной. Он реализует алгоритмы машинного обучения в рамках повышения градиента. XGBOOST обеспечивает параллельное повышение дерева (также известное как GBDT, GBM), которое быстро и точно решает много проблем с данными. Он поддерживает распределенную подготовку на нескольких машинах, включая AWS, GCE, Azure и пряжу. Кроме того, он может быть интегрирован с Flink, Spark и другими системами облачных данных.

Cuml - это набор библиотек, которые реализуют алгоритмы машинного обучения и математические примитивы, которые разделяют совместимые API с другими проектами Rapids. CUML позволяет ученым, исследователям и инженерам -программистам для данных выполнять традиционные задачи ML на графических процессорах, не вдаваясь в детали программирования CUDA. В большинстве случаев Python API Cuml соответствует API от Scikit-Learn.

Apache Cassandra ™ - это распределенная база данных NOSQL с открытым исходным кодом, доверяя тысячам компаний для масштабируемости и высокой доступности без ущерба для производительности. Cassandra обеспечивает линейную масштабируемость, а проверенный склонность к товарному аппаратному оборудованию или облачной инфраструктуре делает его идеальной платформой для критически важных данных.

Apache Flume является распределенным, надежным и доступным услугами для эффективного сбора, агрегирования и перемещения больших объемов данных о событиях потоковой передачи.

Apache Mesos - это диспетчер кластеров, который обеспечивает эффективную изоляцию ресурсов и совместное использование между распределенными приложениями или структурами. Он может управлять Hadoop, Jenkins, Spark, Aurora и другими рамками на динамически общем пуле узлов.

Apache Hbase ™-это NOSQL с открытым исходным кодом, распределенный хранилище больших данных. Это обеспечивает случайный, строго последовательный доступ в реальном времени к петабайтам данных. Hbase очень эффективен для обработки больших, редких наборов данных. Hbase служит прямым вводом и выводом в структуру Apache MapReduce для Hadoop и работает с Apache Phoenix, чтобы включить SQL-подобные запросы на таблицы Hbase.

Распределенная файловая система Hadoop (HDFS) - это распределенная файловая система, которая обрабатывает большие наборы данных, работающие на товарном оборудовании. Он используется для масштабирования одного кластера Apache Hadoop до сотен (и даже тысяч) узлов. HDFS является одним из основных компонентов Apache Hadoop, остальные - MapReduce и пряжа.

Apache Arrow-это независимый от языка формат столбчатой памяти для плоских и иерархических данных, организованный для эффективных аналитических операций на современном аппаратном обеспечении, таких как процессоры и графические процессоры.

Apache Spark ™-это единый аналитический двигатель для крупномасштабной обработки данных. Он обеспечивает высокоуровневые API в Scala, Java, Python и R, а также оптимизированный двигатель, который поддерживает общие графики вычислений для анализа данных. Он также поддерживает богатый набор инструментов более высокого уровня, включая Spark SQL для SQL и DataFrames, Mllib для машинного обучения, Graphx для обработки графика и структурированную потоковую передачу для обработки потока.

Apache Predictionio - это структура машинного обучения с открытым исходным кодом для разработчиков, ученых данных и конечных пользователей. Он поддерживает сбор событий, развертывание алгоритмов, оценка, запрос прогнозных результатов с помощью API REST. Он основан на масштабируемых услугах с открытым исходным кодом, таким как Hadoop, Hbase (и другие DBS), Elasticsearch, Spark и реализует то, что называется архитектура Lambda.

Microsoft Project Bonsai-это платформа AI с низким кодом, которая ускоряет разработку автоматизации AI, и часть пакета автономных систем от Microsoft. Bonsai используется для создания компонентов искусственного интеллекта, которые могут обеспечить руководство оператора или принимать независимые решения для оптимизации переменных процесса, повышения эффективности производства и сокращения времени простоя.

Диспетчер кластеров для Apache Kafka (CMAK) - это инструмент для управления кластерами Apache Kafka.

BigDL - это распределенная библиотека глубокого обучения для Apache Spark. Благодаря BIGDL пользователи могут писать свои приложения глубокого обучения в качестве стандартных программ Spark, которые могут непосредственно работать на существующих кластерах Spark или Hadoop.

Apache Cassandra ™ - это распределенная база данных NOSQL с открытым исходным кодом, доверяя тысячам компаний для масштабируемости и высокой доступности без ущерба для производительности. Cassandra обеспечивает линейную масштабируемость, а проверенный склонность к товарному аппаратному оборудованию или облачной инфраструктуре делает его идеальной платформой для критически важных данных.

Apache Flume является распределенной, надежной и доступной услугой для эффективного сбора, агрегирования и перемещения больших объемов данных о событиях потоковой передачи.

Apache Mesos - это диспетчер кластеров, который обеспечивает эффективную изоляцию ресурсов и совместное использование между распределенными приложениями или структурами. Он может управлять Hadoop, Jenkins, Spark, Aurora и другими рамками на динамически общем пуле узлов.

Apache Beam-это открытый исходный код, унифицированная модель и набор специфичных для языка SDK для определения и выполнения рабочих процессов обработки данных, а также потоков проглатывания данных и интеграции, поддерживающих моделей интеграции предприятия (EIPS) и специфических для домена языков (DSLS).

Notebook Jupyter-это веб-приложение с открытым исходным кодом, которое позволяет создавать и обмениваться документами, которые содержат живой код, уравнения, визуализации и повествовательный текст. Юпитер широко используется в отраслях, которые делают очистку и преобразование данных, численное моделирование, статистическое моделирование, визуализацию данных, науку данных и машинное обучение.

NEO4J является единственной базой данных графиков корпоративной силой, которая сочетает в себе хранилище нативного графа, расширенную безопасность, масштабируемую скорость-оптимизированную архитектуру и соблюдение кислоты для обеспечения предсказуемости и целостности запросов, основанных на отношениях.

Elasticsearch - это поисковая система, основанная на библиотеке Lucene. Он обеспечивает полнотекстовую поисковую систему с распределенной, способствующей MulteTenant, с веб-интерфейсом HTTP и документами JSON без схемы. Elasticsearch разработан на Java.

Logstash - это инструмент для управления событиями и журналами. При общем использовании термин охватывает более крупную систему сбора журналов, обработки, хранения и поиска.

Kibana - это плагин визуализации данных с открытым исходным кодом для Elasticsearch. Он предоставляет возможности визуализации поверх контента, индексированного в кластере Elasticsearch. Пользователи могут создавать графики стержней, линии и рассеяния, или круговые диаграммы и карты поверх больших объемов данных.

Trino - это распределенный двигатель SQL -запроса для больших данных. Он может значительно ускорить процессы ETL, позволить им все использовать стандартный оператор SQL и работать с многочисленными источниками данных и целей в одной и той же системе.

Извлечение, преобразование и нагрузка (ETL) - это конвейер данных, используемый для сбора данных из различных источников, преобразования данных в соответствии с бизнес -правилами и загрузите их в хранилище данных.

Redis (сервер Demote Dictionary) является открытым исходным кодом (BSD Licensed), хранилище структуры данных в памяти, используемое в качестве базы данных, кеша и брокера сообщений. Он предоставляет структуры данных, такие как строки, хэши, списки, наборы, отсортированные наборы с запросами диапазона, растровыми изображениями, гиперлоглами, геопространственными индексами и потоками.

Apache OpenLP-это библиотека с открытым исходным кодом для инструментария на основе машинного обучения, используемого при обработке текста естественного языка. Он имеет API для вариантов использования, таких как распознавание именованных объектов, обнаружение предложений, тегинга POS (частично-речь), извлечение функций токенизации, подготовка к подготовке, анализ и разрешение Coreference.

Apache Airflow-это платформа управления рабочими процессами с открытым исходным кодом, созданную сообществом для программного автора, планирования и мониторинга рабочих процессов. Установить. Принципы. Масштабируемый. Воздушный поток имеет модульную архитектуру и использует очередь сообщений, чтобы организовать произвольное количество работников. Воздушный поток готов к масштабированию до бесконечности.

Open Neural Network Exchange (ONNX) - это открытая экосистема, которая позволяет разработчикам ИИ выбирать правильные инструменты по мере развития их проекта. ONNX предоставляет формат с открытым исходным кодом для моделей искусственного интеллекта, как глубокого обучения, так и традиционного ML. Он определяет обширную модель графика вычислений, а также определения встроенных операторов и стандартных типов данных.

Apache Mxnet - это глубокая структура обучения, предназначенная как для эффективности, так и для гибкости. Это позволяет вам смешивать символическое и императивное программирование, чтобы максимизировать эффективность и производительность. По своей сути MXNET содержит планировщик динамической зависимости, который автоматически параллелизирует как символические, так и императивные операции на лету. Сложный слой оптимизации графика делает символическим выполнением быстро и памятью эффективным. MXNET является портативным и легким, эффективно масштабируя до нескольких графических процессоров и нескольких машин. Поддержка Python, R, Julia, Scala, Go, JavaScript и многое другое.

Autogluon - это инструментарий для глубокого обучения, который автоматизирует задачи машинного обучения, позволяющее вам легко достичь сильной прогнозирующей производительности в ваших приложениях. Имея всего несколько строк кода, вы можете обучать и развернуть модели глубокого обучения с высокой точностью на таблице, изображения и текстовые данные.

OpenCl Development

Вернуться на вершину

OpenCl Learning Resources

Open Computing Language (OpenCL) является открытым стандартом для параллельного программирования гетерогенных платформ, состоящих из процессоров, графических процессоров и других аппаратных ускорителей, найденных в суперкомпьютерах, облачных серверах, персональных компьютерах, мобильных устройствах и встроенных платформах.

OpenCl | GitHub

Хронос Группа | GitHub

Технологические курсы и обучение Хроноса

Учебники OpenCl - Streamhpc

Введение в инструменты Intel® OpenCl

OpenCl | Nvidia Developer

Введение в OpenCl на курсе FPGAS | Курсера

Компиляция ядра OpenCl к курсу FPGAS | Курсера

Инструменты OpenCl, библиотеки и рамки

Renderdoc-это отдельный графический отладчик, который позволяет быстро и простой однократный захват и подробный самоанализ любого приложения с использованием Vulkan, D3D11, OpenGL & OpenGL ES или D3D12 в Windows, Linux, Android, Stadia или Nintendo Switch ™.

Gpuverify - это инструмент для формального анализа ядер графических процессоров, написанных в OpenCl и CUDA. Инструмент может доказать, что ядра не свободны от определенных типов дефектов, включая гонки данных.

OpenCl ICD Loader - это установленной механизм клиентского драйвера (ICD), который позволяет разработчикам создавать приложения против установленного погрузчика драйвера клиента (загрузчик ICD), а не связывать свои приложения с определенной реализацией OpenCL.

CLBLAS - это программная библиотека, содержащая функции BLAS, написанные в OpenCl.

CLFFT - это программная библиотека, содержащая функции FFT, написанные в OpenCl.

CLSPARSE - это программная библиотека, содержащая разреженные функции, написанные в OpenCl.

CLRNG - это программная библиотека на основе OpenCL, содержащая функции генерации случайных чисел.

CLSMITH-это инструмент, который использует два существующих метода тестирования, случайное дифференциальное тестирование и входы модуля эквивалентности (EMI), применяя их в многоядерной среде, OpenCl. Его основной особенностью является генерация случайных ядер OpenCl, которые используют много особенностей языка. Это также приносит новую идею применения EMI через инъекцию мертвого кода.

Oclgrind - это виртуальный симулятор устройства OpenCl, в том числе время выполнения OpenCl с поддержкой ICD. Цель состоит в том, чтобы предоставить платформу для создания инструментов для помощи в разработке OpenCl. В частности, этот проект в настоящее время реализует утилиты для отладки ошибок доступа к памяти, обнаружения данных и барьерных расходов, сбора гистограмм инструкций и для интерактивной отладки ядра OpenCl. Симулятор построен на интерпретатора для LLVM IR.

Nvidia® NSIGHT ™ Visual Studio Edition - это среда разработки приложений для гетерогенных платформ, которая приводит к вычислению GPU в Microsoft Visual Studio. Nvidia nsight ™ VSE позволяет создавать и отлаживать интегрированные ядра графического процессора и нативный код ЦП, а также проверять состояние графического процессора и памяти.

Radeon ™ GPU Profiler - это инструмент производительности, который может использоваться разработчиками для оптимизации приложений DirectX®12, Vulkan® и OpenCl ™ для оборудования AMD RDNA ™ и GCN.

Radeon ™ GPU Analyzer - это компилятор и инструмент анализа кода для Vulkan®, DirectX®, OpenGL® и OpenCl ™.

AMD Radeon Prorender-это мощный физически основанный на физическом рендеринге, который позволяет творческим специалистам производить потрясающе фотореалистичные изображения практически на любом графическом процессоре, любом процессоре и любой ОС в более чем дюжине ведущих приложений цифрового контента и CAD.

Nvidia Omniverse-это мощная платформа моделирования и совместной работы в режиме реального времени для 3D-производственных трубопроводов, основанной на описании универсальной сцены Pixar и Nvidia RTX.

Intel® SDK для приложений OpenCL ™-это рабочие нагрузки с выгрузкой. Настройте гетерогенные вычислительные приложения и ускорить производительность с помощью программирования на основе ядра.

NVIDIA NGC-это центр для оптимизированного программного обеспечения для графических процессоров для глубокого обучения, машинного обучения и высокопроизводительных рабочих нагрузок (HPC).

Контейнеры NVIDIA NGC-это реестр, который предоставляет исследователям, ученым-данных и разработчикам простой доступ к комплексному каталогу программного обеспечения с ускорением графических процессоров для ИИ, машинного обучения и HPC. Эти контейнеры в полной мере используют графические процессоры NVIDIA и в облаке.

NVIDIA CUDNN-это библиотека примитивов с ускорением GPU для глубоких нейронных сетей. Cudnn предоставляет высоко настроенные реализации для стандартных процедур, таких как прямая и обратная свертка, объединение, нормализация и активационные слои. Cudnn ускоряется широко используемые рамки глубокого обучения, включая Caffe2, Chainer, Keras, Matlab, Mxnet, Pytorch и Tensorflow.

Nvidia Container Toolkit - это коллекция инструментов и библиотек, которые позволяют пользователям создавать и запускать контейнеры Docker с ускоренным графическим процессором. Toolkit включает в себя библиотеку времени выполнения контейнера и утилиты для автоматической настройки контейнеров для использования графических процессоров NVIDIA.

CUDA Development

Вернуться на вершину

CUDA Toolkit. Источник: разработчик NVIDIA CUDA

CUDA Learning Resources

CUDA - это параллельная вычислительная платформа и модель программирования, разработанная NVIDIA для общих вычислений на графических единицах обработки (графические процессоры). С CUDA разработчики могут значительно ускорить вычислительные приложения, используя мощность графических процессоров. В приложениях с ускорением GPU последовательная часть рабочей нагрузки работает на процессоре, которая оптимизирована для однопользованной. Вычислительная интенсивная часть приложения работает на тысячах ядер графических процессоров параллельно. При использовании CUDA разработчики могут программировать на популярных языках, таких как C, C ++, Fortran, Python и Matlab.

КУДА ДОКУМЕНТАЦИЯ НАБОЧКИ

Cuda Quick Start Guide

CUDA на WSL

Поддержка графического процессора CUDA для TensorFlow

NVIDIA Deep Learning Documentation

Облачная документация NVIDIA GPU

NVIDIA NGC-это центр для оптимизированного программного обеспечения для графических процессоров для глубокого обучения, машинного обучения и высокопроизводительных рабочих нагрузок (HPC).

Контейнеры NVIDIA NGC-это реестр, который предоставляет исследователям, ученым-данных и разработчикам простой доступ к комплексному каталогу программного обеспечения с ускорением графических процессоров для ИИ, машинного обучения и HPC. Эти контейнеры в полной мере используют графические процессоры NVIDIA и в облаке.

Библиотеки инструментов CUDA и рамки

CUDA Toolkit-это набор инструментов и библиотек, которые предоставляют среду разработки для создания высокопроизводительных приложений с графическим процессором. CUDA Toolkit позволяет вы можете разработать, оптимизировать и развернуть ваши приложения на встроенных в графических системах встроенных системах, рабочих станциях на рабочем столе, корпоративных центрах обработки данных, облачных платформах и суперкомпьютерах HPC. Toolkit включает в себя библиотеки с ускорением GPU, инструменты отладки и оптимизации, компилятор C/C ++ и библиотеку времени выполнения для создания и развертывания вашего приложения на крупных архитектурах, включая X86,

Расширять

Дополнительная информация