Download cuda samples - download de código fonte cuda samples

cuda samples

Outro código-fonte

v12.5

Baixar

Amostras CUDA

Amostras para desenvolvedores CUDA que demonstram recursos do CUDA Toolkit. Esta versão suporta CUDA Toolkit 12.5.

Notas de versão

Esta seção descreve as notas de lançamento dos exemplos CUDA somente no GitHub.

CUDA 12.5

versões mais antigas...

Começando

Pré-requisitos

Baixe e instale o CUDA Toolkit 12.5 para sua plataforma correspondente. Para obter os requisitos do sistema e as instruções de instalação do kit de ferramentas cuda, consulte o Guia de instalação do Linux e o Guia de instalação do Windows.

Obtendo as amostras CUDA

Usando git, clone o repositório de amostras CUDA usando o comando abaixo.

 git clone https://github.com/NVIDIA/cuda-samples.git

Sem usar o git, a maneira mais fácil de usar esses exemplos é baixar o arquivo zip que contém a versão atual clicando no botão "Baixar ZIP" na página do repositório. Você pode então descompactar todo o arquivo e usar as amostras.

Construindo amostras CUDA

Windows

Os exemplos do Windows são criados usando o IDE do Visual Studio. Arquivos de solução (.sln) são fornecidos para cada versão compatível do Visual Studio, usando o formato:

 *_vs<version>.sln - for Visual Studio <version>

Arquivos de solução de amostras completos existem no diretório pai do repositório:

Cada amostra individual possui seu próprio conjunto de arquivos de solução em: <CUDA_SAMPLES_REPO>Samples<sample_dir>

Para construir/examinar todas as amostras de uma vez, os arquivos completos da solução devem ser usados. Para construir/examinar uma única amostra, os arquivos de solução de amostra individuais devem ser usados.

Linux

As amostras do Linux são construídas usando makefiles. Para usar os makefiles, altere o diretório atual para o diretório de amostra que você deseja construir e execute make:

 $ cd <sample_dir>
$ make

Os makefiles de amostras podem tirar vantagem de certas opções:

TARGET_ARCH= - compilação cruzada visando uma arquitetura específica. As arquiteturas permitidas são x86_64, ppc64le, armv7l, aarch64. Por padrão, TARGET_ARCH é configurado como HOST_ARCH. Em uma máquina x86_64, não configurar TARGET_ARCH é equivalente a configurar TARGET_ARCH=x86_64.
$ make TARGET_ARCH=x86_64
$ make TARGET_ARCH=ppc64le
$ make TARGET_ARCH=armv7l
$ make TARGET_ARCH=aarch64
Veja aqui mais detalhes sobre a compilação multiplataforma de amostras CUDA.
dbg=1 – construir com símbolos de depuração
```
 $ make dbg=1
```
SMS="AB ..." - substitui as arquiteturas SM para as quais a amostra será construída, onde "AB ..." é uma lista delimitada por espaço de arquiteturas SM. Por exemplo, para gerar SASS para SM 50 e SM 60, use SMS="50 60" .
```
 $ make SMS="50 60"
```
HOST_COMPILER=<host_compiler> - substitui o compilador host g++ padrão. Consulte o Guia de instalação do Linux para obter uma lista de compiladores host suportados.
```
 $ make HOST_COMPILER=g++
```

Lista de amostras

0. Introdução

Amostras básicas de CUDA para iniciantes que ilustram os principais conceitos do uso de CUDA e APIs de tempo de execução CUDA.

1. Utilitários

Amostras de utilitários que demonstram como consultar os recursos do dispositivo e medir a largura de banda da GPU/CPU.

2. Conceitos e Técnicas

Amostras que demonstram conceitos relacionados a CUDA e técnicas comuns de resolução de problemas.

3. Recursos CUDA

Amostras que demonstram recursos CUDA (grupos cooperativos, paralelismo dinâmico CUDA, gráficos CUDA, etc.).

4. Bibliotecas CUDA

Amostras que demonstram como usar bibliotecas da plataforma CUDA (NPP, NVJPEG, NVGRAPH cuBLAS, cuFFT, cuSPARSE, cuSOLVER e cuRAND).

5. Específico do domínio

Amostras específicas do domínio (Gráficos, Finanças, Processamento de Imagens).

6. Desempenho

Amostras que demonstram otimização de desempenho.

7.libNVVM

Amostras que demonstram o uso de libNVVVM e NVVM IR.

Dependências

Alguns exemplos de CUDA dependem de aplicativos e/ou bibliotecas de terceiros, ou de recursos fornecidos pelo kit de ferramentas e driver CUDA, para compilar ou executar. Essas dependências estão listadas abaixo.

Se uma amostra tiver uma dependência de terceiros que esteja disponível no sistema, mas não esteja instalada, a amostra será renunciada no momento da construção.

As dependências de cada amostra estão listadas na seção Dependências do README.

Dependências de terceiros

Essas dependências de terceiros são exigidas por alguns exemplos de CUDA. Se disponíveis, essas dependências são instaladas automaticamente em seu sistema ou podem ser instaladas por meio do gerenciador de pacotes do seu sistema (Linux) ou de um site de terceiros.

Imagem grátis

FreeImage é uma biblioteca de imagens de código aberto. O FreeImage geralmente pode ser instalado no Linux usando o sistema gerenciador de pacotes da sua distribuição. O FreeImage também pode ser baixado do site do FreeImage.

Para configurar o FreeImage em um sistema Windows, extraia a distribuição DLL do FreeImage na pasta ../../../Common/FreeImage/Dist/x64 de forma que contenha os arquivos .h e .lib. Copie o arquivo .dll para a pasta bin/win64/Debug e bin/win64/Release no nível raiz.

Interface de passagem de mensagens

MPI (Message Passing Interface) é uma API para comunicação de dados entre processos distribuídos. Um compilador MPI pode ser instalado usando o sistema gerenciador de pacotes da sua distribuição Linux. Também está disponível em alguns recursos online, como Open MPI. No Windows, para construir e executar aplicativos MPI-CUDA pode-se instalar o MS-MPI SDK.

Apenas 64 bits

Algumas amostras só podem ser executadas em um sistema operacional de 64 bits.

DirectX

DirectX é uma coleção de APIs projetadas para permitir o desenvolvimento de aplicações multimídia em plataformas Microsoft. Para plataformas Microsoft, o driver CUDA da NVIDIA oferece suporte a DirectX. Vários exemplos CUDA para Windows demonstram a interoperabilidade CUDA-DirectX. Para construir tais exemplos, é necessário instalar o Microsoft Visual Studio 2012 ou superior, que fornece o Microsoft Windows SDK para Windows 8.

DirectX12

DirectX 12 é uma coleção de APIs de programação avançadas de baixo nível que podem reduzir a sobrecarga do driver, projetada para permitir o desenvolvimento de aplicativos multimídia em plataformas Microsoft a partir do sistema operacional Windows 10. Para plataformas Microsoft, o driver CUDA da NVIDIA oferece suporte a DirectX. Poucas amostras CUDA para Windows demonstram interoperabilidade CUDA-DirectX12. Para construir tais amostras é necessário instalar o SDK do Windows 10 ou superior, com VS 2015 ou VS 2017.

OpenGL

OpenGL é uma biblioteca gráfica usada para renderização 2D e 3D. Em sistemas que suportam OpenGL, a implementação OpenGL da NVIDIA é fornecida com o driver CUDA.

OpenGL ES

OpenGL ES é uma biblioteca gráfica de sistemas embarcados usada para renderização 2D e 3D. Em sistemas que suportam OpenGL ES, a implementação OpenGL ES da NVIDIA é fornecida com o driver CUDA.

Vulcano

Vulkan é uma API de computação e gráficos 3D multiplataforma e de baixa sobrecarga. Vulkan tem como alvo aplicações gráficas 3D em tempo real de alto desempenho, como videogames e mídia interativa em todas as plataformas. Em sistemas que suportam Vulkan, a implementação Vulkan da NVIDIA é fornecida com o driver CUDA. Para construir e executar aplicativos Vulkan é necessário instalar o Vulkan SDK.

OpenMP

OpenMP é uma API para programação de multiprocessamento. OpenMP pode ser instalado usando o sistema gerenciador de pacotes da sua distribuição Linux. Geralmente vem pré-instalado com o GCC. Também pode ser encontrado no site do OpenMP.

Tela

Screen é um sistema de janelas encontrado no sistema operacional QNX. A tela geralmente é encontrada como parte do sistema de arquivos raiz.

X11

X11 é um sistema de janelas comumente encontrado em sistemas operacionais estilo *-nix. O X11 pode ser instalado usando o gerenciador de pacotes da sua distribuição Linux e vem pré-instalado em sistemas Mac OS X.

EGL

EGL é uma interface entre APIs de renderização Khronos (como OpenGL, OpenGL ES ou OpenVG) e o sistema de janelas da plataforma nativa subjacente.

Saída EGL

EGLOutput é um conjunto de extensões EGL que permitem que o EGL seja renderizado diretamente no display.

EGLSync

EGLSync é um conjunto de extensões EGL que fornece objetos de sincronização que são primitivos de sincronização, representando eventos cuja conclusão pode ser testada ou aguardada.

NVSCI

NvSci é um conjunto de bibliotecas de interface de comunicação a partir das quais CUDA interopera com NvSciBuf e NvSciSync. NvSciBuf permite que aplicativos aloquem e troquem buffers na memória. NvSciSync permite que aplicativos gerenciem objetos de sincronização que coordenam quando as sequências de operações começam e terminam.

NvMedia

NvMedia fornece processamento poderoso de dados multimídia para verdadeira aceleração de hardware em dispositivos NVIDIA Tegra. Os aplicativos aproveitam a Interface de Programação de Aplicativo (API) NvMedia para processar os dados de imagem e vídeo.

Recursos CUDA

Esses recursos CUDA são necessários para alguns exemplos de CUDA. Eles são fornecidos pelo CUDA Toolkit ou pelo CUDA Driver. Alguns recursos podem não estar disponíveis no seu sistema.

Rotinas de retorno de chamada CUFFT

As rotinas de retorno de chamada CUFFT são rotinas de kernel fornecidas pelo usuário que o CUFFT chamará ao carregar ou armazenar dados. Essas rotinas de retorno de chamada estão disponíveis apenas em sistemas Linux x86_64 e ppc64le.

Paralelismo Dinâmico CUDA

CDP (CUDA Dynamic Parallelism) permite que kernels sejam iniciados a partir de threads em execução na GPU. O CDP está disponível apenas em GPUs com arquitetura SM 3.5 ou superior.

Grupos Cooperativos Multibloco

Multi Block Cooperative Groups (MBCG) estende os Grupos Cooperativos e o modelo de programação CUDA para expressar a sincronização entre threads e blocos. MBCG está disponível em GPUs com arquitetura Pascal e superior.

Grupos Cooperativos Multi-Dispositivos

Os Grupos Cooperativos de Vários Dispositivos estendem os Grupos Cooperativos e o modelo de programação CUDA, permitindo que blocos de threads em execução em várias GPUs cooperem e sincronizem à medida que são executados. Este recurso está disponível em GPUs com arquitetura Pascal e superior.

CUBLAS

CUBLAS (CUDA Basic Linear Algebra Subroutines) é uma versão acelerada por GPU da biblioteca BLAS.

Comunicação entre processos CUDA

IPC (Interprocess Communication) permite que processos compartilhem ponteiros de dispositivos.

PUNHO

CUFFT (CUDA Fast Fourier Transform) é uma biblioteca FFT acelerada por GPU.

CURAND

CURAND (CUDA Random Number Generation) é uma biblioteca RNG acelerada por GPU.

CUSPARSE

CUSPARSE (CUDA Sparse Matrix) fornece sub-rotinas de álgebra linear usadas para cálculos de matrizes esparsas.

CLIENTE

A biblioteca CUSOLVER é um pacote de alto nível baseado nas bibliotecas CUBLAS e CUSPARSE. Ele combina três bibliotecas separadas sob um único guarda-chuva, cada uma das quais pode ser usada independentemente ou em conjunto com outras bibliotecas de kits de ferramentas. A intenção do CUSOLVER é fornecer recursos úteis do tipo LAPACK, como fatoração de matriz comum e rotinas de resolução triangular para matrizes densas, um solucionador de mínimos quadrados esparsos e um solucionador de autovalores. Além disso, o cuSolver fornece uma nova biblioteca de refatoração útil para resolver sequências de matrizes com um padrão de dispersão compartilhado.

Central nuclear

NPP (NVIDIA Performance Primitives) fornece funções de processamento de imagem, vídeo e sinal aceleradas por GPU.

NVGRÁFICO

NVGRAPH é uma biblioteca de análise gráfica acelerada por GPU.

NVJPEG

A biblioteca NVJPEG fornece funcionalidade de decodificação JPEG acelerada por GPU de alto desempenho para formatos de imagem comumente usados em aplicativos de aprendizagem profunda e multimídia de hiperescala.

NVRTC

NVRTC (CUDA RunTime Compilation) é uma biblioteca de compilação de tempo de execução para CUDA C++.

Prioridades de transmissão

Stream Priorities permite a criação de streams com prioridades especificadas. Stream Priorities está disponível apenas em GPUs com arquitetura SM 3.5 ou superior.

Memória Virtual Unificada

UVM (Memória Virtual Unificada) permite memória que pode ser acessada pela CPU e GPU sem cópia explícita entre as duas. UVM está disponível apenas em sistemas Linux e Windows.

Ponto flutuante de 16 bits

FP16 é um formato de ponto flutuante de 16 bits. Um bit é usado para o sinal, cinco bits para o expoente e dez bits para a mantissa.

C++11CUDA

Suporte NVCC de recursos do C++ 11.

CMake

As amostras libNVVM são criadas usando CMake 3.10 ou posterior.

Guia para colaboradores

Agradecemos sua opinião sobre questões e sugestões de amostras. No momento não estamos aceitando contribuições do público, volte aqui à medida que evoluímos nosso modelo de contribuição.

Usamos o Guia de estilo C++ do Google para todas as fontes https://google.github.io/styleguide/cppguide.html

Perguntas frequentes

As respostas às perguntas mais frequentes sobre CUDA podem ser encontradas em http://developer.nvidia.com/cuda-faq e nas Notas de versão do CUDA Toolkit.

Referências

Guia de programação CUDA
Blog de computação acelerada

Atribuições

A imagem do bule foi obtida da Wikimedia e está licenciada sob a licença Creative Commons Attribution-Share Alike 2.0 Generic. A imagem é modificada para exemplos de casos de uso.

Expandir

Informações adicionais

Versão v12.5
Tipo Outro código-fonte
Data da Última Atualização 2024-12-30
tamanho 139.82MB
Vindo de Github

Aplicativos Relacionados

azure search python samples

2024-11-05
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos