Teste | |
Pacote | |
meta |
pandas é um pacote Python que fornece estruturas de dados rápidas, flexíveis e expressivas, projetadas para tornar o trabalho com dados "relacionais" ou "rotulados" fácil e intuitivo. Seu objetivo é ser o alicerce fundamental de alto nível para fazer análises práticas de dados do mundo real em Python. Além disso, tem o objetivo mais amplo de se tornar a ferramenta de análise/manipulação de dados de código aberto mais poderosa e flexível disponível em qualquer idioma . Já está bem encaminhado em direção a esse objetivo.
Principais recursos
Onde conseguir
Dependências
Instalação a partir de fontes
Licença
Documentação
Fundo
Obtendo ajuda
Discussão e Desenvolvimento
Contribuindo para os pandas
Aqui estão apenas algumas das coisas que os pandas fazem bem:
Fácil manuseio de dados ausentes (representados como NaN
, NA
ou NaT
) em dados de ponto flutuante e também em dados de ponto não flutuante
Mutabilidade de tamanho: colunas podem ser inseridas e excluídas do DataFrame e de objetos de dimensões superiores
Alinhamento de dados automático e explícito: os objetos podem ser alinhados explicitamente a um conjunto de rótulos, ou o usuário pode simplesmente ignorar os rótulos e deixar Series
, DataFrame
, etc.
Funcionalidade de agrupamento poderosa e flexível para executar operações de divisão, aplicação e combinação em conjuntos de dados, tanto para agregar quanto para transformar dados
Facilite a conversão de dados irregulares e indexados de forma diferente em outras estruturas de dados Python e NumPy em objetos DataFrame
Fatiamento inteligente baseado em rótulos, indexação sofisticada e subconjunto de grandes conjuntos de dados
Mesclagem e junção intuitiva de conjuntos de dados
Remodelação e dinamização flexíveis de conjuntos de dados
Rotulagem hierárquica de eixos (possível ter vários rótulos por tick)
Ferramentas robustas de IO para carregar dados de arquivos simples (CSV e delimitados), arquivos Excel , bancos de dados e salvar/carregar dados do formato HDF5 ultrarrápido
Funcionalidade específica de série temporal : geração de intervalo de datas e conversão de frequência, estatísticas de janela móvel, mudança de data e atraso
O código-fonte está atualmente hospedado no GitHub em: https://github.com/pandas-dev/pandas
Os instaladores binários para a versão mais recente estão disponíveis no Python Package Index (PyPI) e no Conda.
# condaconda install -c conda-forge pandas
# ou PyPIpip instala pandas
A lista de alterações nos pandas entre cada lançamento pode ser encontrada aqui. Para obter detalhes completos, consulte os logs de commit em https://github.com/pandas-dev/pandas.
NumPy - Adiciona suporte para matrizes grandes e multidimensionais, matrizes e funções matemáticas de alto nível para operar nessas matrizes
python-dateutil – Fornece extensões poderosas para o módulo datetime padrão
pytz - Traz o banco de dados Olson tz para Python, o que permite cálculos precisos e de fuso horário entre plataformas
Consulte as instruções completas de instalação para versões mínimas suportadas de dependências obrigatórias, recomendadas e opcionais.
Para instalar o pandas a partir do código-fonte, você precisa do Cython além das dependências normais acima. Cython pode ser instalado a partir do PyPI:
pip instalar cython
No diretório pandas
(o mesmo onde você encontrou este arquivo após clonar o repositório git), execute:
instalação do pip.
ou para instalação em modo de desenvolvimento:
python -m pip instalar -ve. --no-build-isolation -Ceditável-verbose=true
Veja as instruções completas para instalação a partir da fonte.
BSD3
A documentação oficial está hospedada em PyData.org.
O trabalho com pandas
começou no AQR (um fundo de hedge quantitativo) em 2008 e tem estado em desenvolvimento ativo desde então.
Para questões de uso, o melhor lugar para ir é StackOverflow. Além disso, perguntas e discussões gerais também podem ocorrer na lista de discussão pydata.
A maioria das discussões de desenvolvimento ocorre no GitHub neste repositório, por meio do rastreador de problemas do GitHub.
Além disso, a lista de discussão pandas-dev também pode ser usada para discussões especializadas ou questões de design, e um canal do Slack está disponível para perguntas relacionadas ao desenvolvimento rápido.
Há também reuniões comunitárias frequentes para mantenedores de projetos abertas à comunidade, bem como reuniões mensais de novos contribuidores para ajudar a apoiar novos contribuidores.
Informações adicionais sobre os canais de comunicação podem ser encontradas na página da comunidade de colaboradores.
Todas as contribuições, relatórios de bugs, correções de bugs, melhorias na documentação, melhorias e ideias são bem-vindas.
Uma visão geral detalhada sobre como contribuir pode ser encontrada no guia de contribuição .
Se você deseja simplesmente começar a trabalhar com a base de código do pandas, navegue até a guia "problemas" do GitHub e comece a examinar problemas interessantes. Há vários problemas listados em Documentos e um bom primeiro problema por onde você pode começar.
Você também pode fazer a triagem de problemas que podem incluir a reprodução de relatórios de bugs ou a solicitação de informações vitais, como números de versão ou instruções de reprodução. Se você quiser começar a triagem de problemas, uma maneira fácil de começar é assinar o pandas no CodeTriage.
Ou talvez através do uso do pandas você tenha uma ideia própria ou esteja procurando algo na documentação e pensando 'isso pode ser melhorado'... você pode fazer algo a respeito!
Sinta-se à vontade para fazer perguntas na lista de discussão ou no Slack.
Como contribuidores e mantenedores deste projeto, espera-se que você cumpra o código de conduta dos pandas. Mais informações podem ser encontradas em: Código de Conduta do Colaborador
Ir para o topo