Serra de mesa
Visão geral
Tablesaw é uma biblioteca de dataframe e visualização que suporta carregamento, limpeza, transformação, filtragem e resumo de dados. Se você trabalhar com dados em Java, poderá economizar tempo e esforço. O Tablesaw também oferece suporte a estatísticas descritivas e pode ser usado para preparar dados para trabalhar com bibliotecas de aprendizado de máquina como Smile, Tribuo, H20.ai, DL4J.
Recursos da serra de mesa
Processamento e transformação de dados
- Importe dados de arquivos de texto RDBMS, Excel, CSV, TSV, JSON, HTML ou largura fixa, sejam eles locais ou remotos (http, S3, etc.)
- Exporte dados para arquivos CSV, JSON, HTML ou largura fixa.
- Combine tabelas anexando ou juntando
- Adicionar e remover colunas ou linhas
- Classificar, agrupar, filtrar, editar, transpor, etc.
- Operações de Mapear/Reduzir
- Lidar com valores ausentes
Visualização
O Tablesaw oferece suporte à visualização de dados, fornecendo um wrapper para a biblioteca de plotagem JavaScript Plot.ly. Aqui estão alguns exemplos da nova biblioteca em ação.
Estatísticas
- Estatísticas descritivas: média, mínimo, máximo, mediana, soma, produto, desvio padrão, variância, percentis, média geométrica, assimetria, curtose, etc.
Começando
Adicione tablesaw-core ao seu projeto. Você pode encontrar o número da versão mais recente nas notas de versão:
< dependency >
< groupId >tech.tablesaw</ groupId >
< artifactId >tablesaw-core</ artifactId >
< version >VERSION_NUMBER_GOES_HERE</ version >
</ dependency >
Você também pode adicionar projetos de apoio:
-
tablesaw-beakerx
- para usar o Tablesaw dentro do BeakerX -
tablesaw-excel
- para usar pastas de trabalho do Excel -
tablesaw-html
- para usar HTML -
tablesaw-json
- para usar JSON -
tablesaw-jsplot
- para criar gráficos
Projetos de apoio externos - fora desta organização :
- tablesaw-parquet - para usar o formato de arquivo Apache Parquet com Tablesaw (relatar problema)
Documentação e suporte
- Comece aqui: https://jtablesaw.github.io/tablesaw/gettingstarted
- Então consulte nossa página de documentação: https://jtablesaw.github.io/tablesaw/ e o Guia do usuário do Tablesaw.
- Faça perguntas, faça sugestões ou conte-nos como você está usando o Tablesaw no novo fórum de discussões do GitHub.
- Solicitações de recursos e relatórios de bugs podem ser feitos na guia de problemas.
Integrações
Cadernos Jupyter
- Recomendamos experimentar o Tablesaw dentro de notebooks Jupyter, que permite experimentar o Tablesaw de uma maneira mais interativa. Comece instalando o BeakerX e experimentando o notebook Tablesaw de amostra
- Uma segunda maneira de usar o Tablesaw dentro de notebooks Jupyter é com IJava, que possui suporte integrado para Tablesaw. Gary Sharpe escreveu um excelente tutorial que mostra como usar gráficos do Tablesaw. Gary escreveu vários outros tutoriais que apresentam o Tablesaw:
- Dados organizados com Java e Jupyter
- Dataframes com Tablesaw – JSON
- Dataframes com Tablesaw — Arquivos CSV
- Uma terceira abordagem é usar o Google Colab. Novamente, Gary Sharpe tem um excelente tutorial:Introdução a Dataframes usando Java e Google Colab
Outras integrações
- Os usos do Eclipse podem achar o etablesaw útil. Ele fornece integração do Eclipse com o objetivo de transformar o Eclipse em um ambiente de trabalho de dados.
- Você pode utilizar o Tablesaw com muitas bibliotecas de aprendizado de máquina. Para ver um exemplo de uso do Tablesaw com Smile, confira o exemplo do notebook Tablesaw Jupyter
- Você pode usar quandl4j-tablesaw se quiser carregar dados financeiros e econômicos do Quandl no Tablesaw. Isso também é demonstrado no exemplo do notebook Tablesaw