sierra de mesa
Descripción general
Tablesaw es una biblioteca de visualización y marcos de datos que admite la carga, limpieza, transformación, filtrado y resumen de datos. Si trabaja con datos en Java, puede ahorrarle tiempo y esfuerzo. Tablesaw también admite estadísticas descriptivas y se puede utilizar para preparar datos para trabajar con bibliotecas de aprendizaje automático como Smile, Tribuo, H20.ai, DL4J.
Características de la sierra de mesa
Procesamiento y transformación de datos
- Importe datos desde archivos de texto RDBMS, Excel, CSV, TSV, JSON, HTML o de ancho fijo, ya sean locales o remotos (http, S3, etc.)
- Exporte datos a archivos CSV, JSON, HTML o de ancho fijo.
- Combine tablas agregando o uniendo
- Agregar y eliminar columnas o filas
- Ordenar, agrupar, filtrar, editar, transponer, etc.
- Operaciones de mapa/reducción
- Manejar valores faltantes
Visualización
Tablesaw admite la visualización de datos al proporcionar un contenedor para la biblioteca de trazado JavaScript Plot.ly. A continuación se muestran algunos ejemplos de la nueva biblioteca en acción.
Estadística
- Estadísticas descriptivas: media, mínimo, máximo, mediana, suma, producto, desviación estándar, varianza, percentiles, media geométrica, asimetría, curtosis, etc.
Empezando
Agregue tablesaw-core a su proyecto. Puede encontrar el número de versión de la última versión en las notas de la versión:
< dependency >
< groupId >tech.tablesaw</ groupId >
< artifactId >tablesaw-core</ artifactId >
< version >VERSION_NUMBER_GOES_HERE</ version >
</ dependency >
También puede agregar proyectos de apoyo:
-
tablesaw-beakerx
- para usar Tablesaw dentro de BeakerX -
tablesaw-excel
: para usar libros de Excel -
tablesaw-html
- para usar HTML -
tablesaw-json
- para usar JSON -
tablesaw-jsplot
- para crear gráficos
Proyectos de apoyo externo - fuera de esta organización :
- tablesaw-parquet: para usar el formato de archivo Apache Parquet con Tablesaw (informar problema)
Documentación y soporte
- Comience aquí: https://jtablesaw.github.io/tablesaw/gettingstarted
- Luego consulte nuestra página de documentación: https://jtablesaw.github.io/tablesaw/ y la Guía del usuario de Tablesaw.
- Haga preguntas, haga sugerencias o cuéntenos cómo utiliza Tablesaw en el nuevo foro de discusiones de GitHub.
- Las solicitudes de funciones y los informes de errores se pueden realizar en la pestaña de problemas.
Integraciones
Cuadernos Jupyter
- Recomendamos probar Tablesaw dentro de los cuadernos Jupyter, que le permiten experimentar con Tablesaw de una manera más interactiva. Comience instalando BeakerX y probando el cuaderno Tablesaw de muestra.
- Una segunda forma de utilizar Tablesaw dentro de los portátiles Jupyter es con IJava, que tiene soporte integrado para Tablesaw. Gary Sharpe ha escrito un excelente tutorial que le muestra cómo utilizar los gráficos de Tablesaw. Gary ha escrito varios otros tutoriales que presentan Tablesaw:
- Datos ordenados con Java y Jupyter
- Marcos de datos con Tablesaw - JSON
- Marcos de datos con Tablesaw: archivos CSV
- Un tercer enfoque es utilizar Google Colab. Nuevamente, Gary Sharpe tiene un excelente tutorial: Introducción a los marcos de datos utilizando Java y Google Colab
Otras integraciones
- Los usos de Eclipse pueden resultar útiles para etablesaw. Proporciona integración de Eclipse destinada a convertir Eclipse en un banco de trabajo de datos.
- Puede utilizar Tablesaw con muchas bibliotecas de aprendizaje automático. Para ver un ejemplo del uso de Tablesaw con Smile, consulte el cuaderno de muestra de Tablesaw Jupyter.
- Puede utilizar quandl4j-tablesaw si desea cargar datos financieros y económicos de Quandl en Tablesaw. Esto también se demuestra en el cuaderno de muestra de Tablesaw.