Hadoop es una arquitectura de sistema distribuido que es extremadamente tolerante a fallas y está diseñada para implementarse en hardware económico. Introducción de funciones: alta fiabilidad. La capacidad de Hadoop para almacenar y procesar datos bit a bit es digna de confianza. Alta escalabilidad. Hadoop distribuye datos y completa tareas informáticas entre los grupos de ordenadores disponibles, que pueden ampliarse fácilmente a miles de nodos. Eficiencia. Hadoop puede mover datos dinámicamente entre nodos y garantizar el equilibrio dinámico de cada nodo, por lo que la velocidad de procesamiento es muy rápida. Alta tolerancia a fallos. Hadoop puede guardar automáticamente múltiples copias de datos y redistribuir automáticamente las tareas fallidas. bajo costo. En comparación con computadoras todo en uno, almacenes de datos comerciales y mercados de datos como QlikView y Yonghong Z-Suite, hadoop es de código abierto, por lo que el costo del software del proyecto se reducirá considerablemente. Hadoop viene con un marco escrito en lenguaje Java, por lo que es ideal para ejecutarse en plataformas de producción Linux. Las aplicaciones en Hadoop también se pueden escribir en otros lenguajes, como C++.
Expandir