Hadoop est une architecture système distribuée extrêmement tolérante aux pannes et conçue pour être déployée sur du matériel peu coûteux. Introduction de la fonction : haute fiabilité. La capacité de Hadoop à stocker et traiter les données petit à petit est digne de confiance. Haute évolutivité. Hadoop distribue les données et effectue des tâches informatiques entre les clusters d'ordinateurs disponibles, qui peuvent être facilement étendus à des milliers de nœuds. Efficacité. Hadoop peut déplacer dynamiquement les données entre les nœuds et assurer l'équilibre dynamique de chaque nœud, de sorte que la vitesse de traitement est très rapide. Haute tolérance aux pannes. Hadoop peut enregistrer automatiquement plusieurs copies de données et redistribuer automatiquement les tâches ayant échoué. faible coût. Comparé aux ordinateurs tout-en-un, aux entrepôts de données commerciaux et aux datamarts tels que QlikView et Yonghong Z-Suite, hadoop est open source, le coût logiciel du projet sera donc considérablement réduit. Hadoop est livré avec un framework écrit en langage Java, il est donc idéal pour fonctionner sur les plates-formes de production Linux. Les applications sur Hadoop peuvent également être écrites dans d'autres langages, tels que C++.
Développer