大数据平台运维(hadoop入门(保姆篇))----概述及基本环境配置(HA-1)

2022.12.4 大数据运维基础篇 本章主要是基础坏境配置

目录

前言

适用于大数据平台运维 1+x证书等

一、hadoop是什么? 1.1 Hadoop 是什么

(1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构

(2)主要解决海量数据的存储和海量数据的分析计算问题

(3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈

1.2 Hadoop 优势

(1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。

(2)高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。

(3)高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。

(4)高容错性:能够自动将失败的任务重新分配。

1.3 Hadoop 组成

图片[1]-大数据平台运维(hadoop入门(保姆篇))----概述及基本环境配置(HA-1)-JieYingAI捷鹰AI

版权声明:本文为CSDN博主「@从一到无穷大」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接: 二、大数据技术体系

图片[2]-大数据平台运维(hadoop入门(保姆篇))----概述及基本环境配置(HA-1)-JieYingAI捷鹰AI

图中涉及的技术名词解释如下:

(1)Sqoop:Sqoop 是一款开源的工具,主要用于在Hadoop、Hive 与传统的数据库(MySQL&#

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享