Handoop

Article Directory

Handoop教程

现状分析(现在)、实时分析(流式处理,秒级别、毫秒级别)

原因分析(过去)、离线分析(批处理)

预测分析(机器学习)

数据分析的基本步骤:(采集、处理、分析、应用)

明确分析目的和思路(分析框架体系化)

数据收集

数据(预)处理(变成干净规整的结构化数据)

数据分析

数据展现

报告撰写

大数据5V特征:

Volume,数据体量大

Variety,种类、来源多样化

Value,低价值密度

Velocity,速度快

Veracity,数据的质量

分布式:多台机器,每台机器上部署不同组件。

集群:多台机器,每台机器部署相同组件。

![Screenshot2022-11-29at20.47.43](https://gitee.com/JiaChengCC/u-pic-chart-bed/raw/master/uPic/Screenshot 2022-11-29 at 20.47.43.png)

Author: Jcwang

Permalink: http://example.com/2022/11/29/handoop/