Handoop教程
现状分析(现在)、实时分析(流式处理,秒级别、毫秒级别)
原因分析(过去)、离线分析(批处理)
预测分析(机器学习)
数据分析的基本步骤:(采集、处理、分析、应用)
明确分析目的和思路(分析框架体系化)
数据收集
数据(预)处理(变成干净规整的结构化数据)
数据分析
数据展现
报告撰写
大数据5V特征:
Volume,数据体量大
Variety,种类、来源多样化
Value,低价值密度
Velocity,速度快
Veracity,数据的质量
分布式:多台机器,每台机器上部署不同组件。
集群:多台机器,每台机器部署相同组件。

Author: Jcwang
Permalink: http://example.com/2022/11/29/handoop/