大数据包含数据收集、数据存取、基础架构、数据处理、统计分析、数据挖掘、模型预测、结果呈现。在大数据的生命周期中,数据采集处于第一个环节。根据mapreduce产生数据的应用系统分类,大数据的采集主要有4种来源:管理信息系统、web信息系统、物理信息系统、科学实验系统。
微信 分享