张会作品
什么是大数据 |
大数据
张会作品
特征
数据体量巨大
数据类型多样
处理速度快
价值密度低
应用领域
大规模并行处理数据库
数据挖掘电网
分布式文件系统
分布式数据库
云计算平台
互联网
可扩展的存储系统
面临的存储问题
容量问题
延迟问题
安全问题
成本问题
数据的积累
应用感知
灵活性问题
定义
巨型数据集组成
有限时间内常规工具难处理
大量高速多变的信息资产
作用
新一代信息技术融合应用的结点
信息产业持续高速增长的新引擎
对其的利用将成为提高核心竞争力的关键因素
将引起科学研究手段的重大改变
分析理论基础
可视化分析
数据挖掘算法
预测性分析
语义引擎
数据质量和数据管理
处理环节
采集
导入/预处理
统计/分析
挖掘