大数据数据分析数据统计数据挖掘的权衡
在大数据领域里,经常会看到例如数据挖掘、OLAP、数据分析等等的专业词汇。如果仅仅从字面上,我们很难说清楚每个词汇的意义和区别。今天,我们就来通过一些大数据在高校应用的例子,来为大家说明白数据挖掘、大数据、OLAP、数据统计的区别。
一、数据分析
数据分析是一个大的概念,理论上任何对数据进行计算、处理从而得出一些有意义的结论的过程,都叫数据分析。从数据本身的复杂程度、以及对数据进行处理的复杂度和深度来看,可以把数据分析分为以下4个层次:数据统计,OLAP,数据挖掘,大数据。
二、数据统计
另外经过Dolby Vision认证的电视内还会加装一套对Dolby Vision内容信号的识别与解码功能 数据统计是最基本、最传统的数据分析,自古有之。是指通过统计学方法对数据进行排序、筛选、运算、统计等处理,从而得出一些有意义的结论。
举例,对全年级学生按照平均成绩从高到低排序,前10%的学生可以获得申请研究生免试资格。
传统的查询和报表工具是告诉你数据库中有什么(What happened)
三、OLAP
联机分析处理(On-Line Analytical Processing,OLAP)是指基于数据仓库的多维统计分析。它允许用户地从多个维度观察某个度量值,从而为决策提供支持。
举例,学校招生时要决定今年在江苏的招生指标,不能简单地参照去年的计划,而是要参考多个维度的数据积累。学校要在这些数据的支持下做出合理的决策。
OLAP更进一步告诉你下一步会怎么样(What next),如果我采取这样的措施又会怎么样(What if)
四、数据挖掘
数据挖掘是指从海量数据中找到人们未知的、可能有用的、隐藏的规则,可以通过关联分析、聚类分析、时序分析等各种算法发现一些无法通过观察图表得出的深层次原因。
举例,学校发现高等数学等主干课的不及格率有逐年上升的趋势,一般认为是学习不认真所致,但做了很多工作效果并不明县,这时通过数据挖掘
针对此可以采取有针对性的管理措施。
五、大数据
大数据是指用现有的计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的数据集。大数据具有规模大、种类杂、快速化、价值密度低等特点(4V特性)。大数据的大是一个相对概念,没有具体标准,如果一定要给一个标准,那么TB通常称为大数据的门槛。
总结
从数据分析的角度来看,目前绝大多数学校的数据应用产品都还处在数据统计和报表分析的阶段,能够实现有效的OLAP分析与数据挖掘的还很少,而能够达到大数据应用阶段的非常少,至少还没有用过有效的大数据集。
湖州治疗包皮过长费用多少钱长沙前列腺炎治疗费用多少钱温州看白癜风医院包头哪家白癜风医院好成都不孕不育医院
昆明治疗白癜风哪好
- 06月21日武侠大狼狗什么意思位置
- 06月21日武侠大白熊犬体臭怎么办如何清除位置
- 06月21日武侠大白熊犬价格一般发达的城市比较贵一点位置
- 06月21日武侠大弹涂鱼的外形特点位置
- 06月21日武侠大家买狗的途径都是哪里位置
- 06月21日武侠大型犬需求和补钙的误区位置
- 06月21日武侠大狗挡在门口撒娇不让女主人离开这下麻烦了位置
- 06月20日武侠合格的苏格兰牧羊犬主人生活中要做到哪些位置
- 06月20日武侠各类狗粮的比较位置
- 06月20日武侠史氏金翅雀鲷吃什么可投喂浮游生物位置
- 06月20日武侠吃狗粮便多为什么位置
- 06月20日武侠吃宵夜捡回来一只小狗没想到它会这个技能位置