加入收藏 | 设为首页 | 会员中心 | 我要投稿 柳州站长网 (https://www.0772zz.cn/)- 基础存储、数据迁移、云安全、数据计算、数据湖!
当前位置: 首页 > 大数据 > 正文

秒懂数据挖掘,玩转数据分析的高级应用很容易

发布时间:2021-06-05 13:35:33 所属栏目:大数据 来源:互联网
导读:什么是数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但有潜在的有用信息和知识的过程。 秒懂数据挖掘,玩转数据分析的高级应用不在话下 可以看出,数据挖掘是一个过程结果的称谓,即主要目
什么是数据挖掘
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但有潜在的有用信息和知识的过程。
秒懂数据挖掘,玩转数据分析的高级应用不在话下
可以看出,数据挖掘是一个过程结果的称谓,即主要目标是从数据中挖取隐藏的信息。它是一个交叉科学领域,受多个学科影响,包括数据库系统、统计、机器学习、可视化和信息科学。
数据挖掘与商业智能的关系
举个简单点的例子:
通过统计购买某产品的人大多数来自北京,则北京是该产品的主要消费者居住的城市,这就是用的商业智能技术。
要从100000人中找出100个购买某产品概率比较大的客户,则可以通过利用统计方法建立数学模型找到这群人,而这就要用数据挖掘技术。
秒懂数据挖掘,玩转数据分析的高级应用不在话下
也就是说:
商业智能就是目标明确的创建统计分析报表,根据统计结果,提供商业决策支持,输入的是数据,输出的是信息。
数据挖掘则是透过数据的表象发现隐藏在背后的蛛丝马迹,从而找到潜伏的规律以及看似无关事物之间背后的联系,用此来洞察或预测未知事项,输入的是数据,输出的是知识。
利用数据挖掘技术,对大量的业务数进行探索和分析揭示隐藏的、未知的规律,是商业智能的高级应用。
数据挖掘能解决哪些问题
根据数据挖掘的应用方向,常见的数据挖掘能解决的问题体现在下面几个方面。
1. 分类与回归
分类根据样本数据中标记的类别对原数据进行分类总结,进而也可以预测未来数据的归类。
回归是确定一种或多种变量间相互依赖关系的一种统计分析方法。
分类与回归本质上解决的都是预测问题,不同的是分类适用于离散型目标变量的预测,而回归适用于连续型目标变量的预测。下面这些问题可以用分类和回归技术来解决:
如何将信用卡申请人分为低、中、高风险群?
如何预测银行可以安全地贷给贷款人的贷款量?
如何有效预测房地产开发中存在的风险?
如何预测哪些顾客在未来半年内会取消该公司服务,哪些电话用户会申请增值服务?
如何预测具有某些特征的顾客是否会购买一台新的计算机?
使用3G通信网络的手机用户哪些有可能转换到 4G通信网络?
如何预测一位顾客在一次销售期间将花多少钱?
如何预测病人应当接受三种具体治疗方案的哪一种?
下图是一个基于决策树预测银行客户是否存在贷款风险的示例:
秒懂数据挖掘,玩转数据分析的高级应用不在话下
2. 聚类
聚类是在预先不知道欲划分类的情况下,根据数据相似度原则进行数据归类的方法。
中国有句古话是“物以类聚,人以群分”,其实已经蕴含了聚类算法的基本思想。聚类能解决如下方面的问题:
谁是银行信用卡的黄金客户?
谁喜欢打国际长途,在什么时间,打到那里?
如何对用户 WAP 上网行为进行分析,通过客户分群,进行精确营销?
对住宅区进行聚类,确定自动提款机 ATM 的安放位置。
如何通过一些特定的症状归纳某类特定的疾病?

(编辑:柳州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读