当前位置:首页 > 天道酬勤 > 正文内容

数据挖掘实际应用(数据分析与数据挖掘的区别)

张世龙2021年12月20日 14:50天道酬勤160

随着时代的发展,人类产生的数据成倍增长,数据的开放应用和数据可挖掘的价值越来越高。 在大数据精准营销、大数据洞察等一系列热词的背后,数据挖掘、分析技术发挥着重要的作用。 数据挖掘技术不仅成为当前政务部门提高管理能力的重要手段,也是提高各行业核心竞争力的关键。

什么是数据挖掘

数据挖掘是从大量、不完整、有噪声、模糊、随机的数据中提取隐藏在其中的、人们事先不知道但潜在有用的信息和知识的过程。

可以看出,数据挖掘是对过程结果的称呼,主要目标是从数据中提取隐藏的信息。 是受数据库系统、统计、机器学习、可视化、信息科学等多个领域影响的交叉科学领域。

数据挖掘与商业智能的关系

举个简单的例子:

统计购买某产品的人大多来自北京,北京是该产品的主要消费者居住的城市,这就是商业智能技术。 要从100000人中找出100个购买某种产品的概率较高的顾客,可以通过用统计方法建立数学模型来找出这些人。 这需要数据挖掘技术。

也就是说:

业务智能是指编制目标明确的统计分析报告,并根据统计结果提供业务决策支持。 输入是数据,输出是信息。 数据挖掘是指通过数据的表象发现隐藏在背后的蛛丝马迹,找出隐藏的规律和看似无关的事物之间背后的联系,洞察和预测未知事项,输入是数据,输出是知识。 利用数据挖掘技术,探索和分析大量的业务数量,揭示隐藏的未知规律,是商业智能的高级应用。

根据

数据挖掘能解决哪些问题

数据挖掘的应用方向,常见的数据挖掘可以解决的问题出现在以下方面。

1 .分类和回归

分类根据样本数据中记载的类别对原始数据进行分类汇总,还可以预测未来数据的分类。

回归是决定一个或多个变量之间相互依存关系的统计分析方法。

分类和回归本质上解决预测问题,但分类适用于离散型目标变量的预测,回归适用于连续型目标变量的预测。 以下问题可以用分类和回归技术解决。

如何将信用卡申请人分为低、中、高风险群体? 如何预测银行可以安全贷给贷款人的贷款量? 如何有效预测房地产开发中存在的风险? 如何预测哪些客户将在未来半年内取消该公司的服务,哪些电话用户将申请增值服务? 如何预测具有特定特点的客户是否会购买新计算机? 使用3G通信网络的手机用户如何有可能迁移到4G通信网络? 如何预测顾客在一次销售期间要花多少钱? 如何预测患者应该接受三种具体治疗方案中的哪一种? 下图是基于决策树预测银行客户是否存在融资风险的示例。

2 .聚类

聚类是指在不预先知道想要分类的类的情况下,根据数据的相似度原则对数据进行分类的方法。

中国有句古话“类呼友,人以群分”,其实已经包含了聚类算法的基本思想。 群集可以解决以下问题:

银行信用卡的黄金客户是谁? 谁喜欢国际电话? 你什么时候给那里打电话? 如何分析用户WAP的互联网连接行为,通过客户群体进行精准营销? 聚类住宅区,确定ATM的安装位置。 如何根据特定的症状总结特定的疾病? 例如,下图显示了查找具有共性的数据,然后将其聚集在一起。

3 .关联规则

关联规则在一个数据集中找出各个物品或商品之间的关系,也称为购物篮分析。

关联规则描述了一个事物中物品之间同时出现的规则知识模式,可以应用于许多实际工作中:

已经购买商品a的人最有可能购买的商品是哪个? 在商业销售中,如何通过交叉销售获得更大的收入? 在保险方面,如何分析索赔要求并发现潜在的欺诈行为? 银行方面

,如何分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务?哪些制造零件和设备设置与故障事件关联?哪些病人和药物属性与结果关联?

下图是某商场购物蓝推荐结果示例:

4. 时间序列预测

通过已有的时间序列数据进行类推,以预测下一段时间的趋势。

时间序列预测是在与时间相关的历史数据中,找到数据随时间变动的规律。你可以用来解决如下问题:

下个月的商品销量、销售额或库存量是多少?明天广州市的最高用电负荷是多少?

下图是某公司红酒销量的预测图:

5. 关系网络分析

关系网络分析用来探索社会行动者及其间的关系,例如:社会关系、亲属关系、角色关系、行为关系、流动关系、地理空间关系等等。

关系网络分析也叫社会网络分析。通过社会网络分析,可以探索和发现行动者之间隐藏的关系。常见的关系有:

亲属关系:父母、子女、夫妻关系等。正式关系(权威关系):正式角色也是关系性的,如老板/职员、教师/学生、医生/病人关系等。个人之间的评价关系:喜欢、信任、尊重等。行为上的互动关系:行动者之间的自然交往,如谈话、参加会议、拜访、提建议等。隶属关系:如参加一项协会、属于某些俱乐部等。物质资本的传递:商业往来、物资交流。非物质资源的转换关系:行动者之间的交往、信息的交换等。空间关联:城市之间的关系,迁入和迁出。职位的升迁,地位的流动。

下面是对《悲惨世界》一书中人物的关系网络分析的一个示例:

数据挖掘是一个周而复始的过程,在生成规则的过程中不断地对模型进行调整,从而提升精度。那么,怎么才能更好地掌握数据挖掘呢,亿信华辰数据挖掘软件豌豆DM是一个不错的选择。

豌豆DM内置分类分析、回归分析、聚类分析、关联规则分析以及时间序列应用等五大类十几个小类的数据挖掘算法,并支持R语言算法扩展。让用户可以通过半自动化或者自动化地分析业务数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助你解决客户流失分析、客户细分、银行客户贷款风险分析、客户信用评价、关联推荐(购物篮分析)等各类数据分析应用问题。

扫描二维码推送至手机访问。

版权声明:本文由花开半夏のブログ发布,如需转载请注明出处。

本文链接:https://www.zhangshilong.cn/work/25696.html

分享给朋友:

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。