数据挖掘是什么意思?

2022-09-06 14:58:47
光点科技
大数据

什么是数据挖掘?

数据挖掘,主要从大量、随机、不完整的数据中,使用具体算法提取未知、潜在价值的规则和信息,是模式识别、机器学习、可视化、数据库和统计、信息检索、高性能计算等技术的交叉集成“集大成者”。



在现代数据丰富的时代,利用相关的互联网技术分析相关的数据信息,发现容易被忽视和检测到的信息,最终挖掘出有用的信息。数据挖掘可以大大降低企业分析信息的时间,提高信息的准确性,为企业节省更多的数据分析成本。


数据发掘可为哪几类

第一:根据变量是否需要划分,即“我们需要知道用什么变量来表示结果吗?”,需则为“有监督学习”,不需则为“无监督学习”。


例如,典型的监督学习:线性回归,这是一种必须有变量的算法,但没有监督学习的算法不需要变量,比如聚类。一开始我们没有设置分类依据,这是最终分类的类别属性。继续细分,监督学习可根据变量是否为连续变量分为:回归和分类。

如果自变量为体重,则返回预测①回归是因为变量是身高(连续变量);②因为变量是性别(离散变量)分类。


第二根据本质可分为:线性算法和非线性算法。由于数据挖掘本身是一项高维研究,即是否可以在空间中构建超平面。


第三:怎样再写论文的过程中选择模型,可根据算法的来源进行分类,分为:基于回归;基于划分;基于概率。


数据挖掘的应用

由于数据挖掘带来的显著经济效益,数据挖掘越来越受欢迎。它不仅可以用来控制成本,还可以给企业带来好处。


很多企业都在利用数据挖掘技术帮助管理客户生命周期的各个阶段,包括争取新客户,从现有客户那里赚更多的钱,保持好客户。如果能确定好客户的特点,就能为客户提供有针对性的服务。例如,如果你发现了购买某种商品的客户的特点,你可以把这种商品卖给那些有这些特点但没有购买这种商品的客户;找到流失客户的特点,在那些特征相似的客户流失之前进行有针对性的弥补,因为保留一个客户比争取一个客户便宜得多。


数据挖掘可以应用于不同的领域。电信公司和信用卡公司是利用数据挖掘来检测欺诈行为的先驱。保险公司和证券公司也开始利用数据挖掘来减少欺诈行为。医疗应用是另一个有前途的行业:数据挖掘可以用来预测手术、医疗实验和药物治疗的效果。零售商使用更多的数据挖掘来决定每种商品在不同地方的库存,并通过数据挖掘更灵活地使用促销和优惠卷手段。制药公司通过挖掘巨大的化学物质和基因对疾病影响的数据库来判断哪些物质可能对治疗某种疾病有效。


成功的数据挖掘

有两个关键因素可以确保数据挖掘的成功。首先,准确定义你想要解决的问题,准确定位的问题通常会带来最好的回报。第二,使用正确的数据,选择你能得到的数据,也许从外部购买数据,你需要有效地整合和转换这些数据。


关于光点科技

光点科技是一家在政企数据治理、数据中台建设、数据可视化展示分析方面有着丰富经验的公司。光点科技既提供数据产品,也提供数据服务,服务客户超过100家,在金融、电信、政务、企业、工程、教育、检验检测等行业有丰富的经验和创新的解决方案。


光点自研的数据治理服务平台,能够为客户提供数据汇聚、建模、开发、管理和服务能力,以及自动化数据处理和数据存储计算环境。为企业的数据治理提供一站式数据治理工具。




上一篇:数字化转型失败率为什么这么高?

下一篇:BI(商业智能)未来的发展前景如何?

关于我们
公司简介
价值观
公司历程
管理团队
人才构成
资质和荣誉
联系我们
咨询热线:020-83342506
地址:广州市越秀区寺右一马路18号泰恒大厦1609室
光点科技服务号
© 2011-2022 广州光点信息科技股份有限公司  |   粤公网安备 44010402002721号  |  粤ICP备12043917号