首页 > 范文大全

基于属性重要度约简算法在数据挖掘中的应用研究论文

时间：2022年12月27日

来源：千里江山寒色远

编辑：本站小编

收藏本文

下载本文

以下是小编帮大家整理的基于属性重要度约简算法在数据挖掘中的应用研究论文，本文共8篇，欢迎大家收藏分享。本文原稿由网友“千里江山寒色远”提供。

篇1：基于属性重要度约简算法在数据挖掘中的应用研究论文

基于属性重要度约简算法在数据挖掘中的应用研究论文

摘要：属性约简是粗糙集理论研究的核心内容之一，本文通过对属性重要度的计算，以核为基础计算条件属性集中除核以外其他属性的重要性来确定最小的约简，最后通过实例分析验证了算法的有效性与可行性。

关键词：数据挖掘属性约简重要度

数据挖掘是从海量的且不断动态变化的数据中，借助有效的方法挖掘出潜在、有价值的知识过程。而粗糙集理论它是一种刻画不完整性和不确定性的数学工具，能在保持分类能力不变的前提下，通过知识约简从中发现隐含的知识，揭示潜在的规律，是由波兰科学家Pawlak在1982年提出的。而属性约简是粗糙集理论研究的核心内容之一，它能保证在分类能力不变的情况下，消除重复、冗余的属性和属性值，减少数据挖掘要处理的信息量，提高数据挖掘的效率。本文提出了通过计算单个属性的重要性，以重要性大于零的属性为核，来选取其它属性加入核中形成新的集合RED，直至剩下的所有属性的重要性为零，得到的集合REDn即为属性约简。

1 粗糙集的基本理论[1-2]

定义1设是一个信息系统，其中是对象的非空有限集合，即 ; 是属性的非空有限集合; ，是属性的值域; 是一个信息函数，即每个对象在每个属性上对应的信息值。若，其中为非空有限条件属性集合，为非空有限决策属性集合，且，则称信息系统为决策表。

定义2对决策表，，，考虑单决策属性的情况，即，则的分辨矩阵是一个矩阵，其中的元素定义如下：

定义3对分辨矩阵中每个，用布尔函数来表示，若，则决策表的分辨函数可定义为：。

2 基于粗糙集的数据挖掘的属性约简算法[3-4]

2.1 算法分析

第一步：求核。通过求条件属性C中的每个属性a对在整个条件属性集C的重要性SigC(x)来确定属性核CORE(x)，重要性SigC(x)>0的属性为核属性。

第二步：通过向属性核CORE(x)中依次加入重要性大的属性来确定属性集x的最小约简，详细步骤如下：(1)把a加入到属性集R 中，计算重要性，选择重要性最大的属性;(2)如果两个属性有相同的重要性，取离散值小的属性。

2.2 算法复杂度

通过算法的`分析，在对决策表进行划分的时间复杂度为O(n2)。而计算条件属性的重要性也是满足划分的线性关系，因此所求属性核的时间复杂度为O(n2)，依次添加次重要度的属性也没有增加额外的开销，因此整个时间复杂度还是O(n2)。

2.3 实例及分析

为了进一步验证算法的可行性，下面以表1中的决策表为例进行分析说明，其中对象集，条件属性集，决策属性。

以上对计算出的实验数据的重要性进行统计得出信息系统的两个约简为{c1,c4}和{c2,c4}。

3 结语

本文针对属性约简算法中的属性重要度的计算来确定核，适合对海量数据的挖掘，不仅节省了存储空间，而且在时间复杂度开销少，通过实验分析验证了算法的可行性与有效性，为决策表的属性约简提供了一条高效的途径。

参考文献：

[1]张文修,吴伟志.粗糙集理论与方法[M].北京:科学出版社,:18-19

[2]周献中,黄兵，李华雄,等.不完备信息系统知识获取的粗糙集理论与方法[M].南京:南京大学出版社,:10-11

[3]饶泓,夏叶娟,李娒竹.基于分辨矩阵和属性重要度的规则提取算法[J].计算机工程与应用，,44(3):163-165

[4]黄国顺,刘云生.一种改进的决策表属性重要性及其快速约简算法[J].计算机工程与应用,,43(28):173-176

篇2：数据挖掘在数字图书馆中的应用研究

文本数据挖掘在数字图书馆中的应用研究

文本数据挖掘在数字图书馆中的应用进行探索研究,重点对数字图书馆文本分类的'构建与实现进行研究,并将开方拟合检验方法、KNN分类算法等经典理论应用到数字图书馆文本分类模型中,以提高数字图书馆检索能力以及检索准确性.

作者：叶福军作者单位：浙江传媒学院动画系,浙江,杭州,310018 刊名：硅谷英文刊名：SILICON VALLEY 年，卷(期)： “”(7) 分类号：G25 关键词：文本数据挖掘数字图书馆文本分类

篇3：支持向量机在数据挖掘中的应用研究论文

支持向量机在数据挖掘中的应用研究论文

摘要：支持向量机(Support Vector Machine, SVM)是数据挖掘和机器学习中的一个很有效的工具。结合支持向量机在数据挖掘和机器学习中的应用, 介绍了支持向量机的基本原理, 发展方向及其研究热点。

关键词：支持向量机; 数据挖掘; 机器学习オ

1 SVM的提出和基本思想

支持向量机是Vapnik等人提出的，在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,已应用于手写体识别、三维目标识别、人脸识别、文本图像分类等实际问题中，性能优于已有的学习方法，表现出良好的学习能力。它是从线性可分情况下的线性分类面发展而来的，接着利用核函数很好的解决了非线性可分情况。

2 支持向量机的几个发展

（1）模糊支持向量机，引入样本对类别的隶属度函数，这样每个样本对于类别的影响是不同的，这种理论的应用提高了SVM的抗噪声的能力，尤其适合在未能完全揭示输入样本特性的情况下。

（2）最小二乘支持向量机。这种方法是在提出，经过这几年的发展，已经应用要很多相关的领域。研究的问题已经推广到：对于大规模数据集的处理；处理数据的鲁棒性；参数调节和选择问题；训练和仿真。

（3）加权支持向量机（有偏样本的加权，有偏风险加权）。

（4）主动学习的支持向量机。主动学习在学习过程中可以根据学习进程，选择最有利于分类器性能的样本来进一步训练分类器，特能有效地减少评价样本的数量。

（5）粗糙集与支持向量机的结合。首先利用粗糙集理论对数据的属性进行约简，能在某种程度上减少支持向量机求解计算量。

（6）基于决策树的支持向量机。对于多类问题，采用二岔树将药分类的样本集构造出一系列的两类问题，每个两类构造一个SVM。

（7）分级聚类的支持向量机。基于分级聚类和决策树思想构建多类svm，使用分级聚类的方法，可以先把n-1个距离较近的类别结合起来，暂时看作一类，把剩下的一类作为单独的一类，用svm分类，分类后的下一步不再考虑这单独的一类，而只研究所合并的n-1类，再依次下去。

（8）算法上的提高。Vapnik在1995年提出了一种称为“chunking”的块算法，即如果删除矩阵中对应Lagrange乘数为0的行和列，将不会影响最终结果。Osuna提出了一种分解算法，应用于人脸识别领域。Joachims在将Osuna提出的分解策略推广到解决大型SVM学习的算法。Platt于19提出了序贯最小优化每次的工作集中只有2个样本。

（9）核函数的构造和参数的选择理论研究。基于各个不同的应用领域，可以构造不同的核函数，能够或多或少的引入领域知识。现在核函数广泛应用的类型有：多项式逼近、贝叶斯分类器、径向机函数、多层感知器。参数的选择现在利用交叉验证的`方法来确认。

（10）支持向量机从两类问题向多类问题的推广。Weston在年提出的多类算法为代表。在经典svm理论的基础上，直接在目标函数上进行改进，重新构造多值分类模型，建立k分类支持向量机。通过sv方法对新模型的目标函数进行优化，实现多值分类。

一对多（one-against-rest）――Vapnik提出的,k类――k个分类器，第m个分类器将第m类与其余的类分开，也就是说将第m类重新标号为1，其他类标号为-1。完成这个过程需要计算k个二次规划，根据标号将每个样本分开，最后输出的是两类分类器输出为最大的那一类。不足：容易产生属于多类别的点（多个1）和没有被分类的点（标号均为-1）――不对，训练样本数据大，训练困难，推广误差无界。

层（数分类方法），是对一对一方法的改进，将k个分类合并为两个大类，每个大类里面再分成两个子类，如此下去，直到最基本的k个分类，这样形成不同的层次，每个层次都用svm来进行分类――1对r-1法，构建k-1个分类器，不存在拒绝分类区。

3 主要研究热点

从上面的发展中，我们可以总结出，目前支持向量机有着几方面的研究热点：核函数的构造和参数的选择；支持向量机从两类问题向多类问题的推广；更多的应用领域的推广；与目前其它机器学习方法的融合；与数据预处理（样本的重要度、属性的重要度、特征选择等）方法的结合。

参考文献

［1］@张学工.统计学习理论的本质［M］.北京：清华大学出版社，.

［2］@NelloCristianini,JohnShawe-Taylor.支持向量机导论［M］.北京：电子工业出版社，.

篇4：论文：大数据在高校中的应用研究

高校大数据及其处理架构

高校中汇聚着大量的信息，从学生角度来看，包括联系方式等基本信息，食堂消费、住宿晚归等生活信息，选课、课后作业、借阅图书、成绩等学习信息，参与的社团、竞赛、讲座等第二课堂信息;从教师角度来看，包含教学任务、课件等教学信息，论文著作、科学研究数据等科研信息;从管理者的角度来看，包含学校的资产信息、师资信息、招生就业信息等。同时随着移动互联网以及物联网等新技术的兴起，学校师生主动产生和由设备自动收集的信息越来越多，如微博、微信等社交信息，各类搜索点击记录信息等。上述信息存在着数据量大、结构复杂、产生频率快的特点。这导致利用常用软件工具捕获、管理和处理此类数据所耗费时问超过了可容忍的时问。

大数据的处理流程与一般数据的处理过程类似，可以定义为在合适工具的辅助下对广泛异构的数据源进行抽取和集成，将结果按照一定的标准统一存储，利用合适的数据分析技术对存储的数据进行分析从中提取有益的知识，并利用恰当的方式将结果展现给终端用户。具体来说可以分为数据抽取与集成、数据分析和数据展示。

数据抽取与集成

大数据的数据来源非常广泛，既包括传统的关系型数据库，也包括半结构化数据，以及以视频、音频、文本和其他形式存在的非结构化数据。数据抽取和集成要解决的主要问题就是收集各种碎片化的数据，对数据进行清洗，保证数据质量，同时根据时问演进小断更新数据模式，确定数据实体及其之问的关系，最终将数据按照统一的格式进行存储，以便提供给上层用来进行数据分析。

目前高校已经基本建立了完备的管理信息系统、学习管理系统等，在统一数据中心中积累了大量的结构化数据;同时各类系统中还散布着大量的半结构化和非结构化数据。半结构化和非结构化的数据经过一定处理后，可以转化为更容易分析使用的结构化数据。

数据分析

经过抽取和集成得到的数据，需要经过分析挖掘其潜在的价值。传统的数据挖掘、机器学习、统计分析等方法仍然可以用来对数据进行分析，只是需要根据大数据的特征进行调整。首先，为了实现对海量数据的分析，需要依据模型，将数据拆分处理，然后再将结果汇总，一个完整的分析可能会经过多层类似的处理过程;其次，大数据的应用通常具有实时性的特点，数据的价值会随着时问的流逝而递减，因此分析方法需要平衡处理的效率和准确率;最后，大数据一般构建在云计算平台之上，分析方法需要考虑与云计算平台的集成或做为一种云服务。

数据展示

数据分析得到的分析结果，需要以直观可理解的方式呈献给最终用户，在大数据时代，数据分析产生的结果有可能也是非常大量的，且结果之问的关联关系复杂、数据维度更多，数据可视化技术通过更加适合人类思维的图形化的方式展示数据分析结果，已经被证明是展示数据分析结果非常有效的方法。常见的可视化方法有:多维叠加式数据可视化、数据在空问、时问坐标中的变化和对比等，当然要将枯燥的信息转换为美丽的、令人印象深刻的图形，需要较高的技术素养和艺术素养。

篇5：论文：大数据在高校中的应用研究

很多高校正在使用大数据分析技术解决遇到的实际问题，如美国德克萨斯大学利用大数据技术分析学校用户使用行为产生的数据，确定用户行为异常，审计基础环境，制定安全防护措施。其他的一些应用场景包括分析学生参与网络课堂产生的数据，进而确定如何改进课程讲述方式，达到因材施教的教育目标。

高校可以在就业情况分析、学习行为分析、学科规划、心理咨询、校友联络等方面借助大数据分析技术，挖掘数据中潜在的价值。

就业情况分析

当前市场经济高速发展、高校小断扩招、就业制度改革小断深化和毕业生数量逐年增加、社会整体就业形势日益严峻，大学生就业问题己经越来越成为目前大家共同关心的话题，研究大学生就业问题具有紧迫性和重要性。本文提出在大数据分析框架下的就业问题分析思路。

1.数据来源

传统的就业分析一般从就业单位、就业地区、所在院系专业、性别、签约类别、就业年份等维度来分析，得到的只是一般意义上的统计结果，对于指导单个学生的就业以及预测未来的就业情况发挥的作用比较有限。应用大数据分析技术，就可以将学生就业模型涉及到的学习情况、社团信息、生活信息、校外实习、参加的竞赛及获奖情况、所投公司当年的招聘计划、历届学生在所投公司的表现等众多的信息进行收集。以上海财经大学为例，可以从各类系统中抽取学生的各类信息，构成就业分析模型所需的各类数据。

2.数据抽取与存储

针对数据来源的小同，我们采取小同的数据抽取方式，对于结构良好的各信息系统的数据，我们采用ETI工具如Kettle将数据抽取到数据库中;对于Web网页这类非结构化数据，通过进行抓取，对数据进行索引后存储到数据库中。数据库是一个开源的高可靠性、高性能、可伸缩、并非建立在关系模型基础上的分布式数据库，用以存储大规模结构化数据。

3.数据分析

将就业分析模型所需的数据存储在数据库后，可以利用数据进行查询和分析。提供了一种简单的类SQI查询语言，适合数据仓库的统计分析。通过我们可以实现传统数据仓库所实现的对就业数据的汇总统计分析，而且可以容易的扩展其存储能力和计算能力。

除了数据统计分析之外，我们还可以利用About这个机器学习工具对数据进行监督学习和无监督学习。监督学习使用先验知识对数据进行分类;无监督学习则由计算机自己学习处理数据，并在做出判断后给予一定的激励或惩罚。在进行就业分析时，我们可以使用About已经实现的具体方法。首先是协作筛选，通过分析已就业学生的成绩、参加的社团活动、关注的行业、性格特点、就业单位、就业岗位等，计算学生之问的相似度，为即将毕业的学生推荐适合的就业单位和岗位，提供个性化的服务;其次是聚类，这是一种无监督的机器学习方法，我们可以通过小同的维度将未能及时就业的学生进行分析，从中找出其共同的特点，再通过比较在校学生的相关属性，及时对学生给出预警，以便其在后续的学习和生活中加以改进。

4.数据展示

在数据展示层，我们可以使用软件将分析的结果进行可视化的展示，将数据与美观的图表完美地结合在一起，它包含非常多的预定义的图表格式，同时还可以将时问、地图等多种维度在单一的图表中进行展示。

学习行为分析

为了支持学生的自主学习，高校一般都有自己的学习管理系统等。这些学习管理系统为学生、教师提供了课程学习和交流的空问。美国教育部教育技术办公室认为教育数据分为键击层、回答层、学期层、学生层、教室层、教师层和学校层，数据就寓居在这些小同的层之中。一般高校每年的开课数在数千门，学生数在数万人，产生的数据量非常大。应用大数据分析技术使得监控学生的每一个学习行为变为了可能，学生在回答一个问题时用了多长时问，哪些问题被跳过了，为了回答问题而作的研究工作等都可以获得，用这些学生学习的行为档案创造适应性的学习系统能够提高学生的学习效果。

学科规划

促进学科交叉融合发展，构筑有生命力的学科生态，打造突显核心竞争力的高水平学科是学校学科规划的重要任务。借助大数据分析技术，充分收集各学科的'教学状态数据、科研项目数据、前沿发展动态等信息，从而分析学科建设存在的小足，确定学科未来发展的方向，发掘出潜在的具有国际视野的学科带头人。

自理咨询

论坛、微博等平台上每天都会产生由评论、帖子、留言等数据，这些数据集反映了师生的思想情况、情感走向和行为动态，对这些数据进行科学的存储、管理并使用大数据技术进行有效的分析利用，建立师生思想情感模型，对掌握师生心理健康程度，有针对性地加强对师生的心理辅导有着重要的意义。

校友联络

校友资源犹如一座座宝藏，对高校的发展建设有着小可替代的重要作用，是高校工作的重要组成部分。有效地把校友联络起来、团结起来，对学校的建设和发展具有重要意义。利用传统的管理方法，仅校友信息收集就要耗费大量的时问和精力。利用大数据技术，收集各类社交网站上的非结构化数据，通过分类、聚类等数据挖掘方法，确定校友身份并收集其联系方式、参加的活动信息等，可以大大提高校友数据收集的效率，为以后利用校友资源提供良好的基础。

应用难点与对策

大数据在高校应用的美好前景令人神往，但目前大数据的应用还存在很多应用难点，主要有数据集成困难、数据分析方法有待改进和数据隐私问题。

数据集成

在很多高校中，因为管理信息系统设计时未考虑到对一些过程数据的收集，导致在分析时缺乏必要的数据来源，需要对应用系统进行扩展;同时对于定义良好的结构化数据很多高校也尚未很好的集成。在大数据时代，异构的数据类型、广泛存在的数据来源、参差小齐的数据质量给数据集成带来了新的挑战。高校应该探索融合结构化、半结构化、非结构化数据的统一模型，同时提高数据采集的质量，强化数据文化。

数据分析方法

半结构化和非结构化数据的迅猛增长，给传统的聚类、关联分析等数据挖掘技术带来了巨大的冲击和挑战。一方面，很多应用场景要求数据的实时分析;另一方面缺乏对半结构化和非结构化数据的先验知识，难以构建其问的关联关系。高校需要紧密跟踪业界对大数据分析方法的研究动态，同时通过高校问的协作沟通探索新型的数据分析方法。

数据隐私

大数据分析的数据基础必然建立在获取更多个人信息之上，而且通过分析还可以使数据之问产生关联关系，进而揭示更多的个人隐私。然而为了保护隐私就将所有数据加以隐藏，那么数据的价值就无法体现。这种矛盾在相当长的时问内必将一直存在，需要通过技术和制度的完善逐步解决。

移动互联等技术的小断兴起给高校的发展带来了极大的挑战，为了应对这种挑战，高校应当充分发挥大数据在其中的支撑作用。在人才培养、科学研究和管理等方面广泛收集过程数据，结合可视化技术充分分析和挖掘蕴含在数据之中的丰富价值。同时我们需要在高校内倡导和强化数据文化，建立持久运作的收集、分析数据并将分析结果转换为教育决策和实践的体系，真正发挥大数据在高校发展中的价值。

篇6：数据挖掘技术在企业决策系统中的应用研究

数据挖掘技术在企业决策系统中的应用研究

本文首先讨论了数据挖掘技术,给出了一种企业决策系统.并就决策系统的`构成、流程和采用的数据挖掘技术进行了探讨.

作者：师东生 Shi Dongsheng 作者单位：内蒙古科技大学信息工程学院,内蒙古包头,014010 刊名：计算机光盘软件与应用英文刊名：COMPUTER CD SOFTWARE AND APPLICATIONS 年，卷(期)： “”(4) 分类号：N37 关键词：数据挖掘数据仓库企业决策系统

篇7：数据挖掘研究综述及其在国土资源信息化中的应用研究初探

数据挖掘研究综述及其在国土资源信息化中的应用研究初探

本文系统论述和总结了数据挖掘和空间数据挖掘的概念、技术方法和研究现状.详细介绍了目前主流的数据挖掘厂商及解决方案.文章最后简要分析了数据挖掘技术在国土资源行业中的研究现状,并对如何利用这些新技术为国土资源业务管理与决策支持提供帮助进行了初步探讨.

作者：王永刚 Wang Yonggang 作者单位：中国科学院遥感应用研究所,北京,100101;北京市国土资源局,北京,100013 刊名：国土资源信息化英文刊名：LAND AND RESOURCES INFORMATIZATION 年，卷(期)： “”(2) 分类号：P23 关键词：数据挖掘空间数据挖掘国土资源

篇8：数据挖掘在CRM中的应用论文

数据挖掘在CRM中的应用论文

摘要：对于CRM数据挖掘的应用程序，本文做出了系统性的总结和研究，这包括了面向CRM数据挖掘的体系和结构，立足于客户生命周期的角度，并结合本行业发展的前景，对CRM中的数据挖掘进行了分析。

关键词：数据挖掘；客户关系管理(CRM)；知识发现

如今，经济全球化发展的速度不断加快，在市场经济的背景之下呈现出蓬勃发展的局面，外加互联网技术的日益普及化，促使当前的市场竞争不断加剧。众所周知，客户对于一家企业来说至关重要，因此为了更好的促使现代企业发展顺利，理应不断维护好企业与客户之间的关系。这种关系对于不断增强企业的综合竞争力十分重要，因此企业不断改善客户关系，便成了企业发展中一项重要的任务。客户分析是企业发展中处理好客户关系管理的基本，然而如何做好客户分析呢，这就需要对数据挖掘进行应用，数据挖掘的研究应用在现代企业客户关系管理意义非凡。

1CRM体系结构

客户关系管理(CustomerRelationshipManagement，CRM)起源于上个世纪的八十年代初期，首次提出了接触管理，也就是不断收集客户与企业联系的所有有关信息。到了九十年代初，又增加了电话服务以及客户服务支持数据等相关的分析。经过20多年的发展，如今企业发展中的客户之间的关系其管理的手段和方式逐渐走向成熟化，并且在理论和实践方面不断成熟化。CRM是一个把客户看做中心的营销理念，通过信息化的技术方式，重新设计企业业务单元，优化工作中的每一个环节的过程。它将现代信息技术也就是我们常说的互联网技术、多媒体信息技术、电子商务技术、数据仓库管理信息技术、专家数据管理系统以及人工智能呼叫中心等融合在了一起。CRM具有较强的自动化特点，并且能够处理好销售与客户管理之间的关系。它的目的在于不断的缩短销售的周期以及销售中投入的成本，进而不断增加企业在盈利方面的能力，并且寻找一片新的产品市场，逐渐增加企业的业务领域，从而提高潜在客户以及忠诚客户的满意度，盈利能力以及忠诚度等。

2CRM中数据挖掘的应用研究领域

2.1从客户生命周期角度分析数据挖掘技术的应用

从CRM的广义来看，可以简单化的理解为管理所有的和客户之间的一系列互动。在购买实践的过程中，这就需要运用多种信息对客户之间的多维关系进行预测以及分析。在不同的阶段过程中，客户关系可以看做是客户的生命周期。一般说来，客户的生命周期可以划分为3个主要的过程：其一是寻找到客户，其二是能够提升客户的价值，其三是不断维护好效益客户，使其持续受益。如果实现了各个阶段效益的最大化，便可以在此基础上不断提高企业的利润。其一是借助数据挖掘寻找潜在的新客户：CRM中首先应该做的便是识别那些潜在的客户，寻找到之后就要尽可能使其转变成企业发展中的忠实客户，数据挖掘可以帮助企业实现这一切。其二是不断提升客户的价值：通过客户盈利能力的相关具体化分析，进一步挖掘和预测客户本身所具有的盈利能力以及未来的具体变化；通过对客户购买模式的相关研究，实现客户的细分化，这样一来可以针对性的提供更加具有针对性的个性化服务，从而能够有效的实现多维化的交叉销售。其三是维护好客户，要及时的对客户忠诚度进行分析研究，以防客户流失。借助数据的深入研究和挖掘，及时分析好客户的历史交易记录，提醒消费者行为，并提出相应的对策和建议。

2.2各行业中CRM的应用

(1)零售业CRM中的数据挖掘零售业CRM它是数据挖掘领域中最重要的应用方面，伴随着网络以及电子商务模式的不断发展而呈现出繁荣发展的态势。通过对零售数据的挖掘可以对客户的购买行为进行识别和具体化的分析，并且及时发现客户的购买嗜好以及未来的购买趋势，这样便不断提高了服务的质量，为客户满意度的提高提供了条件。例如，我们可以借助多个特性化的数据进行全面的销售，这样一来便实现了客户与产品之间的多维联系，使用多维、相关化的分析来做好促销的'有效性，借助序列模式我们可以挖掘客户忠诚度，通过相关性分析可以为购买参考提供建设性的意见和建议。(2)电信业CRM中的数据挖掘当前的电信行业，已经从纯粹的市话服务领域不断转向提供一些综合性的电信服务。它能够把互联网、电信网以及其他的各种通信和计算融合在一起，这是时代发展的大潮流。借助数据挖掘等相关技术可以为一些商业化的实践提供条件，确定好电信服务的基本方式，捕捉每一个盗窃，从而更好地借助技术方面的资源，实现颇具人性的服务。电信数据一般具有多维化的分析功能，可以实现数据的识别与比较，更可以实现数据通信与系统负载等。通过量化分析，聚类分析以及异常值分析对盗用、异常模式进行识别和破解。(3)金融业CRM中的数据挖掘如今，大部分的银行以及一些金融性的专业机构能够为客户提供了多种选择，例如最基本的储蓄、投资以及信贷服务等。有时也可以提供一些保险和股票服务。在金融市场中，数据生成已经相对成熟，从整体看来金融领域的数据相对较完整、可靠，它为数据分析提供了基点。下面的几个是平时常见的应用情况：通过多维化的数据分析、挖掘可以做好数据仓库的基本任务；通过特征比较研究做好数据的衡量和计算帮助客户对贷款偿还进行科学化的预测和分析；通过分类以及聚类的方式对客户群体进行识别，对目标市场进行分析；借助数据的可视化以及关联性分析对金融洗钱以及其他的一些金融犯罪进行侦破。

作者:吴磊单位:吉林省长春市吉林建筑大学计算机科学与工程学院

参考文献

[1]王一鸿.体检中心CRM构建及数据挖掘的应用研究[D].华东理工大学.2011

[2]潘光强.基于数据挖掘的CRM设计与应用研究[D].安徽工业大学.2011

[3]石彦芳,石建国,周檬.数据挖掘技术在CRM中的应用[J].中国商贸.2010(02)

[4]王芳,杨奕.论数据挖掘技术在客户关系管理(CRM)中的应用[J].现代商贸工业.2009(01)

[5]郑玲,陶红玉,阚守辉.数据挖掘在CRM中的应用[J].中国电力教育.2008(S3)

基于属性重要度约简算法在数据挖掘中的应用研究论文.doc

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档