配套资源:电子课件
本书特色:
★紧密结合数据挖掘的最新进展。
★介绍了许多数据挖掘的典型应用方法。
★涉及内容十分广泛,在教学时,可根据实际情况进行选择。
本书教学资源,样书可添加小编微信13146070618索取
本书系统介绍了数据挖掘原理、技术、算法和应用。主要内容包括:数据挖掘的过程、数据存储的数据仓库、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据的数据挖掘和技术。本书涵盖了数据挖掘过程的各方面技术、算法,在内容安排上将理论知识和工程技术应用有机结合,并介绍了许多数据挖掘的典型应用方法。
配套资源:电子课件
本书特色:
★紧密结合数据挖掘的最新进展。
★介绍了许多数据挖掘的典型应用方法。
★涉及内容十分广泛,在教学时,可根据实际情况进行选择。
本书教学资源,样书可添加小编微信13146070618索取
本书系统介绍了数据挖掘原理、技术、算法和应用。主要内容包括:数据挖掘的过程、数据存储的数据仓库、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据的数据挖掘和技术。本书涵盖了数据挖掘过程的各方面技术、算法,在内容安排上将理论知识和工程技术应用有机结合,并介绍了许多数据挖掘的典型应用方法。
前言随着信息技术的普及和应用,各个领域产生了大量的数据,这些数据被获取、存储下来,其中蕴含着丰富的信息。人们持续不断地探索处理这些数据的方法,以期最大程度地从中挖掘有用的信息,面对如潮水般不断增加的数据,人们不再满足于数据的查询和统计分析,而是期望从数据中提取信息或者知识为决策服务。数据挖掘技术突破了数据分析技术的种种局限,它结合统计学、数据库、机器学习等技术解决从数据中发现新的信息,辅助决策这一难题,是正在飞速发展的前沿学科。一些大型企业对数据挖掘产品和工具的使用都超过20年,并已产生了期望的效应。此外,数据挖掘产品和工具在金融、商业、电信、医学等多个领域也得到广泛推广应用。 数据挖掘并不是要取代其他数据分析技术,而是将它们作为其工作的基础。尽管有些技术(如关联分析)是数据挖掘独有的,但是,另一些技术(如聚类、分类和异常检测)则建立在其他学科长期研究的基础之上。数据挖掘利用已有技术加速其发展,并一直与其他学科的技术紧密结合。成功地进行数据挖掘是综合使用多种技术,以及理解数据的专业人员和数据分析人员合作的成果。 本书结合数据挖掘技术的最新发展,系统地介绍了数据挖掘的基础理论、技术原理、算法和应用,以使读者对数据挖掘有一个系统、全面的了解。本书共9章,第1章主要介绍数据挖掘的基本概念和数据挖掘的过程。第2章主要介绍关系数据集和数据仓库等数据存储方式的基本概念、数据组织及其涉及的关键技术,以及分布式文件系统、NoSQL等大数据存储方式的概念、结构、原理和数据组织方法等。第3章主要介绍了数据预处理的概念和必要性,以及数据清理、数据集成、数据转换、数据归约、数据离散化和特征选择等数据预处理技术。第4章主要介绍了相似度度量的基础知识和5种异常检测方法,并深入分析欧式距离等6种传统的度量方法和大数据度量方法。第5章主要介绍了数据分类和预测的基本概念,决策树分类、贝叶斯分类、神经网络等分类方法,以及预测算法与应用。第6章主要介绍了数据聚类分析的基本概念,以及基于划分、基于层次、基于密度、基于网格和基于模型的聚类算法,还介绍了聚类分析的评估方法及其应用。第7章主要介绍了关联分析的基本概念,分析了关联规则挖掘的两个子任务:频繁项集产生和规则产生,介绍了频繁项集的紧凑表示及产生频繁项集的其他方法、FP-growth算法、关联评估及其应用等内容。第8章主要针对数据挖掘模型的评价和度量介绍了评分函数(包括常用的预测性评分函数和描述性评分函数);介绍了针对数据挖掘模型的成本评价曲线;从评价模型复杂度角度介绍了最短描述长度原则等评价方法;针对模型有效性验证介绍了交叉验证和Bootstrap验证方法;从数据挖掘模型效率和准确率提升角度,介绍了云计算和集成学习方法。第9章主要介绍了针对文本、图像、语音识别、视频、网络拓扑、网络舆情、推荐系统、空间数据和数据流等复杂数据的数据挖掘技术,分析了各类复杂数据的特点,介绍了相关数据挖掘的关键技术。本书涉及的内容较为广泛,在教学时,可根据实际情况选择。 本书由梁亚声编写第1、5章,徐欣编写第8、9章,成小菊编写第6、7章,梁佳领编写第2、3章,朱霞编写第4章。何成宇为第4章的编写提供了部分资料。徐欣对全书进行了统稿。 本书编著得到了国家自然科学基金(61402426)资助。 由于作者水平有限,书中难免存在不妥之处,敬请读者批评指正。
随手扫一扫~了解多多