数据仓库与数据挖掘原理及应用


请输入要查询的词条内容:

数据仓库与数据挖掘原理及应用




图书信息


作者:郑岩

出版社: 清华大学出版社; 第1版 (2011年1月1日)

平装: 300页

正文语种: 简体中文

开本: 16

ISBN: 9787302228196, 7302228191

条形码: 9787302228196

产品尺寸及重量: 25.6 x 18.4 x 1.6 cm ; 458 g

内容简介


《数据仓库与数据挖掘原理及应用》从专业角度全面介绍了数据仓库和数据挖掘的理论、方法、技术及其应用,系统地阐述了数据仓库和数据挖掘的产生、发展和应用及其主要概念、原理和算法,并结合当前数据仓库和数据挖掘中一些新的应用实例进一步加以说明,力求学以致用。

全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法。结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和OLAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类、分类、预测和关联分析等,详细分析了数据挖掘在电信领域的具体应用,如客户细分、重入网识别和WAP日志挖掘等。第三篇讨论数据、信息和知识的关系,论述知识表示的主要方法和知识管理的核心技术,介绍当前研究热点——语义网和本体的核心技术和方法,分析了语义网和本体的主要应用。

《数据仓库与数据挖掘原理及应用》可作为计算机专业研究生或高年级本科生教材,也可以作为计算机研究和开发人员以及相关专业人士的参考资料。

目录


第1章 数据仓库基础

1.1 引言

1.1.1 演变过程

1.1.2 定义

1.2 体系结构

1.2.1 两层的体系结构

1.2.2 三层的体系结构

1.3 组成

1.4 元数据

1.4.1 定义和分类

1.4.2 标准化

1.4.3 CWM

1.4.4 UMI、MOF和XML与CWM的关系

1.5 数据粒度

1.6 数据模型

1.7 ETI

1.7.1 主要流程

1.7.2 数据抽取

1.7.3 数据转换

1.7.4 数据加载

第2章 数据仓库设计和实现

2.1 数据仓库设计

2.1.1 设计方法

2.1.2 体系结构设计

2.1.3 数据模型设计

2.2 ETL设计

2.3 数据仓库实现

第3章 数据仓库实例

3.1 实例一

3.1.1 选择主题

3.1.2 逻辑模型设计

3.1.3 物理模型设计

3.1.4 ETL设计

3.2 实例二

3.2.1 总体结构设计

3.2.2 概念模型设计

3.2.3 逻辑模型设计

3.2.4 物理模型设计

3.2.5 数据清洗设计

3.2.6 ETL设计

第4章 OLAP和OLAM

4.1 OLAP

4.2 OLAM

4.2.1 体系结构

4.2.2 特点

4.2.3 基于Web的OLAM

第二篇 数据挖掘

第5章 数据挖掘基础

5.1 概述

5.1.1 定义

5.1.2 功能

5.1.3 模型

5.1.4 展望

5.2 实现

5.3 工具

5.3.1 概述

5.3.2 比较

第6章 聚类分析

6.1 硬聚类

6.1.1 算法种类

6.1.2 相似度计算

6.1.3 实现方法

6.1.4 主要算法

6.2 模糊聚类

6.2.1 概述

6.2.2 主要算法

6.3 评价

第7章 分类和预测

7.1 神经网络

7.2 决策树

7.3 实现过程

第8章 关联分析

8.1 概述

8.2 Apriori

8.3 FP-Growth

第9章 Web挖掘

9.1 概述

9.1.1 定义

9.1.2 自然语言理解

9.1.3 Web挖掘过程

9.2 Web文档抽取和表示

9.2.1 Web文档抽取

9.2.2 Web文档表示

9.3 特征提取

9.4 Web聚类

9.5 Web分类

9.5.1 朴素贝叶斯

9.5.2 其他方法

9.5.3 评价

第10章 数据挖掘实例

10.1 TOM和TOM

10.2 客户细分

10.2.1 客户生命周期

10.2.2 客户价值

10.2.3 数据准备

10.2.4 分析过程

10.2.5 结果

10.3 重入网识别

10.3.1 定义

10.3.2 数据准备

10.3.3 分析过程

10.3.4 结果

10..4 WAF日志挖掘

10.4.1 定义

10.4.2 数据准备

10.4.3 分析过程

10.4.4 结果

第三篇 语义网和本体

第11章 知识

11.1 概述

11.2 知识分类

11.3 知识表示

11.3.1 知识表不观

11.3.2 知识表示方法

11.4 知识管理

11.4.1 概述

11.4.2 知识管理与信息管理的关系

11.4.3 核心技术

第12章 语义网和本体

12.1 语义网

12.1.1 概述

12.1.2 层次结构

12.1.3 元数据

12.1.4 核心技术

12.1.5 开发工具Jena

12.1.6 Web3.0

12.2 本体

12.2.1 哲学本源

12.2.2 定义

12.2.3 建模

12.2.4 分类

12.2.5 构建方法

12.2.6 描述语言

12.2.7 实例

参考文献

序言


数据仓库是将大量传统数据库数据进行抽取、清洗和转换,并按主题进行重新组织,可比喻为随时间推移不断丰富的“宝藏”;而数据挖掘是从海量数据中发现人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息,挖掘的知识表示形式为概念、规则、规律和模式等,可比喻为“淘宝”。随着Internet的迅速普及和广泛应用,每天都产生大量各种各样的信息,但它们背后到底稳藏着什么,这驱使人类不断探索。

工欲善其事必先利其器。在当今信息爆炸的时代,数据挖掘堪比“利器”,让我们面对海量数据时不再感到茫然和不知所措。随着数据仓库的发展和应用,数据挖掘将展现无限的生机和活力,可以辅助、部分代替甚至拓展人的智能和决策,造福人类。

数据经整合汇总为信息,信息经挖掘抽象为知识,知识是智能的基石。因此,信息化到知识化再到智能化将是人类社会发展的必然趋势。数据仓库和数据挖掘正逐步渗透和深人到社会的各个领域,并不断催生新的应用。

本书主要介绍数据仓库和数据挖掘的理论、方法、技术及其应用。此外,用较多篇幅阐述数据仓库和数据挖掘新的应用实例。

全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法,并结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和0LAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类分析、分类、预测和关联分析等,详细分析了数据挖掘在电信领域的具体应用,如客户细分、重入网识别和WAP日志挖掘等。第三篇讨论数据、信息和知识的关系,论述知识表示的主要方法和知识管理的核心技术,介绍当前研究热点——语义网和本体的核心技术和方法,分析了语义网和本体的主要应用。