海量PDF免费下载!

Python数据分析与挖掘实战(第3版).pdf(高清PDF免费下载)

Python数据分析与挖掘实战(第3版)
评分:
9.6
发布时间:
2025/4/11 19:50:26

内容介绍:

本书共13章,分三个部分:基础篇、实战篇、提高篇。 (1)基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 (2)实战篇(第6~12章),重点对数据挖掘技术在金融、航空、零售、农业、制造和互联网等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用中的理解。 (3)提高篇(第13章),围绕去编程化的TipDM大数据挖掘建模平台,先介绍了平台每个模块的功能,再以航空公司客户价值分析案例为例,介绍如何使用平台快速搭建数据分析与挖掘的工程,展示平台去编程化、流程化的特点。

作者介绍:

资深大数据挖掘专家和模式识别专家,高级信息项目管理师。10余年大数据挖掘应用、咨询和培训经验。为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。精通Java EE企业级应用开发,是华南师范大学、中南财经政法大学、广东工业大学、西安理工大学、广西科技大学、重庆交通大学、桂林电子科技大学等校外硕导。

本书目录:

前言
基础篇
第1章 数据挖掘基础2
1.1 某知名连锁餐饮企业的困惑2
1.2 从餐饮服务到数据挖掘4
1.3 数据挖掘的基本任务4
1.4 数据挖掘的建模过程5
1.4.1 目标定义5
1.4.2 数据采集6
1.4.3 数据探索7
1.4.4 数据预处理8
1.4.5 挖掘建模8
1.4.6 模型评价8
1.5 常用的数据挖掘建模工具8
1.6 小结10
第2章 Python数据分析简介11
2.1 搭建Python开发平台12
2.1.1 需要考虑的问题12
2.1.2 基础平台的搭建13
2.2 Python使用入门14
2.2.1 运行方式14
2.2.2 基本命令15
2.2.3 数据结构18
2.2.4 库的导入与添加23
2.3 Python数据分析工具25
2.3.1 NumPy26
2.3.2 SciPy27
2.3.3 Matplotlib28
2.3.4 pandas29
2.3.5 StatsModels31
2.3.6 scikit-learn31
2.3.7 Keras33
2.3.8 Gensim35
2.3.9 TensorFlow35
2.3.10 PyTorch39
2.3.11 PaddlePaddle42
2.3.12 XGBoost45
2.4 配套附件使用设置47
2.5 小结47
第3章 数据探索48
3.1 数据质量分析48
3.1.1 缺失值分析49
3.1.2 异常值分析49
3.1.3 一致性分析53
3.2 数据特征分析53
3.2.1 分布分析53
3.2.2 对比分析58
3.2.3 统计量分析60
3.2.4 周期性分析63
3.2.5 贡献度分析65
3.2.6 相关性分析67
3.3 Python的主要数据探索函数71
3.3.1 基本统计特征函数71
3.3.2 拓展统计特征函数75
3.3.3 统计绘图函数76
3.4 小结83
第4章 数据预处理84
4.1 数据清洗84
4.1.1 缺失值处理84
4.1.2 异常值处理89
4.1.3 重复值处理89
4.2 数据集成91
4.2.1 实体识别91
4.2.2 冗余属性识别91
4.3 数据变换92
4.3.1 简单函数变换92
4.3.2 数据规范化92
4.3.3 连续属性离散化95
4.3.4 属性构造97
4.3.5 小波变换98
4.4 数据归约101
4.4.1 属性归约101
4.4.2 数值归约106
4.5 Python的主要数据预处理函数109
4.6 小结111
第5章 挖掘建模113
5.1 分类与预测113
5.1.1 实现过程114
5.1.2 常用的分类与预测算法114
5.1.3 回归分析115
5.1.4 决策树119
5.1.5 人工神经网络126
5.1.6 分类与预测算法评价131
5.1.7 Python的分类预测模型136
5.2 聚类分析136
5.2.1 常用的聚类分析算法137
5.2.2 k均值聚类算法138
5.2.3 聚类分析算法评价143
5.2.4 Python的主要聚类分析算法144
5.3 关联规则146
5.3.1 常用的关联规则算法147
5.3.2 Apriori算法147
5.4 时序模式153
5.4.1 时间序列算法153
5.4.2 时间序列的预处理154
5.4.3 平稳时间序列分析156
5.4.4 非平稳时间序列分析159
5.4.5 Python的主要时序模式算法167
5.5 离群点检测170
5.5.1 离群点的成因及类型170
5.5.2 离群点检测方法171
5.5.3 基于统计模型的离群点
   检测方法172
5.5.4 基于聚类的离群点检测方法174
5.6 小结177
实战篇
第6章 房屋租金影响因素分析
    与预测180
6.1 背景与挖掘目标180
6.2 分析方法与过程181
6.2.1 数据预处理181
6.2.2 数据探索190
6.2.3 模型构建201
6.3 上机实验207
6.4 拓展思考208
6.5 小结209
第7章 商超客户价值分析210
7.1 背景与挖掘目标210
7.2 分析方法与过程211
7.2.1 数据探索与预处理212
7.2.2 模型构建及结果分析228
7.3 上机实验238
7.4 拓展思考239
7.5 小结240
第8章 商品零售购物篮分析241
8.1 背景与挖掘目标241
8.2 分析方法与过程242
8.2.1 数据探索分析243
8.2.2 数据预处理249
8.2.3 模型构建249
8.3 上机实验255
8.4 拓展思考256
8.5 小结256
第9章 基于水色图像的水质评价257
9.1 背景与挖掘目标257
9.2 分析方法与过程258
9.2.1 分析流程259
9.2.2 数据预处理259
9.2.3 模型构建263
9.2.4 水质评价264
9.3 上机实验265
9.4 拓展思考265
9.5 小结266
第10章 家用热水器用户行为
     分析与事件识别267
10.1 背景与挖掘目标267
10.2 分析方法与过程268
10.2.1 数据探索分析269
10.2.2 数据预处理272
10.2.3 模型构建283
10.2.4 模型检验284
10.3 上机实验285
10.4 拓展思考287
10.5 小结288
第11章 电视产品个性化推荐289
11.1 背景与挖掘目标289
11.2 分析方法与过程290
11.2.1 分析流程291
11.2.2 数据预处理291
11.2.3 分析与建模306
11.2.4 模型评价310
11.3 上机实验313
11.4 拓展思考314
11.5 小结314
第12章 天问一号事件中的网民
    评论情感分析315
12.1 背景与挖掘目标315
12.2 分析方法与过程316
12.2.1 分析流程316
12.2.2 数据说明317
12.2.3 数据探索318
12.2.4 文本预处理323
12.2.5 绘制词云图327
12.2.6 使用朴素贝叶斯构建
    情感分析模型331
12.2.7 模型评价338
12.2.8 模型优化340
12.3 上机实验344
12.4 拓展思考345
12.5 小结345
提高篇
第13章 基于TipDM大数据挖掘
     建模平台实现商超客户
     价值分析348
13.1 平台简介348
13.1.1 “共享库”模块350
13.1.2 “数据连接”模块350
13.1.3 “数据集”模块350
13.1.4 “我的工程”模块351
13.1.5 “个人组件”模块354
13.2 快速构建数据挖掘工程355
13.2.1 数据源配置355
13.2.2 数据探索与处理360
13.2.3 模型构建与结果分析379
13.3 小结393
· · · · · · (更多)
下载地址
重要提示!:取消关注公众号后将无法再启用回复功能,不支持解封!
第一步:微信扫码关键公众号“架构师老卢”
第二步:在公众号聊天框发送book:85187,如:book:85187 获取下载地址
第三步:恭喜你,快去下载你想要的资源吧
相关留言评论
昵称:
邮箱: