海量PDF免费下载!

Python数据抓取技术与实战.pdf(高清PDF免费下载)

Python数据抓取技术与实战
评分:
9.6
发布时间:
2023/10/21 13:01:48

内容介绍:

如何在大数据时代获得实时的数据信息,分析挖掘、提取出有价值的信息,并以直观清晰的图形表示出关键的数量关系和概念,是一个值得研究的问题。本书通过数据抓取篇(如何获得数据信息)、数据分析篇(分析挖掘,提取出有价值的信息)、数据可视化篇(以直观清晰的图形表示出关键的数量关系和概念)详细描述数据抓取、分析、展示的整个流程,每一篇自成一体,可以单独学习掌握。

本书目录:

章 Python基础1
11 Python安装1
12 安装pip 6
13 如何查看帮助7
14 个程序10
15 文件操作25
16 循环28
17 异常30
18 元组30
19 列表32
110 字典36
111 集合38
112 数39
113 enumerate的使用40
114 第二个例子41
第2章 字符串解析46
21 常用函数46
22 正则表达式50
23 BeautifulSoup 55
24 json结构62
第3章 单机数据抓取77
31 单机顺序抓取77
32 requests 107
33 并发和并行抓取117
第4章 分布式数据抓取137
41 RPC的使用138
42 Celery系45
第5章 全能的Selenium 159

51 Selenium单机159
52 Selenium分布式抓取178
53 Linux无图形界面使用Selenium 188
第6章 神秘的Tor 191
61 抓取时IP封锁的问题191
62 Tor的安装与使用192
63 Tor多线程197
64 Tor与Selenium结合205
第7章 抓取常见问题210
71 Flash 210
72 桌面程序211
73 U盘213
74 二级三级页面214
75 图片的处理214
76 App数据抓取214
第8章 监控框架221
81 框架说明223
82 监控系统实例225
第9章 拥抱大数据229
91 Hadoop生态圈229
92 Cloudera环境搭建231
· · · · · · (更多)
下载地址
重要提示!:取消关注公众号后将无法再启用回复功能,不支持解封!
第一步:微信扫码关键公众号“架构师老卢”
第二步:在公众号聊天框发送book:72229,如:book:72229 获取下载地址
第三步:恭喜你,快去下载你想要的资源吧