包邮Python 3爬虫 数据清洗与可视化实战+Python3网络爬虫开发实战

包邮Python 3爬虫 数据清洗与可视化实战+Python3网络爬虫开发实战 pdf epub mobi txt 电子书 下载 2025

崔庆才 零一,韩要宾,黄园园 著
图书标签:
  • Python3
  • 爬虫
  • 数据清洗
  • 数据可视化
  • 网络爬虫
  • 开发实战
  • 编程
  • 技术
  • 数据分析
  • 实战教程
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 蓝墨水图书专营店
出版社: 电子工业出版社
ISBN:9787121333590
商品编码:26807294188

具体描述





















作 译 者:零一,韩要宾,黄园园

出版时间:2018-03    千 字 数:200

版    次:01-01    页    数:212

开    本:16开

装    帧:

I S B N :9787121333590     

换    版:

所属分类:科技 >> 计算机 >> 计算机科学

纸质书定价:¥49.0

本书内容来自笔者在浙江某高校授课内容,主要介绍运用Python工具获取电商平台的页面数据,并对数据做清洗和存储。本书简化了Python基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容,对于Python基础,建议新手可以选购对应的基础书籍配合本书一起学习。

第1 章 Python 基础 ..................................................................................... 1

1.1 安装Python 环境.............................................................................................................. 1

1.1.1 Python 3.6.2 安装与配置 .......................................................................................... 1

1.1.2 使用IDE 工具——PyCharm .................................................................................... 4

1.1.3 使用IDE 工具——Anaconda ................................................................................... 4

1.2 Python 操作入门 .............................................................................................................. 6

1.2.1 编写第一个Python 代码 .......................................................................................... 6

1.2.2 Python 基本操作 ....................................................................................................... 9

1.2.3 变量 .......................................................................................................................... 10

1.3 Python 数据类型 ............................................................................................................ 10

1.3.1 数字 .......................................................................................................................... 10

1.3.2 字符串 .......................................................................................................................11

1.3.3 列表 .......................................................................................................................... 13

1.3.4 元组 .......................................................................................................................... 14

1.3.5 集合 .......................................................................................................................... 15

1.3.6 字典 .......................................................................................................................... 15

1.4 Python 语句与函数 ......................................................................................................... 16

1.4.1 条件语句 .................................................................................................................. 16

1.4.2 循环语句 .................................................................................................................. 16

1.4.3 函数 .......................................................................................................................... 17

第2 章 写一个简单的爬虫 .......................................................................... 18

2.1 关于爬虫的合法性 ......................................................................................................... 18

2.2 了解网页 ......................................................................................................................... 20

2.2.1 认识网页结构 .......................................................................................................... 21

2.2.2 写一个简单的HTML ............................................................................................. 21

2.3 使用requests 库请求网站 .............................................................................................. 23

Python 3 爬虫、数据清洗与可视化实战

 

2.3.1 安装requests 库 ....................................................................................................... 23

2.3.2 爬虫的基本原理 ...................................................................................................... 25

2.3.3 使用GET 方式抓取数据 ........................................................................................ 26

2.3.4 使用POST 方式抓取数据 ...................................................................................... 27

2.4 使用Beautiful Soup 解析网页 ....................................................................................... 30

2.5 清洗和组织数据 ............................................................................................................. 34

2.6 爬虫攻防战 ..................................................................................................................... 35

第3 章 用API 爬取天气预报数据 ............................................................... 38

3.1 注册免费API 和阅读技术文档 ..................................................................................... 38

3.2 获取API 数据 ................................................................................................................ 40

3.3 存储数据到MongoDB ................................................................................................... 45

3.3.1 下载并安装MongoDB ............................................................................................ 45

3.3.2 在PyCharm 中安装Mongo Plugin ......................................................................... 46

3.3.3 将数据存入MongoDB ............................................................................................ 49

3.4 MongoDB 数据库查询 ................................................................................................... 52

第4 章 大型爬虫案例:抓取某电商网站的商品数据 ................................... 55

4.1 观察页面特征和解析数据 ............................................................................................. 55

4.2 工作流程分析 ................................................................................................................. 64

4.3 构建类目树 ..................................................................................................................... 65

4.4 获取产品列表 ................................................................................................................. 68

4.5 代码优化 ......................................................................................................................... 70

4.6 爬虫效率优化 ................................................................................................................. 74

4.7 容错处理 ......................................................................................................................... 77

第5 章 Scrapy 爬虫 ................................................................................... 78

5.1 Scrapy 简介 ..................................................................................................................... 78

5.2 Scrapy 安装 ..................................................................................................................... 79

5.3 案例:用Scrapy 抓取股票行情 .................................................................................... 80

第6 章 Selenium爬虫 ................................................................................ 88

6.1 Selenium 简介 ................................................................................................................. 88

6.2 案例:用Selenium 抓取电商网站数据 ........................................................................ 90

 

第7 章 数据库连接和查询 ........................................................................ 100

7.1 使用PyMySQL ............................................................................................................ 100

7.1.1 连接数据库 ............................................................................................................ 100

7.1.2 案例:某电商网站女装行业TOP100 销量数据 ................................................. 102

7.2 使用SQLAlchemy ........................................................................................................ 104

7.2.1 SQLAlchemy 基本介绍 ......................................................................................... 104

7.2.2 SQLAlchemy 基本语法 ......................................................................................... 105

7.3 MongoDB ...................................................................................................................... 107

7.3.1 MongoDB 基本语法 .............................................................................................. 107

7.3.2 案例:在某电商网站搜索“连衣裙”的商品数据 ............................................ 107

第8 章 NumPy ......................................................................................... 109

8.1 NumPy 简介 .................................................................................................................. 109

8.2 一维数组 ........................................................................................................................110

8.2.1 数组与列表的异同 .................................................................................................110

............




出版信息

书 名Python 3网络爬虫开发实战

系列书名图灵原创

执行编辑关于本书的内容有任何问题,请联系 王军花

书 号978-7-115-48034-7

页 数608

印刷方式单色

开 本16开

出版状态正在排版

定价99.00

 

 

本书特色

1.本书详细介绍了爬虫的关键技术,涵盖面广,实用性强。

2.本书作者崔庆才,北京航空航天大学硕士,北京钉趣网络公司技术总监,其个人博客为cuiqingcai.com,其上爬虫文章的浏览量总计已过百万。

 

目录

本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,最后介绍了pyspider框架、Scrapy框架和分布式爬虫。

本书适合Python程序员阅读。


用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有