本书将介绍如何使用Python编写网络爬虫程序获取互联网上的大数据。本书包括三部分内容: 基础部分、进阶部分和项目实践。基础部分 (第1-6章) 主要介绍爬虫的三个步骤 (获取网页、解析网页和存储数据), 并通过诸多示例的讲解, 让读者从基础内容开始系统性地学习爬虫技术, 并在实践中提升Python爬虫水平; 进阶部分 (第7-12章) 包括多线程的并发和并行爬虫、分布式爬虫、更换IP等, 帮助读者进一步提升爬虫水平; 项目实践部分 (第13-16章) 使用本书介绍的爬虫技术对几个真实的网站进行抓取, 让读者能在读完本书后根据自己的需求写出爬虫程序。
作者:邢青青,张晓萍,于希辰
出版:西安电子科技大学出版社,2022
作者:孔祥盛
出版:人民邮电出版社,2022
作者:翟世臣,张良均
出版:人民邮电出版社,2022
作者:王永青
出版:经济管理出版社,2024
基于SECG教学模式的中小学音乐大单元主题教学设计与实践研究
作者:戴智,
出版:东北师范大学出版社,2024
作者:刘欢
出版:中国经济出版社,2024