
本书将介绍如何使用Python编写网络爬虫程序获取互联网上的大数据。本书包括三部分内容: 基础部分、进阶部分和项目实践。基础部分 (第1-6章) 主要介绍爬虫的三个步骤 (获取网页、解析网页和存储数据), 并通过诸多示例的讲解, 让读者从基础内容开始系统性地学习爬虫技术, 并在实践中提升Python爬虫水平; 进阶部分 (第7-12章) 包括多线程的并发和并行爬虫、分布式爬虫、更换IP等, 帮助读者进一步提升爬虫水平; 项目实践部分 (第13-16章) 使用本书介绍的爬虫技术对几个真实的网站进行抓取, 让读者能在读完本书后根据自己的需求写出爬虫程序。
作者:费诚
出版:经济科学出版社,2025
作者:史浩,吴金旺
出版:清华大学出版社,2024
作者:肖(Shaw, Anthony)
出版:人民邮电出版社,2024
作者:陈姣娣,孙晓媚
出版:文化发展出版社,2025
作者:马文军
出版:企业管理出版社,2025
作者:邵曲玲
出版:吉林出版集团股份有限公司,2025