| ISBN/价格: | 978-7-302-67825-0:CNY59.80 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | Python爬虫大数据采集与挖掘/.曾剑平编著 |
| 版本项: | 第2版 |
| 出版发行项: | 北京:,清华大学出版社:,2025 |
| 载体形态项: | X, 286页:;+图:;+26cm |
| 丛编项: | 大数据与人工智能技术丛书 |
| 一般附注: | 计算机学科组“十四五”规划教材 水木书荟 |
| 提要文摘: | 本书共分为四大部分, 即概述、基础篇、技术与实现篇、大数据挖掘与应用篇。第一部分是概述, 指出了利用Python采集互联网大数据的重要性, 介绍了相关技术研究、技术体系、Python爬虫采集技术的合规性及应用现状等 ; 第二部分是基础篇, 包括Web服务器的应用架构以及HTTP、Robots、HTML、页面编码等相关协议和规范 ; 第三部分是技术与实现篇, 全面介绍了普通网络爬虫技术、动态页面采集方法、主题爬虫技术、DeepWeb爬虫、微博信息采集、Web信息提取以及反爬虫技术等, 内容涵盖了各种爬虫技术实现方法及Python例子 ; 第四部分是大数据挖掘与应用篇, 介绍了文本、情感、社交网络和时间序列等典型大数据处理与挖掘技术及应用模式, 并以新闻采集与分析、Web自动化测试、酒店评估文本挖掘为例介绍了Python爬虫应用构建方法, 将本书介绍的一些关键技术、模型和工具贯穿在一起。 |
| 题名主题: | 程序语言 程序设计 教材 |
| 非控主题词: | Python |
| 中图分类: | TP312 |
| 个人名称等同: | 曾剑平 编著 |