- 内容介绍热点排行相关文章下载地址↓
-
本书介绍了网络爬虫开发中的关键问题与java实现。主要包括从互联网获取信息与提取信息和对web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教材。
目录:
第1篇 自己动手抓取数据
第1章 全面剖析网络爬虫
第2章 分布式爬虫
第3章 爬虫的“方方面面”
第2篇 自己动手抽取web内容
第4章 “处理”html页面
第5章 非html正文抽取
第6章 多媒体抽取
第7章 去掉网页中的“噪声”
第3篇 自己动手挖掘web数据
第8章 分析web图
第9章 去掉重复的“文档”
第10章 分类与聚类的应用 -
人气书籍
-
算法导论 (原书第二版) 中文 PDF 清晰版 [48.6M]
48.6MB | 简体中文
-
61.03MB | 简体中文
-
WPF编程宝典 C#2010版 中文 PDF版 [118M]
118MB | 简体中文
-
Windows程序设计 (第5版 珍藏版)(Programming Windows, 5th Edit
390MB | 简体中文
-
深入理解计算机系统(原书第3版) 中文pdf完整版[500MB]
500.9MB | 简体中文
-
设计模式:可复用面向对象软件的基础 PDF 扫描版[21M]
21.58MB | 简体中文
-
OpenCV3编程入门 (毛星云著) PDF扫描版[61MB]
60.9MB | 简体中文
-
73.34MB | 简体中文
-
4.6MB | 简体中文
-
-
相关文章
-
网友评论
-
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的自己动手写网络爬虫(罗刚、王振东) PDF 扫描版[27M]资源来源互联网,版权归该下载资源的合法拥有者所有。