失效链接处理 |
二级课题某招聘网站爬虫 PDF 下载
本站整理下载:
相关截图:
![]()
主要内容:
利用所学的知识,对要爬取的网站进行具体的分析,同时对网页中的数据进行有效的
提取,导入到数据库,并在图形界面里进行展示。
1.1 问题描述
随着互联网的发展,网络上的资源变得日益丰富但却驳杂不堪,信息的获取成本变得
更高,而且互联网中的数据是海量的,如何自动高效地获取互联网中我们感兴趣的信息并
为我们所用是一个重要的问题,而爬虫技术就是为了解决这些问题而生的。
针对招聘网站中对我们有用的数据,可以采取网络爬虫来方便快捷的获取到。
1.2 项目分析
利用网页内容的规律性和所学习的 HTML 基本语法,利用 JAVA 提取到有用的信息,
再将其与数据库连接,最后设计窗口展示。
1.3 工程进度
第一周学习相关知识内容,包括 JDBC,HTML 基本语法,Druid 连接池,实现对本
地静态网页的数据爬取。
第二周开始学习如何对招聘网站进行真正的数据爬取,以及图形界面的设计实现
|