首页 游戏 软件 排行 智能

如何采集58同城上面信息 58同城采集信息教程

来源: 西西整理 日期:2017/11/8 17:42:13

如何采集58同城上面信息?采集教程每一家公司中都会有专门的招聘专员,作为一名优秀的招聘专员,就一定要学会如何在58同城上采集一些有价值的招聘信息。现在就让西西小编教教你如何正确的采集宝贵的信息吧!

步骤:

首先需要找好专门的采集软件,今天西西小编主要用的是熊猫采集软件。需要到官网下载这个软件。

然后打开我们这次采集需要的工具熊猫采集软件,点击新建项目(标准)。

随便输入一个项目名称,或者不输入也是可以的,系统默认会给你命名一个文件名,这里因为我是准备采集58二手房上面的电话号码的信息 我就起了一个我需要的名称。

然后点击下一步。

进入标题列表页及其翻页设置,列表页是包含我们要采集内容的链接网址的页面,比如百度搜索一个关键词,会列出来很多网页,这些网页我们就可以认为是标题列表页面。在58上面找到我们要采集的标题列表页。

将页面的网址拷贝到我们的熊猫软件中。

点击开始分析。

如果我们需要翻页采集,那么选择是即可,不要则选择否即可。我这里没有设置翻页采集,我选择的是否,当然这个根据实际情况来决定。

点击下一步设置,进入选择内容页的设置,随便选择一个我们要采集的链接,会发现右边我们要采集的链接全部被红框框选起来了。那么这里我们就不要进行调整,直接再次下一步设置。

来到内容页面模板管理,直接点击添加新模板,会把我们在上一步选中的链接作为模板,这地方也可以自己选择一个模板,然后把网址粘贴到添加新模板按钮左边的文本框里,点击添加新模板。

点击添加新模板之后会弹出一个设置模板的新窗口。点击软件上方的开始分析,稍等片刻之后软件会询问你是否需要软件自动提取标题正文,一般情况下我们在这里都会选择否,如果你是采集新闻类的内容,那么你也可以选择是。

之后我们会发现左边款里面会出现很多我们在网页中能看见的内容,这个时候我们需要什么就勾选上采集该项即可。

这个时候我们会发现,上面模板如果是我们是用的个人二手房源的话,那么我在左边是看不到电话号码的信息的,看到的只会是一张图片,这个时候我们只需要稍微做点手脚就可以采集图片上面的电话号码了。像58同城这种网站,我们会发现在wap上面访问这个内容时,看到的电话号码就是数字了。那么我们只需要知道wap访问的时候是什么网址就可以了。

勾选上之后,输入我们的中介规则。

然后然后替换到网址,组合一下就会出现我们要采集的那个手机访问出来的页面地址。

点击添加按钮之后,勾选上该链接为指向下级子页面的链接,点击分析链接指向的页面,然后进入到我们下级子页面。

在子页面里面我们开始设置,点开始分析按钮。

这个时候我们再去采集我们要采集的电话号码会发现已经变成数字了,不在是一张图片了。

然后再里面寻找自己想要的信息就可以了。

玩家留言 跟帖评论
查看更多评论
相关文章
猜你喜欢
同类下载