分类

安卓应用安卓游戏攻略资讯

网络辅助

SysNucleus WebHarvy(网页数据抓取工具)

SysNucleus WebHarvy(网页数据抓取工具) v5.2.0.155 免费版

大小:59.42 MB

语言:简体中文系统:WinXP, Win2003, Vista, Win7, Win8, Win10

类别:网络辅助时间:2018-03-30

SysNucleus WebHarvy是一款专业的网页数据抓取工具,采用自动检测模式,智能识别web页面的数据模式,可以抓取网页中的重要数据,将数据导出到数据库和文件夹中,支持多个页面提取数据,从事网站管理软件的朋友可以来本站下载!

软件特点

1、点击界面

WebHarvy是一个视觉网络刮板。绝对不需要编写任何脚本或代码来抓取数据。您将使用WebHarvy的内置浏览器浏览网页。您可以选择要点击的数据。这很容易!

2、自动模式检测

WebHarvy自动识别网页中发生的数据模式。因此,如果您需要从网页上刮取项目列表(名称,地址,电子邮件,价格等),则无需执行任何其他配置。如果数据重复,WebHarvy会自动删除它。

3、导出抓取的数据

您可以以多种格式保存从网页中提取的数据。WebHarvy Web Scraper的当前版本允许您将抓取的数据导出为Excel,XML,CSV,JSON或TSV文件。您也可以将抓取的数据导出到SQL数据库。

4、从多个页面提取数据

通常,网页在多个页面上显示产品列表等数据。WebHarvy可以自动抓取并从多个页面提取数据。只需指出“链接到下一页”,WebHarvy Web Scraper就会自动从所有页面中抓取数据。

5、基于关键字的Scraping

通过自动提交搜索表单的输入关键字列表来抓取数据。任何数量的输入关键字可以提交给多个输入文本字段来执行搜索。可以提取所有输入关键字组合的搜索结果数据。

6、类别提取

WebHarvy Web Scraper允许您从链接列表中获取数据,从而导致网站中出现类似的页面/列表。这使您可以使用单一配置来刮取网站内的类别和子类别。

7、正则表达式

WebHarvy允许您在网页的文本或HTML源代码上应用正则表达式(RegEx)并删除匹配的部分。这种强大的技术为您提供更多的灵活性,同时抓取数据。

8、运行JavaScript

在提取数据之前在浏览器中运行您自己的JavaScript代码。这可以用来与页面元素交互或者调用已经在目标页面中实现的JavaScript函数。

9、下载图片

可以下载图像或者提取图像URL。WebHarvy可以自动提取电子商务网站的产品详细信息页面中显示的多个图像。

10、自动浏览器交互

WebHarvy可以很容易地配置执行任务,如点击链接,选择列表/下拉选项,输入文本到一个字段,滚动页面等。

SysNucleus WebHarvy安装教程

1、双击安装文件,进入欢迎界面,点击next

2、阅读许可协议,勾选“I accept...”表示同意协议

3、选择安装位置

4、确认安装信息,点击“install”

5、安装完成

展开

猜您喜欢

同类推荐

网友评论