WebHarvy内置高级网页浏览工具,帮助您轻松访问所需网站,以便选择需要的图像、文本或产品列表等内容进行捕获提取。该程序支持同时从多个网站页面捕获内容,只要点击跳转到下一页,就可以快速实现。
点击场景布局
WebHarvy是一个视觉收集刮板。相对不需求编写任何脚本或代码来抓取数据。您将运用WebHarvy的内置阅读器阅读网页。您可以选摘要点击的数据。这很轻易!
主动形式检测
此软件主动辨认网页中产生的数据形式。是以,若是您需求从网页上刮取项目列表(称号,地址,电子邮件,价钱等),则无需履行任何其他设置。若是数据反复,此软件会主动删除它。
导出抓取的数据
您可以以不同格局保留从网页中提取的数据。此软件WebScraper确当前版本许可您将抓取的数据导出为Excel,XML,CSV,JSON或TSV文件。您也能够将抓取的数据导出到SQL数据库。
从多个页面提取数据
凡是,网页在多个页面上展示产物列表等数据。此软件可以主动抓取并从多个页面提取数据。只需指出链接到下一页,此软件WebScraper就会主动从一切页面中抓取数据。
基于重点字的Scraping
经由主动提交搜刮表单的输出重点字列表来抓取数据。任何数目的输出重点字可以提交给多个输出文本字段来履行搜刮。可以提取一切输出重点字组合的搜刮成果数据。
经由代办署理服务器
为了匿名抓取并避免收集抓取软件被收集服务器禁止,您可以选择经由代理服务器或V PN拜候方针网站。可使用单个代办署理服务器地址或代办署理服务器地址列表。
种别提取
此软件WebScraper许可您从链接列表中获得数据,从而致使网站中呈现近似的页面/列表。这使您可使用单一设置来刮取网站内的种别和子种别。
正则表达式
此软件许可您在网页的文本或HTML源代码上运用正则表达式(RegEx)并删除匹配的部门。这类厉害的功能为您供给更多的矫捷性,同时抓取数据。
运转JavaScript
在提取数据之前在阅读器中运转您本身的JavaScript代码。这可以用来与页面元故旧互或挪用已在方针页面中完成的JavaScript函数。
下载图片
可以下载图象或提取图象URL。此软件可以主动提取电子商务网站的产物具体信息页面中展示的多个图象。
主动阅读器交互
此软件可以很轻易地设置履行义务,如点击链接,选择列表/下拉选项,输出文本到一个字段,转动页面等。
修复了页面启动的时候能够致使禁用毗连。
可以对页面形式设置专属的毗连技巧。
可以主动搜刮HTML上可以设置的资本。
增添了键盘向下转动下一页的性能。
增添了经由Java脚本加载下一页。
加入了URL设置的性能。
可以将重点字输出一个列表上2搜刮。
该程序可使用自定义的正则表达式从多个页面捕获数据,还允许通过代理服务器或VPN服务进行匿名抓取。另外,内置浏览工具可运行Java脚本,而且还能单独捕获HTML源代码的特定部分。
看了这么多,你下载了WebHarvy吗?想要下载最新软件就来软件爱好者好玩的游戏、简单易懂的软件教程、令人耳目一新的游戏玩法这里统统都有,更多精彩不容错过!
随着比特币在全球的火热程度不断增加,有很多用户都已经知晓比特币了,不过却不知道比特币是什么类型的货币,所以只是知道没有过多的了解,小编已经将比特币的类型和性质信息都分享在下方了,想要了解的用户都来看看吧。