一款全新的网页数据采集工具:爬山虎

2017-12-02 17:26:25 +08:00
 oness

前言

现在互联网上有这么多的采集器,我们为什么要开发爬山虎呢?

原因很简单,大部分已有的软件用起来不爽,于是我们就自己开发了一个。

特性

爬山虎采集器是一款全新的网页数据采集工具。作为一款工具软件,我们:

  1. 放弃了花哨的界面,换之以快速流畅的体验。
  2. 放弃了复杂的规则配置,开发了智能的自动提取算法。
  3. 在基于浏览器的可视化操作上,同时保留了快速的 HTTP 引擎架构。

爬山虎采集器在保持了用户体验、用户低学习成本的同时,兼顾了软件的数据抓取效率。

数据采集

爬山虎采集器能够采集互联网上的绝大部分网页,比如动态网页、静态网页、单页程序、表格数据、列表数据、文章数据、搜索引擎结果、下载图片等等。

发布数据

在采集到数据后,还可以发布到 CSV、Excel、MySQL、SQLite、Access、MSSQL、以及网站 API 接口上。

当然爬山虎采集器作为一个新上场的选手,跟前辈们相比,可能会有些缺点、问题。

欢迎您下载试用,并且给我们提供宝贵的意见。(如果你懒得下载,可以看下网站首页的演示视频:)

爬山虎采集器网站

编辑器

16938 次点击
所在节点    分享创造
81 条回复
ys746663912
2018-10-01 13:13:16 +08:00
@oness 考虑开发 mac 版吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/411413

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX