随着数字化进程的加速,企业越来越重视数据的价值。根据IDC预计,全球大数据市场规模在2019年将达到1870亿美金。其中,企业除了关注自身的经营数据之外,对于外部数据,尤其是与自身息息相关的(如竞品动态、舆情信息等)数据也非常关注。

在获取这些数据时,最常用的手段就是爬虫技术。但传统的爬虫开发难度大,除了需要自己搭建服务器并运维,还需要工程师根据爬取需求编写代码、对接代理服务等等。计算下来,企业平均每月开发和运维成本往往需要上万元。

而猎云网今天带来的“神箭手”则为个人开发者和企业提供了简单便捷的爬虫工具。该项目创始人吴桐2013年硕士毕业于西安交大软件工程专业,毕业后加入谷歌搜索基础设施组,2014年离开谷歌创办壁虎数据恢复项目。

2015年8月,吴桐再度出发创办神箭手,从爬虫切入,希望把谷歌的大数据开发的管理理念带给更多用户。其核心创始团队都是吴桐的大学同窗,从大三时期就与吴桐一起创业。吴桐向猎云网独家透露,神箭手曾于2015年11月获得过来自中路资本的数百万元天使轮融资。

吴桐介绍,神箭手致力于成为一个一站式大数据应用开发平台,旨在通过为客户提供完整的开发架构和套件,降低大数据和AI应用开发的部署难度,实现从数据采集、清洗、训练、导出的完整生命周期。

当然,对于尚在起步阶段的神箭手来说,实现完整数据处理周期尚需时日。不过,该平台已经在第一步的数据采集方面体现出了自己的特点与优势。“爬虫市场”就是其中之一。

为了最大限度降低个人开发者和企业使用爬虫的技术门槛,神箭手团队自行编写了上百个爬虫,使用者无需关注如何设置IP、如何设置验证码,甚至对编程一窍不通的小白用户,也可以直接使用。

  神箭手操作界面

据猎云网了解,神箭手提供的爬虫可爬取的数据源囊括社交、电商、生活服务、互金、休闲旅游、汽车交通、医疗健康以及其他等多种分类。包括微博、淘宝、天猫、京东等网站的爬虫,都能在爬虫市场中找到。

值得一提的是,神箭手提供的爬虫目前全部都是团队自行编写。之所以尚未提供第三方开发者编写的爬虫,吴桐认为,爬虫对于代码编写技术要求较高,否则在运行时稳定性将受到影响。

虽然如此,但吴桐强调,现在的神箭手并非仅仅提供傻瓜式爬虫,而是一个开发平台。如果平台提供的爬虫无法满足用户需求,那么有开发实力的用户也可以在神箭手平台上自行编写爬虫并使用,并且平台对于这种用户还会有一定的鼓励。

除爬虫以外,目前平台也提供了诸多API调用。“其实,无论是爬虫还是API,甚至是直接购买数据池,都是用户获取数据的方式。我们希望夯实数据采集的第一步,再为用户提供后续的数据服务。”吴桐说。

在商业模式上,神箭手采用的是销售计算节点(服务器)的方式,每个节点79元,节点越多,爬虫爬取的速度越快。当然,平台也有套餐销售,根据节点数不同分为个人版和企业版。用户购买节点之后,根据爬虫所适用的最低套餐即可使用爬虫。而API则根据调用次数进行收费。

自2015年底产品上线以来,神箭手已积累了超过4万名用户注册使用,其中包括500多家企业套餐付费客户,目前月收入已超过20万元。

在数据采集器市场,其实已有包括八爪鱼这种工具存在。对于细分领域的竞争,吴桐认为,八爪鱼等产品是以软件形式存在,必须本地运行,这在数据爬取和软件更新时就会有所限制。而神箭手则是云服务形式,更灵活,自主性更强。另外其更专注对头部网站的爬取,这也是客户的重点需求。

接下来,吴桐透露,神箭手在解决了第一步数据采集之后,就要向云端机器学习、数据清洗、BI等后续环节迈进。另外,为企业提供私有化部署也是神箭手下一阶段的计划之一。

未来,吴桐希望能够将谷歌的代码管理理念融入神箭手,现在正在进行运行权限管理的研发,在未来实现云协同开发。

目前,该项目正在进行新一轮融资。

本文转自d1net(转载)

天使轮获数百万投资,神箭手从爬虫切入构建大数据应用开发平台相关推荐

  1. 玩具租赁品牌“玩巨人”获数百万元天使轮融资

    9月13日消息,据亿欧报道,玩具租赁品牌"玩巨人"获数百万元天使轮融资,投资方为欧洲DHS财团.杉杉基金.通大集团.本轮融资用于首批玩具租赁终端的制造.投放及运营. 玩巨人是一家用 ...

  2. 在线真人角色扮演,剧本杀“百变大侦探”获数百万元天使融资

    10月15日消息,剧本杀"百变大侦探"官方宣布获数百万元天使轮融资,本轮融资由"电竞女神"小苍及多名著名电竞主播共同投资.资金主要用于原创剧本的签约.用户的营销 ...

  3. 自主研发智能扭蛋机,快乐扭蛋获数百万 Pre-A 轮融资

    8月20日消息,今年 6 月扭蛋机品牌"快乐扭蛋"获数百万 Pre-A 轮融资,投资方为武汉一家上市公司个人股东.此前,快乐扭蛋曾获梅花创投个人投资人千万级天使轮融资. 快乐扭蛋成 ...

  4. 神箭手云爬虫平台 如何在1小时内编写简单爬虫

    既然你来到了这里,想必你肯定已经知道了神箭手云爬虫平台是干什么的,目的也是非常的明确. 那么接下来的过程中,我将给你演示如何在最快时间内编写一个简单的爬虫,每一个属性的讲解,将会让你一路顺风. dem ...

  5. 如何在神箭手云爬虫上写爬虫

    摘要   上一篇博客跟大家详细介绍了如何写出<黄焖鸡米饭是怎么火起来的>这样的数据分析类的文章,相信很多人都对数据来源也就是如何爬取到黄焖鸡米饭商家信息很感兴趣.那么今天我就跟大家具体讲一 ...

  6. 联系我们-神箭手云爬虫开发平台

    联系我们-神箭手云爬虫开发平台 联系我们-神箭手云爬虫开发平台 posted on 2016-07-22 17:54 lexus 阅读(...) 评论(...) 编辑 收藏 转载于:https://w ...

  7. 神箭手-云爬虫开发平台

    神箭手-云爬虫开发平台 神箭手-云爬虫开发平台 posted on 2016-07-22 17:55 lexus 阅读(...) 评论(...) 编辑 收藏 转载于:https://www.cnblo ...

  8. 杭州数澜联合创始人 \u0026 CTO 江敏:大数据思维和大数据冶炼 —— 拒绝坐着金山吃馒头...

    大家好,我是江敏,来自杭州数澜科技.我在 2007 年加入同花顺,前期主要做服务端的架构研发,后期主要负责组建同花顺大数据团队和构建大数据平台.2013 年,我加入阿里数据平台事业部数据服务团队,构建 ...

  9. 全国首个海洋大数据交易服务平台交易额破百万

    最近,北京比特大陆科技有限公司在推进海上风电业务的过程中需要风场.波浪场.流场等海洋环境分析数据,花费23万元购得了多项海洋领域专业数据.无独有偶,中国海洋大学也花费32万元购买了包括海洋大气预报数据 ...

最新文章

  1. 伍六七带你学算法 动态规划 ——不同路径
  2. php+下载+网路错误,下载zip文件“网络错误失败”(PHP / NGINX)
  3. Windows server2012虚拟机 密码重置
  4. Oracle 12c coming soon?
  5. oracle绑定变量赋值,Oracle教程之绑定变量
  6. 如何设计区块链项目的通证(token)模型
  7. stm32搭建mqtt_STM32+ESP8266+AIR202基本控制篇-102-服务器基本搭建-安装MQTT软件(.Windows系统)...
  8. Spark加载hadoop配置原理
  9. 一辈子的礼物56ay长沙论坛
  10. 经典编程问题之:选择排序、冒泡排序、汉诺塔游戏,均用js代码实现
  11. 英伟达正寻求欧盟批准其收购Arm
  12. 虚拟机Ubuntu20.04.2LTS卸载python3.8出现tty1-tty6循环登录,无法进入图形化界面,乱码(亲测)
  13. controller层没反应_打过蜡的石材再做结晶没效果怎么办?
  14. 网络安全技术心得体会
  15. fh 幅频特性曲线怎么画fl_放大电路幅频特性曲线的测试方法.PPT
  16. 数模算法:排队论模型
  17. Excel快速删除空白行与调整行高列宽的方法,学会了很实用
  18. centos7安装并使用supervisor管理服务队列
  19. 全国书画艺术之乡-----通渭
  20. vue导入pdf插件报错

热门文章

  1. 中国农业银行测试开发岗在线笔试题目
  2. 别被骗了,你以为建模师工资真的能年薪50W吗?
  3. python秒杀神器苏宁_Python苏宁易购免费试用申请一键执行脚本源代码
  4. 第十一届“泰迪杯”挑战赛作品提交仅剩2天了!!!
  5. 在Linux系统下XAMPP安装与配置(可离线安装)
  6. FPGA与MicroBlaze之间,MicroBlaze使用中断
  7. mvc2.0 html样式输出,MVC2.0中的HtmlHelper大全
  8. react-native原生GPS与高德地图坐标,百度地图坐标系的转换
  9. c语言能实现图片转字符画吗,图片转字符画
  10. HyperApp:用于构建前端应用程序的1 KB JavaScript库