关键字:爬虫

正文 | 内容

01

【介绍】

一个爬虫代码。主要用于对公众号进行获取数据使用的。使用的python进行开发的。内容比较简单。可以简单试用下。

02

【技术框架】

1、python环境, 检查python的版本,是否为2.7.x,如果不是,安装2.7.6。

2、安装依赖包, clone代码 安装Mysql-python依赖

yum install python-devel mysql-devel gcc

安装lxml依赖

yum install libxslt-devel libxml2-devel

安装浏览器环境 selenium依赖.(如果是mac环境,仅需安装firefox, 但确保版本是 firefox 36.0,使用最新的版本会报错)

yum install xorg-x11-server-Xvfb
yum upgrade glib2 # 确保glib2版本大于2.42.2,否则firefox启动会报错
yum install firefox # centos下安装最新的firefox版本

clone代码,安装依赖python库

$ git clone https://github.com/bowenpay/wechat-spider.git
$ cd wechat-spider
$ pip install -r requirements.txt

3、创建mysql数据库

创建数据库wechatspider,默认采用utf8编码。(如果系统支持,可以采用utf8mb4,以兼容emoji字符)

mysql> CREATE DATABASE `wechatspider` CHARACTER SET utf8;

4、安装和运行Redis

$ wget http://download.redis.io/releases/redis-2.8.3.tar.gz
$ tar xzvf redis-2.8.3.tar.gz
$ cd redis-2.8.3
$ make
$ make install
$ redis-server

5、更新配置文件local_settings

在 wechatspider 目录下,添加 local_settings.py 文件,配置如下:

6、初始化表

$ python manage.py migrate

7、启动网站

python manage.py runserver 0.0.0.0:8001

访问 http://localhost:8001/。

创建超级管理员账号,访问后台,并配置要爬取的公众号和关键字

python manage.py createsuperuser

8)启动爬虫

$ python bin/scheduler.py
$ python bin/downloader.py
$ python bin/extractor.py
$ python bin/processor.py

03

【源码获取方式】

https://github.com/bowenpay/wechat-spider.git



公众号ID:  itcode

微信ID:  itcoder


【写作说明】以上文章属于此公众号原创所有,如需转载请注明出处。【免责申明】本公众号不是广告商,也没有为其他三方网站或者个人做广告宣传。文章发布源代码和文章均来源于各类开源网站社区或者是小编在项目中、学习中整理的一些实例项目。主要目的是将开源代码分享给喜欢编程、有梦想的程序员,希望能帮助到你们与他们共同成长。其中用户产生的一些自愿下载或者付费行为,原则与平台没有直接关系。如果涉及开源程序侵犯到原作者相关权益,可联系小编进行相关处理。

【投稿邮箱】315997972@qq.com

—————————————

目前已有1000000+优秀的程序员加入我们

                         

                         

———————————————

【你的每一份打赏就是对我最真诚的鼓励】

【程序源代码】微信爬虫相关推荐

  1. python爬取微信小程序源代码_爬虫爬取微信小程序

    之前打算做个微信小程序的社区,所以写了爬虫去爬取微信小程序,后面发现做微信小程序没有前途,就把原来的项目废弃了做了现在的网站观点,不过代码放着也是放着,还不如公开让大家用,所以我把代码贴出来,有需要的 ...

  2. 【程序源代码】微信小程序商城管理系统(Java后台+微信小程序)最新版

    关键字:微信小程序 商城系统 02 - [技术框架] 微信小程序商城管理系统(Java后台+微信小程序) 基于Spring+Vue+Mysql+Redis主流技术开发框架集成开发的微信商场管理系统:其 ...

  3. 【程序源代码】小程序最佳开发实践-租房小程序

    " 关键字:小程序开发 云开发 最佳实践"  正文:小程序  基于微信小程序云开发的一款租房小程序.主要用于租房信息发布.该项目的特点主要是基于小程序的云开发技术进行实现的,使用到 ...

  4. 【程序源代码】驾校模拟考试系统

    " 关键字: 驾校模拟考试系统 学习案例 " 正文:驾校模拟考试系统 驾校模拟考试系统 软件架构 springboot+vue        适合对象 学生.前端工程师.后端开发工 ...

  5. 【程序源代码】完全开源仓储管理软件

    " 关键字: 企业平台  "  正文:后台管理系统 介绍 完全开源仓储管理软件,遵循Apache License 2.0协议,前后端分离,且完全开源,API使用restful协议, ...

  6. 【程序源代码】VUE驾校模拟考试系统

    " 关键字: 驾校模拟考试系统 学习案例 " 正文:驾校模拟考试系统 驾校模拟考试系统 软件架构 vue主要就是使用了vue这个框架,        适合对象 学生.前端工程师.后 ...

  7. java反编译微信小程序_教你如何一键反编译获取任何微信小程序源代码(图形化界面,傻瓜式操作)...

    一键获取微信小程序源代码 1 Tips:2 一键获取微信小程序源码, 使用了C#加nodejs制作 直接解压在D盘根目录下后就可以使用 将小程序文件放到 wxapkg目录下 3 这个目录下有一些dem ...

  8. 【程序源代码】微信小程序商城-最新源码

    关键字:微信小程序 商城源码 前后端都有 正文 | 内容 01 - 基于Spring Boot和微信小程序框架开发.其中包括微信小程序和后台管理端,功能上常用的功能都有包括:分销(支持三级).团购(拼 ...

  9. 【程序源代码】微信小程序商城

    " 关键字:小程序"  正文:小程序 01 - 微信小程序商城,微信小程序微店03微信小程序商城,微信小程序微店03微信小程序商城,微信小程序微店03微信小程序商城,微信小程序微店 ...

  10. 【程序源代码】微信小程序商城,微信小程序微店

    关键字:开源微信小程序商城 正文 | 内容 01 - 商城前端使用uni-app开发, 可打包部署到微信小程序, APP, H5,系统后台则是用java语言开发.   https://gitee.co ...

最新文章

  1. nil slice 和 空 slice
  2. apache工作原理
  3. oracle 作业 断开原因,解惑 | Oracle JOB 异常中断原因分析
  4. 【PS】WBS结算到建工程问题
  5. python 艺术照片滤镜_使用Python创建自己的Instagram滤镜|视觉实战
  6. php静态资源服务器,Node实现静态资源服务器
  7. 如何解决anaconda出现CondaHTTPError问题
  8. java web环境_java web
  9. python静态方法怎么调用_python实例方法、静态方法和类方法
  10. 华为星环大数据_大数据平台-华为和星环
  11. excel填充序列_EXCEL工资表制作后导入工资条方法,实现1秒搞定,万人群发
  12. word文档通配符换行_Word怎么批量删除分隔符
  13. 混沌数学之Chua's circuit(蔡氏电路)
  14. Scala学习笔记(三)类层级和特质
  15. html选区控制怎么用,ps载入选区的快捷键是什么?
  16. 高防服务器与高防IP的区别和联系
  17. UI层自动化测试框架(五):业务层和用例层
  18. 一分钟教你看懂蓝屏代码,轻松解决电脑蓝屏问题
  19. FAST迅捷FW150US无线网卡安装说明
  20. Redis和memcache的异同以及Redis的主从配置

热门文章

  1. Java 回调函数(传统方法和lambda方法)-一个例子秒懂
  2. android中h5页面播放声音,【报Bug】h5+的Android版的打包之后无法播放声音
  3. 【C语言】程序阅读题
  4. 发现一个宝藏!全网最全的Python算法仓库!
  5. 如何处理 Java 中的 NumberFormat 异常
  6. DirectX11 环境光
  7. 电力系统机组组合(Matlab代码实现)
  8. Win10开机弹出msn中文网该怎么取消?取消开机弹出msn导航的方法
  9. 程序员日常小工具集棉
  10. 三菱FX3U与8和称重仪通信的程序。 主要功能是记录8个工位的重量 程序使用ST语言与梯形图的接合运用,使用三菱MODBUS 专用指令,8站轮询