一、背景

    股民是网络用户的一大群体,他们的网络情绪在一定程度上反映了该股票的情况,也反映了股市市场的波动情况。作为一只时间充裕的研究僧,我课余时间准备写个小代码get一下股民的评论数据,分析以下用户情绪的走势。这个博客还会修改,因为结果不准确,哈哈!

二、数据来源

    本次项目不用于商用,数据来源于东方财富网,由于物理条件,我只获取了一只股票的部分评论,没有爬取官方的帖子,都是获取的散户的评论。

三、数据获取

Python是个好工具,这次我使用了selenium和PhantomJS组合进行爬取网页数据,当然还是要分析网页的dom结构拿到自己需要的数据。

爬虫部分:

#!/usr/bin/env python
# -*- coding: UTF-8 -*-
'''
Created on 2017��5��17��
@author: luhaiya
@id: 2016110274
@description:
'''
from selenium import webdriver
import time
import json
import re
# from HTMLParser import HTMLParser
from myNLP import *
# from lxml import html
# import requests
class Crawler:url = ''newurl = set()headers = {}cookies 

Python爬虫股票评论,snowNLP简单分析股民用户情绪(草稿)相关推荐

  1. python爬虫股票分析准不准_教你用Python爬虫股票评论,简单分析股民用户情绪

    这里是文件夹列表 main(); function main(){ var stocknum = 600000; getDate(stocknum); } function getDate(stock ...

  2. python爬取股票评论_Python爬虫股票评论,snowNLP简单分析股民用户情绪

    原标题:Python爬虫股票评论,snowNLP简单分析股民用户情绪 一.背景 股民是网络用户的一大群体,他们的网络情绪在一定程度上反映了该股票的情况,也反映了股市市场的波动情况.作为一只时间充裕的研 ...

  3. Python爬虫+数据分析+数据可视化(分析《雪中悍刀行》弹幕)

    Python爬虫+数据分析+数据可视化(分析<雪中悍刀行>弹幕) 哔哔一下 爬虫部分 代码部分 效果展示 数据可视化 代码展示 效果展示 视频讲解 福利环节 哔哔一下 雪中悍刀行兄弟们都看 ...

  4. python爬虫实践--晋江小说书籍分析

    系列文章目录 python爬虫实践–晋江小说书籍分析 python爬虫实践-腾讯视频弹幕分析 python爬虫实践-B站弹幕分析 文章目录 系列文章目录 目录 爬取晋江排行榜 爬取文案 其它想法 结语 ...

  5. 编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法

    这篇文章主要介绍了编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法,用到了Python的urllib和urllib2模块,需要的朋友可以参考下 抓取豆瓣电影TOP100 一.分析豆瓣top ...

  6. python爬虫豆瓣评论实验报告_用python实现豆瓣短评通用爬虫(登录、爬取、可视化分析)...

    原创技术公众号:bigsai 前言 在本人上的一门课中,老师对每个小组有个任务要求,介绍和完成一个小模块.工具知识的使用.然而我所在的组刚好遇到的是python爬虫的小课题. 心想这不是很简单嘛,搞啥 ...

  7. python爬虫实例-python3.7简单的爬虫实例详解

    python3.7简单的爬虫,具体代码如下所示: #https://www.runoob.com/w3cnote/python-spider-intro.html #Python 爬虫介绍 impor ...

  8. python爬虫微博评论图片_python爬虫爬取微博评论

    原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...

  9. Python爬虫实战项目:简单的百度新闻爬虫

    这个实战例子是构建一个大规模的异步新闻爬虫,但要分几步走,从简单到复杂,循序渐进的来构建这个Python爬虫 本教程所有代码以Python 3.6实现,不兼顾Python 2,强烈建议大家使用Pyth ...

最新文章

  1. Java 事件适配器 Adapter
  2. Facebook开源最大规模并行语料,45亿语料,覆盖576种语言对
  3. ActiveMQ中Queue消费者
  4. win10组件服务计算机是红色的,KB4023057:Windows 10更新服务组件的更新
  5. php中0与NULL,False,“0”,\0的区别
  6. Scikit-Learn 机器学习笔记 -- SVM
  7. 如何提升 Kestrel 上传文件的大小限制?
  8. 第十四期: 拥有7000多万店铺和10多亿件商品的微店如何打造AI系统?
  9. Springboot 整合 swagger
  10. 快速简易的分解歌词文件
  11. jqgrid 编辑列拿不到值_如何在DAX Stadio和Excel中返回表和度量值?
  12. OpenStack 存储服务 Cinder介绍和控制节点部署 (十三)
  13. MapBox本地化部署
  14. ugui 转轮_unity3D的FingerGestures小工具
  15. 网页怎么算切屏_电脑怎么切屏
  16. Android接收短信和发送短信
  17. 熊猫烧香.威金.落雪.SXS.ARP.网络执法管.AUTORUN.INF等高危病毒清除
  18. 在华为13年的峥嵘岁月后,我加入了一个13人的初创团队
  19. C语言编程>第三周 ⑦ 将一个数组逆序输出。
  20. iPhone播放音乐

热门文章

  1. 计算机网络基础之多路复用技术
  2. ecology9.0
  3. 【瑞萨RA_FSP】DMAC/DTC——直接存储器访问与数据传输
  4. 全面注册制来了, U9 cloud如何支持IPO企业信息披露?
  5. 织梦网站php源码安装,加固版织梦CMS整站源码通用安装教程
  6. 【GPU精粹与Shader编程】(一) 开篇 全系列11本书核心知识点总览
  7. 现代最前沿成果之一---G1垃圾收集器器详解
  8. 配置MySQL字符集教程
  9. 【安卓】选项卡之顶部选项卡(简易)
  10. 2023中国消费行业趋势前瞻与机遇展望