"""
已周大生为例;
2018/4/10-2018/6/20
抓取业绩说明会前后的股民评论"""#!/usr/bin/env python
# -*-coding:utf-8 -*-
import urllib
import urllib2
import re
#导入对excel文件进行操作的库
import xlwt
#创建表格,设置编码模式,创建新的sheet
book=xlwt.Workbook(encoding='utf-8',style_compression=0)
sheet=book.add_sheet('dede',cell_overwrite_ok=True)#j的作用是对url不断进行修改,翻页
length1 = 1192
for j in range(1,20):     #print jurl = 'http://guba.eastmoney.com/list,002867,5,f_'+str(j)+'.html'try:request=urllib2.Request(url)response=urllib2.urlopen(request)content = response.read().decode('utf-8')pattern = re.compile('<span class.*?title=(.*?)>',re.S)title = re.findall(pattern, content)pattern = re.compile('<span class.*?<a href.*?data-popper.*?>(.*?)</a>', re.S)author = re.findall(pattern, content)pattern = re.compile('<span class.*?data-popper.*?</span><span class.*?>(.*?)</span>.*?<span class.*?>(.*?)</span>', re.S)time = re.findall(pattern, content)pattern = re.compile('<div class.*?articleh.*?<span.*?>(.*?)</span>.*?<span class.*?>(.*?)</span>', re.S)num = re.findall(pattern, content)for i in range(0,80):titleans=title[i+1]sheet.write((j-1)*80+i,0,titleans)authorans=author[i]sheet.write((j - 1) * 80 + i, 1, authorans)fabiaotime=time[i][0]sheet.write((j - 1) * 80 + i, 2, fabiaotime)gengxintime=time[i][1]sheet.write((j - 1) * 80 + i, 3, gengxintime)yuedu = num[i][0]#print yuedusheet.write((j - 1) * 80 + i, 4, yuedu)pinglun = num[i][1]#print pinglunsheet.write((j - 1) * 80 + i, 5, pinglun)#保存book.save('G://project/sentimation_analysis/data/002868.xls')except urllib2.URLError,e:if hasattr(e,"code"):print e.codeif hasattr(e,"reason"):print e.reason

代码说明:

网站选取:东方财富网---股吧:链接戳这里:周大生--股吧

只抓取业绩说明会前后的文本信息,保存为xls格式,内容如下形式:

金融情感分析,股市预测(二)相关推荐

  1. 金融情感分析--股市预测(一)

    (PS:趋势分析) 我选的是周大生2018年第二季度的股市行情,在这里选择周大生 直接复制粘贴得到xlsx文件(文件内容如下) (已在Win7.python3.6上运行成功) "" ...

  2. 【量化交易】94篇论文分析股市预测的深度学习技术

    论文 | Stock Market Prediction via Deep Learning Techniques: A Survey 作者 | Jinan Zou, Qingying Zhao, Y ...

  3. 自然语言处理模型_ICLR 2020 「自然语言处理」【Prosus AI】金融情感分析FinBERT模型(含源码)!...

    来源:AINLPer微信公众号 编辑: ShuYini 校稿: ShuYini 时间: 2020-1-15 TILE: FinBERT: Financial Sentiment Analysis wi ...

  4. 朴素贝叶斯算法实现 豆瓣Top250电影评价的情感分析与预测。​

    前言 本文使用朴素贝叶斯算法实现 豆瓣Top250电影评价的情感分析与预测. 最近在学习自然语言正负面情感的处理问题,但是绝大部分能搜索到的实践都是Kggle上IMDB影评的情感分析. 所以在这里我就 ...

  5. 情感分析系列(二)——使用BiLSTM进行情感分析

    目录 一.数据预处理 二.搭建BiLSTM 三.训练&测试 一.数据预处理 先前我们已经进行了数据预处理:情感分析系列(一)--IMDb数据集及其预处理,这里不再过多介绍,本文将聚焦于模型的搭 ...

  6. NLP情感分析笔记(二):Updated情感分析

    本章主要内容如下: 序列填充 预训练词嵌入 LSTM 双向 RNN 多层 RNN 正则化 优化 1.准备数据 首先设置seed,并将其分类训练.测试.验证集. 注意:由于 RNN 只能处理序列中的非 ...

  7. 金融情感分析--基于业绩说明会的研究

    额,基本工作完成了,先整理一下这个小项目.发现一个非常棒的网址:https://github.com/yaleimeng/Final_word_Similarity 项目内容: 一.数据准备 项目数据 ...

  8. 实战六十四:基于机器学习朴素贝叶斯的豆瓣Top250影评的情感分析与预测 附完整源码和数据

    首先需要豆瓣Top250影评的语料,我用Scrapy抓取了5w份语料,用于训练与验证. 豆瓣影评爬虫 github.com/3inchtime/d- 有了语料之后我们就可以开始实际开发了. 这里建议使 ...

  9. Python实现基于LSTM的中文评论情感分析

    资源下载地址:https://download.csdn.net/download/sheziqiong/85949420 资源下载地址:https://download.csdn.net/downl ...

最新文章

  1. 推荐一款让你纵横Github的读码神器
  2. vs2017 不能加载.vdproj
  3. SAP-FICO学习笔记
  4. Stream流中的常用方法_limit
  5. linux环境 Oracle客户端连接远程Oracle服务端
  6. python搭建邮件服务器地址_python 配置邮件发送服务器发送邮件
  7. Error running app: Default Activity Not Found
  8. 电影'社交网络'获金球奖最佳影片,最佳编剧,最佳导演,最佳配乐奖
  9. 廖雪峰python教程-廖雪峰Python教程的配套视频教程,全套完整版!
  10. “绿坝-花季护航”软件
  11. 前端使用js来获取ip起始和结束地址
  12. 测试进阶必备,这5款http接口自动化测试工具不要太香~
  13. 从网络访问此计算机 注册表位置,安装软件报错1606:无法访问网络位置解决方法...
  14. (2022-2028年年)全球与中国实验室开发试验(LDT)行业发展调研与市场前景预测报告
  15. Gson的使用——Gson解析json数组并展示在ListView控件上
  16. Pandas 那些年踩过的坑
  17. 数据结构---线性表课后习题详解(朱昌杰编著)
  18. Python实现元胞自动机——十字路口
  19. TIVA 123GXL的边沿计数模式测量低频PWM
  20. Linux平台上文件同步——rsync+inotify之定时同步

热门文章

  1. 80万条毛巾库存,16天就销售一空,并净赚240万的营销方案揭秘!
  2. 常见的计算机网络教学模式有哪几种,常见的教学方法有哪几种
  3. 给定k个排好序的序列,设计一个算法确定2路合并次序,使所需的总比较次数最少。Java代码
  4. 谈区块链技术在积分领域的应用
  5. C语言求两个时间的时差
  6. 前端动画之贝塞尔曲线推导及应用
  7. 谷歌浏览器 打开网页出现 out of memory
  8. 队列应用----模拟患者看病
  9. win10平板读写TF卡异常的解决记录
  10. SASS Or SCSS