该文章代码均在jupyter Notebook中运行,且已安装相关包

import jieba
import os
import csv# 读取预定的情感词列表
def read_dict(file):text = open(file,encoding='gbk').read()text = text.split('\n')words = [w for w in text if w] # 去除空的内容return words# 得到情感词列表
negs = read_dict(r'C:\Users\qingfeng\Desktop\Python爬虫与文本分析\Python爬虫与文本分析\Python爬虫与文本分析课件(更新)\03-初识文本分析\data\Reports\negative.txt')
poss = read_dict(r'C:\Users\qingfeng\Desktop\Python爬虫与文本分析\Python爬虫与文本分析\Python爬虫与文本分析课件(更新)\03-初识文本分析\data\Reports\positive.txt')
# print(negs,poss)# 计算目标函数的情感词
def senti_count(text):wordlist = jieba.lcut(text) # 将要分析的文本进行分词pos_count = 0for pos in poss:pos_count = pos_count + wordlist.count(pos) # 计算要分析的文本中累计含有的正面情感词汇的数量neg_count = 0for neg in negs:neg_count = neg_count + wordlist.count(neg) # 计算要分析的文本中累计含有的正面情感词汇的数量return{'wordnum':len(wordlist),'pos':pos_count,'neg':neg_count}# 新建CSV保存内容
csvf = open(r'C:\Users\qingfeng\Desktop\company_senti.csv','w',encoding = 'gbk',newline='')
writer = csv.writer(csvf)
writer.writerow(('company','year','wordnum','pos','neg'))# 对某一个txt进行情感计算
# text = open(r'C:\Users\qingfeng\Desktop\Python爬虫与文本分析\Python爬虫与文本分析\Python爬虫与文本分析课件(更新)\03-初识文本分析\data\Reports\reports\青海华鼎2015.txt').read()
# senti_count(text)# 通过for循环,批量获取文件路径,读取文件
file_list = os.listdir(r'C:\Users\qingfeng\Desktop\Python爬虫与文本分析\Python爬虫与文本分析\Python爬虫与文本分析课件(更新)\03-初识文本分析\data\Reports\reports')
for f in file_list:# python中,如果你的字符串最后一位是斜杠(slash)字符,那么即使字符串前面加了r表示regular的普通字符串,也是无法通过编译的,也是会导致SyntaxError的。file = 'C:\\Users\\qingfeng\\Desktop\\Python爬虫与文本分析\\Python爬虫与文本分析\\Python爬虫与文本分析课件(更新)\\03-初识文本分析\\data\\Reports\\reports\\' + ftext = open(file,encoding = 'gbk').read()senti_score = senti_count(text) # 这里是词典格式wordnum = senti_score['wordnum']pos = senti_score['pos']neg = senti_score['neg']company = f[:-8] # 切片year = f[-8:-4]
#     print(company,year,wordnum,pos,neg)writer.writerow((company,year,wordnum,pos,neg))
csvf.close()

Python批量读取公司年报并进行情感分析--代码实战相关推荐

  1. json字段顺序读取 python_如何利用Python批量读取视频文件的时间长度?

    本期的主题是利用Python来实现对视频文件时间长度的读取. 在学习编程语言时,相比较于通过书本来学习知识,我更喜欢通过观看学习视频的方式来进行学习,通过主讲老师的讲解,我能很直观且快速的了解一些知识 ...

  2. python批量提取word指定内容_使用python批量读取word文档并整理关键信息到excel表格的实例...

    目标 最近实验室里成立了一个计算机兴趣小组 倡议大家多把自己解决问题的经验记录并分享 就像在CSDN写博客一样 虽然刚刚起步 但考虑到后面此类经验记录的资料会越来越多 所以一开始就要做好模板设计(如下 ...

  3. python批量读取图片gps位置_某少儿不宜网站图片拍摄位置分析,Python批量读取图片GPS位置!...

    原标题:某少儿不宜网站图片拍摄位置分析,Python批量读取图片GPS位置! 1. python读取图片exif属性中的GPS信息 智能手机或平板如果在拍照时开启定位服务,照片中就会记录拍照位置信息和 ...

  4. 我用Python批量读取考生成绩单,并自动发送录取通知书邮件

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 欢笑情如旧,萧疏鬓已斑. 01 前 ...

  5. python 批量读取csv_python批量读取csv文件

    请问大神怎样用python批量读取文件夹下的文件? python如何读取CSV文件一部分数据 Python如何批量读取CSV文件并写入TXT? 如何用python把多个csv文件数据处理后汇总到新cs ...

  6. 自动化神器啊,Python 批量读取身份证信息写入 Excel

    大家好,今天分享一个实用技能,利用 Python 批量读取身份证信息写入 Excel. 喜欢记得收藏.关注.点赞. 注:文末提供完整版代码.技术交流方式 读取 以图片形式的身份证为例,信息读取我们使用 ...

  7. NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码

    NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之情感分析:基于python编程(jieba库)实现中文文本情 ...

  8. NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码

    NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之TEA:基于python编程(jieba库)实现中文文本情感分 ...

  9. ​​​​​​​NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)

    NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分) 目录 输出结果 设计思路 相关资料 1.关于代码 2.关于数据集 关于留言 1.留言内容的注意事项 2.如 ...

最新文章

  1. Python 从入门到精通:一个月就够了?真的能行嘛?
  2. 【UGV】32版UGV原理图
  3. 深度讲解spring的循环依赖以及三级缓存
  4. 跟着微信后台团队学习分布式一致性协议
  5. SAP CRM WebUI上Opportunity reason字段的后台配置
  6. 卖家工具箱源码_我的测试和代码分析工具箱
  7. VC嵌入python时debug版lib下载
  8. maven项目部署到linux上的奇葩问题
  9. spring兼容mysql_springboot 最新版本支持 mysql6.0.6吗
  10. SQL Server里查看当前连接的在线用户数
  11. 浅谈FFT(快速博立叶变换)学习笔记
  12. php更改html内容,请问你们怎么将html的文件的内容改变为php
  13. armeabi与armeabi-v7a的区别,绝对干货!
  14. 操作系统第三章课后答案
  15. 雷电2接口_Steinberg 发布旗舰级 32 bit / 384 kHz 雷电 2 音频接口 AXR4
  16. IndexError: Target 25 is out of bounds.
  17. 前端找实习岗的7条建议
  18. Alpha冲刺——事后诸葛亮
  19. aws saa 认证价值大吗?aws认证指的是什么?
  20. MAC 下Sublime text 同时编辑多行内容

热门文章

  1. html纵向滚动条隐藏,隐藏横向滚动条或纵向滚动条的解决方案
  2. STM32学习笔记二:命令行工具安装
  3. vue3.0(包含中文官方文档)
  4. 第二篇:个案管理师之执行篇-台湾最佳医院信息化及管理实践
  5. java线程池的简单使用
  6. 五道口宅男 - Android NDK and OpenCV Development With Android Studio
  7. hdu2520 我是菜鸟,我怕谁
  8. 使用sale数据库,统计全部商品的平均价格,以及文具类商品的平均价格
  9. java 内存 溢出_java内存溢出的几种原因和解决办法是什么?
  10. 贪心算法之埃及分数问题