python词频统计结果写入csv_Python词频对比并导入CSV文件
需要用到的停用词库我上传到我的资源了,大家也可以自己去网上找!
本来是想把两个词频统计放入一个CSV文件中,但是无奈向已经存在的CSV文件中追加写入数据只能在已经存在的数据下面追加,也就是在同一列追加,不能另起一列添加数据,哪位兄弟怼出来了,欢迎回复或私信!
import jieba
import pandas as pd
import csv
import codecs
# num=jieba.lcut("中国是一个伟大的国家") # jieba库的测试
# print(num)
# 计算机专业的-1.txt
txt1=open("计算机专业.txt").read()
# 导入停用词库,过滤掉那些没用的词语,甚至都不是词语,比如标点符号,停用词在我的资源中有保存
stopwords=[line.strip() for line in open("停用词.txt").readlines()]
words1=jieba.lcut(txt1)
# print(words1)
counts1={}
for word1 in words1:
if len(word1)==1:
continue
else:
counts1[word1]=counts1.get(word1,0)+1
items1=list(counts1.items())
items1.sort(key=lambda x:x[1],reverse=True) # 根据词频进行降序排序
# print(items1)
file_csv=open("计算机专业词频.csv",'w+',newline='') #添加newline='',可以删除每行之间的空行
writer=csv.writer(file_csv)
writer.writerow(["词汇","词频"])
for data in items1:
writer.writerow(data)
file_csv.close()
# 法学专业的-2.txt
txt2=open("法学专业.txt").read()
words2=jieba.lcut(txt2)
counts2={}
for word2 in words2:
if len(word2)==1:
continue
else:
counts2[word2]=counts2.get(word2,0)+1
items2=list(counts2.items())
items2.sort(key=lambda x:x[1],reverse=True)
#print(items2)
# dataframe=pd.DataFrame({'items1_name':items1,'items2_name':items2})
# dataframe.to_csv("test.csv")
# file_csv=open('test.csv','a')
file_csv=open("法学专业词频.csv",'w+',newline='')
writer=csv.writer(file_csv)
writer.writerow(["词汇","词频"])
for data in items2:
writer.writerow(data)
file_csv.close()
python词频统计结果写入csv_Python词频对比并导入CSV文件相关推荐
- Python词频对比并导入CSV文件
需要用到的停用词库我上传到我的资源了,大家也可以自己去网上找! 本来是想把两个词频统计放入一个CSV文件中,但是无奈向已经存在的CSV文件中追加写入数据只能在已经存在的数据下面追加,也就是在同一列追加 ...
- pythoncsv表格对比_对比两个csv文件记录差异
搜索热词 下面是编程之家 jb51.cc 通过网络收集整理的代码片段. 编程之家小编现在分享给大家,也给大家做个参考. # -*- coding:utf-8 -*- import csv import ...
- python导入csv文件-jupyter 导入csv文件方式
先将准备的文件上传到自己的jupyter工作空间 import numpy as np import pandas as pd housing = pd.read_csv('housing.csv') ...
- python导入csv文件-python如何导入csv文件格式
1.通过标准的Python库导入CSV文件 Python提供了一个标准的类库CSV文件.这个类库中的reader()函数用来导入CSV文件.当CSV文件被读入后,可以利用这些数据生成一个NumPy数组 ...
- python导入csv文件-python如何导入csv
1.通过标准的Python库导入CSV文件 Python提供了一个标准的类库CSV文件.这个类库中的reader()函数用来导入CSV文件.当CSV文件被读入后,可以利用这些数据生成一个NumPy数组 ...
- python如何将utf-8编码文件改为ansi编码文件_Excel导入CSV文件乱码?两个小方法让文件正常显示...
最近网友抱怨,收到别人发来的数据表,打开后长这样: CSV再EXCEL中显示为乱码 除了数字,其他是啥玩意儿 完全乱码... (乱码!乱马!乱吗?乱!) 但是当使用记事本打开,检查确认是否文件有问题时 ...
- python怎么导入csv文件数据-机器学习Python实践——数据导入(CSV)
一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...
- Python使用Pandas导入csv文件产生错误的解决方式(UnicodeDecodeError)
众所周知,Pandas是一个很强大的库,可用于数据分析.我们常常要使用Pandas来导入csv文件,进而通过编程对文件中的数据加以分析. 笔者在以前通常使用如下的方式来导入数据,一列一列的进行分析,十 ...
- python词频统计结果写入csv,Python中CSV列的词频
我有一个.csv文件,其中有一列我收集的消息,我希望得到该列中每个单词的词频列表.这是我到目前为止的情况,我不知道我在哪里犯了错误,任何帮助都将不胜感激.编辑:预期的输出是将单词的整个列表及其计数(不 ...
最新文章
- Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
- php 年的第几天,收藏-php中某年第几天计算出日期年月日的代码
- 【转】交织容积重建技术:基本原理与临床价值
- 借助Intent实现Android工程中Activity之间Java对象的传递——实现Serializable接口
- 地理必修一三大类岩石_90后地理老师4天收700封情书!这波操作,绝了……
- opencv使用trackbar调控美颜程度
- 怎么用spss做冗余分析_【攻略】手把手教你怎么用SPSS做统计分析
- kotlin教程(一)
- windows环境命令行创建虚拟环境
- PHP怎么做成Qq空间相册,美化QQ空间相册的照片4步走 让你轻松学会PS
- 调用百度云短语音合成简单程序
- 如何大量做外链 不仅正规而有效果
- layim php,Workerman+LayIM+ThinkPHP5的webIM,即时通讯系统 – ThinkPHP框架
- 时间复杂度:1秒内能执行多少指令
- pythonU盘小偷并发送邮箱
- 喧喧 2.5 发布,新增客户端自动升级,优化界面交互性能
- influxdb删除错误DB contains shards using both inmem and tsi1 indexes.
- 商业模式(四):群硕软件,欧美客户为主的软件外包
- 湖南农业大学计算机考试试题,湖南农业大学机械CADCAM考试复习题
- python esm构建ac自动机
热门文章
- 轻量级的ORM框架 fluentdata
- 检测ID卡的输入或者是其它卡的输入。
- python canny检测_【数字图像分析】基于Python实现 Canny Edge Detection(Canny 边缘检测算法)...
- MybatisCodeHelperNew-2.8.1-191-201插件使用
- git前端工程实现ci_大前端项目代码重用,也许lerna是最好的选择
- sql 数字转换为16进制数函数
- java流的应用_Java中I/O流的应用
- 选择题_一级造价师选择题的分值是多少
- mysql查询重复数据
- lgg8配置_LGG8XThinQ参数配置-LG G8X ThinQ详细性能评测