需要用到的停用词库我上传到我的资源了,大家也可以自己去网上找!

本来是想把两个词频统计放入一个CSV文件中,但是无奈向已经存在的CSV文件中追加写入数据只能在已经存在的数据下面追加,也就是在同一列追加,不能另起一列添加数据,哪位兄弟怼出来了,欢迎回复或私信!

import jieba

import pandas as pd

import csv

import codecs

# num=jieba.lcut("中国是一个伟大的国家") # jieba库的测试

# print(num)

# 计算机专业的-1.txt

txt1=open("计算机专业.txt").read()

# 导入停用词库,过滤掉那些没用的词语,甚至都不是词语,比如标点符号,停用词在我的资源中有保存

stopwords=[line.strip() for line in open("停用词.txt").readlines()]

words1=jieba.lcut(txt1)

# print(words1)

counts1={}

for word1 in words1:

if len(word1)==1:

continue

else:

counts1[word1]=counts1.get(word1,0)+1

items1=list(counts1.items())

items1.sort(key=lambda x:x[1],reverse=True) # 根据词频进行降序排序

# print(items1)

file_csv=open("计算机专业词频.csv",'w+',newline='') #添加newline='',可以删除每行之间的空行

writer=csv.writer(file_csv)

writer.writerow(["词汇","词频"])

for data in items1:

writer.writerow(data)

file_csv.close()

# 法学专业的-2.txt

txt2=open("法学专业.txt").read()

words2=jieba.lcut(txt2)

counts2={}

for word2 in words2:

if len(word2)==1:

continue

else:

counts2[word2]=counts2.get(word2,0)+1

items2=list(counts2.items())

items2.sort(key=lambda x:x[1],reverse=True)

#print(items2)

# dataframe=pd.DataFrame({'items1_name':items1,'items2_name':items2})

# dataframe.to_csv("test.csv")

# file_csv=open('test.csv','a')

file_csv=open("法学专业词频.csv",'w+',newline='')

writer=csv.writer(file_csv)

writer.writerow(["词汇","词频"])

for data in items2:

writer.writerow(data)

file_csv.close()

python词频统计结果写入csv_Python词频对比并导入CSV文件相关推荐

  1. Python词频对比并导入CSV文件

    需要用到的停用词库我上传到我的资源了,大家也可以自己去网上找! 本来是想把两个词频统计放入一个CSV文件中,但是无奈向已经存在的CSV文件中追加写入数据只能在已经存在的数据下面追加,也就是在同一列追加 ...

  2. pythoncsv表格对比_对比两个csv文件记录差异

    搜索热词 下面是编程之家 jb51.cc 通过网络收集整理的代码片段. 编程之家小编现在分享给大家,也给大家做个参考. # -*- coding:utf-8 -*- import csv import ...

  3. python导入csv文件-jupyter 导入csv文件方式

    先将准备的文件上传到自己的jupyter工作空间 import numpy as np import pandas as pd housing = pd.read_csv('housing.csv') ...

  4. python导入csv文件-python如何导入csv文件格式

    1.通过标准的Python库导入CSV文件 Python提供了一个标准的类库CSV文件.这个类库中的reader()函数用来导入CSV文件.当CSV文件被读入后,可以利用这些数据生成一个NumPy数组 ...

  5. python导入csv文件-python如何导入csv

    1.通过标准的Python库导入CSV文件 Python提供了一个标准的类库CSV文件.这个类库中的reader()函数用来导入CSV文件.当CSV文件被读入后,可以利用这些数据生成一个NumPy数组 ...

  6. python如何将utf-8编码文件改为ansi编码文件_Excel导入CSV文件乱码?两个小方法让文件正常显示...

    最近网友抱怨,收到别人发来的数据表,打开后长这样: CSV再EXCEL中显示为乱码 除了数字,其他是啥玩意儿 完全乱码... (乱码!乱马!乱吗?乱!) 但是当使用记事本打开,检查确认是否文件有问题时 ...

  7. python怎么导入csv文件数据-机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  8. Python使用Pandas导入csv文件产生错误的解决方式(UnicodeDecodeError)

    众所周知,Pandas是一个很强大的库,可用于数据分析.我们常常要使用Pandas来导入csv文件,进而通过编程对文件中的数据加以分析. 笔者在以前通常使用如下的方式来导入数据,一列一列的进行分析,十 ...

  9. python词频统计结果写入csv,Python中CSV列的词频

    我有一个.csv文件,其中有一列我收集的消息,我希望得到该列中每个单词的词频列表.这是我到目前为止的情况,我不知道我在哪里犯了错误,任何帮助都将不胜感激.编辑:预期的输出是将单词的整个列表及其计数(不 ...

最新文章

  1. Node.js(nodejs)对本地JSON文件进行增、删、改、查操作(轻车熟路)
  2. php 年的第几天,收藏-php中某年第几天计算出日期年月日的代码
  3. 【转】交织容积重建技术:基本原理与临床价值
  4. 借助Intent实现Android工程中Activity之间Java对象的传递——实现Serializable接口
  5. 地理必修一三大类岩石_90后地理老师4天收700封情书!这波操作,绝了……
  6. opencv使用trackbar调控美颜程度
  7. 怎么用spss做冗余分析_【攻略】手把手教你怎么用SPSS做统计分析
  8. kotlin教程(一)
  9. windows环境命令行创建虚拟环境
  10. PHP怎么做成Qq空间相册,美化QQ空间相册的照片4步走 让你轻松学会PS
  11. 调用百度云短语音合成简单程序
  12. 如何大量做外链 不仅正规而有效果
  13. layim php,Workerman+LayIM+ThinkPHP5的webIM,即时通讯系统 – ThinkPHP框架
  14. 时间复杂度:1秒内能执行多少指令
  15. pythonU盘小偷并发送邮箱
  16. 喧喧 2.5 发布,新增客户端自动升级,优化界面交互性能
  17. influxdb删除错误DB contains shards using both inmem and tsi1 indexes.
  18. 商业模式(四):群硕软件,欧美客户为主的软件外包
  19. 湖南农业大学计算机考试试题,湖南农业大学机械CADCAM考试复习题
  20. python esm构建ac自动机

热门文章

  1. 轻量级的ORM框架 fluentdata
  2. 检测ID卡的输入或者是其它卡的输入。
  3. python canny检测_【数字图像分析】基于Python实现 Canny Edge Detection(Canny 边缘检测算法)...
  4. MybatisCodeHelperNew-2.8.1-191-201插件使用
  5. git前端工程实现ci_大前端项目代码重用,也许lerna是最好的选择
  6. sql 数字转换为16进制数函数
  7. java流的应用_Java中I/O流的应用
  8. 选择题_一级造价师选择题的分值是多少
  9. mysql查询重复数据
  10. lgg8配置_LGG8XThinQ参数配置-LG G8X ThinQ详细性能评测