用python实现词频统计

词频统计就是输入一段句子或者一篇文章,然后统计句子中每个单词出现的次数。

那么,这个在python中其实是很好实现的,下面我们来看看具体是怎样实现的,里面又用到了哪些知识呢?

输入一段话,统计每个字母出现的次数

先来讲一下思路:

例如给出下面这样一句话

Love is more than a word
it says so much.
When I see these four letters,
I almost feel your touch.
This is only happened since
I fell in love with you.
Why this word does this,
I haven’t got a clue.

那么想要统计里面每一个单词出现的次数,思路很简单,遍历一遍这个字符串,再定义一个空字典count_dict,看每一个单词在这个用于统计的空字典count_dict中的key中存在否,不存在则将这个单词当做count_dict的键加入字典内,然后值就为1,若这个单词在count_dict里面已经存在,那就将它对应的键的值+1就行

下面来看代码:

#定义字符串
sentences = """           # 字符串很长时用三个引号
Love is more than a word
it says so much.
When I see these four letters,
I almost feel your touch.
This is only happened since
I fell in love with you.
Why this word does this,
I haven't got a clue.
"""
#具体实现
#  将句子里面的逗号去掉,去掉多种符号时请用循环,这里我就这样吧
sentences=sentences.replace(',','')
sentences=sentences.replace('.','')   #  将句子里面的.去掉
sentences = sentences.split()         # 将句子分开为单个的单词,分开后产生的是一个列表sentences
# print(sentences)
count_dict = {}
for sentence in sentences:if sentence not in count_dict:    # 判断是否不在统计的字典中count_dict[sentence] = 1else:                              # 判断是否不在统计的字典中count_dict[sentence] += 1
for key,value in count_dict.items():print(f"{key}出现了{value}次")

输出结果是这样:

怎么样,大家get到了吗?赶紧试试

如果对你有帮助,不要忘记点赞评论关注加收藏哦!

用python实现词频统计相关推荐

  1. python 英语词频统计软件_Python数据挖掘——文本分析

    作者 | zhouyue65 来源 | 君泉计量 文本挖掘:从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程. 一.语料库(Corpus) 语料库是我们要分析的所有文档的集合. ...

  2. Python英文词频统计(哈姆雷特)程序示例

    今天继续给大家介绍Python相关知识,本文主要内容是Python英文词频统计程序示例,主要是对英文文本--<哈姆雷特>进行分词. 一.英文文本词频统计思路 想要对<哈姆雷特> ...

  3. python英文词频统计代码_python实现中文和英文的词频统计功能方法汇总

    python的思维就是让我们用尽可能少的代码来解决问题.对于词频的统计,就代码层面而言,实现的方式也是有很多种的.之所以单独谈到统计词频这个问题,是因为它在统计和数据挖掘方面经常会用到,尤其是处理分类 ...

  4. python特定词频统计_词频统计方案与具体实现-elasticsearch、spark、python

    方案一.基于ElasticSearch方式 方案二.基于Spark方式 方案三.基于Python方式 方案一.基于ElasticSearch方式 详见文章,里面列举了各种ElasticSearch的实 ...

  5. Python数据挖掘-词频统计-实现

    词频:某个词在该文档中出现的内容 1.语料库搭建 import jieba jieba.load_userdict("D:\\Python\\Python数据挖掘\\Python数据挖掘实战 ...

  6. Python实现词频统计的两种方法

    词频统计是指在文本中计算每个单词出现的次数,是文本处理中一个最基本的任务.在Python中,可以使用多种方法实现词频统计,包括使用字典.列表.Counter类等数据结构. 一.使用字典 其中,使用字典 ...

  7. python 小说词频统计_Python中文分词及词频统计

    中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含义,因此,中文分词相比英文 ...

  8. 【文本处理 词频统计】python 实现词频统计

    自定义词频统计函数:wordcount # -*- encoding=utf-8 -*-import string import pandas as pdword_list=[] freq_list= ...

  9. python进行词频统计_如何利用Python进行文本词频统计

    欢迎点击「算法与编程之美」↑关注我们! 本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 问题描述 Python在自然语言处理这个方面,有其天然的优势: ...

  10. Python新闻联播词频统计

    http://www.judymax.com/archives/1033 在本文中,我们将编写这样一个 Python 程序:从网络上抓取前一日<新闻联播>的文本稿,利用分词技术将它们拆散成 ...

最新文章

  1. 二分法:search insert position 插入位置
  2. 【转载】你真的了解补码吗
  3. 多重背包单调队列优化思路_动态规划入门——多重背包与单调优化
  4. 洛谷T1967 货车运输 Kruskal最大生成树倍增LCA
  5. fancyupload java_javascript-如何在内部Windows身份验证Intranet上...
  6. mysql主从复制读写分离
  7. 51单片机流水灯程序
  8. 北航计算机专业怎么样考研好考不,计算机专业考研,北航和北邮各有什么优势...
  9. pycharm逗号后面补空格_解决在pycharm 中复制代码时出现空格的方法
  10. 中兴承建WoStore:联通摒弃苹果“自封神话”?
  11. 微信小程序 控制台报错net::ERR_UNSAFE_PORT
  12. Tomcat安装及环境配置教程
  13. 还想贪小便宜?建议你先了解一下物联卡收费标准!
  14. DELL 电脑 重装系统出现 no boottable devices found
  15. 基于Web SCADA平台构建实时数字化产线 - 初篇
  16. 流式低代码编程,拖拽节点画流程图并运行
  17. “龙”腾智跃,“万”象更新 | 达索系统专精特新企业SIMULIA解决方案云峰会邀君共探未来
  18. AndroidShortcuts
  19. 聚偏氟乙烯(PVDF)/1-乙烯基-3-丁基咪唑氯盐离子液体([VBIM][Cl])复合材料(PVDF/[VBIM][Cl])特性
  20. 陀螺专访 | 元征科技CIO:疫情加速维修行业数字化进程

热门文章

  1. Echarts官网Json获取方式
  2. sql字符串拼接,转义
  3. Fiddler 4——手机抓包工具
  4. 如何前后端分离的架构中使用Shiro框架
  5. 新手入门:手把手从PHP环境到ThinkPHP6框架下载
  6. 10个快乐习惯来源于美国哈佛大学
  7. 小程序版聊天室|聊天小程序|仿微信聊天界面小程序
  8. 微信小程序云开发实现聊天(聊天室,一对一聊天)
  9. steam加速_Steam玩家们快看看,追梦加速器的试用体验者怎么说?
  10. Untiy3D里用C#做出连线题目~